Programme orthoMCL avec blastp (filtre faible complexité désactivé [ -F F] et PCQ & PCS >= 80 [i.e. alignement sur plus de 80% de la longueur de la Query et du Match)])
P-value Cut-off 1e-05 Percent Identity Cut-off 0 Percent Match Cut-off 80
Remarque: le filtre PCQ & PCS >= 80 est très stringeant: ce qui est affiché comme orthologue est donc assez sur, par contre il est probable que nous ayons des faux négatifs (notament les protéines fragmentaires)
MCL Inflation 1.5 Maximum Weight 316
Hpa : Hyaloperonospora arabidopsidis PLHAL : Plasmopara halstedii PLVIT : Plasmopara viticola ALCAN: Albugo candida PITG: Phytophthora infestans PHYRA: Phytophthora ramorum PHYSO: Phytophthora sojae PUG1: Pythium ultimum
Effectif par organisme et par groupes de protéines homologues (en triant sur le code hexa, on trie par groupe d'organismes représentés dans le groupe d'homologues
Format(texte tabulé) : ---------------------- #Nom du groupe NbProtéinesOrganismeA NbProtéinesOrganismeB NbProtéinesOrganismeC ... CodeHexa Annotation InterPro - code hexa : ce code correspond à un groupe d'organismes (i.e. un profil phylogénétique): 1 ==> PUG1 2 ==> PLVIT 3 ==> PLVIT + PUG1 4 ==> PLHAL 5 ==> PLHAL + PUG1 ... 255 ==> ALCAN + Hpa + PHYRA + PHYSO + PITG + PLHAL + PLVIT + PUG1
Groupes de protéines présentes dans tous les organismes en un et une seule copie (pas de paralogues)
Format (texte tabulé + séparateur espace entre les différents numéros d'accession): ----------------------------------------------------------------------------------- #Nom du groupe AccessionA(OrganismeA) AccessionB(OrganismeB) AccessionC(OrganismeC) ... Annotation InterPro ORTHOMCL2523(8 genes,8 taxa): AC2VRR_s00252g4(ALCAN) PITG_15485T0(PITG) PYU1_T007254(PUG1) Phyra1_1_80998(PHYRA) ... IPR011043:Galactose oxidase/kelch, beta-propeller [7/8];
Groupes de protéines homologues (paralogues inclues)
Format (texte tabulé + séparateur espace entre les différents numéros d'accession): ----------------------------------------------------------------------------------- #Nom du groupe AccessionA(OrganismeA) AccessionB(OrganismeB) AccessionC(OrganismeC) ... ORTHOMCL2523(8 genes,8 taxa): AC2VRR_s00252g4(ALCAN) PITG_15485T0(PITG) PYU1_T007254(PUG1) Phyra1_1_80998(PHYRA) ...
Nombre de groupes de protéines homologues (orthologues + paralogues) par protfil phylogénétique
Format(texte tabulé) : ---------------------- #CodeHexa NbFamilles ListeDesOrganismes
Pour chaque domaine InterPro, pour chaque organisme, décompte du nombre protéine de la famille
Format (texte tabulé): ---------------------- - count = nombre de proteines - rank = rang de la famille au sein de l'organisme (1 pour la famille la plus représenté, 999 pour celles absentes)
Pour chaque domaine Pfam, pour chaque organisme, décompte du nombre d'occurence du domaine (attention:si une proteine contient 2 fois le meme domaine, cela compte pour 2)
Format (texte tabulé): ---------------------- - count = nombre d'occurence du domaine Pfam - rank = rang du domaine Pfam au sein de l'organisme (1 pour le domaine le plus représenté, 999 pour ceux absents)
Pour chaque code enzymatique EC, pour chaque organisme, décompte du nombre de prot"ines avec cette activité
Format (texte tabulé): ---------------------- - count = nombre d'occurence du domaine EC - rank = rang de l'activité EC au sein de l'organisme (1 pour l'activité la plus représentée, 999 pour celles absentes)