Plasmopara sp.

Procédure

  1. Annotation InterPro des 8 organismes
  2. Recherche des best hits blasp réciproques dans les 8 organismes

    Programme orthoMCL avec blastp (filtre faible complexité désactivé [ -F F] et PCQ & PCS >= 80 [i.e. alignement sur plus de 80% de la longueur de la Query et du Match)])

    P-value Cut-off  1e-05     
    Percent Identity Cut-off  0         
    Percent Match Cut-off  80        
    

    Remarque: le filtre PCQ & PCS >= 80 est très stringeant: ce qui est affiché comme orthologue est donc assez sur, par contre il est probable que nous ayons des faux négatifs (notament les protéines fragmentaires)

  3. Clustering avec l'algorithme MCL
    MCL Inflation  1.5       
    Maximum Weight  316       
    

Codes Organismes

Hpa : Hyaloperonospora arabidopsidis
PLHAL : Plasmopara halstedii
PLVIT : Plasmopara viticola
ALCAN: Albugo candida
PITG: Phytophthora infestans
PHYRA: Phytophthora ramorum
PHYSO: Phytophthora sojae
PUG1: Pythium ultimum

Fichiers résultats

  1. Groupes d'homologues

    Effectif par organisme et par groupes de protéines homologues (en triant sur le code hexa, on trie par groupe d'organismes représentés dans le groupe d'homologues

    Format(texte tabulé) :
    ----------------------
    #Nom du groupe	NbProtéinesOrganismeA	NbProtéinesOrganismeB	NbProtéinesOrganismeC	...	CodeHexa	Annotation InterPro
    
    - code hexa : ce code correspond à un groupe d'organismes (i.e. un profil phylogénétique):
        1 ==> PUG1
        2 ==> PLVIT
        3 ==> PLVIT + PUG1
        4 ==> PLHAL
        5 ==> PLHAL + PUG1
        ...
        255 ==> ALCAN + Hpa + PHYRA + PHYSO + PITG + PLHAL + PLVIT + PUG1
    
  2. Groupes d'orthologues

    Groupes de protéines présentes dans tous les organismes en un et une seule copie (pas de paralogues)

    Format (texte tabulé + séparateur espace entre les différents numéros d'accession):
    -----------------------------------------------------------------------------------
    #Nom du groupe	AccessionA(OrganismeA) AccessionB(OrganismeB) AccessionC(OrganismeC) ...	Annotation InterPro
    ORTHOMCL2523(8 genes,8 taxa):	 AC2VRR_s00252g4(ALCAN) PITG_15485T0(PITG) PYU1_T007254(PUG1) Phyra1_1_80998(PHYRA) ...	IPR011043:Galactose oxidase/kelch, beta-propeller [7/8];
    
  3. Groupes d'homologues

    Groupes de protéines homologues (paralogues inclues)

    Format (texte tabulé + séparateur espace entre les différents numéros d'accession):
    -----------------------------------------------------------------------------------
    #Nom du groupe	AccessionA(OrganismeA) AccessionB(OrganismeB) AccessionC(OrganismeC) ...
    ORTHOMCL2523(8 genes,8 taxa):	 AC2VRR_s00252g4(ALCAN) PITG_15485T0(PITG) PYU1_T007254(PUG1) Phyra1_1_80998(PHYRA) ...	
    
  4. Nombre de familles par protfil phylogénétique

    Nombre de groupes de protéines homologues (orthologues + paralogues) par protfil phylogénétique

    Format(texte tabulé) :
    ----------------------
    #CodeHexa	NbFamilles	ListeDesOrganismes
    
  5. Analyse en familles de protéines

    Pour chaque domaine InterPro, pour chaque organisme, décompte du nombre protéine de la famille

    Format (texte tabulé):
    ----------------------
    - count = nombre de proteines 
    - rank = rang de la famille au sein de l'organisme (1 pour la famille la plus représenté, 999 pour celles absentes)
    
  6. Analyse en domaines Pfam

    Pour chaque domaine Pfam, pour chaque organisme, décompte du nombre d'occurence du domaine (attention:si une proteine contient 2 fois le meme domaine, cela compte pour 2)

    Format (texte tabulé):
    ----------------------
    - count = nombre d'occurence du domaine Pfam
    - rank = rang du domaine Pfam au sein de l'organisme (1 pour le domaine le plus représenté, 999 pour ceux absents)
    
  7. Analyse d'activités enzymatiques

    Pour chaque code enzymatique EC, pour chaque organisme, décompte du nombre de prot"ines avec cette activité

    Format (texte tabulé):
    ----------------------
    - count = nombre d'occurence du domaine EC
    - rank = rang de l'activité EC au sein de l'organisme (1 pour l'activité la plus représentée, 999 pour celles absentes)
    

Termes GO