Hvordan lage Phylogenetic Trees

Hvordan lage Phylogenetic Trees

 

1.

Sett sammen et datasett av gener. Dette krever tilgang til repositorier som GenBank, EMBL eller DDBJ, fra hvilke nukleotidsekvenser kan lastes ned, samt kunnskap om hvordan de skal brukes. Bruk søkeord eller sekvenslikhetssøk for å finne en gruppe av sekvenser som er relaterte. Last ned formatet 'FASTA' eller tekstdokumentet for hvert gen som er valgt, og kompilere disse i en fil.

2.

Juster sekvensene i datasettet. Utfør flere sekvensjusteringer ved hjelp av beregningsbiologiske verktøy som er tilgjengelige på ditt anlegg, for eksempel VectorNTI, ClustalX, BioEdit, CLCBio Workbench og så videre. Vær oppmerksom på at noen av disse verktøyene er svært kompliserte å operere og svært dyre å bruke (nettstedslisenser kan koste opptil flere tusen dollar), slik at tidligere trening kan være obligatorisk. Utfør en progressiv sekvensjustering der sekvenser legges til en-i-ett, og lignende nukleotider matches opp (dvs. justert) til justeringen er etablert. Dette må være svært nøyaktig fra starten. Feil her vil bli forsterket i det endelige fylogenetiske treet.

3.

Kontroller justeringen. Ikke alle deler av tilpasningen må inkluderes i konstruksjonen av fylogenetisk treet; for eksempel slette eventuelle hull som er satt inn under konstruksjonen av justeringen. Fjern også eventuelle uklare, feiljusterte eller tvetydige justeringer. Hvis genet som studeres, faktisk produserer et protein, bør du vurdere om det ville være mer hensiktsmessig å konvertere nukleotidsekvensjusteringen til en proteinsekvensjustering. Dette vil avhenge av hvor mye data som skal innhentes fra treet (aminosyresekvensene vil være mer informative). Merk at jo mer justerte sekvensene er til hverandre, jo mer evolusjonært relatert de er (dvs. kortere 'evolusjonær avstand' fra en art til en annen).

4. Bestem om treet skal bygges med 'avstandmatrise' eller 'diskret data' -metode. Avstandsmatormetoden er enklere og mindre komplisert, og krever bare avstanden mellom de justerte sekvensene for å konstruere det mest egnede treet. Den diskrete datametoden bryter innretningen ned i deler og prøver å samle hver av disse inn i treet, og på grunn av dette gir det mye mer informasjon for etterfølgende analyse; Men de tar mye lengre tid å fullføre enn avstandsmatrisetrær.

5.

Legg inn de justerte sekvensene i en fylogenepakke. Flere billige eller åpne programvarepakker er tilgjengelige, og er industristandarden, som PHYLIP, Mega og PAUP. ClustalX kan brukes til enklere trær. Bruk ClustalX som et eksempel, fjern hull fra justeringen og korriger deretter for justeringsfeil eller flere utskiftninger. Kontroller at riktig utdataformat ('noder', ikke 'grener') er valgt. Sett programvaren til 'boostrap NJ tree', som vil utføre de kompliserte beregningene som kreves for montering av treet.

6.

Presentere de beregnede dataene som et tre. Phylogeny-pakken vil ha beregnet avstander som representerer hvordan like (nær) eller forskjellige (langt) sekvenser er fra hverandre mellom forskjellige arter. Dette kan brukes til å tegne et tre, med grener som representerer disse avstandene og noder på enden av grenene for å betegne arten eller genet. Tegn dette til skala for å gi en god visuell fremstilling av evolusjonær avstand mellom artene.

Tips og advarsler

  • Phylogenetisk trekonstruksjon er en svært komplisert og intens beregningsmetode. Det er best å søke en utdannet bioinformatiker for å gi veiledning eller praktisk trening. Feil i treformasjon er ekstremt vanlig, men kan ikke løses manuelt og vil kreve avansert databehandlingskompetanse.
  • Fylogenetiske trær er et komplisert, høyt teknisk bioinformatisk verktøy som brukes av biologer for å bestemme det evolusjonære forholdet mellom forskjellige arter. Filogenetikk ser særlig på forskjellene eller likhetene i gener mellom arter og har som mål å etablere de to artene som faktisk kommer fra en felles forfader. 'Træret' er i hovedsak en billedlig fremstilling av dette evolusjonære forholdet. Fylogenetiske trær er vanskelige å konstruere og bør ikke forsøkes av nybegynnere, ikke-forskere eller studenter uten riktig veiledning fra en kvalifisert forsker eller ekspert. Avansert (høyskolenivå) kunnskap om genetikk og beregningsbiologi er nødvendig.