2009 03


3. DRZEWA FILOGENETYCZNE

Poczatki badan w dziedzinie ewolucji molekularnej. Fundamenty nauki zwanej "molekularna ewolucja" zostaly polozone przez Anglika Nuttalla i Niemca Uhlenhutha na poczatku XX wieku. Mieszali oni roztwory bialek osocza z roztworami przeciwcial roznych gatunkow zwierzat w nadziei na wykrycie stopnia pokrewienstwa (slowo pochodzace od slowa « krew ») pomiedzy tymi gatunkami. Pomysl opieral sie na przypuszczeniu, ze im blizej spokrewniony gatunek tym reakcja immunologiczna bedzie silniejsza. I rzeczywiscie, obserwacje potwierdzily te hipoteze. Dzis wiemy, ze pokrewienstwo pomiedzy gatunkami zalezy od stopnia powinowactwa genetycznego. Mimo, ze techniki, ktorymi sie wowczas poslugiwano wydaja sie dzis byc prymitywne praca tych badaczy ustanowila najwazniejsza regule ewolucji molekularnej: stopien pokrewienstwa ewolucyjnego pomiedzy organizmami odzwierciedlony jest przez pokrewienstwo miedzy produktami ich genow.

Lata 50-te zapoczatkowaly rozkwit ewolucji molekularnej. Po pierwsze Watson i Crick odkryli molekularna strukture DNA. Drugim kamieniem milowym bylo poznanie sekwencji aminokwasowej insuliny bydla domowego, swini i owcy. Okazalo sie, ze obok roznic fenotypowych, oczywistych w przypadku tych trzech gatunkow istnieje roznica trzech aminokwasow pomiedzy czasteczkami insuliny syntetyzowanej przez ich organizmy. We wczesnych latach 60-tych oznaczono sekwencje aminokwasowe wielu bialek, co pozwolilo na zbudowanie modelu ewolucji na poziomie molekularnym. Model ten oparty byl na trzech podstawowych elementach

Po pierwsze stwierdzono, ze mozna zalozyc, ze ewolucja molekularna jest zdominowana przez procesy przypadkowe. Po drugie, zdano sobie sprawe, ze liczba roznic miedzy genami nie jest rowna liczbie zmian, ktore zaszly w czasie ewolucji. Mutacje, ktore zaszly dawno sa maskowane przez mutacje, ktore zaszly pozniej. Ostatnia idea byl postulat zegara molekularnego zakladajacy stala szybkosc akumulacji mutacji w czasie. Pozwala ona na umiejscowienie na osi czasu zmian zaszlych w sekwencjach biopolimerow. Jest to jedna z podstawowych wlasciwosci, ktore stwierdzono porownujac sekwencje aminokwasow bialek roznych gatunkow istot zywych. Nagromadzenie wielkiej ilosci danych wykazalo jednak, ze istnieja bialka, ktorych sekwencja aminokwasowa ewoluuje szybko i inne, ewoluujace wolno. To samo dotyczny sekwencji nukleotydowej w DNA: niektore pozycje w sekwencji ewoluuja szybko, inne wolno. Postulatu zegara molekularnego nie mozna wiec przyjmowac bez zastrzezen.

Jednym z waznych etapow rozwoju ewolucji molekularnej jako nauki bylo stwierdzenie Allana Wilsona i Vinca Saricha, ze gatunki szympans, goryl i czlowiek sa genetycznie jednakowo oddalone od siebie i wyraznie rozne od orangutana. Stwierdzono to przy pomocy metody Nuttalla i Uhlenhutha badajac reakcje antygenow z przeciwcialami.

Od lat 60-tych nastapil ogromny postep w dziedzinie ewolucji molekularnej. Badanie reakcji immunologicznych zostalo zastapione przez badanie sekwencji DNA. W szczegolnosci reakcja PCR wprowadzona w latach 80-tych pozwolila na szybkie otrzymywanie segmentow DNA w dowolnych ilosciach. Nowoczesna ewolucja molekularna obejmuje wiele dziedzin od ewolucji cyklu rozwojowego ( zwanej niekiedy “evodevo”), do ewolucji systemow ekologicznych. Wspolnym motywem tych badan jest rekonstrukcja pokrewienstw pomiedzy sekwencjami nukleotydow w genach a ich centralnym elementem jest konstrukcja drzew filogenetycznych, ktore w naturalny sposob pozwalaja uporzadkowac uzyskane informacje.

Molekularna filogenetyka przeksztalcila nasze podejscie do systematyki. Rzuca ona takze swiatlo na inna dziedzine biologii a mianowicie pozwala zrozumiec dlaczego genomy wspolczesnie zyjacych organizmow wygladaja tak jak wygladaja. W szczegolnosci podejmuje takie pytania, jak to skad sie biora introny, czemu geny sa zorganizowane w rodziny, co robia w genomie « smieci » molekularne. Mimo, ze wiele z tych pytan nie znalazlo jeszcze definitywnych odpowiedzi, jednak mozna w zasadzie juz opisac w przyblizeniu w jaki sposob genomy ewoluuja zarowno na poziomie pojedynczych genow jak i na poziomie populacji.

Drzewa filogenetyczne. Organizmy zywe istniejace obecnie pochodza od wspolnych przodkow. Rekonstrukcja "drzewa zycia" pokazujacego ten fakt jest jednym z podstawowych celow nauki o ewolucji molekularnej. Drzewo filogenetyczne jest struktura matematyczna stanowiaca model historii grupy organizmow. Drzewa skladaja sie z "galezi" i "wezlow " (ryc. 3 - 1).

0x08 graphic
0x01 graphic

Ryc. 3 - 1. Elementy struktury drzew filogenetycznych

Wezly korony lub  "liscie" stanowia "Operacyjne Jednostki Taksonomiczne" OJT. Wezly wewnetrzne reprezentuja hipotetycznych wspolnych przodkow. Wspolny przodek wszystkich organizmow grupy to "korzen". Niekiedy odleglosci pomiedzy wezlami dadza sie ustalic. Mowimy wtedy o "dlugosci galezi". Istnieje zwykle wiele sposobow przedstawienia tego samego drzewa. Galezie bowiem mozna dowolnie obracac w wezlach (ryc. 3 - 2).

0x01 graphic

Ryc. 3 - 2. Drzewa filogenetyczne jako mobile.

"Stopien wezla" podaje ile galezi od niego odchodzi. Jesli wiecej niz trzy (dwoch potomkow i jeden przodek) to mamy do czynienia z politomia. Politomia oznacza albo rownoczesna ewolucje w kilku kierunkach, albo nasza nieznajomosc filogenezy. Drzewo filogenetyczne mozna przedstawic w sposob liniowy np. (((A,B)C)(D,E)). Najprostszym drzewem filogenetycznym jest kladogram, ktory podaje stosunki pokrewienstwa pomiedzy OJT. Nie podaje natomiast odleglosci i nie definiuje wspolnych przodkow. Drzewo "addytywne" albo "metryczne" podaje odleglosci od wspolnych przodkow. "Drzewo ultrametryczne" (dendrogram) to takie drzewo w ktorym wszystkie wezly korony sa jednakowo oddalone od korzenia (ryc. 3 - 3). Odleglosci mozna podawac albo w ilosciach mutacji albo w latach. W tym drugim przypadku musi sie przyjac jakies zalozenie dotyczace zegara molekularnego.

0x01 graphic

Ryc. 3 - 3. Rozne typy drzew filogenetycznych : kladogram, drzewo addytywne, drzewo ultrametryczne

"Drzewa zakorzenione" maja wezel od ktorego pochodza wszystkie inne wezly. Drzewa niezakorzenione nie definiuja ewolucyjnego pokrewienstwa w ten sam sposob co drzewa zakorzenione. Nie definiuja one wspolnego przodka a sekwencje sasiadujace na drzewie niezakorzenionym niekoniecznie sa blisko spokrewnione. Np. orangutan i gibbon (O i B) sasiaduja na drzewie niezakorzenionym a sa bardziej oddalone od siebie niz O i H (Homo). Zalezy to bardzo od tego gdzie sie miesci korzen.

Z jednego drzewa niezakorzenionego o pieciu wezlach korony mozna skonstruowac siedem drzew zakorzenionych (ryc. 3 - 4).

0x08 graphic
0x01 graphic

Wiele metod rekonstruujacych pokrewienstwo filogenetyczne generuje drzewa niezakorzenione. Znalezienie korzenia wymaga specjalnych metod. Najprostsza polega na porownanie z jednostka taksonomiczna zewnetrzna w stosunku do badanych jednostek (outgroup). Na przyklad informacja o tym, ze B (gibbon) jest bardzo rozny od pozostalych gatunkow naczelnych pozwala przypuszczac, ze korzen drzewa filogenetycznego naczelnych znajduje sie na galezi, ktora laczy B z pozostalymi gatunkami. Drzewo 7 jest najbardziej prawdopodobne (ryc. 3 - 4). Ale w ten sposob nie mozna odnalezc umiejscowienia korzenia na drzewie zycia. Duplikacje genow rowniez daja informacje pozwalajaca na zakorzenienie drzewa, tak jak w przypadku genow alfa i beta globiny.

Ilosc mozliwych drzew zakorzenionych przy danej ilosci wezlow korony jest duzo wieksza niz ilosc drzew niezakorzenionych (Tabela 3 - 1).

0x01 graphic

Tabela 3 - 1. Ilosc mozliwych drzew filogenetycznych w zaleznosci od ilosci sekwencji

Mozna je wyliczyc z nastepujacych zaleznosci:

Un = (2n - 5) x (2n - 7) ……..(3)x(1) dla n>2 (U, unrooted, niezakorzeniony)

Rn = (2n - 3) x (2n - 7) ……..(3)x(1) dla n>3 (R, rooted, zakorzeniony)

Rn = (2n - 3) x Un

Ogolnie Rn = 1 x 3 x 5 x 7 x 9 x 11 x 13 x ………(itd. Wyrazenie to posiada n czynnikow).

135 ludzkich sekwencji DNA mitochondrialnego uzytego do badania filogenezy czlowieka daje 2,113 x 10267 mozliwych drzew zakorzenionych, co przekracza ilosc atomow we wszechswiecie. Pokazuje to jakie problemy obliczeniowe zwiazane sa z konstrukcja drzew.

Topologia drzewa genealogicznego, czyli jego ksztalt informuje o pokrewienstwie miedzy OJT. Wszystkie 105 drzew, ktore mozna otrzymac z 5 sekwencji daje 15 drzew zakorzenionych, ktore maja z kolei tylko trzy rozne topologie.

Rozszczepienie. Drzewo filogenetyczne (((C,H)G)(O,B)) moze byc rozszczepione na siedem roznych sposobow przez przeciecie jednej z galezi. Takie rozszczepienie daje dwie grupy sekwencji. Jednak 5 z tych rozszczepien jest nieinformatywnych poniewaz odszczepiaja jedna sekwencje od pozostalych. Wszystkie mozliwe drzewa beda zawieraly te rozszczepienia. Tylko dwa rozszczepienia sa informatywne, te mianowicie, ktore powstaja przez przeciecie galezi wewnetrznych

(1) (C,H)(G,O,B) oraz

(2) (C,H,G)(O,B)

Istnieja inne mozliwosci zgrupowan tych gatunkow np. (G,H)(C,O,B), ale sa one sprzeczne z drzewem filogenetycznym.

Rozszczepienie (1) mozna opisac nadajac arbitralnie litere np. A jednej grupie a np. T drugiej grupie.

H A

C A

G T

O T

B T

Takie oznaczenie przypomina nam zasady A i T. Przy rekonstrukcji drzewa korzysta sie z tej wlasnosci .

Rekonstrukcja historii zmiany cechy genetycznej lub fenotypu. Samo drzewo filogenetyczne nie mowi nic na temat zmiany cechy (takiej jak np. podstawienie nukleotydu czy zamiana jednego aminokwasu na inny) a w szczegolnosci na temat tego kiedy ta zmiana miala miejsce. Rozroznia sie ceche pierwotna (stan plesiomorficzny) lub ceche pochodna (stan apomorficzny). Jesli w drzewie istnieje tylko jedna cecha pochodna mowimy ze jest to autapomorfia. Jesli cecha (np. nukleotyd) obecna w roznych galeziach jest odziedziczona od bezposredniego wspolnego przodka mowimy o homologii, natomiast jesli ta sama zmiana zaszla w roznych galeziach mowimy o homoplazji. Ewolucja rownolegla zachodzi wowczas gdy w dwoch galeziach zachodzi identyczna zmiana z tego samego stanu poczatkowego. Jesli stan koncowy w dwoch galeziach jest taki sam, ale stan poczatkowy jest inny mowimy o ewolucji zbieznej (konwergencji). Jesli nastepuje powrot do stanu poczatkowego mowimy o utracie cechy.

Przodkowie. Wszystkie molekularne drzewa filogenetyczne zawieraja przodkow. Dotychczas uwazano, ze mozliwosc, ze ktoras ze znanych sekwencji moze byc identyczna z sekwencja wspolnego przodka (a wiec wspolnym przodkiem innych sekwencji) jest tak malo prawdopodobna, ze moze byc zaniedbana. Obecnie, gdy istnieje mozliwosc uzyskania sekwencji z gatunkow wymarlych, jak rowniez w przypadku gdy sledzimy szybka ewolucje wirusow, problem znany tylko paleontologom pojawil sie i w ewolucji molekularnej.

Sekw 1 Sekw. 2

A T

0x08 graphic
0x08 graphic

X (T lub A)

0x08 graphic

A

(sekw 3), (przodek)

Aby zdecydowac, ktora z sekwencji korony w powyzszym przykladzie jest pierwotna a ktora wtorna (jaki jest nukleotyd X w wezle od ktorego odchoda sekwencje 1 i 2) przyjmuje sie, ze sekwencja zawierajaca A jest pierwotna, poniewaz mozna otrzymac z niej cale drzewo wprowadzajac jedna zmiane (zasada oszczednosci - parsimony). Uznanie sekwencji (2) za przodka spowodowaloby koniecznosc wprowadzenia dwoch zmian.

0x01 graphic

Ryc. 3 - 5. Rozne drzewa filogenetyczne, ktore odpowiadaja temu samemu kladogramowi.

Kladogramy sa to takie drzewa w ktorych wszystkie jednostki taksonomiczne sa w koronie. Nie definiuje sie wspolnych przodkow niezaleznie od tego czy gatunek (sekwencja) wygasla czy nie. Nie zawiera on tez informacji o dlugosci galezi. Kladogram przedstawiony na ryc. 3 - 5 moze odpowiadac kilku drzewom, ale zawsze sekwencje A i B beda blizej ze soba spokrewnione niz kazda z nich z C.

A B C

0x08 graphic
0x08 graphic
Dlugosc galezi nic nie znaczy, moze byc rowna zeru.

Klasyfikacja kladystyczna uznaje tylko grupy monofiletyczne tzn. takie, ktore zawieraja wszystkich potomkow jednego przodka. Taka grupa nazywa sie kladem. Grupa niemonofiletyczna to np. malpy czlekoksztaltne gdyz wyklucza ona czlowieka. Grupa niemonofiletyczna « gady » wyklucza « ptaki ». Jest to grupa parafiletyczna i charakteryzuje sie autapomorfia. Ptaki maja morfologie bardzo rozna od krokodyli mimo, ze sa dosc bliskimi krewnymi. Grupa polifiletyczna to sepy. Sepy nowego swiata sa spokrewnione z bocianami a sepy starego swiata z innymi ptakami drapieznymi. Klasyfikacja kladystyczna jest niezalezna od szybkosci ewolucji i jest wewnetrznie niesprzeczna.

Drzewa metryczne. Odleglosci w drzewach filogenetycznych pomiedzy dwiema sekwencjami sa metryczne jesli spelnione sa nastepujace warunki.

(1) d(a,b) ≥ 0 (nieujemnosc)

(2) d(a,b) = d(b,a) (symetria)

(3) d(a,c)≤ d(a,b) + d(b,c) (odleglosc miedzy sekwencjami musi byc niewieksza niz suma odleglosci pomiedzy kazda z nich a trzecia sekwencja, mozliwosc skonstruowania trojkata)

(4) d(a,b) = 0 wtedy i tylko wtedy gdy a = b (roznicowanie)

Jesli jest spelnione dodatkowe kryterium

(5) d(a,b) ≤ maksimum [d(a,c) ; d(b,c)]

mamy wtedy do czynienia z drzewem ultrametrycznym. Jest ono rownoznaczne z tym, ze z trzech odleglosci ab, ac i bc, dwie najdluzsze sa sobie rowne.

Aby odleglosc byla wlasciwa miara zmian zachodzacych w czasie ewolucji musi zachodzic kryterium czterech punktow :

(6) d(a,b) + d(c,d) ≤ maksimum [d(a,c) + d(b,d) ; d(a,d) + d(b,c)] Jest ono rownoznaczne z wymogiem, zeby z trzech sum dwie najwieksze byly rowne.

Drzewa genow a drzewa gatunkow. Oczekiwanie ze strony molekularnych systematykow, ze drzewa filogenetyczne genow beda z koniecznosci pokrywac sie z drzewami filogenetycznymi gatunkow okazaly sie naiwne. Najwazniejsza z przyczyn dlaczego tak nie jest to duplikacje genow, ktore powoduja, ze gatunki zawieraja pewna ilosc roznych acz spokrewnionych sekwencji. Jesli mamy np. trzy gatunki A, B i C i porownamy tylko geny alfa z gatunku A i C z genem beta z gatunku B to mozemy dojsc do blednego wniosku, ze gatunki A i C sa blizej spokrewnione niz gatunki A i B (ryc. 3 - 6).

0x01 graphic

Ryc. 3 - 6. Paralogiczne i ortologiczne relacje w drzewie filogenetycznym

Tak wiec sekwencjonowanie jednego genu nie daje gwarancji poprawnej systematyki. W tym celu nalezy porownywac geny ortologiczne a wiec takie, ktore nie ulegly duplikacji od czasu wspolnego przodka. Geny nie spelniajace tego kryterium nazywamy paralogicznymi.

Rozdzial alleli. Allele sie lacza, gdy patrzac wstecz sledzimy ich ewolucje. Mimo, ze np. w gatunkach A i B mamy po dwa allele pochodzace od wspolnego przodka nie znaczy to, ze automatycznie sa to pary ortologiczne, poniewaz podczas specjacji do genotypu B mogl wejsc tylko allel 2, ktory nastepnie ulegl duplikacji. W tym przypadku tylko gen 2 z pierwszego gatunku wraz z genami 3 i 4 drugiego gatunku sa monofiletyczne.

Poprzez serie duplikacji i ekstynkcji sytuacja w genomach staje sie bardziej skomplikowana. (Ekstynkcja nazywamy znikniecie z genomu funkcjonalnej formy genu naskutek rekombinacji lub mutacji). Gdy porownanie roznych genow (sekwencji) daje rozne wyniki, konflikt rozwiazuje sie stosujac konsensus (uzgodnienie). Uzgodnione w ten sposob drzewo filogenetyczne wykazuje politomie.

0x08 graphic
0x08 graphic
H C G O B H C G O B H C G O B

0x08 graphic
0x08 graphic

konflikt politomia

Drzewo uzgodnione podsumowuje informacje zawarte w obu drzewach.

Sieci. Drzewa filogenetyczne sa tylko niedokladnym modelem rzeczywistosci. Prawdziwa historia ewolucji gatunkow nie jest drzewem o jednym korzeniu i galeziach, ktore nigdzie sie nie lacza. Po pierwsze, zawsze gdy organizmy plci przeciwnej sie lacza ich galezie zlewaja sie w jedna. To samo dotyczy i genow, ktore moga ulegac rekombinacji. W tym przypadku wlasciwiej byloby mowic o sieciach.

0x08 graphic
A B C

Mierzenie zmian genetycznych. Przy mierzeniu zmian genetycznych nalezy zwrocic uwage na to aby porownywac cechy homologiczne. Dwa nukleotydy w dwu roznych sekwencjach sa homologiczne wtedy i tylko wtedy, jesli obydwa zostaly odziedziczone od wspolnego przodka. Pojecie homologii nie zawsze jest tak jednoznaczne. Np. skrzydla nietoperza i ptaka sa homologiczne jako przedramiona, poniewaz obydwa odziedziczyly przedramiona od wspolngo przodka, ktory rowniez mial przedramiona. Nie sa jednak homologiczne jako skrzydla, poniewaz ich wspolny przodek nie mial skrzydel. Jako skrzydla wykazuja homoplazje. W przypadku genow rozroznia sie w zasadzie dwa typy homologii : ortologie, gdy geny pochodza od wspolnego genu - przodka. Gdy gen - przodek ulegl jednej lub wiekszej ilosci duplikacji mowimy o paralogii. Ksenologia zachodzi wowczas gdy gen przodek zostal przeniesiony z innego gatunku (transfer poziomy).

Lizozymy w przewodzie pokarmowym bydla domowego i malp roslinozernych pochodza od tego samego konwencjonalnego lizozymu. Natomiast lizozym u poludniowoamerykanskiego ptaka hoatzin jest paralogiczny w stosunku do tych pierwszych (ryc 3-7).

0x08 graphic
0x01 graphic

Gdy rozwazamy problem homologii musimy zdecydowac czy chodzi o homologie sekwencji czy funkcji. Wszystkie geny lizozymu sa homologiczne poniewaz pochodza od wspolnego przodka. Geny krowy i langura sa ortologiczne poniewaz pochodza od tej samej kopii lizozymu. Natomiast lizozym wiazacy wapn oraz lizozym konwencjonalny sa roznymi kopiami przodka lizozymu i dlatego sa paralogiczne.

Homologia sekwencji. Porownujac dwie sekwencje stwierdza sie niekiedy, ze sa one podobne. Aby moc ilosciowo okreslic to podobienstwo nalezy, po pierwsze odpowiedziec na pytanie, ktory nukleotyd w pierwszej sekwencji odpowiada ktoremu nukleotydowi w drugiej sekwencji. Dokonuje sie wiec przyszeregowania tych sekwencji (ang. alignment). Rzadko istnieje tylko jeden mozliwy sposob przyszeregowania. Np. w przypadku sekwencji ATGCGTCGTT i ATGCGTCGT mozliwe sa dwa przyszeregowania :

ATGCGTCGTT lub ATG---CGTCGTT

ATGCGTCGT ATGCGTCGT

W drugim przypadku w pierwszej sekwencji postulujemy przerwe o dlugosci trzech nukleotydow, ktora moze wyniknac albo z delecji albo z insercji (indel).

Porownujac sekwencje ATGCGTCGTT i ATCCGTCAT

ATGCGTCGTT

ATCCGTCAT

Stwierdzamy, ze w sekwencji zaszly substytucje

Aby moc wyrazic liczbowo jakosc przyszeregowania po to aby powiedziac ktore z nich jest lepsze wprowadza sie pojecie kosztu przyszeregowania.

D = s + wg

gdzie « s » oznacza liczbe substytucji, « w » koszt przerwy a « g » liczbe przerw. Gdy w = 1 wtedy koszt substytucji jest taki sam jak koszt przerwy. Nalezy zauwazyc, ze nie bierze sie pod uwage dlugosci przerwy. Istnieja inne formuly, ktore biora ja pod uwage. Przyszeregowanie sekwencji dokonuje sie w ten sposob aby jego koszt byl najmniejszy . Zalezy to bardzo od kosztu przerwy tak, ze w ostatecznym rachunku sposob przyszeregowania jest w pewnym stopniu arbitralny.

Popularnie stosowana metoda przyszeregowania jest wykres kropkowy (dot plot, ryc. 3- 8).

0x08 graphic
0x01 graphic

Dla sekwencji analizowanych w tym rysunku istnieja dwia rozne sposoby przyszeregowania podanych sekwencji :

AT--GCGTCGTT i ATGCGTCGTT

ATCCGCGTC ATCCG-CGTC

Koszt przyszeregowania kilku sekwencji bardzo zalezy od tego jak je przyszeregowujemy. Jesli porownujemy kazda sekwencje z kazda koszt przyszeregowania jest najwyzszy (ryc 3 - 9). Przy przyszeregowaniu gwiezdzistym eliminujemy czesc kosztu. Najwiekszy sens biologiczny ma przyszeregowanie typu drzewa filogenetycznego. Problem lezy w tym, ze nie zawsze zna sie jego topologie. W praktyce przyszeregowanie i filogenetyke dokonuje sie rownoczesnie.

0x01 graphic

Ryc. 3 - 9 Koszty roznych schematow przyszeregowania

Odleglosc genetyczna. Gdy porownujemy dwie sekwencje nukleotydowe zwykle stwierdzamy roznice odzwierciedlajace ewolucje tych sekwencji. Najczesciej wystepujace substytucje mozemy zaliczyc do jednego z szesciu zasadniczych typow. Moga one byc : pojedyncze, wielokrotne, rownoczesne, rownolegle, wspolbiezne i wsteczne (ryc. 3 - 10).

0x01 graphic

Ryc. 3 - 10. Przyklady roznych typow substytucji

Jesli liczba substytucji, ktora nastapila w sekwencji od czasu wspolnego przodka jest mala, wiekszosc z nich bedzie substytucjami pojedynczymi, poniewaz prawdopodobienstwo substytucji wielokrotnych lub rownoczesnych jest niewielkie. Sytuacja zmienia sie jesli ilosc substytucji jest duza. Wielokrotne substytucje moga zaciemnic przebieg ewolucji. W tym przypadku liczenie roznic pomiedzy sekwencjami prowadzi do niedocenienia ilosci zmian. Szczegolnie dotyczy to homoplazji wynikajacej z substytucji rownoleglych, wspolbieznych i wstecznych, gdyz sekwencje w tym przypadku sa identyczne mimo, ze zaszly w nich dwie lub trzy mutacje. Inny aspekt mutacji to zmiany typu nukleotydu. Puryna moze byc zastapiona przez puryne (tranzycja) lub przez pirymidyne (transwersja) (ryc. 3 - 11).

0x01 graphic

Ryc. 3 - 11. Tranzycja i transwersje.

Zwykle tranzycje sa znacznie czestsze niz transwersje. Ryc 3 - 12 przedstawia liczbe tranzycji i transwersji u przezuwaczy w odcinku DNA mitochondrialnego zawierajacym 684 pary zasad.

0x01 graphic

Ryc. 3 - 12. Akumulacja tranzycji i transwersji w genomie mitochondrialnym przezuwaczy.

Najprostszy sposob mierzenia odleglosci miedzy sekwencjami to liczenie miejsc nukleotydowych w ktorych sekwencje sie roznia. Jednak tylko dla bardzo podobnych sekwencji ten sposob da poprawna wielkosc. W miare uplywu czasu roznica miedzy sekwencjami staje sie coraz mniej dokladna miara odleglosci genetycznej ze wzgledu na wielokrotne substytucje, ktorym ulegaly sekwencje w miare oddalania sie od ostatniego wspolnego przodka. Naskutek efektu nasycenia wyniklego z wielokrotnych mutacji w tych samych pozycjach sekwencje bydla domowego i kozy, ktore oddzielily sie 20 milionow lat temu nie wykazuja wiekszych roznic niz bydla i antylopy kudu, ktore oddzielily sie 15 milionow lat temu. Zwazywszy, ze obserwowane bezposrednio odleglosci miedzy sekwencjami podaja zanizone odleglosci zmian zaszlych od czasu wspolnego przodka zaproponowano szereg technik, ktore wprowadzaje korekcje uwzgledniajace ten efekt. Modele roznia sie od siebie sposobami oceny prawdopodobienstwa ze w danym okresie czasu nastapila substytucja nukleotydu. Zakladaja one, ze (1) typ substytucji pozostaje ten sam i (2) sklad nukleotydowy (fN) pozostaje niezmieniony. Przyjawszy te zalozenia maciez substytucji mozna przedstawic nastepujaco.

0x01 graphic

gdzie pAC jest prawdopodobienstwem, ze w miejscu sekwencji w ktorym na poczatku znajduje sie nukleotyd A po czasie « t » znajdzie sie nukleotyd C. W wiekszosci modeli maciez jest symetryczna czyli pAC = pCA. Elementy przekatnej odpowiadaja przypadkom w ktorych zmiana pozornie nie nastapila, co nie znaczy, ze rzeczywiscie nie nastapila. Znaczy, ze na poczatku i na koncu okresu « t » znajduje sie tam ten sam nukleotyd. Jesli nukleotydom A,C,T i G przypiszemy numery 1,2,3 i 4, wartosc elementow po przekatnej wynosi

pAA = 1 - (pAT + pAC + p AG)

czyli piszemy

pi,i = 1 - ∑ij pi,j

Inaczej mowiac prawdopodobienstwo zaobserwowania nukleotydu A w danym miejscu, w czasie 0 i ponownie w czasie « t » wynosi 1 minus prawdopodobienstwo ze zmutuje on do C, G lub T.

Pierwszym modelem wprowadzajacym korekcje uwzgledniajaca wielokrotne substytucje, byl model Jukesa - Kantora. Jest to najprostszy model ewolucji zakladajacy, ze czestosc wystepowania zasad jest taka sama w porownywanych sekwencjach. W tym modelu odleglosc miedzy sekwencjami wynosi d [-3/4 ln(1 - 4r/3)] gdzie "d" jest iloscia nukleotydow w sekwencji "r" jest proporcja nukleotydow, ktore sa rozne w porownywanych sekwencjach w przeliczeniu na jeden nukleotyd. Mozna ten model przedstawic nastepujaco :

0x01 graphic

gdzie prawdopodobienstwo mutacji,  jest takie same dla wszystkich nukleotydow.

W przypadku bovidae przedstawionym na Ryc. 3 - 12, w sekwencji 684 nukleotydow po 20 milionach lat znajdujemy 100 roznic (tranzycje + transwersje). A wiec r = 100/684 = 0,15; 4r/3 = 0,2; 1 - 0,2 = 0,8; -3/4xln(1 - 4r/3) = 0,167; 684 x 0,167 = 114,2

Ostatecznie skorygowana odleglosc wynosi 114 nt.

Model K2P (Kimury dwuparametrowy) zaklada, ze podczas ewolucji tranzycje zachodza znacznie czesciej niz transwersje. Jesli ilosc tranzycji w jednostce czasu wynosi  a ilosc transwersji wynosi  to  = . Dla roznych typow sekwencji  jest rozne (9 dla mt. DNA, 1.75 dla 12S RNA, 0.66 dla  i β globiny i 2.70 dla pseudoglobiny η.

0x01 graphic

W tym modelu skorygowana odleglosc miedzy sekwencjami wynosi d{1/2ln[1/(1 - 2P - Q) + 1/4ln[1/1 - 2Q]} gdzie P i Q sa roznicami pomiedzy dwiema sekwencjami spowodowane odpowiednio tranzycjami i transwersjami, w przeliczeniu na jeden nukleotyd. W przypadku podanym na ryc. 3 - 12 dla sekwencji o dlugosci 684 nukleotydy, ktore ewoluowaly oddzielnie 20x106 lat i dla ktorych nieskorygowana odleglosc wynosi 80 tranzycji i 20 transwersji, skorygowana odleglosc wynosi 160 nt.

Model Felsensteina 1981 (F81) bierze pod uwage roznice w skladzie zasad. U bakterii te roznice moga byc znaczne (od 25 do 75% GC). Jesli pewnych zasad jest w sekwencji wiecej niz innych to mozemy oczekiwac, ze pewne podstawienia moga byc czestsze niz inne. Jesli w sekwencji jest malo G to jest male prawdopodobienstwo, ze mutacja nastapi wlasnie w G. Model ten zaklada jednak, ze w porownywanych sekwencjach sklad zasad jest taki sam.

Hasegawa, Kishino i Yano zaproponowali model, ktory jest synteza modeli K2P i F81 i ktory nazwany zostal HKY85. W tym modelu wprowadza sie zarowno poprawke na sklad zasad jak i na roznice w szybkosci akumulacji tranzycji i transwersji.

0x01 graphic

gdzie A,C,G,T jest proporcja nukleotydow (srednia) w porownywanych sekwencjach a  i  sa prowdopodobienstwami zajscia tranzycji i tranzwersji. Gdy zalozyc ze  =  HKY85 zamienia sie w F81, natomiast gdy A,C,G,T = 0.25, HKY 85 zamienia sie na K2P.

Porownano wyniki obliczen czestosci podstawien otrzymane przy uzyciu tych modeli z rzeczywista czestoscia podstawien. Model HKY85 daje wynik bardzo bliski rzeczywistosci (ryc. 3 - 13). Zaproponowano modele jeszcze bardziej skomplikowane. Wszystkie te modele zakladaja, ze

1. nukleotydy mutuja niezaleznie

2. szybkosc substytucji jest stala w czasie

3. sklad zasad jest w stanie rownowagi (nie ulega zmianom w czasie)

  1. prawdopodobienstwo substytucji jest stale w czasie i jest takie same we wszystkich miejscach w sekwencji.

Zalozenia te sa w niektorych przypadkach nieusprawiedliwione, co moze wprowadzac bledy w liczeniu czestosci podstawien.

0x01 graphic

Ryc. 3 - 13. Porownanie wynikow obliczen czestosci podstawien z danymi doswiadczalnymi.

Ad 1. Od zasady niezaleznosci akumulacji sekwencji zdazaja sie wyjatki. Na przyklad wtedy gdy DNA koduje RNA, ktory ma liczne petle. Substytucja w regionie, ktory tworzy petle dzieki sparowaniu zasad w RNA powoduje zmniejszenie stabilnosci. W takim przypadku mozna sie spodziewac mutacji kompensujacej. Jednak kompensacja moze nastapic tylko wtedy, gdy struktura typu petli tworzy sie w DNA podczas replikacji i system naprawy zle sparowanych zasad powoduje mutacje kompensacyjne.

Ad 2. Problem zmiany szybkosci akumulacji w czasie ewolucji jest jednym z najbardziej dyskutowanych problemow ewolucji molekularnej. Jesli w danej linii ewolucyjnej szybkosc ewolucji byla zmienna wtedy pojecie zegara molekularnego nie ma zastosowania. Porownujac akumulacje substytucji aminokwasow w bialkach z danymi paleontologicznymi dla glownych grup organizmow mozna powiedziec, ze hipoteza zegara molekularnego znajduje potwierdzenie. W wielu przypadkach stwierdza sie jednak znaczne odstepstwa od stalosci szybkosci ewolucji w czasie.

Ad 3. Sklad zasad jest w stanie rownowagi tylko w pewnych okresach w czasie ewolucji. Zwykle wystepuja odstepstwa od tego zalozenia co prowadzi do problemow w konstrukcji drzew filogenetycznych.

Ad 4. Metody obliczania odleglosci ewolucyjnej zakladaja, ze prawdopodobienstwo substytucji jest niezalezne od tego gdzie w sekwencji znajduje sie nukleotyd. Jest to z biologicznego punktu widzenia zalozenie bardzo nierealistyczne (ryc. 3 - 14). Istnieja metody, ktore biora ten problem pod uwage.

0x08 graphic
0x01 graphic

Drzewa filogenetyczne

-----------------------------------------------------------------------------------------------------------------

39

48

korzen

galaz

wezel wewnetrzny, hipotetyczny przodek

wezly korony (liscie)

Ryc. 3 - 14. Porownanie szybkosci akumulacji mutacji w roznych regionwch genomu.

Ryc. 3 - 4. Rozne mozliwosci zakorzenienia drzewa filogenetycznego naczelnych.

Ryc. 3 - 7 Paralogia i ortologia w genach lizozymu.

Ryc. 3 - 8. Wykres kropkowy (dot plot)



Wyszukiwarka

Podobne podstrony:
2009 03 26 prezentacja pochodne Nieznany
Maniek 2009-03-12 SC, Ściągi do szkoły, Zajęcia Specializujące
[C] Badania Operacyjne Zadania (2009 03 01)
2009 03 21 PZPN Egzamin Asystentow (2)
2009 03 15 pieniadz
farmacja 2009 03
2009 03 18 POZ 03id 26788 ppt
2009 03 04 POZ 01id 26786 ppt
29 Co nowego w znieczuleniu wziewnym 2009 03 Smiechowicz K
TIiK zadania 2009 03 27 V pol
2009 03 03
2009-03-04, pedagogium, wykłady, Teoretyczne podstawy wychowania, ćwiczenia
Elektronika Praktyczna 2009 03
2009-03-11, pedagogium, wykłady, Teoretyczne podstawy wychowania, ćwiczenia
39.2009-03-03 - DRGANIA MECHANICZNE prca na lekcjiIIB IIA, fizyka, 0, prace klasowe fizyka (monisia1
2009.03.16 test egzaminacyjny nr 4 IV liga
2009 03 19 19 19 mapa pradow morskich
Nauczyciel w prawie oswiatowym i wymagania kwalifikacyjne na sta, Ustawa o systemie oÂwiaty stan na
TIiK zadania 2009 03 20 IV pol

więcej podobnych podstron