BIOLOGIA MOLEKULARNA W.3 - 20.10, wykłady biologia molekularna


BIOLOGIA MOLEKULARNA Wykład 3 ( 20.10.2006)

Sekwencje obecne w genomie:

W genomie człowieka sekwencji powtarzalne to mniej więcej 45% w stosunku do całości genomu.

Sekwencje powtarzające się generalnie są trzech typów:

- sekwencje powtórzone tandemowo - jedna za drugą, takie same, wiele dziesiątek, a często setek tysięcy razy, te sekwencje nazywa się często satelitarnymi, wydaje się że niczego nie kodują, są zgrupowane w genomie w nielicznych miejscach w okolicach centromerów, telomerów.

- sekwencje rozproszone (rozproszone sekwencje powtarzalne) - kilka, najczęściej setki, tysiące czy miliony kopii, ale rozrzuconych po genomie, te sekwencje są dwóch rodzajów.

W obrębie genu sekwencje powtórzone (powtarzalne) również występują w miarę chętnie, raczej w intronach, gdzie w zasadzie to niczemu nie przeszkadza. Wbudowanie w obręb eksonu prawie na 100% ten zapis genetyczny likwiduje i taki gen staje się pseudogenem.

Alu - krótkie, rozproszone sekwencje powtórzone - short interspersed nuclear elements (SINES)

LINES - long interspersed nuclear elements

W genach globinowych, gdzie introny są krótkie, również występują sekwencje powtórzone, ale w okolicy tych genów, a nie w intronach. Pewnie dlatego, że introny w nich są krótkie.

Wyspy CpG - dinukletotyd CpG unikalny

CCGG - to, że to jest CCGG a nie CG to nie ma sensu biologicznego, to o to chodzi jak te sekwencje najprościej wykrywać? Mianowicie przez trawienie enzymami restrykcyjnymi, które rozpoznają te sekwencje i w zależności czy są zmetylowane czy nie - różnie tną - stąd ta czteronukleotydowa sekwencja. Tak naprawdę nas interesuje dinukleotyd CG. Wyspy CpG to nagromadzenie dinukleotydów CpG, często w okolicy promotora.

Wyspy matabolizmu podstawowego (housekeeping gene) - i one mają wyspy CpG.

Geny globinowe nie są powszechnie wyrażane - typową cechą genów specyficznych tkankowo czy specyficznych rozwojowo jest to , że one zazwyczaj nie mają wysp CpG.

Sekwencje powtarzalne (na ogół 2 rodzajów):

- albo to jest 1 lub 2, 3, 4 nukleotydu powtórzone jeden za drugim, kilka, kilkanaście czy kilkadziesiąt razy - SSL, SRS.

- albo transpozony (sekwencje zdolne do przenoszenia się w DNA) lub też ich resztki, ślady molekularne (coś co kiedyś potrafiło się przenosić, a teraz się już nie przenosi, ale jeszcze ślady widać) i ich jest w genomie najwięcej spośród sekwencji powtórzonych.

Transpozony dzielą się na 2 klasy:

Klasa 1 - takie, w których etapem pośrednim w przenoszeniu się jest RNA, siedzą w genomie w postaci DNA, ale kiedy się przenoszą to przez etap transkrypcji, a potem odwrotnej transkrypcji. Mają tę właściwość, że ich liczba może w genomie przyrastać, bo nowa kopia się wstawia w nowe miejsce, a oryginalna kopia siedzi tam, gdzie była.

Klasa 2 - nie przechodzą przez etap RNA - transpozony DNA i one się nie namnażają - one się przenoszą w genomie; w jednym miejscy się wycinają i przenoszą gdzie indziej, gdzie się włączają - czasami zostawiają po sobie jakieś ślady.

LINES:

SINES:

Retrowirusy:

W genomach różnych organizmów występują ślady różnych retrowisrusów.

Pojawia się problem przeszczepów narządów - transplantacji. Do nas najbardziej pasuje świnia (chodzi o wielkość narządów, metabolizm itd.) i są próby humanizowania świń (wprowadzania im antygenów powierzchniowych ludzkich zamiast świńskich). Ale świnia ma dużo świńskich retrowirusów w świńskim genomie;). Nie wiemy, czy jeśli wprowadzimy to do ludzkiego organizmu, to czy retrowirusy się nie uaktywnią na skutek bycia w innym środowisku (mogłyby się wyciąć i spowodować pandemię) - jest to poważny problem, który trudno badać.

Klasa 2 - transpozony DNA:

-nieautonomiczne

- autonomiczne:

Spośród SINES najwięcej jest sekwencji typu Alu - około 1 mln.

LINES - element L1- najwięcej, inne elementy DNA to marier, piggyback (ja nie wiem czy to się tak pisze)

Alu - najwięcej w genomie, reszta po retrotranspozycji 7SLRNA; 7SLRNA - cząsteczka RNA, która wchodzi w skład SRP (signal recognition particle) - cząstki nukleoproteinowej, która uczestniczy w trakcie translacji we wkładaniu powstającego białka do wnętrza cysterny retikulum endoplazmatycznego. W związku z tym na skutek odwrotnej transkrypcji 7SLRNA i wbudowania pojawiły się sekwencje Alu.

Nazwa Alu - kiedy endonuklezą restrykcyjną Alu pocięło się DNA, powstały maleńkie prążki (w wyniku cięcia tych miejsc).

Genom ryżu

Sekw. typu retrowirusowego w kukurydzy koło 20 %, u człowieka koło 8%.

Sekw. klasy 2 u ryżu są dużo obficiej występujące niż w genomie człowieka. W każdym organizmie te proporcje są różne. Wydaje się, że w zasadzie te elementy nie pełnią istotnej funkcji w genomach, a to ile ich jest możliwe, że jest kwestia ewolucyjnego przypadku.

• To wszystko są to elementy egoistyczne, które się namnażają kosztem genomu, w którym bytują i w zasadzie jakiejś istotnej funkcji temu genomowi nie nadają. Obecność powtórzonych sekwencji rozproszonych niesłychanie sprzyja rekombinacji (rekombinacja wymaga sekwencji homologicznych w 2 cząsteczkach DNA), a tu mamy dużo homologicznych sekwencji.

• Zdarza się czasami, że sekwencje powtórzone wchodzą w skład sekwencji kodującej białko.

• Zdarza się , że w obrębię sekwencji powtórzonych jest obszar o charakterze promotorowym - potrafi być wykorzystany przez genom gospodarza i wtedy sekwencja powtórzona zyskuje jakąś funkcję - to jest raczej rzeczą wyjątkową. Na ogół te sekwencje to po prostu śmieci, przy czym u nas to prawie połowa genomu

SSR, STR (short tandem repeats):

Sekwencja ACACACAC- kilkanaście razy powtórzone AC, spotykamy 30 razy na 1mln par zasad.

Istnieją specjalne białka, które rozpoznają te nietypowe struktury DNA wytworzone przez minisatelitarne układy tandemowe. Mogą one pełnić funkcje regulacyjne, ale bardzo mało o tym wiadomo. To jest swego rodzaju błąd ewolucji, ale błąd, który chyba bywa wykorzystywany.

Sekwencje są różnie rozpowszechnione, najczęściej występują di-, trinukletydy, w których jest A (także ciągi AAAA…), a np. GC - prawie tego w genomie nie ma, te są eliminowane przez ewolucję, z powodu metylacji DNA. Mikrosatelitarne układy występują z różną częstością.

Niektóre z nich mają tendencję do rozrastania się w genomie, co prowadzi do wielu chorób dziedzicznych, często chorób progresywnych (z każdym pokoleniem choroba się pogłębia np. choroba Huntingtona, Zespół Kruchego Chromosomu X itd.). Ekspansja trinukleotydów się pogłębia pogłębiając objawy choroby.

PARY GC:

Charakterystyczne jest to, ile genom zawiera par GC- w genomie człowieka średnio 40-42%. Ale to nie znaczy, że wszędzie jest tak samo, są obszary o dużo niższej i dużo wyższej zawartości par GC i często są to długie obszary rzędu milionów, dziesiątków milionów nukleotydów bogatych, bądź ubogich w pary GC. Jak popatrzeć jak ma się średnia zawartość par GC w przeciętnym genie i porównać zawartość par GC w genomie jako takim to w genach przeciętna zawartość par GC jest dużo większa niż w genomie jako całości (w genach wynosi ok. 50%).

Korelacja par GC z zawartością genów w genomie:

30 tys. genów w 3 miliardach bp, średnio 1 gen na 140 tys. nukleotydów. Jak gęsto są upakowane GC pomiędzy obszarami o największej zawartości par GC, a najniższej zawartości GC? Różnica jest kilkusetkrotna.

Tam, gdzie jest mało GC, tam jest mało genów; tam gdzie średnia zawartość GC w odc. DNA wynosi 60- 70 %, genów jest bardzo dużo. Geny lubią obszary bogate w pary GC. Jedną z przyczyn jest to, że przeciętna długość eksonów nie zależy od tego, jak dużo jest par GC. Przeciętny ekson ma 100 - kilkadziesiąt nukleotydów, ale gdy popatrzymy na introny, to widzimy, że w tych genach, w których jest mało GC, introny są bardzo długie.

Gdy przemieszczamy się do regionów genomu bogatych w pary GC to introny robią się coraz krótsze. A tam gdzie dużo GC w genomie, introny są krótkie: 200-300- 400 nukleotydów (czyli jak na genom człowieka są krótkie). Więc może więcej jest genów w obszarach bogatych w GC, bo się ich po prostu tam więcej mieści (mają krótsze introny, gen jako całość jest krótszy).

Jedną z przyczyn wydłużania się genów jest to, że w introny lubią się wbudowywać sekwencje powtarzalne, z rodziny LINES - długie sekwencje powtarzalne, ubogie w pary GC, (wydłużając je i obniżając zawartość par GC w nich). To są rzeczy słabo zrozumiane, mechanizmy niemalże nieznane.

Konsekwencją tego, że w genomach różnych organizmów bardzo długie bloki różnią się zawartością par GC jest to, że możemy w genomie wyróżnić tzw. izochory.

Gdy się wiruje długie kawałki DNA w gradientach gęstości soli cezu to okazuje się, że DNA rozdziela się na szereg prążków o różnej gęstości pławnej, różniących się zawartością par GC; jedne były lżejsze - L, inne cięższe - H. Izochory - obszary o takiej samej gęstości.

Izochora H3 - ta najcięższa, znajduje się na różnych chromosomach w genomie człowieka (ma najwięcej par GC).

Izochory lekkie o zawartości par GC poniżej średniej stanowią 60% genomu, ale zawierają 1/3 genów (ubogie w geny). Izochora H3 stanowi tylko 3 % genomu, ale zawiera aż 40% wszystkich genów.

W DNA bogatym w pary GC (odpowiadającym izochorze H3) jest 11 razy więcej genów, 11 razy gęściej są one upakowane niż w genomie jako całości.

W genomie człowieka są zarówno obszary, gdzie jest dużo genów o krótkich intronach i obszary gdzie genów jest mało, o długich intronach.

Jaka jest średnia ilość wysp CpG na 1 mln bp dla chromosomów? Ile średnio jest genów na 1 mln bp?:

Dla ogromnej większości chromosomów jest tyle samo genów, co wysp CpG. Wynika to z faktu, że geny mają swoje wyspy CpG, które leżą w regionie promotorowym genu. Ta reguła czasem się nie zgadza np. w chromosomie 19 (malutki chromosom), zawiera dużo genów, dużo izochory H3. Dużo bogatszy w pary GC niż inne chromosomy, ma wysp CpG dużo. Dużo genów, ale i CpG dużo więcej. Jest kilka takich chromosomów.

Generalnie wszystkie procesy (transpozycji, replikacji) mają tendencję do wyolbrzymiania zastanego stanu. Dodatnie sprzężenie zwrotne. Więc może skrajne przypadki to przypadek, powstający na skutek wyolbrzymiania zastanego stanu

Nie tylko ilość genów koreluje z zawartością par GC. Jest też zależność występowania sekwencji powtórzonych w zależności od tego czy odcinek jest ubogi, średniobogaty czy bardzo bogaty w pary GC.

Alu (SINES) lubią występować w obszarach bogatych pary GC, same też są bogate w pary GC. Długie sekwencje powtórzone LINES, L1,L2 - same dość ubogie w pary GC (a bogate w pary AT) lubią występować w odcinkach bogatych w pary AT. Te proporcje w różnych częściach genomu, pomiędzy genami a „niegenami”, pomiędzy różnymi rodzajami sekwencji powtórzonych też są różne.

U człowieka i u większości, zaawansowanych zwierząt płeć jest determinowana chromosomowo - występują chromosomy płci. Różne gatunki rozwiązały to w różny sposób. U człowieka, u wszystkich ssaków, u owadów (nie wszystkie - wyjątek: Drosophila) płeć męska jest płcią heterogametyczą (produkująca gamety 2 rodzajów- z chromosomem X lub Y). U Homo sapiens samiec jest heterogametyczny, samica jest homogametyczna (produkuje jajeczka z chromosomem X). Są liczne grupy taksonomiczne - ptaszki, gady, motylki, gdzie jest odwrotnie. Np. u ptaków chromosomy płci nazywają się Z i W. Kogut produkuje plemniki z chromosomem Z (homogametyczny). Jaja kury mają albo chromosom Z albo W.

Duże setki milionów lat temu chromosomy były identyczne między sobą, tworzące pary ze sobą, chromosomami somatycznymi. Na skutek zmian zaczęły one się rozchodzi i różnicować, przestały być homologiczne i to się stało z płcią - zaczęły one determinować płeć.

Chromosom X ma około 150 milionów par zasad. U samicy występuje inaktywacja połowy chromosomów X (jeden z 2 chromosomów X występuje jako ciałko Barra) . Chromosom Y ma około 50 milionów par zasad, zawiera mało genów.

Jest ogromna różnica pomiędzy X i Y - nie dochodzi pomiędzy nimi do rekombinacji. Tylko na samych końcach są króciutkie odcinki po kilka milionów par zasad (odcinki pseudoautosomalne) i tam zachodzi crossing over między X i Y. U samic crossing over X-X w czasie oogenezy zachodzi zupełnie normalnie. Dlatego chromosom X powstające zmiany może wyrównywać, kompensować. Chromosom X jest normalnym chromosomem. Ma troszkę mniej genów (80% średniej). Spośród tego tysiąca genów, które zawiera - jest cała masa genów, których mutacje powodują choroby (choroby dziedziczne), a w szczególności choroby umysłowe. Chromosom X zawiera około 4 % genów człowieka, 10% chorób umysłowych jest powodowanych przez mutacje w genach chromosomu X. 2,5 krotna nadreprezentacja genów związanych z naszą psychiką (chodzi zapewnie o to, że genów związanych z psychiką - odpowiedzialnych za cechy umysłowe jest 2,5 razy więcej niż średnio przypada na chromosom). Dlatego też panowie częściej chorują (nie mają drugiego X, działa to w przypadku mutacji recesywnych).

Gdy zdarzy się korzystny gen na X to, przenoszony przez mężczyznę, ma dużo silniejszą presję pozytywną (mężczyzna może mieć liczne potomstwo) niż gdyby był przenoszony przez kobietę. Z tego powodu ewolucyjnie geny leżące na X nabierały znaczenia. Tam się koncentrowały geny nadające ważne cechy, cechy umysłowe, psychiczne. Stąd ta koncentracja genów umysłowych na chromosomie X - dodatnia presja selekcyjna na facetów niosących dobre cechy umysłowe.

Chromosom Y jest 3 razy mniejszy od X. Ma około 80 genów kodujących białka (tak naprawdę różnych rodzajów białek jest około 20, z czego 11 rodzajów białek, to są białka specyficzne, bardzo preferencyjnie wyrażane w gonadach męskich). Naprawdę ważny jest jeden gen - SRY (przejęty i nieco zmutowany gen z chromosomu X) - „to jest to, co nadaje męskość.”

Ludzie w sensie zewnętrznym mogą się bardzo różnić. Jak głębokie jest podłoże genetyczne tych różnic?

- Szokująco małe. Różnice genetyczne pomiędzy osobnikami z wybranej losowo pary - te różnice są mniej niż jeden nukleotyd na tysiąc (0.1%). Jesteśmy prawie identyczni genetycznie, a różnice fenotypowe są ogromne. Nie ma żadnych większych różnic między przedstawicielami tzw. ras niż pomiędzy osobnikami z bardzo homogennej kaukaskiej rasy - to jest zawsze około 0.1%.

Nie ma większych różnic pomiędzy dowolnie wybranymi 2 rasami niż pomiędzy 2 dowolnie wybranymi osobnikami jednej rasy. Pomiędzy rasami są powtarzające się różnice w konkretnych genach.

Różnice genomowe, międzygatunkowe

Na poziomie sekwencji nukleotydowych różnice w mutacjach punktowych są rzędu 1.5- 2%.

Ale tylko na poziomie mutacji punktowych. Kiedy uwzględnimy znacznie częstsze mutacje typu indel (insercje, delecje) to różnica między genomem szympansa i człowieka na poziomie mutacji punktowych + indeli już jest w okolicy 5%. Genom człowieka i genom szympansa jest w 95% identyczny - to prawda, ale to nie prawda, że my się różnimy tylko 2-5% genów. Przecież gen ma setki lub tysiące nukleotydów. Jeżeli w tysiącu nukleotydów 5 % jest różnych to znaczy, że w większości genów pomiędzy człowiekiem a szympansem są różnice, tylko że to są różnice na poziomie 1-2 aminokwasów. Tak na prawdę grubo ponad 50 % genów człowieka i szympansa koduje różne białka - one się różnią, najczęściej, ale ta różnica jest minimalna. Tak, wiec różnimy się bardzo wieloma genami, ale te geny różnią się pomiędzy sobą bardzo mało.

Skąd się wzięły geny? Dlaczego genomy wyglądają tak, jak wyglądają? (należy patrzeć w kontekście ewolucji)

Genom prostej bakterii:

Ilustracja genomu Bacillus subtilis (około 400 genów). Jak porównujemy geny między sobą, to mniej więcej połowa tych genów to sieroty - pojedyncze geny. Druga połowa to geny, które występują w rodzinach. Rodziny mogą być różnej liczności, najmniejsza rodzina to dwa geny podobne do siebie.

Paralogi - 2 podobne geny występujące w jednym organizmie

Homologi - 2 podobne geny

Rodziny:

500 genów występuje w parach

200 kilkadziesiąt to rodziny trójgenowe

100 - to rodziny czterogenowe

Jedna rodzina - podobnych do siebie 77 genów.

Takie rodziny występują już w genomach prostych bakterii. Skąd się biorą?

- z rozmnażania, geny potrafią się rozmnażać. Był 1 gen danego rodzaju, teraz są 2. Można by sobie wyobrazić, że w pragenomie było 10 genów i jeden z nich na skutek:

-Nierównego crossing over

-Błędu polimerazy

-Transpozycji

dał brata bliźniaka - gen o identycznej funkcji.

Jeden z nich mógł zacząć swobodnie mutować, (co komórce nie przeszkadzało, bo były 2 takie same), nabywając ciekawych właściwości, i zacząć kodować coś nowego. Jeśli zmiana była korzystna, utrwaliła się w ewolucji. Uważa się, że nowe geny powstawały w ten sposób.

Możemy sprawdzić, że geny występujące w rodzinach mają podobne funkcje i zapewne mogą się trochę zastępować.

Eksperymenty genomiczne mają to do siebie, że badacze dysponują pełnym opisem obiektu, który badają. Badając genom mamy pełną informację o tym genomie - pełną sekwencję nukleotydową. Kiedyś robiono badania genetyką klasyczną (od fenotypu do genu). Teraz jest odwrotnie - najpierw mutujemy konkretne miejsce, potem badamy, co ta mutacja spowodowała. Absolutna rewolucja w nauce. Niewyobrażalnie dużo informacji.

Geny drożdżowe:

- unikatowe

- geny mające paralogi

Efekt letalny jest na ogół przy genach pojedynczych (unikatowych). Gdy rozwalamy jeden z paralogów, efekt jest często bardzo mały lub go brak.

Robiąc podobne doświadczenia z Mycoplasma genitalium (bakteria o najmniejszym genomie, ma 460 genów) ludzie próbowali dociec, ile i które geny są niezbędne do funkcjonowania komórki. Mniej więcej 250 genów (może 350) spośród tych 460 genów jest niezbędnych, by komórka żyła i funkcjonowała. W tej chwila są próby skonstruowania sztucznie komórki z minimalną ilością genów.

Spośród tych około 300 genów, około 100 nie wiemy do czego służą. Chociaż są odpowiedzialne za najbardziej podstawowe funkcje komórki, w dalszym ciągu nie wiemy, co 1/3 z tych genów robi.

Nowe geny mogą pojawiać się nie tylko na skutek podwojenia się pojedynczych genów, ale także na skutek powielania się całych zestawów genowych (rodzin genowych) - klasycznym przykładem jest ewolucja globin. Duplikacja jakiegoś genu czy rodziny (pra-alfa, pra- beta, łańcuchy). Gen beta się zduplikował. Potem się znowu zduplikował i powstał zestaw 5 genów, z których jeden najczęściej ulega zepsuciu - jest pseudogenem. Taki zestaw 4 genów (rodzina) się duplikuje, a czasami dzieje się to kilka razy i w genomach współczesnych ssaków mamy albo 2 takie geny - zestawy rodzin genów globinowych klasy beta albo nawet 3 takie zestawy. Duplikacje całych rodzin genowych. (spisałam to, co słyszałam i zdaję sobie sprawę, że to jest zaplątane jakieś)

Duplikacje nie sprowadzają się tylko do tego, że z jednego powstają 2 geny. Tych duplikacji może być niesłychanie dużo. Mogą się tworzyć ogromne rodziny genowe. Przykład: receptory hormonów: Człowiek, Caenorhabditis, Drosophila.

Rodziny genowe, które w stosunkowo krótkim czasie namnożyły się niesłychanie, np. u robaka jeden z takich genów występuje w 200 wersjach, a u wspólnego przodka (robaka, człowieka i muszki) była jedna taka kopia. Dla robaka gen ten okazał się ważny w rozwoju. Grupa tych genów koduje różne receptory jądrowe. U człowieka inny gen się namnożył bardziej, u muchy inny. Procesy takie zachodzą w skali ewolucyjnej bardzo szybko. Taka znana rodzina to geny kodujące kinazy białkowe. U Saccharomyces cerevisiae jest ponad 100 genów kodujących kinazy białkowe, a powstały z jednego genu. U człowieka tych genów jest koło 1 tys. Kinazy białek są potrzebne i użyteczne ewolucyjnie.

Takim duplikacjom mogą podlegać nie tylko geny lub rodziny genów, ale całe kawałki chromosomów.

Np. u drożdży ogromne obszary, które są homologiczne, np. chromosom 10 i 11 - występują na nich bardzo podobne sekwencje, długie dziesiątki lub setki tysięcy nukleotydów, rozrzucone (czasami w jednym chromosomie, ale czasami w różnych chromosomach) całe wielkie bloki. Tak więc w ewolucji przenoszą się całe fragmenty chromosomów. To nie jest tylko cecha drożdży. Mnóstwo jest tych powtarzających się bloków, zarówno w obrębie chromosomów jak i pomiędzy chromosomami.

Takie powtarzające się duże bloki w różnych chromosomach mogą wynikać z dwóch przyczyn:

- chromosomy się łamią, łączą, przenoszą między sobą fragmenty

- albo w ewolucji cały genom uległ powieleniu i komórki potomne miały dwa razy więcej genów niż powinny, cały genom zduplikowany.

Nie ulega wątpliwości, że takie procesy duplikacji całych genomów zachodziły wiele razy. Wiadomo, że u drożdży też była taka sytuacja. Sacharomyces lactis zachował pierwotny genom w mało zmienionej formie, ale kiedyś uległ on duplikacji, potem ogromna część została zatracona, ale niektóre fragmenty nadal zostały. Pozostały jedynie ślady na to, że kiedyś te geny występowały w 2 wariantach. Więc również całe genomy podlegały duplikacji, to się działo stosunkowo niedawno, bo np. w ewolucji ryb.

WGD - whole genome duplication

Afrykańska żaba szponiasta Xenopus laevis - tetraploid, tworzy diploidalne gamety, trudno jest ją zmutować, obiekt badań embriologicznych.

W bakteriach genomy się tasują, przenoszą, przemieszczają. Przenoszą się całe wyspy tzw. wyspy patogenezy (moim zdaniem tu o wyspy patogenności chodzi) - wywołujące choroby, przenoszą się z jednego gatunku do innego. Genomy są płynne i nieustabilizowane. Geny skaczą z miejsca na miejsce - robi się kompletna „sieczka”, w tym pomagają sekwencje transpozycyjne, które często zabierają jeszcze jakieś dodatkowe sekwencje ze sobą (czasami przenosi się jakaś sekwencja pomiędzy jednym transpozonem a drugim). Ruszają się i sklejają chromosomy.

Metody badań:

Metoda hybrydyzacji fluorescencyjnej sond z chromosomami -FISH. ZOOFISH - gdy sondę bierze się z jednego gatunku i hybrydyzuje z innym.

FISHe: To, co lemura jest w jednym miejscu, u człowieka jest w kilku miejscach porozsiewane. Chromosomy człowieka to składanki kawałków. Człowiek i mysz: chromosomy ludzkie o dowolnym numerze są składanką w stosunku do chromosomów myszy. Wszystko w ewolucji jest ruchome i płynne. Mysz ma praktycznie centromery na samym końcu chromosomów - telocentryczne. Zaś chromosomy człowieka są metacentryczne albo akrocentryczne.

Na poziomie chromosomów również występuje tasowanie. Na ogół nie ma to znaczenia (choć czasem regulacyjne). Np. chromosom Philadelphia, który przenosi onkogen pod silny promotor - wywołuje to dziedziczną chorobę nowotworową.

Prawidłowości w ewolucji genów:

- długości eksonów u eukariontów są podobne

ciekawa tendencja, że u człowieka nie występują długie eksony, u muchy i robaka są.

- introny u człowieka - prawie nie ma krótkich intronów; u muchy i robaka prawie nie ma bardzo długich intronów, a więc to jest zasadnicza różnica pomiędzy wysoko postawionymi organizmami, a tymi niższymi, prostszymi.

Interesującym modelem do badań porównawczych, genomicznych jest rybka fugu (Fugu rubripes). Ma mały genom - 400 tys. par nukleotydów, człowiek ma 3 miliony.

Gdy się porówna jakiś gen u człowieka i u fugu, jest pewna homologia. Takie same eksony poprzecinane intronami w tych samych miejscach. Gen człowieka jest 8 razy dłuższy niż fugu, dokładnie tak samo, jak genom człowieka jest 8 razy dłuższy niż genom fugu i bierze się to z długości intronów (nie do końca - jeszcze kwestia sekwencji powtórzonych). Długość intronów i obfitość sekwencji powtórzonych są to zasadnicze elementy powodujące że jedne genomy są zwarte i upakowane, a inne nie.

Mnóstwa informacji możemy wyciągnąć porównując całe genomy. Drzewka ewolucyjne powstałe na podstawie całych genomów.

Drożdże są między sobą tak odległe ewolucyjnie jak człowiek od najprostszego tkankowca. Ale łatwiej badać dwa gatunki drożdży niż jakieś inne organizmy mało spokrewnione. Stąd wnioski z genomów drożdżowych w pewnym sensie można przenosić na ewolucję genomów zwierząt, bo mniej więcej tyle samo czasu minęło od rozejścia się poszczególnych linii rozwojowych.

Badania doświadczalne dające nam wiadomości o funkcjonowaniu genomu:

Mamy zapis genomu, ale nie wiemy, do czego to generalnie służy. Czyli np. szukamy miejsc odpowiedzialnych za wiązanie czynników transkrypcyjnych. Jeśli zrobimy czyste przeszukanie: bierzemy genom drożdżowy i znamy, jakie sekwencje nukleotydowe są rozpoznawane przez konkretne czynniki transkrypcyjne i szukamy takich sekwencji. One zwykle mają miedzy 8 a „małe” - kilkanaście par nukleotydów , szukamy tej sekwencji w genomie. Gdy znajdziemy - czy to znaczy, że wszystkie z nich służą do wiązania czynnika transkrypcyjnego? - raczej nie.

Można popatrzeć na blisko spokrewnione genomy, czy te sekwencje tak się zachowały. Jeżeli pełnią funkcje wiązania czynnika transkrypcyjnego, to pewnie się w ewolucji zachowały. Gdy będą swobodnie ewoluowały, to nie służą do wiązania czynnika. Czy wszystkie te konserwowane sekwencje służą do wiązania czynników transkrypcyjnych?

Trzeba zrobić doświadczenie. Z tych konserwowanych ewolucyjnie miejsc tylko kilka będzie rzeczywiście wiązało czynniki transkrypcyjne. Analiza jednego genomu daje nam informację zakłamaną, analiza porównawcza genomów bardzo nam tę informację zawęża, odrzucając rzeczy, które są przypadkowe, ale nie daje dowodu, że to jest funkcjonalne miejsce. To wykrywamy przez doświadczenie - albo przez mutagenezę albo przez sprawdzenie biochemiczne - czy siada i wiąże te wszystkie miejsca czynnik transkrypcyjny.

Podobną analizę zrobiono dla genomu człowieka - popatrzono na różne miejsca, które powtarzają się w różnych miejscach genomu i co więcej, są konserwowane wśród kręgowców. Znaleziono mnóstwo miejsc. Było wiele wiązanych przez znane czynniki transkrypcyjne. Znaleziono często występujące, silnie konserwowane sekwencje, która na 100% pełnią funkcje regulatorowe (bo jest silnie konserwowana i ma wiele cech sekwencji regulatorowej), ale do tej pory nie wiemy, jaki czynnik transkrypcyjny wiąże. Takie doświadczenia (czysto informatyczna analiza) pomagają nam szukać nowych bytów ekologicznych. Tzn. wiemy jaka jest sekwencja i próbujemy znaleźć te hipotetyczne czynniki transkrypcyjne.

Dokładnie taka samą analizę zrobiona dla obszarów na końcach 3' genów i znaleziono sekwencje wysoce konserwowane ewolucyjnie, a więc pełniące jakieś funkcje, które pasowały swoimi właściwościami do miRNA. (miRNA - gorący temat ostatnich lat, niebywale istotna droga kontroli regulacji genów.) U człowieka znaleziono kilkaset takich nowych potencjalnych miRNA. Wiadomo, że u myszy i u ryby uczestniczą one w regulacji rozwoju i pewnie u człowieka też pełnią taką funkcję. Nie mając żadnych przesłanek o charakterze fenotypowym, żadnych przesłanek o charakterze biochemicznym , tylko z analizy sekwencji potrafimy wywnioskować pewne rzeczy. Tylko potem zawsze trzeba sprawdzić doświadczalnie czy to ,co wygląda na funkcjonalną sekwencję, jakąś funkcję pełni.

6 tys. genów drożdży chcemy sprawdzić, gdzie białka kodowane przez te geny lokują się w komórce. Jak to zrobić?

Można przyłączyć do ramki odczytu GFP (zielone fluorescencyjne białko) i patrzeć jak każde białko się lokalizuje. Jest to trochę kłopotliwe, bo trzeba każde 6 tys. genów zmodyfikować (6 tys. szczepów). I potem obejrzeć. Nie wszystkie się udały, ale generalnie większość tak. W ten sposób udało się określić położenie w komórce (a to jest mocna przesłanka o funkcji białka). W sumie w stosunku do ponad 5 tys. genów wiemy, gdzie wędruje ich produkt białkowy. Połowa z tych białek to są białka o znanej lokalizacji, o których już wcześniej wiedzieliśmy. (SD baza drożdżowa, dane o drożdżach.)

Czyli prawie 2 tys. nowych informacji mamy dzięki temu podejściu.

Wyłącznie dokonując analizy in silico, znając sekwencje wszystkich genów, możemy zgadywać, jakie reakcje komórka prowadzi. Niebywała oszczędność czasu, nakładów. To nie jest dowód, że ona takie reakcje prowadzi, ale przesłanka, że może potrafić.

Znając sekwencje genomu możemy prowadzić doświadczenia z tzw. mikromatrycami DNA. Możemy mieć na szkiełko nakropione takie nanoplamki - każda zawiera sondę molekularną, kawałeczek DNA odpowiadający danemu genowi. Możemy otrzymać totalne RNA z komórek np. zdrowego osobnika i drugiego osobnika. Wyznakować te dwa preparaty jeden na zielono, drugi na czerwono i hybrydyzować z mikromatrycą. Plamki czerwone to jest gen, który był wyrażany np. tylko w osobniku chorym, plamki zielone odpowiadają genowi, który był eksprymowany tylko w osobniku zdrowym (kolory w zależności od wcześniejszego wyznakowania). Żółte to wyrażane tu i tam. Tutaj też badamy wszystkie geny organizmu, bo znamy wszystkie geny. Nawet nie wiedząc, do czego one są.

Metody mikromatrycowe są teraz na ogromna skalę wykorzystywane do diagnostyki medycznej np. do odróżniania różnych typów nowotworów. Na wczesnym etapie rozwoju nowotwory są histopatologicznie nierozróżnialne, a wiemy że są rożne, różnie odpowiadają na terapię. I człowieka leczy się „na czuja” pewnym zestawem leków. Na bardzo wczesnych etapach rozwoju nowotworu można zrobić biopsję i zrobić taką mikromatrycę, cofając się historycznie do próbek martwych pacjentów, o których wiemy, na jakiego raka umarli. Można porównać. I wiemy, że ten typ nowotworu daje charakterystyczny wzór ekspresji genów. W ogóle nie musimy wiedzieć, co to są za geny. Patrząc na wzór ekspresji genów z biopsji potrafimy powiedzieć od razu, jaki typ nowotworu ma dana osoba i możemy ją skuteczniej leczyć właściwymi lekami.

Możemy również zainteresować się genami, które są charakterystycznie eksprymowane. Zbadać je, poznać ich funkcję, szukać specyficznych leków. Znajdujemy białko, badamy strukturę, próbujemy modelowo dopasować rożne cząsteczki leków. Próbujemy znaleźć lek, który hamuje dane białko. Jak je zahamujemy, może będziemy mogli leczyć daną chorobę.

Genom to nie jest wyznacznik fenotypu, to jest tylko potencjalnie to, co jest w nim zapisane. Może być zrealizowane, ale nie musi - w zależności jakie geny się wybierze, taki jest fenotyp.

11



Wyszukiwarka