W2 - ORGANIZACJA GENOMÓW
Genom to pełny zapis genetyczny - całość informacji genetycznej (materiału genetycznego) danego organizmu lub komórki: to zespół (zbiór, suma) wszystkich genów oraz wszystkich sekwencji niekodujących DNA. Termin ten wprowadził w 1920 r. niemiecki botanik Hans Winkler. Genom to kompletny zestaw informacji genetycznej danego organizmu (zapis wszystkich informacji zawartych w DNA, specyficzny dla każdego organizmu): to biologiczna instrukcja organizmu (ściślej: informacje o danym organizmie zapisane w DNA każdej komórki tego organizmu). Genom to genetyczna struktura określonego organizmu lub komórki.
Badaniem całych genomów oraz analizą funkcjonowania zawartych w nich genów zajmuje się genomika. Genomika jest działem biologii molekularnej i jest pojęciem szerszym aniżeli genetyka: łączy bowiem nauki biologiczne z matematyką i informatyką - jest nierozłącznie związana z zastosowaniem bioinformatyki. Termin „genomika” wprowadził w 1986 r. Thomas H. Roderick. Warto podkreślić, że porównanie sekwencji genomów różnych organizmów ujawnia wspólne dziedzictwo życia.
I. Rodzaje genomów
U Prokaryota występuje brak jądra komórkowego, a genom stanowi pojedyncza kolista cząsteczka DNA nie posiadająca wolnych końców. Pierścieniowy chromosom bakteryjny (nukleoid) składa się z superskręconych pętli DNA oraz z niewielkiego rdzenia białkowego. Superskręcenie stanowi idealny sposób upakowania kolistej cząsteczki DNA w niewielkiej przestrzeni. Genomy Prokaryota zawierają od kilkuset do kilku tysięcy genów: ich wielkość najczęściej nie przekracza 5 milionów par zasad (Mz).
U Eukaryota materiał genetyczny jest zamknięty w jądrze komórkowym (które jest wypełnione nukleoplazmą i jest oddzielone od cytoplazmy otoczką jądrową składającą się z dwóch blon i posiadającą pory jądrowe) oraz w takich organellach jak mitochondria i chloroplasty. Genom Eukaryota tworzą genom jądrowy, zawierający większość informacji genetycznej, oraz genomy organellowe, w których znajduje się niewielka część całkowitego DNA komórki: dlatego też często używa się pojęcia „genom” tylko w odniesieniu do genomu jądrowego. Genom jądrowy składa się z wielu liniowych cząsteczek DNA tworzących chromosomy i tworzy wysoce upakowaną oraz uporządkowaną wielopoziomową strukturę, powstającą w wyniku oddziaływania DNA z białkami (histonami). Genomy organellowe (mitochondrialne i chloroplastowe) mają formę kolistych cząsteczek DNA i swoją budową przypominają genomy organizmów prokariotycznych: jednak mitochondria i chloroplasty, w odróżnieniu od bakterii, mają po kilka cząsteczek DNA. Organellowy DNA ma zdolność samodzielnej replikacji, niezależnej od replikacji DNA chromosomalnego.
W mitochondrialnym DNA występują geny kodujące mt tRNA, mt rRNA oraz niektóre podjednostki białek łańcucha oddechowego (m.in. dehydrogenazy NADH w kompleksie I, cytochromu b w kompleksie III i oksydazy cytochromowej w kompleksie IV). Mitochondrialny DNA wykazuje wyższą częstotliwość mutacji (nawet 10-krotnie) niż DNA jądrowy, bo nie jest połączony z histonami i w mitochondriach brak enzymów systemów naprawczych DNA. To zjawisko jest przydatne w badaniach ewolucyjnych różnicujących populacje.
Charakterystyka mt DNA człowieka: jest dziedziczony w linii matczynej (żeńskiej); składa się z 2 do 10 kolistych cząsteczek DNA; zawiera około 17 kpz oraz około 40 genów; geny są ułożone w sposób ciągły (brak intronów); jest transkrybowany i wykorzystywany przez mitochondrium w całości; jego kod genetyczny wykazuje pewne odstępstwa od kodu standardowego (kodon UGA oznacza tryptofan, a nie STOP; kodony AGA i AGG oznaczają STOP, a nie argininę; kodon AUA oznacza metioninę, a nie izoleucynę); nie jest połączony z histonami, w wyniku czego jest bardziej narażony na działanie mutagenów; jest także narażony na powstające in situ wolne rodniki pochodzenia tlenowego.
Genomy chloroplastowe u roślin zawierają więcej genów niż genomy mitochondrialne. Chloroplastowy DNA zawiera geny kodujące ct tRNA, ct rRNA oraz geny około 50 białek.
Nie wszystkie białka obecne w mitochondriach i chloroplastach są kodowane przez organellowy DNA: znaczna część tych białek jest bowiem syntetyzowana w cytoplazmie i jest kodowana przez jądrowy DNA (np. mtDNA koduje tylko 13 z 67 polipeptydów obecnych w mitochondrium).
II. Wielkość genomów
Wielkość genomu zależy od gatunku i wyraża się liczbą zasad, które wchodzą w jego skład.
GATUNEK |
WIELKOŚĆ GENOMU [Mz = mln par zasad] |
Escherichia coli drożdże traszka Caenorhabditis elegans muszka owocowa pies koń domowy człowiek mysz groch kukurydza pszenica szachownica, rzodkiewnik |
około 5 12 84 90 140 2 400 2 700 3 000 3 300 4 800 5 000 17 000 120 000, 125 000 |
Wielkość genomów eukariotycznych jest zróżnicowana i jest cechą gatunkową. Ilość DNA w genomie danego gatunku często jest zupełnie nie skorelowana z poziomem rozwoju ewolucyjnego tego gatunku (z jego pozycją na „drabinie ewolucyjnej”) - jest to tzw. paradoks zawartości DNA. Nie można więc oceniać stopnia skomplikowania organizmu tylko na podstawie wielkości jego genomu.
III. Genom jądrowy - chromosomy
Genom jądrowy składa się z wielu liniowych cząsteczek DNA, które w połączeniu z białkami tworzą odrębne chromosomy. Są to stałe i samoodtwarzające się składniki jądra komórkowego, złożone z DNA ściśle połączonego z dużą ilością białek. Termin „chromosom” wprowadził w 1884 roku niemiecki anatom H. W. Waldeyer. Liczba chromosomów w komórce, ich kształt i wielkość są stałe i charakterystyczne dla danego gatunku. Chromosom eukariotyczny ma postać liniową. W każdym chromosomie eukariotycznym znajdują się następujące wyspecjalizowane sekwencje DNA: miejsca inicjacji replikacji; centromer - przewężony obszar chromosomu mitotycznego będący miejscem połączenia dwóch siostrzanych chromatyd oraz tworzenia kinetochorów oraz telomery, końcówki chromosomu występujące na jego obu końcach i wyznaczające regiony końcowe każdej chromatydy. Centromer dzieli chromatydy na dwa ramiona, umożliwia rozdzielenie nowo powstałych chromosomów do komórek potomnych (stanowi miejsce przyczepu chromosomu do wrzeciona mitotycznego) i jest najbardziej skondensowanym regionem chromosomu. Telomery (z greckiego telos - koniec i meros - część) zabezpieczają chromosomy przed skracaniem podczas kolejnych cykli podziałowych, są połączone z białkami (które chronią DNA przed degradacją), a replikują się z udziałem telomerazy (odwrotnej transkryptazy odkrytej w 1984 roku). Telomeraza sprawia, że telomery odtwarzają się z każdym podziałem komórki w całości. W 2009 roku Nagrodę Nobla z fizjologii i medycyny przyznano Elizabeth Blackburn, Carol Greider oraz Jackowi Szostakowi właśnie za odkrycia wyjaśniające, w jaki sposób telomeraza zabezpiecza prawidłowe odtwarzanie się chromosomów w czasie podziału komórki. Dowiedziono już, że telomeraza w żywych komórkach bierze udział zarówno w procesie ich starzenia się, jak i w procesie nowotworzenia. Położenie centromeru jest stałe dla danego chromosomu i stanowi podstawę podziału chromosomów na 4 typy morfologiczne: chromosomy metacentryczne, submetacentryczne, akrocentryczne (z redukcją krótkiego ramienia) i telocentryczne (pozbawione krótkiego ramienia). U ludzi chromosomami metacentrycznymi są chromosomy 1., 3., 16., 19. i 20.; chromosomy submetacentryczne to 2., 4., 5., 6., 7., 8., 9., 10., 11., 12., 17., 18. i X; a chromosomy akrocentryczne to 13., 14., 15., 21., 22. i Y. Prawidłowy kariotyp człowieka nie zawiera chromosomów telocentrycznych. Liczba chromosomów jest cechą charakterystyczną danego gatunku.
GATUNEK |
LICZBA CHROMOSOMÓW |
muszka owocowa Caenorhabditis elegans żaba drożdże mysz człowiek szympans krowa pies kura langusta skrzyp polny |
2 x 4 2 x 6 2 x 13 2 x 16 2 x 20 2 x 23 2 x 24 2 x 30 2 x 39 2 x 39 2 x 50 2 x 54 |
Morfologię chromosomów (ich liczbę i kształt) opisuje kariotyp. Jest to kompletny zestaw ułożonych w pary chromosomów homologicznych, charakterystyczny dla danej komórki, organizmu lub gatunku. Kariotyp jest cechą gatunkową, ale także osobniczą. Podstawę uporządkowania chromosomów w kariotypie stanowią: ich wielkość, położenie centromerów oraz specyficzny wzór prążkowy powstający w wyniku wybarwiania. Graficzną formą kariotypu jest kariogram.
Liczba chromosomów w komórkach danego organizmu nie jest skorelowana ani ze stopniem skomplikowania, ani z wielkością genomu tego organizmu: o cechach gatunku i jego zawansowaniu ewolucyjnym nie świadczy liczba chromosomów, ale zawarta w nich informacja. Jest to odzwierciedlenie zdarzeń ewolucyjnych, które ukształtowały strukturę genomów w różnych organizmach.
IV. Genom jądrowy - stopnie upakowania chromatyny
Chromatyna to interfazowa (międzypodziałowa), rozproszona i rozciągnięta postać chromosomów. Stanowi wysoko zorganizowany kompleks DNA i białek (głównie histonów) oraz niewielkich ilości RNA:ma postać sieci włókien nukleoproteidowych. Struktura i skład białkowy chromatyny ulegają znacznym zmianom w czasie cyklu komórkowego (w czasie podziału komórki tworzy strukturę chromosomów). Euchromatyna to tzw. chromatyna funkcjonalna, czyli słabo barwiąca się, aktywna transkrypcyjnie część chromatyny ulegająca despiralizacji (dekondensacji). Natomiast heterochromatyna to w pełni skondensowana (nie ulegająca despiralizacji), silnie barwiąca się i nieaktywna transkrypcyjnie część chromatyny występująca głównie wokół centromerów oraz w telomerach. Podstawę podziału na hetero- i euchromatynę stanowi różny stopień kondensacji regionów chromatyny. Zagęszczenie chromatyny zależy od fazy cyklu życiowego komórki: w interfazie chromatyna jest najbardziej rozproszona, natomiast w chromosomach metafazowych - najbardziej skondensowana.
Genom komórki eukariotycznej, ze względu na swoją wielkość, musi być ściśle upakowany w jądrze komórkowym. Wiadomo już, że łączna długość DNA w jądrze typowej komórki człowieka wynosi około 2 m. Natomiast stopień kondensacji DNA w chromosomie mitotycznym człowieka osiąga 10 000 razy. Ścisłe upakowanie DNA w chromosomach umożliwiają histony, które wraz z owiniętą wokół nich nicią DNA (o długości około 150 pz) tworzą nukleosomy. Histony są białkami jądrowymi (stanowiącymi 40-50 % składu chromatyny) o charakterze silnie zasadowym (lizyna i arginina stanowią do 30% wszystkich aminokwasów), które działają jako polikationy. Histony są białkami tkankowo i gatunkowo niespecyficznymi: cechuje je ogromna zachowawczość struktury - są to najbardziej konserwatywne białka u Eukaryota! Histony tworzą pięć klas: H1 (łącznik nukleosomowy), H2a i H2b (histony brzegowe), H3 i H4 (histony dzeniowe). Dwa tetramery histonów brzegowych i rdzeniowych tworzą globularny rdzeń każdego nukleosomu. Owinięcie DNA wokół rdzenia nukleosomów stanowi pierwszy stopień upakowania chromatyny. Struktura nukleosomów jest najprostszym i najlepiej poznanym poziomem upakowania DNA.
V. Liczba genów w genomie
Liczba genów w genomie danego organizmu nie decyduje o jego złożoności. Istota „złożoności” organizmu tkwi nie tylko w liczbie posiadanych genów, lecz przede wszystkim w precyzyjnej regulacji działania genów.
GATUNEK |
LICZBA GENÓW |
Escherichia coli drożdże muszka owocowa Caenorhabditis elegans pies i kot krowa rzodkiewnik człowiek mysz Ryż |
4 300 6 500 14 000 19 000 19 000 22 000 25 000 „tylko” 25 000 30 000 40 000 |
U kręgowców nowe możliwości rozwoju organizmy zdobywają zazwyczaj poprzez doskonalenie mechanizmów regulacyjnych. Jeśli nawet pojawiają się nowe geny, są one jedynie wariantami już istniejących. Kluczowe znaczenie dla konstrukcji złożonych organizmów ma hierarchiczne (kaskadowe) włączanie poszczególnych genów, czyli złożoność i zawiłość koordynacji ekspresji genów. Złożoność naszego gatunku wynika nie tyle z liczby genów, co z bardzo skomplikowanej regulacji ich działania, np. na podstawie tej samej informacji komórka potrafi wyprodukować różne białka w zależności od aktualnych potrzeb.
VI. Struktura genów organizmów eukariotycznych
Geny organizmów eukariotycznych są genami nieciągłymi: informacja o sekwencji aminokwasów nie jest ciągła, lecz jest poprzerywana odcinkami niekodującymi. Nieciągłą strukturę genów i ich mozaikową budowę odkryli w 1977 roku Anglik Richard J. Roberts i Amerykanin Phillip A. Sharp, którzy za to odkrycie otrzymali Nagrodę Nobla w 1993 roku. Sekwencje kodujące w naszych genach to eksony, sekwencje niekodujące w obrębie genu to introny. Geny mają różną długość i różnią się liczbą oraz wielkością intronów. W naszych genach względnie krótkie eksony występują naprzemiennie z długimi intronami: eksony są oddzielone od siebie intronami. Tylko niewielką część jądrowego DNA stanowią geny. W genomie człowieka tylko 3-5 % DNA (około 90 Mz) stanowią sekwencje kodujące (eksony), czyli geny. Większość DNA jądrowego stanowią sekwencje niekodujące: wyjaśnienie ich dokładnej roli wciąż jest przedmiotem badań. Niektóre obszary DNA jądrowego nie są w ogóle wykorzystane i stanowią jedynie balast przenoszony z pokolenia na pokolenie. Jednak wiele sekwencji niekodujących ma istotne znaczenie dla funkcjonowania komórki (i organizmu). Geny w genomie są rozproszone i nie są rozłożone równomiernie w poszczególnych chromosomach. W niektórych regionach genomu geny występują częściej, a w innych znacznie rzadziej: pewne fragmenty genomu wcale nie zawierają genów - np. sekwencje DNA w centromerach i telomerach.
VII. Podział DNA jądrowego człowieka
Szacuje się, że w genomie człowieka geny i sekwencje związane z genami stanowią około 30% jądrowego DNA. Do sekwencji niekodujących związanych z genami należą: introny, sekwencje początkowe (liderowe) i sekwencje końcowe (ogonowe) genów; pseudogeny oraz fragmenty genów. Pseudogeny to niefunkcjonalne (nie kodujące białka) kopie genów funkcjonalnych, które wykazują znaczną homologię z genami, lecz są nieaktywne (najczęściej z powodu mutacji). Pseudogeny nie podlegają transkrypcji i dalszej translacji.
W genomie człowieka DNA intergenowy (międzygenowy, pozagenowy) stanowi aż 70% jądrowego DNA. DNA intergenowy dzieli się na sekwencje unikatowe i o małej liczbie kopii (DNA unikalny i niskokopiowy) oraz na sekwencje powtórzone (repetetywne), które występują w genomie w wielu kopiach.
Typy DNA repetetywnego w genomie człowieka:
powtórzenia tandemowe (zespolone): zblokowane, seryjne powtórzenia (kopie) krótkich sekwencji, położonych bezpośrednio jedna za drugą; większość tych powtórzeń znajduje się w centromerach i telomerach
powtórzenia rozproszone rozmieszczone nierównomiernie w całym genomie.
Typy DNA powtórzonego tandemowo w genomie człowieka:
DNA satelitarny: motywy zawierające od 100 do 6500 nukleotydów
DNA minisatelitarny: motywy zawierające 10-100 nukleotydów; VNTR (variable number of tandem repeats - zmienna liczba tandemowych powtórzeń) to polimorfizm sekwencji minisatelitarnych
DNA mikrosatelitarny: proste powtórzenia tandemowe wielkości 2-10 nukleotydów; STR (short tandem repeats - krótkie powtórzenia tandemowe) to polimorfizm sekwencji mikrosatelitarnych.
Nazwa „DNA satelitarny” powstała na podstawie analizy wyników wirowania preparatów DNA w gradiencie gęstości chlorku cezu - po wirowaniu ten typ DNA tworzy jednorodną frakcję w postaci dodatkowego prążka (pasma satelity) o mniejszej gęstości pławnej od prążka głównego DNA.
Długości i liczba różnych sekwencji mini- i mikrosatelitarnych w genomie człowieka stanowią charakterystyczną cechę osobniczą: wykazują one bowiem u ludzi niezwykle dużą zmienność (wysoki polimorfizm, duże zróżnicowanie międzyosobnicze) i dlatego różnią się znacznie między poszczególnymi osobnikami. Porównywanie sekwencji mini- i mikrosatelitarnych u różnych osób pozwala np. na ustalenie ojcostwa lub na identyfikację zwłok. U osób nie spokrewnionych te sekwencje występują w różnych loci i w różnej liczbie powtórzeń. Dlatego też minisatelity i mikrosatelity stanowią doskonałe markery genetyczne i są używane jako unikatowe sondy w technice genetycznego odcisku palca (genetic fingerprinting), zastosowanej po raz pierwszy w 1985 roku w Anglii przez Aleca Jeffreysa. Sekwencje mini- i mikrosatelitarne są sekwencjami o bardzo wysokim stopniu zmienności, które - podobnie jak odciski palców (linie papilarne) w tradycyjnej daktyloskopii - są w stanie niezawodnie rozróżnić wszystkich osobników w populacji ludzkiej, dając możliwość identyfikacji ludzi. Duża zmienność sekwencji (różnice w liczbie tandemowych powtórzeń) mini- i mikrosatelitarnych w genomie poszczególnych osób to przykład genetycznego polimorfizmu (wielopostaciowości) populacji ludzkiej. Analiza sekwencji mini- i mikrosatelitarnych stała się powszechnie stosowanym narzędziem w medycynie sądowej i w genetyce populacyjnej, a DNA wydaje się najlepszym z dostępnych nam narzędzi identyfikacji ludzi. Techniki genetycznej daktyloskopii są wykorzystywane do ustalania dla poszczególnych osób ich indywidualnych profili genetycznych, czyli charakterystycznych, unikatowych wzorów fragmentów DNA. Profilowanie genetyczne stało się metodą identyfikacji ludzi oraz ustalania ich pokrewieństwa: im osoby są bliżej spokrewnione, tym ich profile DNA są bardziej podobne.
Typy powtórzeń rozproszonych w genomie człowieka:
elementy LTR (long terminal repeats): to długie, końcowe powtórzenia
sekwencje SINE (short interspersed nuclear elements): to krótkie rozproszone elementy jądrowe o wielkości 100-500 nukleotydów; należą do nich m.in. sekwencje Alu o długości 300 nukleotydów i występujące w genomie ludzi w liczbie od 500 000 do 1 000 000 kopii
sekwencje LINE (long interspersed nuclear elements): to długie rozproszone elementy jądrowe o wielkości rzędu tysięcy nukleotydów i występujące w genomie ludzi w liczbie od 20 000 do 100 000 kopii
transpozony: to krótkie fragmenty DNA wykazujące zdolność przemieszczania się
(transpozycji) w obrębie całego genomu danej komórki; ruchome elementy genomu (mobile genetic elements); ważne źródło zmienności genetycznej; odkryte w latach 40. XX w. przez amerykańską genetyczkę Barbarę McClintock, która prowadziła badania nad dziedziczeniem barwy nasion kukurydzy i w 1983 roku została uhonorowana Nagrodą Nobla.
Podsumowanie
Genomy są strukturami dynamicznymi i plastycznymi (a nie statycznymi i sztywnymi), ponieważ ewoluują w czasie na skutek skumulowanych efektów zmian sekwencji wywołanych przez rekombinacje (doprowadzające do ciągłego przetasowywania układów alleli i powstawania różnych nowych kombinacji genotypów), mutacje (odpowiadające za tworzenie się zupełnie nowych alleli danego genu i nowych genów) oraz transpozycje (czyli przemieszczanie się fragmentów genomu).
Precyzja informacji genetycznej zależy od stabilności, ale całkowita stabilność oznaczałaby statyczne trwanie i ograniczenie rozwoju nowych form życia w odpowiedzi na zmiany zachodzące w środowisku. Dlatego też genomy muszą być (i są) przedmiotem zmian.
Gdyby nie było rekombinacji, genomy byłyby stosunkowo stabilnymi strukturami, podlegającymi bardzo niewielkim zmianom. Po upływie dłuższego czasu stopniowa akumulacja mutacji prowadziłaby do niewielkich zmian w sekwencji genomu, jednak większe rearanżacje, za które odpowiada rekombinacja, nie zachodziłyby. Potencjał ewolucyjny genomu byłby poważnie ograniczony.
11