BUDOWA I FUNKCJA GENOMU LUDZKIEGO
Magdalena Mayer
Katedra i Zakład Genetyki Medycznej UMj w Poznaniu
1. Projekt poznania genomu człowieka:
Cele programu:
- skonstruowanie szczegółowych map fizycznych i genetycznych całego
genomu człowieka,
- zlokalizowanie wszystkich genów w obrębie genomu człowieka,
- wypracowanie metod przechowywania i udostępniania uzyskanych
danych; ulepszenie metod sekwencjonowania,
- uzyskanie wiedzy na temat skutków społecznych, ideologicznych i
etycznych nowych technologii genetycznych.
15 luty 2001 – odczytanie genomu ludzkiego
2003 r. – podsumowanie działalności programu, ogłoszenie kompletnych
sekwencji genomu
2. Genom-budowa
Genom - całkowity DNA komórki lub organizmu, obejmujący zarówno
wszystkie geny, jak i odcinki międzygenowe.
Genom zawiera około 20000 - 25000 genów, ale odcinki kodujące stanowią
tylko 1-3% całego genomu.
Około 30% stanowią sekwencje ulegające transkrypcji oraz sekwencje związane
z genami. Pozostała część genomu to różne klasy sekwencji powtarzających
(repetytywnych) oraz sekwencje unikatowe.
Geny i sekwencje związane z genami to: eksony, introny,
pseudogeny, fragmenty genów, sekwencje regulatorowe, sekwencje
początkowe i końcowe genów.
Pozagenowy DNA to: sekwencje unikatowe, sekwencje powtórzone
(repetytywne).
Typy sekwencji powtórzonych:
1) Sekwencje powtórzone rozproszone (transpozony i retrotranspozony)
- długie LINE (ang. long interspersed nuclear element) długie rozproszone
sekwencje jądrowe; sekwencje o długości około 6,4 kb. Najbardziej znana to
sekwencja LINE-1
- krótkie SINE (ang. short interspersed nuclear element) - krótkie rozproszone
sekwencje jądrowe – sekwencje o długości około 100-400 bp. Najbardziej
znana to sekwencja Alu.
2) Sekwencje powtórzone tandemowe (zwarte)
- satelitarne – większość powtórzeń występuje w regionach
centromerowych chromosomu, odgrywając tam prawdopodobnie funkcję
strukturalną; powtórzenia dochodzą do setek tysięcy par zasad,
- minisatelitarne – fragmenty długości sięgającej 20 kbp, z powtarzającą się
jednostką długości około 25 bp; występują najczęściej w telomerach lub
w pobliżu końców chromosomu; funkcja nieznana
- mikrosatelitarne – powtórzenia krótkie, zwykle poniżej 150 bp, a
jednostka powtórzona to 1-, 2-, 3-, 4 pary zasad; funkcja nieznana.
Powtórzenia tego typu znalazły zastosowanie jako marker molekularny
(np.ustalanie profilu genetycznego – kryminalistyka).
Ź
ródło:
Przykłady analiz DNA (pod redakcją
Ryszarda Słomskiego), Wydawnictwo AR w
Poznaniu, Poznań 2004; zmodyfikowano
20-25tys. genów
3.
Budowa fizyczna genomu.
Genom jądrowy:
- zbudowany z około 3 Gp (3 miliardy par zasad)
- złożony z 24 różnych dwuniciowych liniowych cząsteczek DNA –
chromosomów
- zakres wielkości cząsteczek (chromosomów) od 55 Mbp do 250 Mbp
- wśród chromosomów wyróżniamy autosomy i heterosomy
Genom mitochondrialny:
- zbudowany z około 16 kbp (dużo mniejszy niż genom jądrowy)
- kolista dwuniciowa cząsteczka DNA
- występuje w mitochondrium w kilku kopiach
- obecny we wszystkich mitochondriach
- obecny w wielu kopiach w komórce (mamy wiele mitochondriów w
jednej komórce)
Genom jądrowy Genom mitochondrialny
Ź
ródło: Human Molecular Genetics wyd.3, Strachan T, Read AP,
Wysoce
konserwatywne
(kodujące sekwencje)
Wysoce konserwatywne (inne)
Powtórzenia związane z transpozonami
Heterochromatyna
Inne, nie-konserwatywne
1%
3%
45%
7%
44%
2%
93%
5%
4. . Gęstość genów
Ś
rednia gęstość występowania : 1 na 450pz w genomie mitochondrialnym
1na 40-45kpz w genomie jądrowym
5. . Rodziny genów
Klasyczne rodziny genów
Geny należące do klasycznych rodzin genów wykazują wysoki stopień
homologii sekwencji nukleotydowych. Geny te kodują białka zawierające
wysoce konserwatywne, duże domeny lub krótkie konserwatywne
motywy np.:
Rodzina genów
Liczba genów Domeny/motywy
konserwatywne
Geny homeobox
Geny PAX
Geny SOX
38
9
8
Homeodomena składająca
się z 60 aminokwasów
Domena składająca się ze
128 aminokwasów
Domena składająca się z 69
aminokwasów
Superrodziny genów
Geny należące do superrodzin kodują produkty o podobnym znaczeniu
funkcjonalnym i wykazują jedynie niewielki stopień homologii sekwencji
nukleotydowych. Przykładem mogą być:
Superrodzina immunoglobulin
Superrodzina globin
6. . Nakładanie się genów i geny wewnątrz genów
W niektórych regionach chromosomów, w których zagęszczenie genów jest
duże a sekwencja jest bogata w pary GC mamy do czynienia ze zjawiskiem
nakładania się genów (ang. overlapping genes). Przykładem mogą być geny
kompleksu HLA w chromosomie pary 16 (lokalizacja 16p21.3)
Przykładem występowania genów wewnątrz innego genu jest gen NF1
zawierający w obrębie swojej sekwencji intronowej trzy inne, mniejsze
geny: OGMP, EVI2B i EVI2A. Geny ulegają transkrypcji z nici
antysensownej, w przeciwieństwie do genu NF1, który transkrybowany jest
z nici sensownej.
7. . Mapowanie genomu
Mapowanie fizyczne:
- przypisanie genów specyficznym miejscom (locus) na chromosomie
- dla ustalenia pozycji genów na chromosomach wykorzystuje się
następujące techniki biologii molekularnej: mapowanie restrykcyjne,
mapowanie STS (sekwencje unikatowe), FISH (fluorescencyjna
hybrydyzacja in situ)
- jednostką mapowania fizycznego jest para zasad (bp)
Mapowanie genetyczne:
- ustalenie względnego położenia genów poprze pomiar tendencji dwóch
genów do bycia przekazywanymi (segregowania) razem w czasie mejozy,
- podstawą mapowania genetycznego jest zjawisko rekombinacji, które
zostało odkryta przez Morgana,
- pozwala na identyfikacje genów tylko na podstawie ich efektu
fenotypowego, bez znajomości sekwencji oraz funkcji białka,
- techniką wykorzystywaną w tworzeniu map genetycznych jest analiza
sprzężeń, która wymaga stosowania markerów genetycznych, czyli
sekwencji charakterystycznych, które są wystarczająco silnie sprzężone z
genem, ze dziedziczą się razem, a rekombinacja między nimi (genem, a
markerem) zachodzi niezwykle rzadko,
- stosowane markery to najczęściej markery RFLP (polimorfizm długości
odcinków restrykcyjnych), SSLP (polimorfizm długości prostych
sekwencji), SNP (polimorfizm pojedynczych nukleotydów),
- analiza sprzężeń wymaga badań rodzinnych (badanie DNA wielu
członków rodziny)
- prawdopodobieństwo sprzężenia szacuje się na podstawie metody
statystycznej zwanej lod score (logarytm szans)
- jednostka mapowania genetycznego jest centymorgan (cM), czyli procent
prawdopodobieństwa rekombinacji.
8.
Bioinformatyka
Bioinformatyka jest dziedziną zajmującą się stosowaniem narzędzi
matematycznych i informatycznych do rozwiązywania problemów
biologicznych. Ważnymi aspektami tej dziedziny jest modelowanie białek,
badania genetyczne, symulacje ewolucyjne.
Bioinformatyka w genetyce:
Bazy danych
Analiza sekwencji kwasów nukleinowych
Wyszukiwanie sekwencji homologicznych
Identyfikacja sekwencji regulatorowych i otwartych ramek odczytu
(ORF)
Translacje sekwencji kwasu nukleinowego do sekwencji
aminokwasowej
Identyfikacja i wyszukiwanie białek w bazach danych
BAZY DANYCH:
• USCS Genome Browser, Ensemble - - umożliwiają wyszukiwanie genów,
sekwencji, sekwencji homologicznych, polimorfizmów, rejonów ewolucyjnie
konserwatywnych, dane dotyczące ekspresji genów
•
• NCBI –
www.ncbi.nih.gov/
www.ncbi.nih.gov/
www.ncbi.nih.gov/
www.ncbi.nih.gov/
- zawiera bazy danych dotyczące:
- BLAST – odszukiwania homologicznych sekwencji
- ENTREZ – wyszukiwania struktur białkowych
- PubMed – baza literaturowa
- OMIM – katalog chorób genetycznych