1
dr Paweł Golik
dr Ana Stanković
mgr Mateusz Baca
mgr Hanna Panagiotopoulou
Analiza naturalnych populacji – ekologia molekularna. Analiza DNA w
archeologii. Genetyka w kryminalistyce.
Nawiązując do poprzednich ćwiczeń, na których była mowa o mitochondrialnym
DNA i jego użyciu jako markera przy ustalaniu różnych chorób genetycznych, chcielibyśmy
również przedstawić pojęcie markera genetycznego. Omówimy wykorzystywanie markerów
genetycznych w różnych dyscyplinach: genetyce populacji, genetyce ochronnej, archeologii i
kryminalistyce.
Marker genetyczny
Markerem genetycznym nazywamy każdą sekwencję nukleotydową, której
polimorfizm (występowanie w postaci przynajmniej dwóch łatwo rozróżnialnych alleli)
pozwala na ustalanie różnic genetycznych pomiędzy osobnikami i grupami
taksonomicznymi.
Rodzaje markerów genetycznych
SNPs (ang. single nucleotide polimorphism)– mutacje punktowe (tranzycje i transwersje) w
sekwencji nukleotydowej. Zaletą ich analizy jest ich ogromna liczba w genomie - u człowieka
kilka milionów. Wykrywanie SNPs opiera się na analizie hybrydyzacji z oligonukleotydami
(krótkie zsyntetyzowane chemicznie jednoniciowe cząsteczki DNA (poniżej 50 bp), które
będą hybrydyzowały jedynie przy pełnej komplementarności z badaną sekwencją DNA.
SSLP (ang. simple sequence lenght polimorphism) są szeregami powtórzeń sekwencji - a
więc różnymi allelami zawierającymi różną liczbę jednostek powtarzalnych. Podstawą
zmienności są indele (delecje lub insercje). Aby ustalić homologię dwóch sekwencji
nukleotydowych wykonujemy ich przyrównanie (uliniowanie), czyli tzw. ang. alignment).
2
Podczas przyrównania sekwencji nie można odróżnić od siebie delecji od insercji. Nadaje im
się zatem wspólną nazwę indele].
• Minisatelity-VNTR (ang. variable number of tandem repeats) – jednostka
powtarzająca się, złożona z kilkudziesięciu nukleotydów (10-100 bp).
• Mikrosatelity – STR, msDNA (ang. simple tandem repeats), czyli proste powtórzenia
tandemowe, w których powtarzalny motyw złożony jest z 2 do 6 bp (np. CAAG, TGA
lub CA). Typowe loci mikrosatelitarne zawierają 10-30 (maksymalnie. 50) powtórzeń
motywu i osiąga długość 100 do 400 bp. Zlokalizowane są najczęściej w regionach
niekodujących genomu.
Allele (warianty długości jednego locus) mikrosatelitów są koodominujące i
dziedziczą się w sposób mendlowski. Jeśli mamy do czynienia z 2 identycznymi
allelami w locus, to taki osobnik jest dla tego locus homozygotą. Jeśli allele są różnej
długości – heterozygotą.
Ze względu na ich budowę, w mikrosatelitach często zachodzą mutacje.
Powtórzenia tandemowe powodują, że polimeraza DNA „ślizga się” (ang. polimerase
slippage), dodając lub opuszczając najczęściej pojedyncze powtórzenie, wydłużając
lub skracając tym samym sekwencję mikrosatelitarną. Oblicza się, że częstość
występowania mutacji w tych markerach u ssaków wynosi ok. 10
-2
– 10
-4
na
pokolenie. Jest ona zmienna u różnych grup organizmów i wyższa u zwierząt niż u
roślin. Im więcej powtórzeń znajduje się w danym allelu mikrosatelitarnym, tym
większe prawdopodobieństwo jego mutacji. Stąd po pewnym czasie dla danego locus
Powtarzaj
ący się motyw np. ATCG
osobnik1
osobnik2
osobnik3
Rys 1. Budowa loci
mikrosatelitarnych
3
(odcinka DNA) obecnych będzie wiele alleli. W związku z szybkim tempem mutacji
mikrosatelity są bardzo dobrym markerem do badań populacyjnych.
Zastosowanie badań genetycznych w ekologii
Od około 20 lat techniki genetyczne są wykorzystywane w badaniach ekologicznych,.
przede wszystkim do ustalania polimorfizmu genetycznego populacji. Czynniki i procesy
ekologiczne determinują strukturę genetyczną. W latach 70. i 80. XX wieku badano przede
wszystkim polimorfizm allozymów. W latach 90. nastąpił gwałtowny rozwój zastosowania
techniki PCR i sekwencjonowania. Obecnie w badaniach populacyjnych wykorzystuje się
najczęściej niekodujące sekwencje DNA, podlegające minimalnie lub wcale presji selekcyjnej
(doborowi naturalnemu). Sekwencje te są z reguły wysoce polimorficzne. Należą do nich w
jądrze sekwencje mikrosatelitarne (msDNA). Z sekwencji mitochondrialnych w badaniach
głównie. Filogeograficznych i populacyjnych wykorzystuje się D-loop oraz cytochrom b
(będący wysoce polimorficznym genem).
. Informacje uzyskane w oparciu o analizę sekwencji mtDNA i msDNA wykorzystuje się w
badaniach nad migracjami gatunków, określania efektywnej wielkości populacji, stopnia
przepływu genów, polimorfizmu genetycznego populacji, jej heterozygotyczności,
pokrewieństwa osobników, dystansu genetycznego między populacjami, przejścia populacji
przez wąskie gardło itd. Pamiętać należy, że mitochondrialny DNA dziedziczy się wyłącznie
w linii matczynej, w związku z czym jego analiza dostarcza informacji dotyczących jedynie
części populacji (samic lub kobiet). W zależności od charakteru badań wykorzystuje się
jeden lub obydwa wyżej opisane markery molekularne.
Replikacja
Poślizg
Nowy cykl replikacji
+ 1 motyw
- 1 motyw
Rys 3. Przykład poślizgu polimerazy podczas replikacji
(http://www.scielo.br/img/revistas/gmb/v29n2/a18fig02.gif)
4
Genetyka ochronna (ang. Conservation genetics).
Zgodnie z powszechnie akceptowanymi zasadami ekologii na świecie, restytucję bądź
ochronę gatunków powinna poprzedzać staranna analiza genetyczna, której wyniki pozwalają
ocenić, czy zakres polimorfizmu genetycznego zachowanych lub introdukowanych populacji
jest wystarczający dla powodzenia projektu ochronnych. Zastosowanie metod genetycznych
pozwala poznać różnorodność (polimorfizm genetyczny) populacji, jak i określić przepływ
genów między populacjami. Możliwe jest także ustalenie stopnia i obecności hybrydyzacji
pomiędzy gatunkami autochtonicznymi a pokrewnymi, introdukowanymi przez człowieka.
Wiedza ta jest niezbędna dla prawidłowej odbudowy populacji gatunku, który na danym
obszarze kiedyś występował lub umożliwienie naturalnego jej odrodzenia się. Wyżej opisane
działania zyskały nazwę conservation genetics – w wolnym tłumaczeniu „genetyka ochronna”
(Hedrik, 2001). Genetyka ochronna to połączenie ekologii, genetyki populacyjnej,
modelowania matematycznego, taksonomii i mikroewolucjonizmu. Poznanie dokładnie
struktury ekologicznej i genetycznej pomaga w aktywnej ochronie gatunków.
Genetyka w kryminalistyce.
Identyfikacja osób i określanie pokrewieństwa.
W ostatnich latach, rozwój technik izolacji DNA oraz możliwość analizy wielu loci
mikrosatelitarnych jednocześnie, dostarczyła niezawodnego narzędzia do ustalania
identyczności lub stopień pokrewieństwa osobników. Możliwości te wykorzystywane są
dzisiaj w wielu zagadnieniach medycyny sądowej (ang. forensic science) takich jak określanie
związku pomiędzy śladami biologicznymi, identyfikacja ofiar katastrof, ustalanie ojcostwa
lub pokrewieństwa dla celów spadkowych czy imigracyjnych.
Identyfikacja osób – podstawy teoretyczne:
Aby stwierdzić, że przykładowo, plama krwi znaleziona na miejscu morderstwa
pochodzi od konkretnego podejrzanego, trzeba porównać profile mikrosatelitarne uzyskane z
krwi oraz od podejrzanego. Aby uzyskane wyniki były wiarygodne i porównywalne np.
pomiędzy bazami danych w różnych krajach, organizacje takie jak FBI w USA czy ISFS
(ang. Intrnational Society of Forensic Science) w Europie stworzono zestawy loci
mikrosatelitarnych autosomalnych (położonych na chromosomach autosomalnych)
wykorzystywane do celów identyfikacyjnych. W USA zestaw ten nazwano CODIS (ang.
Combined DNA Identification System) i zawiera on 13 loci:
5
• CSF1PO, FGA, TH01, TPOX, VWA, D3S1358, D5S818, D7S820, D8S1179,
D13S317, D16S539, D18S51, D21S11
• Amelogenina – marker pozwalający na określenie płci
W Europie funkcjonuje kilka systemów zawierających podobne zestawy, obejmujące tzw.
ang. European Core Loci set:
• FGA, TH01, VWA, D2S1338, D3S1358, D8S1179, D16S539, D18S51, D19S433,
D21S11
• Amelogenina
Jeżeli obydwa uzyskane profile są jednakowe (tzn. posiadają identyczne allele we
wszystkich loci), mamy podstawy by sądzić, że pochodzą one od jednej osoby. Jednak
możliwe jest, że 2 lub więcej niespokrewnionych osób w populacji posiada taki sam profil
genetyczny zupełnie przypadkowo. Prawdopodobieństwo takiego zdarzenia określane jest
jako prawdopodobieństwo przypadkowej zgodności (ang. match probability, mp). Takie
prawdopodobieństwo obliczane jest za każdym razem dla danego profilu genetycznego na
podstawie danych populacyjnych z danego regionu. Prawdopodobieństwo przypadkowego
pojawienia się danego profilu u dwóch niespokrewnionych osób w populacji zależy do ilości
wykorzystanych loci oraz ich zmienności w populacji. Dla zestawu CODIS wynosi ono
średnio 5 x 10
-15
a dla dostępnych komercyjnie zestawów sięga nawet 7,2 x 10
-19
. Innymi
słowy oznacza to, że konkretny profil genetyczny wystąpi raz na miliony miliardów osób, a
jest to liczba znacznie większa niż kiedykolwiek żyło ludzi na Ziemi. Zapewnia to prawie
100% pewność, że zgodne (identyczne) profile należą do jednej osoby. Jednak tak, jak z
całkowitą pewnością można stwierdzić, że profile nie należą do tej samej osoby (nie są
zgodne), tak prawdopodobieństwo, że profile pochodzą od jednej osoby nigdy nie osiąga
100%.
W kryminalistyce często wykorzystuje się mikrosatelity zlokalizowane na
chromosomie Y. Takie analizy wykonuje się szczególnie w przypadku przestępstw na tle
seksualnym, kiedy uzyskana próbka jest mieszaniną materiału pochodzącego od kobiety i od
mężczyzny i nie udaje się uzyskać czystego profilu mikrosatelitów autosomalnych.
Specyficzna amplifikacja mikrosatelitów zlokalizowanych na chromosomie Y pozwala
uzyskanie profilu, który można porównać z profilami podejrzanych. Wadą markerów na
chromosomie Y jest to, że dziedziczą się niezmienione z ojca na syna, przez co nie można
odróżnić krewnych w linii męskiej. Z tego powodu z reguły traktuje się je jako tzw. markery
wykluczające. Oznacza to, że można jedynie wykluczyć podejrzanego, kiedy profile są
niezgodne.
6
Określanie pokrewieństwa
Jeżeli dwie osoby są ze sobą spokrewnione, to posiadają pewną część jednakowych
alleli. Allele jednakowe u dwóch osób, kiedy ich identyczność wynika z pokrewieństwa (czyli
odziedziczenia tego samego allelu po wspólnym przodku), określa się jako IBD (ang. identity-
by-descent, identyczne poprzez pochodzenie). Przeciwieństwem takiej sytuacji jest
występowanie identycznych alleli u dwóch osób, kiedy to allele te nie pochodzą od jednego
przodka/chromosomu. O takich allelach mówimy, że są IBS (ang. Identity-by-state).
Posiadając profile genetyczne dwóch osób, można określić, jaka część ich alleli jest
wspólna ze względu na pochodzenie (IBD) i na tej podstawie określić stopień pokrewieństwa
pomiędzy tymi osobami.
Określanie pokrewieństwa jest wykorzystywane przy testowaniu ojcostwa, sprawach
imigracyjnych czy identyfikacji zmarłych. Wykorzystuje się je także w badaniach nad
restytucją gatunków. Przykładowo ważne jest określenie stopnia pokrewieństwa narybku,
którym prowadzi się zarybienia. Ponadto zaplanować można dokładny schemat krzyżowań
osobników przeznaczonych do rozrodu, by uniknąć chowu wsobnego.
Przypomnieć sobie:
Jądrowy i mitochondrialny DNA (charakterystyka ogólna szczególnie człowieka).
Literatura:
Genetyka molekularna PWN (2006) pod red. P. Węgleński rozdział 11 (koniecznie:
koncepcja „out of Africa”)
Literatura mini i mikrosatelity Genomy – strony: 20-22, 136-137, 414-421.
(MATERIAŁ DODATKOWY – nie wymagany!)
Pętla D – (ang. displacement loop, d-loop) zwany też regionem kontrolnym, (ang. control
region). Uznawany jest za najbardziej zmienny odcinek genomu mitochodrialnego. Ma on
długość około 1000 bp. Cechą tego markera genetycznego jest jego neutralność selekcyjna. W
obrębie pętli D mieszczą się trzy hiperzmienne regiony HVR1, HVR2 oraz HVR3 (ang.
hipervariable region), w których mutacje powstają znacznie częściej aniżeli w pozostałej
7
części regionu kontrolnego. Na samym końcu 3’ D-loop mieści region polipirymidynowy,
złożony z ciągu powtórzonej cytozyny lub tyminy. Funkcją D-loop jest rozpoczęcie replikacji
genomu mitochondrialnego. Tutaj mieści się region ori.
Na podstawie zmian mutacyjnych (substytucji, delecji oraz insercji - indeli) - przede
wszystkim w obrębie HVR1 utworzono haplogrupy, czyli grupy sekwencji (haplotypów) o
pewnym wspólnym wzorze nukleotydów (np. u ludzi: haplogrupy A,B,C,D). Wewnątrz
każdej haplogrupy istnieją haplotypy, zawierające pewne wspólne podstawienia
nukeotydowe, specyficzne dla danej haplogrupy. Haplotyp jest właściwym określeniem w
stosunku do mtDNA (nie allel!). Wszystkie geny genomu mtDNA są dziedziczone wspólnie,
zatem odmiany sekwencji są haplotypami. Ponadto na podstawie danych tysięcy sekwencji
nukleotydowych ludzi stworzono mapę migracji ludzkości na świecie. Podobne badaniach
przeprowadza się na innych gatunkach rekonstruując ich historię i ewolucję. Mogą to być
badania filogeograficzne (np. rozprzestrzenianie się populacji) oraz filogenetyczne (czyli
rekonstrukcja pokrewieństwa różnych taksonów).
Wykorzystanie loci mikrosatelitarnych w badaniach populacyjnych
Mikrosatelity znajdują zastosowanie w badaniach mechanizmów ewolucyjnych, które
zachodzą w stosunkowo krótkim czasie. Za ich pomocą analizuje się dystans genetyczny
pomiędzy populacjami. Ponadto bada się procesy demograficzne, takie jak gwałtowne
wahania liczebności.
Mogą one być spowodowane efektem wąskiego gardła (ang. bottleneck) lub efektem
założyciela (ang. founder effect), czyli kolonizacją małą liczbą osobników. Na takie populacje
silnie działa dryf genetyczny (losowe utrwalanie się – fiksacja (ang. fixation)) lub eliminacja
części alleli oraz zmiana ich frekwencji) ze względu na odtwarzanie populacji z małej liczby
przypadkowych osobników.
Z kolei czynniki behawioralne, do których należy dobór płciowy, terytorializm,
decydują o tym, które genotypy (określone zestawy alleli danych genów w osobniku) będą
uczestniczyły w rozrodzie, a tym samym zostaną przekazane do kolejnych pokoleń. Na tym
poziomie rozgrywa się tzw. selekcja określonych fenotypów, które jednak mają swoje
odzwierciedlenie w konkretnym genotypie. Poligamia również jest źródłem ograniczenia
polimorfizmu danej populacji, szczególnie mało liczebnej. Szczególne zastosowanie znajdują
badania polimorfizmu mikrosatelitów u gatunków zagrożonych wymarciem, które często są
populacjami izolowanymi o ograniczonym polimorfizmie i przepływie genów. Poznanie
dokładnie ich struktury ekologicznej i genetycznej pomaga w aktywnej ochronie tych
8
gatunków. Migracyjność osobników przeciwdziała wsobności (ang. ibreeding)i sprzyja
wymianie materiału genetycznego (ang. outbreeding). Wykorzystując sekwencje
mikrosatelitarne, możliwe jest wykrycie migrantów lub ich potomstwa w danej populacji oraz
wskazanie, z jakiej populacji prawdopodobnie pochodziły.
Z czynników środowiskowych, które silnie oddziałują na strukturę genetyczną
wymienić można stopień izolacji, którego wpływ skutkuje ograniczeniem polimorfizmu
populacji, jeśli jest ona mało liczebna, w związku z ograniczonym przepływem genów. Na
taką izolowaną populację będą silniej oddziaływać czynniki losowe, takie jak np. dryf
genetyczny. Nasilone kojarzenie wsobne w tych populacjach może prowadzić do załamania
się populacji (ang. inbreeding depression). Możliwe jest określenie efektywniej wielkości
populacji (N
E
), która jest wyznacznikiem kondycji genetycznej danej populacji. Jej wartość
zwykle drastycznie maleje w wyniku wspomnianych wyżej efektów szyjki od butelki, efektu
założyciela czy występowania wsobności. Czasami jednak kojarzenie wsobne może mieć
działanie korzystne dla populacji (ang. puring selection). Jako, że w takiej populacji
większość osobników to homozygoty pod względem wielu genów, w wyniku selekcji
pozostaną jedynie osobniki najlepiej przystosowane do lokalnych warunków środowiska.
Większe jest też prawdopodobieństwo wyeliminowania alleli genów powodujących choroby
genetyczne. Krzyżowanie się w takiej sytuacji osobników z dwóch populacji
przystosowanych do odmiennych warunków środowiska, może mieć skutek w gorszym
dostosowaniu potomstwa poprzez rozrywanie korzystnych kombinacji alleli różnych genów
(ang. outbreeding depression). Z drugiej strony, taka pozbawiona polimorfizmu populacja jest
mało odporna na zmiany warunków środowiska, np. pojawienie się nowego czynnika
chorobotwórczego. Poza tym łatwiej dochodzi do ujawniania się recesywnych chorób
genetycznych.
Analiza mikrosatelitów
Obecnie mikrosatelity analizuje się za pomocą elektroforezy kapilarnej (ang. capilary
electrophoresis) w sekwenatorze. W tym celu jeden z 2 starterów znakuje się barwnikiem
fluorescencyjnym. Ustalanie długości produktów PCR polega na rejestrze czasu, jaki upływa
od rozpoczęcia elektroforezy w żelu, do momentu otrzymania sygnału świetlnego,
pochodzącego od fluorescencyjnie znakowanych nukleotydów. Za pomocą standardu, oblicza
się długość analizowanych fragmentów DNA (czas migracji produktu w żelu jest
proporcjonalny do jego długości). Istnieje wiele programów, dzięki którym można ustalić
długości alleli (np. Peak Scanner). Przed analiza statystyczną, należy wykluczyć obecność:
9
• tzw. ang. allelic dropout – ADO, obecność tylko 1 allelu (z 2) mającego źródło w
jego preferencyjnym namnażaniu się, najczęściej krótszego (dotyczy to zwykle
alleli powyżej 300 pz),
• fałszywych alleli (ang. false allels, FA),
• artefaktów elektroforetycznych (ang. electrophoresis artefacts, EA) powstających
między innymi na skutek błędów sekwenatora,
• alleli zerowych (ang. null allels, NA), mających źródło w wyniku zmiany
sekwencji w miejscu przyłączania się startera, na skutek mutacji.
Wykonuje się też analizę ewentualnego sprzężenia loci mikrosatelitarnych ze sobą
(ang. linked loci) czyli nielosowej dystrybucji alleli (ang. linkage disequilibrium). Może być
ona zaburzona, jeśli dwa loci leżą blisko siebie na jednym chromosomie. W przypadku
obliczeń wykonanych na loci sprzężonych ze sobą można otrzymać fałszywe wyniki.
Wykonuje się analizy używając sprzężonych loci, ale wykorzystuje się wówczas inne
algorytmy. Wymienione artefakty (poza FA) oraz sprzężenie doprowadzają do
przeszacowania liczby homozygot (ang. false homozygote, FH).
Równowaga Hardy’ego-Weinberga
Prawo Hardy’ego –Weinberga (ang. Hardy-Weinberg Equillibrium; HWE), mówi, że ddy
populacja znajduje się w stanie równowagi, to przy określonej frekwencji allelu p oraz q
prawdziwe jest równanie, że
p
2
+2pq+q
2
=1; (gdzie p+q=1)
W stanie równowagi populacja znajduje się, gdy nie obserwuje się wysokiej częstości mutacji
oraz zjawisk selekcji, migracji i dryfu genetycznego. Warunkiem dochodzenia do stanu
równowagi populacji jest także losowość kojarzenia się osobników i ich wystarczająco duża l
liczba Odstępstwa od HWE świadczą o obecności procesów demograficznych, które
zmieniają (zaburzają) frekwencje i rozkład alleli.
Polimorfizm loci:
W badaniach zmienności (polimorfizmu) loci mikrosatelitarnych wykorzystuje się
następujące wskaźniki:
•
Liczba alleli w danym locus (Na)
•
Bogactwo alleli (R) – uwzględnią wielkość próby przyrównując do populacji o
najmniejszej liczebności
10
•
Liczba alleli prywatnych (Np) – liczba alleli charakterystyczna tylko dla danej
populacji.
•
Heterozygotyczność o oczekiwana – H
E
dla frekwencji alleli danego locus w populacji
szacuje się, jaki powinien być udział heterozygot w warunkach równowagi
Hardy’ego-Weinberga.
•
Heterozygotyczność obserwowana – H
O
- oblicza się rzeczywista frekwencje
heterozygot występujących w populacji.
Statystyka Wrighta
Współczynnik wsobności (ang. inbred, fixation index):
• F
IS
= 1 – (H
O
/ H
E
) - wsp. inbredu – określa stopień wsobność, czyli proporcję
heterozygotyczności obserwowanej do oczekiwanej w obrębie populacji, losowość
kojarzenia się osobników (panmiksje). Wartości F
IS
< -1; 1 >:
o Nieistotne wartości F
IS
oraz F
IS
= 0 oznaczają, że populacja jest w
równowadze Hardy’ego Weinberga i brak jest struktury wewnętrznej w tej
populacji.
o Istotne statystycznie wartości F
IS
> 0 mogą wskazywać na: efekty wsobności
(ang. inbreeding), istnienie struktury wewnętrznej w populacji (występowanie
subpopulacji), dryf genetyczny, istnienie doboru płciowego, fizyczne
sprzężenie loci, jako że w populacji występuje nadmiar homozygot.
o Znaczące wartości F
IS
< 0 oznaczają, iż w populacji występuje nadmiar
heterozygot, który może być wynikiem selekcji na heterozygoty albo efektem
szyjki od butelki.
• Współczynnik F
ST
– wsp. utrwalenia - określa spadek heterozygotyczności w
subpopulacji w stosunku do całej populacji, na skutek np. selekcji lub dryfu
genetycznego. Jego wartości wskazują, jak intensywny jest przepływ genów pomiędzy
subpopulacjami. Mówi od dystansie genetycznym pomiędzy populacjami. Wartości:
o 0 - 0,05 – małe genetyczne zróżnicowanie populacji
o 0,05 - 0,15 – średnie genetyczne zróżnicowanie populacji
o 0,15 - 0,25 – duże genetyczne zróżnicowanie populacji
o 0,25 – bardzo duże genetyczne zróżnicowanie populacji