GENOMIKA.
MAPOWANIE
GENOMÓW
MAPY
GENOMICZNE
Bioinformatyka, wykład 3 (21.X.2008)
krzysztof_pawlowski@sggw.waw.pl
„Gen”
???
Biologiczne bazy danych –
historia
Biologiczne bazy danych
– „najważniejsze”
tydzień
temu…
Wykład 3 –
spis treści
Genomika
Mapy genomowe
Markery genetyczne,
mapy genetyczne
Mapowanie fizyczne
Bazy danych map genomowych
GENOMIKA
GENOMIKA
–
–
badanie struktury i funkcjonowania genom
badanie struktury i funkcjonowania genom
ó
ó
w
w
GENOMIKA
GENOMIKA
STRUKTURALNA
GENOMIKA
PORÓWNAWCZA
GENOMIKA
FUNKCJONALNA
MAPOWANIE GENOMU:
•Mapy genetyczne
•Mapy fizyczne
SEKWENCJONOWANIE
•
Ewolucja genomów
• Ewolucja genów
•
Transkryptom
•Regulacja tranckrypcji
• Proteom
Structural
genomics
Comparative
genomics
Functional genomics
GENOMIKA
GENOMIKA
–
–
badanie struktury i funkcjonowania genom
badanie struktury i funkcjonowania genom
ó
ó
w
w
GENOMIKA
GENOMIKA
STRUKTURALNA
GENOMIKA
PORÓWNAWCZA
GENOMIKA
FUNKCJONALNA
MAPOWANIE GENOMU:
•Mapy genetyczne
•Mapy fizyczne
SEKWENCJONOWANIE
•
Ewolucja genomów
• Ewolucja genów
•
Transkryptom
•Regulacja tranckrypcji
• Proteom
Structural
genomics
Comparative
genomics
Functional genomics
II znaczenie:
=proteomika
strukturalna
Bio
logia
molekularna & bioinformatyka
Zmienność
genomu ludzkiego
Nature, 2008
•
1695 sites
of
structural
variation
(> 6kbp)
•
4 million
SNPs
•
800000 small
indels
(< 100 bp)
Zmienność
genomu ludzkiego
PubMed stats
[Oct
2008]
Genomics[MAJR]
12,606
Bioinformatics[MAJR] 8,257
Genomics
43,415
Bioinformatics
34,610
Bioinformatics
(Google) 12,200,000
Genomics
(Google) 12,100,000
Mapa genomu –
graficzna prezentacja
położenia markerów/genów na chromosomie
MAPY
GENETYCZNE
MAPY
FIZYCZNE
cM
bp
Mapy genomowe
MAPY GENETYCZNE
MAPY
FIZYCZNE
•
powstają
w oparciu o analizę
częstości rekombinacji między
badanymi markerami
•
pokazują
rozmieszczenie
markerów na chromosomie oraz
odległości genetyczne między
nimi
•
powstają
poprzez bezpośrednią
lokalizację, technikami biologii
molekularnej, badanej sekwencji
DNA w genomie
•
jednostka:
pary zasad –
pz
(ang. bp, kbp)
•
jednostka:
1cM = 1% rekombinacji
(1 crossing
–
over
na 100 mejoz)
u ludzi to ok.0,7 –
1 Mb
Mapy genetyczne
Rekombinacje
Jeżeli
markery A i B są
na
tym
samym
chromosomie,
częstość
rekombinacji
jest > 0 i < 0.5
Jeżeli
markery
A i B są
na
różnych
chromosomach,
częstość
rekombinacji
jest = 0.5.
Ten sam
chromosom
Różne
chromosomy
Bardzo
blisko
Blisko
Daleko
Częstość
CROSSING-OVER
Rzadko
Kilka
Często
Często
Sprzężenie
TAK
TAK
NIE
NIE
θ
0%
1-4%
50%
50%
Częstość
rekombinacji
(
θ
)
From: TISSUE ENGINEERING & HUMAN GENETICS LABORATORY
Marker genetyczny
–
polimorficzna sekwencja DNA
(specyficzna) z jednego miejsca na chromosomie,
używana do mapowania genetycznego,
może być
związana z fenotypem.
Jest to podstawowe narzędzie genetyka
Marker genetyczny
klasa I
(markery fenotypowe)
•
są
to geny kodujące cechy jakościowe
organizmu np. antygeny erytrocytarne, antygeny
głównego układu zgodności tkankowej
(Major Histocompatibility
Complex
-
MHC).
•
markery tej klasy indentyfikowane
są
metodami serologicznymi lub metodami
elektroforetycznymi.
klasa II
(markery DNA)
•
są
to sekwencje DNA, niekoniecznie
kodujące, np. RFLP, SSLP, SNP
•
markery
takie
jako markery
genetycze
muszą
mieć
przynajmniej dwie alleliczne
formy.
•
markery tego typu identyfikowane są
przy użyciu technik analizy molekularnej.
Markery DNA
RFLPs
(Restriction
Fragment Lenght
Polymorphisms)
Minisatelity
Mikrosatelity
SNPs (Single Nucleotide
Polymorphisms)
Markery
genetyczne cd.
RFLPs
(
R
estriction
F
ragment
L
enght
P
olymorphisms) --
polimorfizm długości fragmentów restrykcyjnych
Miejsce cięcia enzymu restrykcyjnego HindIII.
Markery
RFLP
:
Restriction
Fragment Length Polymorphism
Żel
Markery genetyczne cd.
Wady
markerów RFLP:
-
tylko dwie formy alleliczne
-
dużo miejsc cięcia w dużych genomach
SSLPs
(
S
imple
S
equence
L
ength
P
olymorphisms) –
polimorfizm długości prostych sekwencji
-minisatelity
-
mikrosatelity
Markery genetyczne cd.
Minisatelitarny
DNA
VNTRs
(
V
ariable
N
umber of
T
andem
R
epeats) –
zmienna liczba powtórzeń
tandemowych
•
sekwencje zawierające zmienną
liczbę
tandemowych powtórzeń
motywu
(11 –
60 pz)
•
z reguły występują
przy końcach chromosomów -
telomerach
•
liczba powtórzeń
motywu:
2 do 1000,
w zależności od ilości powtórzeń
dany
fragment DNA ma charakterystyczną
długość
(polimorfizm długości widoczny
podczas elektroforezy)
•
VNTR może być
badane metodą
PCR wraz z elektroforezą, połączoną
z hybrydyzacją
z wyznakowaną
sondą. Liczba powtórzeń
decyduje o długości
fragmentu, co z kolei wpływa na szybkości jego przemieszczania się
podczas
elektroforezy.
•
w danym locus VNTR występuje znaczna zmienność
osobnicza
Przykładowy motyw sekwencji minisatelitarnej:
AGGGCTGGAGG
Allel
1.
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
Allel
2.
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
Allel
3.
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
AGGGCTGGAGG
itd.
Przykładowa
analiza VNTRs
Mikrosatelitarny
DNA
STRs
(
S
hort
T
andem
R
epeats) –
krótkie sekwencje powtórzone tandemowo
•
sekwencje zawierające zmienną
liczbę
tandemowych powtórzeń
kilkunukleotydowego
motywu (1 –
4 pz)
•
motyw równomiernie rozmieszczony w genomie
•
liczba powtórzeń
motywu minisatelitarnego:
10 do 50
i w zależności od ilości powtórzeń
dany fragment DNA ma charakterystyczną
długość
(polimorfizm długości widoczny podczas elektroforezy)
•
często motyw taki może być
regularnie przerywany inną
sekwencją.
•
ulokowane są
zazwyczaj w intronach (czasami również
w eksonach
[egzonach] w postaci mniejszej liczby powtórzeń).
STR (Short
Tandem Repeats)
a analiza restrykcyjna
A1A1
A1A2
A3A4
Zalety:
- duża zmienność
-
często tworzą
multi-locus patterns
charakterystyczne dla
danego osobnika
Wady:
-
nie nadają
się
do
dokładnego mapowania
z powodu ich nielosowego
rozkładu w genomie
A1A1 A1A2 A3A4
…ACGACGACGACG…
SNPs
(
S
ingle
N
ucleotide
P
olymorphisms) –
polimorfizm pojedynczych nukleotydów
Genom ludzki: 56 mln
SNPs (6,5 mln
„validated”
SNPs) -
dbSNP
@ NCBI
Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego
nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na
amplifikacji określonego fragmentu genomu w reakcji PCR
i sekwencjonowaniu
uzyskanego produktu.
Zaletą
tej techniki jest wysoka wydajność
identyfikacji polimorfizmu
w obrębie badanej sekwencji, wadą
jest wysoki koszt analizy.
Markery genetyczne cd.
Analiza SNP
SNP
microarrays
molecular
beacons
Analiza sprzężeń
zaburzenia w
analizach:
-
gorące miejsca
rekombinacji
-
podwójny
crossing
–
over
Type of marker
No. of loci Features
Blood groups
~20
May need fresh blood
1910-1960
No easy physical localization
Electrophoretic mobility
variants of serum proteins
~30
May need fresh serum, specialized assays
1960-1975
No easy physical localization
Often limited polymorphism
HLA tissue types
1 One linked set
1970-
Can only test for linkage to 6p21.3
DNA RFLPs
>10
5
Two allele markers, maximum heterozygosity 0.5
1975-
(potentially) Initially required Southern blotting, now PCR
Easy physical localization
DNA VNTRs
>10
4
Many alleles, highly informative
(minisatellites)
(potentially) Tend to cluster near ends of chromosomes
1985-
Easy physical localization
DNA VNTRs
>10
5
Many alleles, highly informative
(microsatellites)
(potentially) Can type by automated multiplex PCR
Easy physical localization
1989-
Distributed throughout genome
DNA SNPs
>10
6
Less informative than microsatellites
(single nucleotide
polymorphisms)
(potentially) Can be typed on a very large scale by automated
equipment without gel electrophoresis
1998-
Markery
fenotypowe
Markery
DNA
Mapa
Cytogenetyczna
(chromosome bands) –
rozróżnialne
zabarwione
fragmenty chromosomów
(mikroskop
optyczny)
Mbps
Niska
Niska
rozdzielczo
rozdzielczo
ść
ść
Wysoka
Wysoka
rozdzielczo
rozdzielczo
ść
ść
Sequence “map”
-
całkowicie
zsekwencjonowany chromosom
1bp
.
STS sequence
mapping
–
kolejność
unikalnych
w genomie
markerów
DNA (STS)
100 kbp
Mapowanie
Fizyczne
Restriction mapping
–
kolejność
i odległości
pomiędzy
punktami
trawienia
enzymami
DNA.
100s kbp
Fluorescence
in
situ hybridisation
–
hybrydyzacja
fluorescencyjnych sond do chromosomów
100s kbp
Mapy fizyczne
FISH
(
F
luorescent
i
n
s
itu
h
ybridization) –
hybrydyzacja fluorescencyjna
in situ
Mapa fizyczna genomu
Medicago truncatula
(lucerny)
skonstruowana metodą
FISH
Mapy fizyczne cd.
STS
(
S
equence
t
agged
s
ite)
mapping
-
-
mapowanie
miejsc znakowanych sekwencją
Analiza STS
A
B
Mapa restrykcyjna
A
B
Sekwencjonowanie genomów
WGS
(whole
genome
shotgun)
Clone contig
Przeglądarki genomowe
-
Genome
Browsers
NCBI Map Viewer
UCSC Genome
Browser
(University
of
Calif., Santa Cruz)
Ensembl Map View
Ensembl
Ensembl
UCSC
NCBI
NCBI