Bioinformatyka
wykłady dla I r. studiów magisterskich, biologia
(SGGW)
2007/2008
Wykład 1, 4.X.2007
Krzysztof Pawłowski
Wykład 4.X.2007
Co to jest bioinformatyka?
Program wykładów
Sekwencjonowanie DNA
Sekwencjonowanie genomów
definicja
bioinformatyki / biologii obliczeniowej
Rozwiązywanie problemów biologicznych metodami
obliczeniowymi
Solving biological problems by computational means
Some synonyms:
In silico biology
Biocomputing
Theoretical biology
Substantial overlaps:
Computational chemistry / cheminformatics
Systems biology
Structural biology
Theoretical biophysics
Zakres zainteresowań
bioinformatyki
" Objects: small molecules, structural motifs and domains, proteins,
transcripts, genes, organelles, cells, tissues, organs, organisms
" Objects attributes: sequences, 3-D structures, expression data, clinical
data, publications,& .
oficjalne definicje NIH
Bioinformatics: approaches for expanding the
use of biological, medical, behavioral or health
data, including those to acquire, store, organize,
archive, analyze, or visualize such data.
Computational Biology: The development and
application of data-analytical and theoretical
methods, mathematical modeling and
computational simulation techniques to the study
of biological, behavioral, and social systems.
bioinformatyka nowa dyscyplina?
Publikacje bioinformatyczne (PubMed)
10000
1000
100
10
1
bioinformatics[Text Word]
bioinformatics[MeSH Heading]
& ale pod innymi nazwami rozwijała się
przynajmniej od lat 1960-tych
9
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
9
8
9
9
9
9
9
9
9
9
9
9
0
0
0
0
0
0
0
0
0
0
9
9
9
9
9
9
9
9
9
9
9
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
Bioinformatyka w Google
126 000 000
17 500 000
27 700 000
1 730 000
1 160 000
1 140 000
241 000
47 300
k
s
a
a
a
a
i
k
c
ic
ik
i
t
t
at
y
ogy
t
que
t
i
ogi
a
a
m
ol
a
ol
at
m
m
ma
m
r
r
or
bi
m
r
bi
o
o
or
f
f
nf
o
f
or
nf
in
in
oi
in
nf
o
o
oi
o
bi
oi
bi
bi
bi
bi
bi
BIOINFORMATYKA - dziedzina interdyscyplinarna
BIOINFORMATYKA - dziedzina interdyscyplinarna
informatyka
biologia (molekularna)
bioinformatyka = +
narzędzia,metody
dane biologiczne
i obliczenia komputerowe
dane dotyczące kwasów
nauki i techniki komputerowe,
nukleinowych, białek,
teoria informacji, matematyka
lipidów, węglowodanów i
stosowana, statystyka, teoria
innych makrocząsteczek
prawdopodobieństwa
BIOINFORMATYKA - dziedzina interdyscyplinarna
BIOINFORMATYKA - dziedzina interdyscyplinarna
informatyka
biologia (molekularna)
bioinformatyka = +
narzędzia,metody
dane biologiczne
i obliczenia komputerowe
dane dotyczące kwasów
nauki i techniki komputerowe,
nukleinowych, białek,
teoria informacji, matematyka
lipidów, węglowodanów i
stosowana, statystyka, teoria
innych makrocząsteczek
prawdopodobieństwa
a
i
m
e
h
c
i
a
k
y
iz
f
BIOINFORMATYKA - cele
BIOINFORMATYKA - cele
Organizowanie i zarządzanie informacjami o
makrocząsteczkach i innych danych biologicznych w formie
skomputeryzowanych (cyfrowych) zapisów - baz danych
Analiza tych danych przy pomocy metod obliczeniowych,
rozwój metod i algorytmów
BIOINFORMATYKA - poziomy analiz
BIOINFORMATYKA - poziomy analiz
DNA
mRNA
białka
interakcje i metabolizm
BIOINFORMATYKA - poziomy analiz
BIOINFORMATYKA - poziomy analiz
poziom badań przedmiot badań dziedzina badań tematy badań
poszukiwanie sekwencji
kodujących, rozpoznawanie
wszystkie sekwencjie DNA
genom genomika
genomika
eksonów i intronów,
zawarte w organizmie, geny,
organizacja genomów,
sekwencje regulatorowe
porównanie sekwencji
wszystkie sekwencie RNA
transkryptom transkryptomika
transkryptomika
analiza ekspresji genów
zawarte w organizmie
porównanie sekwencji,
wszystkie białka zawarte w
proteomika
proteomika
proteom identyfikacja zachowanych
organizmie
regionów, przewidywannie
struktury, oddziaływania
wszystkie procesy metaboliczne
określanie sieci i szlaków
metabolom metabolomika
metabolomika
zachodzące w organizmie,
metabolicznych, symulacje
metabolity
Program wykładów
Genomy
Sekwencje biologiczne
Biologiczne bazy danych
Struktury makrocząsteczek biologicznych
Elementy biologii systemowej
Elementy epigenetyki
& dygresje w stronę biologii, fizyki, chemii
zaliczenie
Ćwiczenia:
lista obecności & kolokwium (a)
Wykład:
kolokwium (b)
Ocena: średnia z ocen z kolokwiów a i b,
jeśli obie oceny > 2
Literatura
Literatura
Literatura
Literatura
http://www.ncbi.nlm.nih.gov/books
Baxevanis, Ouelette
Sekwencjonowanie DNA
Sekwencjonowanie DNA
1977
Sanger i współpr. metoda terminacji łańcucha, dideoksy
1987
Prober i współpr. znakowanie fluorescencyjne i zautomatyzowanie metody
analizator DNA (sekwenser)
ABI PRISM 3700
Oczyszczanie fragmentów DNA:
wyciętych z klonów plazmidowych lub fagowych
zamplifikowanych przez PCR
Denaturacja (pojedyncze nici)
Hybrydyzacja ze starterem oligonukleotydowym
Synteza nowej nici DNA od końca startera przy pomocy: polimerazy Taq
puli trifosforanów deoksyrybonukleotydów (dATP, dTTP, dGTP, dCTP)
puli trifosforanów dideoksynukleotydów (ddATP, ddTTP, ddGTP, ddCTP)
znakowanych fluorescencyjnie i powodujących zakończenie syntezy nici
T-C-A-G
T-C-A-G-C-A-T-A
-A-G-T-C-G-T-A-T
-A-G-T-C-G-T-A-T
T-C-A-G-C
T-C-A-G-C-A-T
T-C-A-G-C-A
-A-G-T-C-G-T-A-T
-A-G-T-C-G-T-A-T
-A-G-T-C-G-T-A-T
Elektroforeza kapilarna (sekwencje o długości do 1500 nukleotydów)
T-C-A-G-C-A-T-A
T-C-A-G-C-A-T
T-C-A-G-C-A
T-C-A-G-C
T-C-A-G
Odczyt sekwencji
0 5 10 15 20 25
GCATATCGGCTAATTGCTCTAGCAC
5
2
0
2
5
1
0
1
5
0
C
A
C
G
A
T
C
T
C
G
T
T
A
A
T
C
G
G
C
T
A
T
A
C
G
Etapy sekwencjonowania genomów
Etapy sekwencjonowania genomów
Oczyszczanie chromosomów
Pofragmentowanie metodą sonikacji na odcinki
o długości 100 kpz (kbp) lub większe
Klonowanie fragmentów w wektorach (YAC, BAC)
Tworzenie mapy chromosomu
Wybór zachodzących pojedynczych klonów do sekwencjonowania
Subklonowanie w mniejszych fragmentach
Tworzenie mapy subklonów
Human Genome Project
metoda tradycyjna
Wybór i sekwencjonowanie
zachodzących subklonów
SEKWENCJONOWANIE
Human Genome Project
ATGCTCG TTGATAGA TACAACGG GCGGTAGC
TCGATCTT AGAGCTAC GGCTTGC AGCTTATA
metoda tradycyjna
ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA
Subklonowanie w mniejszych fragmentach
Sekwencjonowanie wszystkich
subklonów i tworzenie bazy
komputerowej
SEKWENCJONOWANIE
ATGCTCG TTGATAGA TACAACGG GCGGTAGC
TCGATCTT AGAGCTAC GGCTTGC AGCTTATA
Celera Genomics
metoda shotgun
ATGCTCGATCTTGATAGAGCTACAACGGCTTGCGGTAGCTTATA
Komputerowy zapis sekwencji nukleotydowej
Komputerowy zapis sekwencji nukleotydowej
G A
C
C
A
lub lub
lub S P
M
G
T
C G
A
C
G
A
C
A
T
T
A
T
T T
C
A
G
T
CGTACGTMTASTATAGTACTPC
Obróbka sekwencji HTGS
Obróbka sekwencji HTGS
Faza 0
contigs
Faza 1
Faza 2
Faza 3
Sekwencjonowanie genomów
Sekwencjonowanie genomów
1977
Sanger i współpr. - fag ŚX 174 (5,4 tys. pz)
1981
Anderson i współpr. - mtDNA człowieka (17 tys. pz)
1995
Fleischmann i współpr. - Haemophilus influenzae (1.8 mln pz)
Fraser i współpr. - Mycoplasma genitalium (0.6 mln pz)
1997
Blattner i współpr. Escherichia coli (4.6 mln pz)
Kunst i współpr. Bacillus subtilis (4.2 mln pz)
Sekwencjonowanie genomów
Sekwencjonowanie genomów
1996
1997
Goffeau i współpr.
Saccharomyces cerevisiae (13 mln pz)
1998
The C. elegans Sequencing Consortium
Caenorhabditis elegans (100 mln pz)
Sekwencjonowanie genomu człowieka
Sekwencjonowanie genomu człowieka
Celera Genomics Human Genome Project
od 1998 od 1990
VI 2000
ogłoszenie zakończenie prac nad wstępną wersją genomu ludzkiego; zsekwencjonowano:
99 % 85 %
Konferencja prasowa w Białym Domu w towarzystwie premiera Wielkiej Brytanii i
prezydenta USA. Zespoły HPG oraz Celery postanowiły ze sobą współpracować
w końcowej fazie badań po okresie zażartej konkurencji.
Craig Venter
Francis Collins
Celera Genomics Human Genome Project
II 2001
niezależna publikacja wyników w:
THE GENOME INTERNATIONAL
Venter i współpracownicy
SEQUENCING CONSORTIUM
The diploid sequence of an
individual human
PLoS Biol (2007) 5:e24
Individualised medicine?
GenBank statystyka
GenBank statystyka
Entries Bases Species
5910385 8975089696 Homo sapiens
3693368 4248000223 Mus musculus
440177 2845643085 Rattus norvegicus
334184 684138071 Drosophila melanogaster
Grupa liczba genomów
364947 340669960 Arabidopsis thaliana
zsekwencjonowanych
73786 324515226 Oryza sativa (japonica cultivar-group)
Archaea 45
196469 220265073 Caenorhabditis elegans
280958 200452421 Danio rerio
Bacteria 521
140766 196468644 Oryza sativa
299860 195352078 Brassica oleracea
Eucaryota 25
189102 169109095 Tetraodon nigroviridis
160484 161781732 Pan troglodytes
319238 148070112 Zea mays
279229 128872165 Glycine max
242987 128784744 Bos taurus
219188 115991395 Xenopus laevis
174573 112789672 Medicago truncatula
205617 103041525 Triticum aestivum
179025 99099713 Hordeum vulgare
155282 95915175 Anopheles gambiae
Liczba całkowicie zsekwencjonowanych genomów bakteryjnych
Kompletnie zsekwencjonowane genomy
Kompletnie zsekwencjonowane genomy
Eucaryota:
OWADY (1)
Drosophila melanogaster
GRZYBY (10)
Saccharomyces cerevisiae
Schizosaccharomyces pombe
Candida glabratha
Encephalitozoon cuniculi GB-M1& .
Caenorhabditis elegans
Entamoeba histolytica
NICIENIE (1)
Plasmodium falciparum
Trypanosoma cruzi& .
KRGOWCE (2)
Homo sapiens
Mus musculus
ROŚLINY (4)
Arabidopsis thaliana
Oryza sativa
Oltmansiellopsis viridis
PIERWOTNIAKI
Ostreococcus lucimarinus
(6)
Za tydzień&
gen definicja?
biologiczne bazy danych
Wyszukiwarka
Podobne podstrony:
bioinfoI wyklad03elementy bioinformatyki wyklad4bioinfoI wyklad04bioinfoI wyklad02bioinfoI wyklad01bioinfoI wyklad05bioinformatyka wyklad #1Sieci komputerowe wyklady dr FurtakWykład 05 Opadanie i fluidyzacjaWYKŁAD 1 Wprowadzenie do biotechnologii farmaceutycznejwięcej podobnych podstron