bioinformatyka wyklad #1


BioInformatyka
BioInformatyka
"  The way to convert data into information
"  The way to convert data into information
& and information to knowledge
& and information to knowledge
" Zarządzanie i analiza danych biologicznych
" Zarządzanie i analiza danych biologicznych
Definicje BioInformatyki
Definicje BioInformatyki
BioInformatyka  to integracja matematycznych, statystycznych
BioInformatyka  to integracja matematycznych, statystycznych
metod oraz technologii komputerowej do analizy biologicznych,
metod oraz technologii komputerowej do analizy biologicznych,
DANYCH
DANYCH
BioInformatyka  to analiza DANYCH jakie są generowane w procesie
BioInformatyka  to analiza DANYCH jakie są generowane w procesie
badań nad żywą komórką. Stanowi ona tworzenie nowych technologii
badań nad żywą komórką. Stanowi ona tworzenie nowych technologii
komputerowych w celu rozwiązywania problemów w biologii
komputerowych w celu rozwiązywania problemów w biologii
molekularnej.
molekularnej.
BioInformatyka  to matematyczne i statystyczne metody, których
BioInformatyka  to matematyczne i statystyczne metody, których
celem jest rozwiązanie problemów biologicznych używając informacji
celem jest rozwiązanie problemów biologicznych używając informacji
zawartej w DNA jak i w białkach.
zawartej w DNA jak i w białkach.
Computational Biology (Biocomputing)
Computational Biology (Biocomputing)
Jest to dziedzina nauki zajmująca się analizą
Jest to dziedzina nauki zajmująca się analizą
teoretyczną procesów biologicznych. Czasami jest
teoretyczną procesów biologicznych. Czasami jest
ona nazywana biologią teoretyczną. Dotyczy ona
ona nazywana biologią teoretyczną. Dotyczy ona
przeważnie analiz populacyjnych, ewolucyjnych na
przeważnie analiz populacyjnych, ewolucyjnych na
skale makro, jak i bada procesy biochemiczne.
skale makro, jak i bada procesy biochemiczne.
Głównym językiem tej dziedziny naukowej jest
Głównym językiem tej dziedziny naukowej jest
matematyka.
matematyka.
Paul J Schulte
"Computational biology is not a "field", but an "approach" involving the use of computers to
study biological processes and hence it is an area as diverse as biology itself."
FarmakoGenomika
FarmakoGenomika
FarmakoGenomika
Biologia
Biologia
Biologia
Medycyna
Medycyna
Medycyna
(Informatyka Medyczna)
(Informatyka Medyczna)
(Informatyka Medyczna)
Molekularna
Molekularna
Molekularna
FarmakoGenetyka
FarmakoGenetyka
FarmakoGenetyka
" Genomika
" Genomika
" Genomika
" Proteomika
" Proteomika
" Proteomika
Klasyczna
Klasyczna
Klasyczna
Bioinformatyka
Bioinformatyka
Bioinformatyka
" " Bazy danych
" Bazy danych
Bazy danych
" " Analiza DNA
" Analiza DNA
Analiza DNA
" " Analiza białka
" Analiza białka
Analiza białka
Matematyka
Matematyka
Matematyka
" Statystyka
" Statystyka
" Statystyka
Bioinformatyka
Bioinformatyka
ChemioInformatyka
ChemioInformatyka
ChemioInformatyka
Technologia
Technologia
Technologia
komputerowa
komputerowa
komputerowa
Fizyka/BioFizyka " Przechowywanie danych
Fizyka/BioFizyka " Przechowywanie danych
Fizyka/BioFizyka " Przechowywanie danych
" Analiza struktury " Zarządzanie danymi
" Analiza struktury " Zarządzanie danymi
" Analiza struktury " Zarządzanie danymi
3D białek " Nowe algorytmy
3D białek " Nowe algorytmy
3D białek " Nowe algorytmy
BioInformatyka jako proces poznawczy
Eksperyment biologiczny
Eksperyment biologiczny
Akumulacja danych
Akumulacja danych
Dane
Dane
Analiza porównawcza
Analiza porównawcza
Informacja
Informacja
Modelowanie procesów
Modelowanie procesów
biochemicznych
biochemicznych
Wiedza
Wiedza
Centralny dogmat w Biologii Molekularnej
Centralny dogmat w Biologii Molekularnej
 przepływ informacji genetycznej
 przepływ informacji genetycznej
Informacja genetyczna
Informacja genetyczna
Informacja genetyczna
DNA mRNA Białko
DNA mRNA Białko
DNA mRNA Białko
Fenotyp Funkcja Struktura
Fenotyp Funkcja Struktura
Fenotyp Funkcja Struktura
Centralny dogmat w BioInformatyce
Centralny dogmat w BioInformatyce
- przepływ informacji genetycznej
- przepływ informacji genetycznej
Informacja genetyczna
Informacja genetyczna
Informacja genetyczna
Struktura 3D
Struktura 3D
Struktura 3D
Funkcja biochemiczna
Funkcja biochemiczna
Funkcja biochemiczna
Fenotyp
Fenotyp
Fenotyp
Ilość danych generowanych w procesie
sekwencjonowania DNA
Ilość par zadas (mld) opublikowanych
Year BasePairs Sequences
w bazie danych GenBank
1982 680338 606
1983 2274029 2427
100
1984 3368765 4175
80
1985 5204420 5700
60
1986 9615371 9978
40
1987 15514776 14584
20
1988 23800000 20579
0
1989 34762585 28791
Rok 2001 Rok 2002 Rok 2003 Rok 2004 Rok 2005
1990 49179285 39533
1991 71947426 55627
1992 101008486 78608
1993 157152442 143492
1994 217102462 215273
1995 384939485 555694
1996 651972984 1021211
1997 1160300687 1765847
1998 2008761784 2837897
1999 3841163011 4864570
2000 11101066288 10106023
2001 14396883064 13602262
Ilość struktur białkowych wygenerowanych i
Ilość struktur białkowych wygenerowanych i
dostępnych w bazach danych
dostępnych w bazach danych
... początek końca?
... początek końca?
Trzy funkcjonalne domeny
odpowiedzialne za funkcjonowanie komórki
Centralny dogmat biologii molekularnej
Genom
DNA
DNA
AAAA
RNA
AAAA
RNA
AAAA
Transkryptom
Białko
Białko
Proteom
Genomika
Zarządzanie danymi w formie
Zarządzanie danymi w formie
Zarządzanie danymi w formie
 Surowe Dane
 Surowe Dane
tworzenia baz danych (GenBank)
tworzenia baz danych (GenBank)
tworzenia baz danych (GenBank)
" Identyfikacja genów
" Identyfikacja genów
" Analiza podobieństw
" Analiza podobieństw
" Identyfikacja funkcji
" Identyfikacja funkcji
na podstawie homologii
na podstawie homologii
Analiza sekwencji DNA
Analiza sekwencji DNA
Analiza sekwencji DNA
" Analiza eksperymentalna
" Analiza eksperymentalna
-transkryptomika
-transkryptomika
-proteomika
-proteomika
Zrozumienie procesów
Zrozumienie procesów
Zrozumienie procesów Analiza i symulacja
Analiza i symulacja
Procesów biologicznych
Procesów biologicznych
wewnątrzkomórkowych
wewnątrzkomórkowych
wewnątrzkomórkowych
Fizyczna i Funkcjonalna
Mapa Interakcji w Komórce
PROTEOMIKA
Genom
Interakcje białko-białko
Białko 2
Białko 1
Szlak metaboliczny
Oddziaływania metaboliczne
E-Cell (komputerowy model komórki)
Zintegrowana Genomika (OMIKA)
Mały fragment metabolizmu komórki
został opisanych.
System komórkowy to ogromna
sieć interakcji biochemicznych i
fizycznych pomiędzy poszczególnymi
komponentami komórkowymi.
Genomika  generowanie i przetwarzanie danych
Genomika  generowanie i przetwarzanie danych
Analiza sekwencji całych
Analiza sekwencji całych
Analiza sekwencji całych
genomów (sekwencjonowanie)
genomów (sekwencjonowanie)
genomów (sekwencjonowanie)
Genomika
Genomika
i identyfikacja genów
i identyfikacja genów
i identyfikacja genów
Porównanie genów między
Porównanie genów między
Porównanie genów między
Genomika porównawcza
Genomika porównawcza
genomami różnych organizmów
genomami różnych organizmów
genomami różnych organizmów
Określenie funkcji genu na
Określenie funkcji genu na
Określenie funkcji genu na
Genomika funkcjonalna
Genomika funkcjonalna
skale całego genomu
skale całego genomu
skale całego genomu
Identyfikacja białek na skalę
Identyfikacja białek na skalę
Identyfikacja białek na skalę
Proteomika
Proteomika
całego genomu, interakcje białek,
całego genomu, interakcje białek,
całego genomu, interakcje białek,
(Genomika białka)
(Genomika białka)
profil ekspresji
profil ekspresji
profil ekspresji
Określenie struktury 3D białek
Określenie struktury 3D białek
Określenie struktury 3D białek
Na skale całego genomu,
Na skale całego genomu,
Proteomika strukturalna Na skale całego genomu,
Proteomika strukturalna
klasyfikacja i określenie funkcji
klasyfikacja i określenie funkcji
klasyfikacja i określenie funkcji
Genomika
Obecnie w bazach danych można znalezć ponad 908 genomów różnych
Obecnie w bazach danych można znalezć ponad 908 genomów różnych
organizmów, które zostały częściowo lub całkowicie opracowane, w tym
organizmów, które zostały częściowo lub całkowicie opracowane, w tym
dla około 100 organizmów genomy zostały już całkowicie opracowane
dla około 100 organizmów genomy zostały już całkowicie opracowane
Ilość genomów: 1974
Wirusy Eukaryota Prokaryota
Mutacja gene ski, 1465 257 252
Mutacja w gene ski, który
w który
koduje
koduje białko odpowiedzialne
białko odpowiedzialne
za
za dystrybucje pigmentu
dystrybucje pigmentu
JEDNAK ! Genom okazał się dość ubogim zródłem informacji jeśli chodzi o
uchwycenie różnic pomiędzy pojedynczymi komórkami lub całymi
organizmami.
Rozważmy dwa organizmy, mysz i człowiek. Jeśli wezmiemy pod uwagę tylko
długość życia to, mysz może żyć około 3 lat, podczas gdy człowiek z bardzo podobnym
genomem (85% podobieństwa) może maksymalnie żyć 120 lat. Różnice w genomie nie
wyjaśniają tego. Wyjaśnienie tego zjawiska tkwi na wyższych poziomach organizacji
komórki.
Saccharomyces cerevisiae - genom
Saccharomyces cerevisiae - genom
Wszystkie geny: 6362
Znana funkcja: 3303
Wysoki stopień podobieństwa
do innych białek: 237
Niski stopień podobieństwa
do innych białek 823
Podobieństwo do białek o nie znanej
funkcji 766
Brak podobieństw 785
31%
Geny(białka) nie do końca
zidentyfikowane 448
1/3 Genów (białek) w drożdżach nie posiada
1/3 Genów (białek) w drożdżach nie posiada
zidentyfikowanej funkcji
zidentyfikowanej funkcji
Genomika porównawcza
a b c d e
Geny
A B C D E
Białka
Analiza porównawcza Podobieństwa i homologia
Ewolucja na poziomie molekularnym Analiza struktur białek i ich klasyfikacja
Transkryptomica
Analiza ekspresji pojedynczych genów na poziomie
całego genomu
18
16,4
16
15,6
14
12
11,6
mRNA expression pattern < DNA microaray,
10
8
or Genome chip, DNA chip >
7,4
6,6
6
568666
,
4,6
4 3,9
2,6
2 1,8
0
0 10 20 30 40 50 60 70 80
Czas hodowli (hr)
10
8
6
4
2
0
-2
Pojedyncza kropka określa poziom
-4
ekspresji jednego genu na tle
-6
1 2 3 4 5 6
całego genomu.
Graficzna reprezentacja ekspresji
pojedynczego genu w różnych
stanach fizjologicznych komórki
OD
600
Proteomika (Genomika Białka)
"the PROTEin complement of the genOME"
2D SDS-PAGE , rozdział białek
Spektrometria masowa
Spektrometria masowa
cytoplazmatycznych
Sekwencja aminokwasowa
Analiza porównawcza
w bazach danych
Identyfikacja białka
Proteomika strukturalna: okreslenie struktury przestrzennej
białek na skale całego genomu
metodami doświadczalnymi
Proces
biochemiczny
HIV
Proteomika strukturalna: struktura przestrzenna
białka a jego sekwencja AA
- modelowanie struktury białka
Biblioteka struktur
Nowa sekwencja AA
białkowych
Funkcja
Funkcja Analiza 2D i 3D
PDB (Protein DataBase)
Model 3D
Pobieranie informacji z biologicznych baz danych
http://www.ncbi.nlm.nih.gov
Pobieranie informacji z biologicznych baz danych- ENTREZ
ENTREZ  interfejs do przeszukiwania
wszystkich dostępnych baz danych
znajdujących się w NCBI
Struktura interfejsu ENTREZ
ENTREZ  przeszukiwanie danych na zasadzie:
-Sąsiadowania; poszukiwanie informacji pokrewnych
tematycznie. Ustalenie związków sąsiedztwa w obrębie
określonej bazy danych opiera się na pomiarze
statystycznym podobieństwa
-Aączy stałych; logiczne połączenie między rekordami w
różnych bazach danych
Pobieranie informacji z biologicznych baz danych- ENTREZ
Pobieranie informacji z biologicznych baz danych- ENTREZ
Pobieranie informacji z biologicznych baz danych
- literaturowe bazy danych
Pobieranie informacji z biologicznych baz danych
- PubMed, literaturowa baza danych
Słowo lub słowa kluczowe;
Np.: ribosome
Lub ribosome AND paromomycin
Rybosome Rybosome AND paromomycin
Pobieranie informacji z biologicznych baz danych
- PubMed, literaturowa baza danych
Czasopisma naukowe
Czasopismo naukowe - to rodzaj czasopisma, w którym są drukowane publikacje naukowe.
Współcześnie szacuje się, że na świecie jest wydawanych nie mniej niż 54 tys. czasopism naukowych,
w których pojawia się nie mniej niż milion artykułów rocznie.
Czasopismo naukowe różni się tym od zwykłych czasopism, że publikowane w nim artykuły przechodzą
żmudny proces recenzowania naukowego.
Czasopismo naukowe posiada zwykle ściśle zdefiniowany zakres tematyczny i publikuje artykuły wyłącznie
z tego zakresu. Wyjątkiem są tylko czasopisma ogólne takie jak Science czy Nature, które publikują artykuły
opisujące, zdaniem ich rad redakcyjnych, najważniejsze dokonania naukowe ze wszystkich nauk przyrodnicznych.
W odróżnieniu od zwykłych czasopism, w większości czasopism naukowych, autorzy artykułów nie otrzymują
żadnych gratyfikacji pieniężnych. Jedynym motywem nadsyłania prac, jest zasada "publikuj albo giń".
Działalność naukowców jest bowiem oceniania na podstawie liczby i jakości artykułów naukowych,
które udało im się opublikować w czasopismach naukowych. Wyjątkiem są tylko tzw. artykuły zamawiane
w czasopismach przeglądowych. Przywilej ich pisana mają jednak zwykle tylko najwybitniejsi specjaliści ze
swoich dziedzin.
Czasopisma naukowe może ogólnie podzielić na:
- zródłowe - w których publikowane są głównie artykuły opisujące oryginalne badania naukowe,
- przeglądowe - w których publikowane są wyłącznie artykuły opisujące i zestawiające wnioski
z wielu publikacji zródłowych,
- naukowo-techniczne - nastawione na publikowanie artykułów omawiających badania na styku nauki i przemysłu
- np. opisujące wdrożenia wynalazków lub te badania naukowe, które szybko mogą znalezć jakieś zastosowa
- branżowe - które są przeznaczone głównie dla ludzi z przemysłu i zamieszczają artykuły o nowościach technologicznych,
nowinki z "branży" oraz naukowe artykuły przeglądowe, które potencjalnie mogą zainteresować
ludzi wdrażających nowe technologie,
- popularnonaukowe - które zamieszczają uproszczone artykuły przeglądowe, pisane w taki sposób aby mogły
je zrozumieć osoby bez wykształcenia z opisywanej dziedziny.
Czasopisma naukowe
- ocena jakości czasopisma
Lista filadelfijska  jest to lista czasopism naukowych o dużym prestiżu naukowym stworzona przez
Institute of Scientific Information zwany popularnie Instytutem Filadelfijskim.
Instytut ten oferuje odpłatnie dostęp do kilkudziesięciu różnych baz danych, z których najbardziej znane to:
ISI Citation Index - czyli indeks cytowań poszczególnych artykułów publikowanych w czasopismach naukowych.
ISI Journal Citation Reports - czyli sumaryczny indeks liczby i dynamiki cytowań wszystkich artykułów w danym
czasopiśmie - jest on podstawą do przyznawania poszczególnym czasopismom
tzw. Impact factor - która jest miarą prestiżu i siły oddziaływania danego czasopisma.
Current Contents - czyli zbiory abstraktów czasopism z wybranych dziedzin nauki.
Dostępne są Science Current Contents, Biomedicinal Current Contents,
Arts & Huminites Current Contents, Social Sciences Current Contents.
Czasopisma naukowe
- ocena jakości czasopisma
- IMPACT FACTOR
Impact factor - (IF)  w wolnym tłumaczeniu  Miara oddziaływania
 to wskaznik prestiżu i siły oddziaływania czasopism naukowych, ustalany przez Instytut Filadelfijski
(Institute of Scientific Information), na podstawie prowadzonego przez ten instytut
indeksu cytowań publikacji naukowych.
Wskaznik ten, dzięki autorytetowi Instytutu Filadelfijskiego, ma ogromne znaczenie zarówno
dla ocenianych w ten sposób czasopism jak i poszczególnych autorów publikacji zamieszczanych w tych czasopismach.
Znaczenie tego wskaznika jest potrójne:
-Dla czasopism jest to często  być albo nie być  czasopisma, których IF z roku na rok maleje zwykle tracą dobrych
autorów i czytelników i w końcu tracą na znaczeniu zupełnie. Stąd, czym czasopismo ma wyższe IF tym sito selekcji
publikacji, które się mogą w tym czasopiśmie ukazać jest ostrzejsze. Jeśli system selekcji danego czasopisma jest
wadliwy odbija się to natychmiast w spadku jego IF.
-Dla autorów jest to z jednej strony istotny czynnik przy decydowaniu, do jakiego czasopisma wysyłać swoją publikację,
a z drugiej liczba przyjętych do druku publikacji w czasopismach o wysokim IF jest miarą jakości badań naukowych
opisywanych przez danego autora.
-Dla instytucji naukowych miarą wartości prowadzonych w nich badań jest liczba publikacji przyjętych do druku w
czasopismach o wysokim IF, które zostały napisane przez pracowników tych instytucji.
Czasopisma naukowe
- ocena jakości czasopisma
- IMPACT FACTOR
1. CA-CANCER J CLIN 49.794
2. ANNU REV IMMUNOL 47.400
3. NEW ENGL J MED 44.016
4. ANNU REV BIOCHEM 33.456
5. NAT REV CANCER 31.694
6. SCIENCE 30.927
7. NAT REV IMMUNOL 30.458
8. REV MOD PHYS 30.254
9. NAT REV MOL CELL BIO 29.852
10. CELL 29.431
11. NATURE 29.273
12. NAT MED 28.878
13. PHYSIOL REV 28.721
14. NAT IMMUNOL 27.011
15. NAT GENET 25.797
16. ANNU REV NEUROSCI 24.184
17. ANNU REV CELL DEV BI 23.690
18. LANCET 23.407
19. JAMA-J AM MED ASSOC 23.332
20. NAT BIOTECHNOL 22.738


Wyszukiwarka

Podobne podstrony:
bioinfoI wyklad03
elementy bioinformatyki wyklad4
Bioinformatyka wykłady
bioinfoI wyklad04
bioinfoI wyklad02
bioinfoI wyklad01
bioinfoI wyklad05
Sieci komputerowe wyklady dr Furtak
Wykład 05 Opadanie i fluidyzacja
WYKŁAD 1 Wprowadzenie do biotechnologii farmaceutycznej

więcej podobnych podstron