Modelowanie molekularne w
projektowaniu leków
Wykład IX
Modelowanie struktury białka na
podstawie homologii
Witold Rudnicki
ICM UW
Przewidywanie struktury białek
Przewidywanie struktury białek
na podstawie sekwencji
na podstawie sekwencji
Krzysztof Ginalski
Krzysztof Ginalski
ICM UW
ICM UW
Witold Rudnicki
ICM UW
Witold Rudnicki
ICM UW
VREVCSEQAETGPCRAMISR
WYFDVTEGKCAPFFYGGCGG
NRNNFDTEEYCMAVCGSA
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Sekwencje a struktury
białek
" sekwencje białkowe
banki sekwencji (SWISS-PROT, PIR, PRF)
ok. 1.300.000 poznanych sekwencji (NR)
" sekwencje DNA
banki sekwencji (GenBank, EMBL, DDBJ)
poznane genomy (wirusy, bakterie (ok. 80),
S. cerevisiae, A. thaliana, C. elegans, D.
Melanogaster, H. Sapiens)
kilkaset genomów w trakcie
sekwencjonowania
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Sekwencje a struktury białek
" ok. 18.000 znanych struktur białkowych (PDB)
krystalografia lub NMR
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Sekwencje a struktury białek
" niewielki procent białek ma poznaną strukturę 3D
" znajomość struktury konieczna dla zrozumienia
działania białka na poziomie molekularnym
1 RPDFCLEPPY 10 11
TGPCKARIIR 20 21
YFYNAKAGLC 30 31
FUNKCJA
QTFVYGGCRA 40 41
KRNNFKSAED 50 51
CMRTCGGA 58
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Teoretyczne metody
przewidywania struktury białek
" modelowanie w oparciu o homologiÄ™
" metody identyfikacji foldu
obecnie ok. 700 foldów (SCOP)
przeciÄ…ganie sekwencji przez struktury
(threading)
zaawansowane metody sekwencyjne,
metody hybrydowe
" metody ab initio
zwijanie na siatkach
składanie z krótkich fragmentów
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Modelowanie w oparciu o
homologiÄ™
" podobne sekwencje ®ð podobna struktura
rdzeń białka (a-helisy, b-wstęgi) niemal
identyczny
różnice w pętlach różna długość i konformacja
2I1B A-----PVRSLN-CTLRDS-QQKSLVMSGPYEL
2ILA NVKYNFMRIIKYEFILNDA-LNQSIIRANAQYL
1BFG ----------DP-KRLYCKNGGFFLRIHPDGRV
2I1B KALHLQGQDMEQQ-VVFSMSFVQGEESNDKIPV
2ILA TAAALH--NLDEA-VKFDMGAYKSSA---KITV
1BFG DGVRE----KSDPHIKLQLQAEER------GVV
2I1B ALGLKEKNLYLSCVLKDDKPTLQLESVDPKNYP
2ILA ILRISKTQLYVTAQD--EDQPVLLKEMPE--IP
1BFG SIKGVSANRYLAMKE---DGRLLASKS------
2I1B KKKM--EKRFVFNKIEI-NNKLEFESAQFPNWY
2ILA KTITGSETNLLFFWETH-GTKNYFTSVAHPNLF
1BFG ---V--TDECFFFERLESNNYNTYRSRKYTSWY
2I1B ISTSQAENMPVFLG--GTKGGQDITDFTMQFVS
2ILA IATKQD--YWVCLA--GG--PPSITDFQILE--
1BFG VALKRT--GQYKLGSKTGPGQ-KAILFLPMSA-
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Etapy modelowania
Wybór
Ustawienie
struktury
sekwencji białka
wzorca
modelowanego
względem
wzorca
Budowa
Sprawdzenie
wstępne
poprawności
go
modelu
modelu
Relaksacja
Wybór
struktury
konformacji
(MM, MD)
łańcuchów
bocznych
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Prawidłowe uliniowienie sekwencji badanej z
wzorcem jest warunkiem koniecznym
prawidłowego przewidywania struktury białka.
Jeżeli uliniowienie jest nieprawidłowe, lub wyrany
wzorzec jest niewłaściwy to model zawsze będzie
nieprawidłowy.
Procedury optymalizacji nie są w stanie poprawić
grubych błędów wynikających ze złego uliniowienia
Witold Rudnicki
ICM UW
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Ograniczenia w modelowaniu opartym o homologiÄ™
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Ograniczenia w modelowaniu opartym o homologiÄ™
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Ograniczenia w modelowaniu opartym o homologiÄ™
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
CASP
Critical Assessment of Techniques
for Protein Structure Prediction
" ogólnoświatowy eksperyment weryfikacji
metod teoretycznych
co 2 lata (wiosna-jesień)
podanych kilkadziesiąt sekwencji białek, których
struktury są na ukończeniu
" kategorie
CM - comparative modeling (modelowanie
homologiczne)
FR - fold recognition (rozpoznanie foldu)
NF - new folds (nowe foldy)
przewidywanie struktury drugorzędowej
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
CM Comparative Modeling
CM (targets manually assessed by Anna Tramontano)
CM Total Z-Scores Above 1.0 for CASP5 All Targets Listed Above:
CM Rank Group Z-Score Ngood Npred NgNW NpNW Group-name
CM ------------------------------------------------
CM 1 G020 47.17 24.50 38.50 25 39 Bujnicki-Janusz
CM 2 G453 46.55 27.00 42.00 27 42 Ginalski
CM 3 G517 42.82 25.50 39.50 26 40 GeneSilico
CM 4 G110 36.03 24.00 35.00 24 35 Honig
CM 5 G006 31.23 19.00 40.00 19 40 BIOINFO.PL
FR Fold Recognition (targets manually assessed by Nick Grishin) FR
Total Z-Scores Above 1.0 for CASP5 All Targets Listed Above: FR
Rank Group Z-Score Ngood Npred NgNW NpNW Group-name
FR ---------------------------------------------------
FR 1 G453 24.26 9.00 12.00 9 12 Ginalski
FR 2 G010 21.64 7.00 12.00 7 12 Skolnick-Kolinski
FR 3 G002 19.55 8.00 12.50 9 14 Baker
FR 4 G006 16.88 6.00 10.00 6 10 BIOINFO.PL
FR 5 G349 15.25 7.00 7.00 7 7 Shortle
FR 6 G029 14.56 6.50 11.50 7 13 BAKER-ROBETTA
Witold Rudnicki
ICM UW
NF New Folds (targets manually assessed by Rob Russell)
NF Total Z-Scores Above 1.0 for CASP5 All Targets Listed Above: NF
Rank Group Z-Score Ngood Npred NgNW NpNW Group-name
NF ----------------------------------------------------------
NF 1 G002 25.72 9.33 12.50 47 63 Baker
NF 2 G349 17.57 8.25 10.00 14 17 Shortle
NF 3 G132 13.46 5.00 10.00 5 10 I-sites/Bystroff
NF 4 G010 11.78 5.69 11.51 29 59 Skolnick-Kolinski
NF 5 G001 11.31 5.53 11.33 20 38 Sam-T02-human
NF 6 G016 10.50 6.70 9.30 26 36 Levitt
NF 7 G068 10.39 5.40 7.00 27 35 Jones-NewFold
AL All Models (targets assessed by one of the three assessors)
AL Rank Group Z-Score Ngood Npred NgNW NpNW Group-name
AL -------------------------------------------------------
AL 1 G453 75.94 38.50 64.50 39 65 Ginalski
AL 2 G020 59.00 33.00 50.50 35 53 Bujnicki-Janusz
AL 3 G002 57.76 25.33 48.88 80 127 Baker
AL 4 G010 57.59 25.79 49.89 58 116 Skolnick-Kolinski
AL 5 G517 55.07 32.25 59.00 36 65 GeneSilico
AL 6 G006 52.74 28.00 61.00 28 62 BIOINFO.PL
AL 7 G110 42.82 27.00 45.00 27 47 Honig
Witold Rudnicki
ICM UW
CASP przykładowe białka
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
T0155 (33%)
Probable dihydroneopterin aldolase
Probable dihydroneopterin aldolase
M. tuberculosis
M. tuberculosis
RMSD 0.78Å
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Fold: Alpha/beta-hydrolases (c.69)
T0195 (18%)
Hypothetical esterase in SMC3-MRPL8
Hypothetical esterase in SMC3-MRPL8
intergenic region; S. cerevisiae
intergenic region; S. cerevisiae
model
target
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Fold: Clathrin adaptor appendage domain (d.105)
T0134_2 (12%)
Delta-adaptin appendage domain
Delta-adaptin appendage domain
H. sapiens
H. sapiens
model target
RMSD 1.8Å
Witold Rudnicki
©Krzysztof Ginalski ICM UW
©Krzysztof Ginalski ICM UW
ICM UW
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Witold Rudnicki
©Janusz Bujnicki,
©Janusz Bujnicki,
ICM UW http://www.genesilico.pl/
http://www.genesilico.pl/
Wyszukiwarka
Podobne podstrony:
Modelowanie ewaluacji projektów europejskich ebook demoModelowanie molekularne metody Monte CarloModelowanie molekularne metodami chemii kwantowejProjekt modelowanie?nych12 Modelowanie form odzieży zgodnie z projektemBiologiczne mechanizmy molekularne Eksperymentalne poparcie dla wniosku o projekcie15 Modelowanie form odzieży zgodnie z projektemBlender Od planowania, modelowania oraz teksturowania do animacji i renderingu Praktyczne projektyModelowaniu w Projektowaniu Maszynwięcej podobnych podstron