80% dokładność-^ struktura 3-cio rzędowa może narzucać preferencje (20%)-> algorytmy nie biorą globalnego wpływu na strukturę drugorzędową Modelowanie struktury na podstawie homologii sekwencji wiele białek ma podobną sekwencję aminokwasową w dużym stopniu podobne typy aminokwasów (Glutaminian i Asparaginian) identyczność sekwencji
30% homologii sekwencji zapewnia ponad 70% identyczności strukturalnej szukamy białek o wysokiej homologii sekwencji-^ wyznaczamy na podstawie struktury; strukturę białka mieszanego
jeżeli homologia < 30% to trzeba bardziej zaawansowanych metod
Postępowanie:
w bazach danych znaleźć najbliższe homologicznie białka zestawienie struktur-^ obszary odpowiadające sobie sekwencyjnie algorytmy punktowe - punkty '+’ gdy mamy podobny aminokwas a punkty za różnice; punkty karne za luki
można znaleźć obszary sekwencyjnie zakonserwowane-^ SRC - to te obszary
do tego program: FASTA, BLAST poszukują max. Nakrywania podobnych sekwencji
inny program-^ przenosi strukturę na białko o nieznanej strukturze: program MODELER
wysymulowanie pętli mniej jednoznacznie ustrukturyzowane
Weryfikacja:
minimalizowanie energii
Statystyczne przeszukiwanie przestrzei konformacyjnej modele , w któtych łańcuch białkowy ; sfery niektórych atomów : C, N, C łańcuch boczny reprezentuje się przez sfery o określonym promieniu i buduje się siatki (uproszczony model atomowy )-> bada się przemieszczenie sfer do innych oczek siatki-> mniejsza ilość konformacji
Kryteria przeszukiwania
procedura Monte- Carlo przypadkowe poszukiwanie przestrzeni dyskretnej by znaleźć globalne minimum energii wielkość białka ma znaczenie
CASP - konkurs; grupy doświadczalne deponują uzyskane struktury u organizatorów konkursu: modelowanie przez a,b,c, przewidywanie nowych struktur