Podstawy i zastosowania
bioinformatyki II
Marek Kudła
BLAST
Jak działa BLAST?
BAZA
DANYCH
podobne
np.
AGI
AGL
AGV
niepodob
ny
AGI
np.
FGT
BLAST
Sekwencja
białkowa
Sekwencja
DNA
blastn
blastp
blastx
tblastn
tblastx
Pfam – Protein families
• Białka można grupować w rodziny na
podstawie podobieństwa JEDNAK
• Często można wyróżnić określony motyw –
domenę, czy sekwencję peptydową, która
występuje u różnych, niespokrewnionych
ze sobą pod innym względem białek.
• Taka domena często ma określoną
specyficzną funkcję, np. aktywność
helikazy, czy rybonukleazy
Baza danych Pfam zawiera informacje o takich
domenach – opis funkcjonalny domeny, linki do
struktur krystalograficznych oraz prawdopodobną
sekwencję domeny w postaci multiple alignment
lub Position Specific Score Matrix
Znanych jest 7600 takich domen.
74% białek posiada przynajmniej jedną domenę w
bazie Pfam.
Multiple alignment dla domen
Position Specific Score Matrix
Pozycja 1: V 0,3 ; G 0,02 ; L 0,68
Pozycja 2: L 0,6 ; M 0,2 ; C 0,2
Pozycja 3: D 0,1 ; F 0,01 ; G 0,01 ; H 0,88
………
………
………
Pozycja N: A 0,99 ; G 0,01
PSI-BLAST