Bioinformatyka wykładMocx

Bioinformatyka – wykład 4

Analiza sekwencji białkowej

Biochemia In-silico

Serwery „online” pozwalają określić wiele właściwości sekwencji białkowych

- masa cząsteczkowa

- współczynnik ekstynkcji

- połówkowy „czas życia” białka

Możliwa jest symulacja trawienia białka proteazami i rozkładu innymi czynnikami

chemicznymi. Dostępne na: www.expasy.ch

Podstawowe właściwości białka

wyznacza paramtery fizykochemiczna sekwencji białkowej: skład aminokwasowy

i atomowy, punkt izoelektryczny, współczynnik ekstynkcji, stabilność, itp.

UWAGA podczas interpretacji wyników!

Przykład: właściwości synataksyny 1A szczura P32851

przewiduje potencjalne miejsca trawienia sekwencji białkowej proteazami i czynnikami chemicznymi Przykład: trawienie albuminy surowicy człowieka

(ALBU_HUMAN, P02768)

Analiza lokalnych właściwości

- Regiony hydrofobowe mogą być domenami transmembranowymi

- Regiony „coiled-coiled” – wzajemne „nawinięcie” dwóch lub trzech alfa

α–helis są potencjalnymi domenami iterakcji białko-białko

- Jednolite regiony hydrofilowe są potencjalnymi pętlami „zahaczonymi” na powierzchni białka

- Przewidywanie metodą „przesuwanego okna” (prosta)

- Przewidywanie metodami Ukrytych Modeli Markowa (wyrafinowana)

Technika „przesuwanego okna”

- niewiele artefaktów

- niezbyt wielka czułość

Praktyczna zasada:

- okno powinno mieć rozmiar

- zbliżony do rozmiaru

- wykrywanego efektu

Domeny transmembranowe:

www.expasy.org)

serwera TMHMM (Transmembrane Helices, Hiden Markov Models)

ProtScale – przykład :Fragment reduktazy żelazowej P78588

(FREL_CANAL)

Skala hyfrofobowości

- np. Kyte’a & Doolittle’a

- np. Eisenberg’a

ProtScale

- wybór szerokości okna ! (19)

TMHMM – przewidywanie domen transmembranowych

Model struktury przestrzennej rodopsyny:

Rodopsyna, ze względu na barwę nazywana też purpurą wzrokową lub czerwienią wzrokową – światłoczuły barwnik występujący w narządzie wzroku (pręciki w siatkówce) głowonogów, stawonogów i kręgowców. Rodopsyna warunkuje widzenie zmrokowe – tj. odcieni szarości. Rodopsyna składa się z białka opsyny, które wiązaniem kowalencyjnym łączy się z kofaktorem 11-cis retinalem (retinenem), który pełni rolę chromoforu. Wiązanie łączy ε- aminową grupę lizyny w pozycji 296 łańcucha białkowego z grupą aldehydową retinalu. Żaden inny stereoizomer retinalu nie wykazuje takiej właściwości łączenia się z opsyną. Pod wpływem światła docierającego do znajdującej się w pręcikach rodopsyny (wystarczy 1 foton) dochodzi do izomeryzacji formy 11-cis retinalu w drugi izomer – formę alltrans. Rodopsyna jest białkiem transbłonowym złożonym z 7 helikalnych łańcuchów i zmiana konformacyjna rodopsyny, powoduje aktywację związanego z nią białka G,

transducyny, a następnie inicjację sygnału komórkowego. Metarodopsyna II pod wpływem witaminy A powraca do formy 11-cis, łączy się z powrotem z opsyną w cząsteczkę rodopsyny gotową do rozpadu. Nazywa się to cyklem widzenia. Istotny wydaje się być sposób pobudzenia neuronów w siatkówce. W awitaminozie A synteza rodopsyny jest niemożliwa, co objawia się upośledzeniem widzenia o zmroku (tzw. ślepota zmierzchowa). Za odkrywcę rodopsyny uważa się Franza Christiana Bolla

Białka G i receptory sprzężone z białkami G

Przewidywanie regionów wtórnie zwiniętych helis („coiled-coil”)

Przewidywanie modyfikacji post-translacyjnych:

Dojrzewanie białka modyfikacje potranslacyjne:

Dojrzewanie może obejmować:

Wzorce PROSITE’a i wyrażenia regularne

Przykłady wzorców PROSITE

- Miejsce aktywne dehydrogenazy L-mleczanowej [LIVMA]-G-[EQ]-H-G-[DN]-[ST]

- Aktywacja ubikwityny P-[LIVM]-C-T-[LIVM]-[KRH]-x-[FT]-P

- Miejsce fosforylacji kinazy tyrozynowej [RK]-x(2)-[DE]-x(3)-Y or [RK]-x(3)-[DE]-x(2)-Y

- Splicing białka [DNEG]-x-[LIVFA]-[LIVMY]-[LVAST]-H-N-[STC]

- p53 M-C-N-S-S-C-[MV]-G-G-M-N-R-R

Wyszukiwanie wzorców PROSITE

- „wzorce” – krótkie sekwencje związane z bardzo istotnymi właściwościami białka (lokalizacja komórkowa, wiązanie liganda, zmiana postranslacyjna, …)

- krótkie wzorce są mało informacyjne (przypadkowość)

- wzorce jedynie wskazują możliwość !

- aby wyciągnąć wnioski, należy zestawić wynik PROSITE’a z innymi informacjami

- dobrze sprawdzają się w identyfikowaniu krótkich motywów o określonej funkcji biologicznej

Przykład: prekursor ludzkiego czynnika V krzepniecia krwi – P12259

Rozszczepienie proteolityczne na dwa łańcuchy:

Coagulation factor V łańcuch ciężki (koniec N)

Coagulation factor V łańcuch lekki (koniec C)

bardzo liczne glikozylacje

- UniProt P12259

- ScanProsite

- „długie” wzorce

- „krótkie” wzorce: glikozylacja PS00001 ASN_GLYCOSYLATION aa. 51-54, …

uwaga: mirystylacja PS00008 MYRISTYL aa. ?20-27?, … (powinna występować na N-końcu)

Interpretacja wzorców PROSITE’a

- wzorce mogą sugerować nieistniejącą cechę białka: np.: wzorzec mirystylacji u prokariota - nieprawdopodobne; w białkach prokariota nie występuje mirystylacja!

(mirystylacja – przeniesienie reszty kwasu mirystynowego na N-końcową resztę glicyny)

- w tej sytuacji należy przygotować dopasowanie wielu sekwencji (prezentacja)

Domeny białkowe:

Definicja:

- strukturalna domeny białkowej - Niezależna jednostka fałdowania białka globularnego. Fragment cząsteczki białka zachowujący swój kształt po oddzieleniu od reszty cząsteczki białka

- oparta na sekwencji aa- Konserwatywne fragmenty sekwencji obecne w różnych białkach

Tytyna – największe nieoligomeryczne białko, 34 tys. aa, m.cz. 3.8 mln. Da ok. 280 domen

Wykrywanie domen

- dopasowywanie sekwencji tych białek,- identyfikowanie konserwatywnych segmentów

Palec cynkowy – domena białkowa:

Kolekcje domen

- Kolekcje ręczne są bardzo dokładne ale niewielkie

- Kolekcje automatyczne są bardzo obszerne ale mniej informacyjne

Kolekcje te : nakładają się na siebie i zostały zestawione przez różnych badaczy. Mają inne słabe i mocne strony, dlatego analizując swoje białko, należy korzystać ze wszystkich!

„Wielka 8”(prezentacja)

Przeszukiwanie kolekcji domen:

- InterProScan www.ebi.ac.uk/interproscan

- CD-Search (Conserved Domains) www.ncbi.nih.nlm.gov

- Motif Scan www.ch.embnet.org

Przykład: domeny białka fosB – FOSB_HUMAN P53539

„Suwak leucynowy”, „nożyce leucynowe” (ang. leucine zipper)

InterProScan to najpełniejsze wyszukiwanie domen w bazach domen. Daje możliwość porównania sekwencji z większością kolekcji. Nie podaje oceny statystycznej uzyskanych wyników.

Wynik przeszukiwania CD-Search:

- 10e-15 Małe E-value Dobre dopasowanie

- 2.1 Duże E-value Złe dopasowanie

Motif Scan

- Im wyższy wynik tym lepiej (mniej prawdopodobny przypadkowe podobieństwo do sekwencji domeny)

- Na ogół wyniki >7 mają wartość

- Wyniki „mocnego” dopasowania wyróżnione wykrzyknikiem (!)

Przeszukiwanie Motif Scan: Wykonanie: - UniProt P53539, - MotifScan

Analiza szczegółowa

Motif Scan daje możliwość sprawdzenia, czy aminokwas jest zachowany w badanej sekwencji

-Wysoki słupek powyżej 0 = Wysoce konserwatywny aminokwas w tym miejscu

-Zieleń = badana sekwencja ma oczekiwany aminokwas

-Czerwień = badana sekwencja nie ma w tym miejscu oczekiwanego aminokwasu

-R (Arginine) bardzo oczekiwana w tej pozycji • Wysoki słupek (np. potencjalne miejsce aktywne w przypadku enzymu)

-Jeśli badana sekwencja posiada w tym miejscu argininę . . .• Słupek wypełniony jest

zielenią (np. badane białko może posiadać aktywność enz.)

Kilka terminów

Analiza domen in-silico

Oprogramowanie do analizy sekwencji aminokwasowych


Wyszukiwarka

Podobne podstrony:
elementy bioinformatyki wyklad2
Bioinformatyka wykład 1
Bioinformatyka wykład 3
elementy bioinformatyki wyklad4
bioinformatyka wyklad #6
bioinformatyka wyklad #3
Bioinformatyka wykłady
bioinfoI wyklad01
elementy bioinformatyki wyklad3
bioinfoI wyklad03
bioinfoI wyklad02
Bioinformatyka wyklad #4
elementy bioinformatyki wyklad1
bioinformatyka wyklad #2
Bioinformatyka wykład 5
bioinfoI wyklad04
Bioinformatyka wykład ocx
elementy bioinformatyki wyklad2

więcej podobnych podstron