Bioinformatyka wykład 5

Bioinformatyka – wykład 5

Wyszukiwanie w bazach sekwencji BLAST:

Podobieństwo sekwencji

- podobną strukturę 3D (białka), - często podobną funkcję (białka)

Homologia

- mogą być lub nie być homologiczne

- przy takiej identyczności nie można stwierdzić jednoznacznie

Homologia, podobieństwo i identyczność

- sekwencja A może być „w 32 % identyczna” jak sekwencja B

- np. izoleucyna i leucyna są podobne

- sekwencja A JEST lub NIE JEST homologiczna z sekwencją B

- sekwencja A NIE może być „w 40% homologiczna z” B

Jak ustalić homologię?

- (specjaliści preferują ocenę na bazie E-value)

- analogia do np. „Jaś i Małgosia są prawdopodobnie rodzeństwem ponieważ są bardzo podobni”

Biologia in-silico:

BLAST:

BLAST – funkcje:

Wybór właściwego BLAST’a białkowego

Zadanie BLAST

Informacje nt białka (np. funkcji) blastp (P Û P)

blastp porównuje analizowane białko

z białkami w bazie danych

Wykrycie nowych genów kodujących tblastn (P Û P ¬ N)

białko tblastn porównuje analizowane białko

z sekwencjami DNA po translacji w 6 możliwych ramkach odczytu

Uruchomienie blastp

Blastp – przykład

Raport BLAST’a

Ilustracja graficzna (NCBI Blast):

Wykaz trafień

-zależny i charakterystyczny dla konkretnej bazy sekwencji

- Uzyskana na podstawie macierzy zastąpień

- Duża wartość oceny = dobre dopasowanie

- wartości poniżej 50 wskazują na bardzo słabe dopasowanie

- Mała wartość E-value = dobre dopasowanie

blastp – macierz zastąpień (substytucji)

Ocena E-Value

„Ile razy może przypadkowo pojawić się dopasowanie sekwencji co najmniej tak

dobre jak uzyskane (tj. o nie gorszej ocenie Bits score) w przeszukiwanej bazie?”

- ocena oparta jest na wartości podobieństwa sekwencji i liczbie rekordów w bazie

danych

- najbardziej prawdopodobnym wyjaśnieniem obserwowanego podobieństwa jest wspólne pochodzenie

- wnioskujemy o homologii analizowanych sekwencji

„Dobre” i „złe” wartości E-Value

1 = „złe” E-Value

1e-3 = 1x10-3 = „graniczne” E-value

1e-4 = 1x10-4 = „dobre” E-Value

1e-10 = 1x10-10 = „bardzo dobre” E-Value

Dlaczego używamy E-Value?

- PSI-BLAST (BLAST ukierunkowany na relacje ewolucyjne)

- Analiza domen (p. MotifScan)

- FASTA (wyszukiwanie sekwencji podobnych)

- możność porównywania wyników różnych programów

Dopasowania na przykładzie NCBI Blast.

-bywa więcej niż jeden w sekwencji

-Identities identyczne

-Positives identyczne i podobne(+)

-Gaps przerwy w dopasowaniu

- np. bogate w Pro (P) lub Glu (E)

- regiony o małej złożoności nie są brane pod uwagę podczas dopasowywania

- unikanie fałszywych trafień

BLAST sekwencji DNA

- kodujące DNA blastx (N ® P Û P), tblastx (N ® P Û P ¬ N)

- nie kodujące DNA blastn (N Û N)

Zapytanie a BLAST

Wybór właściwego BLAST’a nukleotydowego

Zadanie BLAST

Analiza niekodującego DNA blastn (N Û N)

blastn działa dobrze tylko w

przypadku bliskich sekwencji DNA

(ponad 70% identyczności)

Wykrycie nowych białek tblastx (N ® P Û P ¬ N)

Wykrycie białek kodowanych przez blastx (N ® P Û P)

analizowaną sekwencję DNA

Ocena jakości sekwencji DNA blastx (N ® P Û P)

badana sekwencja DNA jest kodująca

ale istnieje podejrzenie, że zawiera

błędy w sekwencji

Znaczenie BLAST

Poszukiwanie genu z BLAST’em

Zadanie

Poszukiwanie genu

Wykorzystanie BLAST’a

Analiza strukturalna z BLAST’em

Zadanie

Przewidywaniestruktury 3D białka

Wykorzystanie BLAST’a

Analiza in-silico z BLAST’em

Zadanie

Przewidywanie funkcji białka

Wykorzystanie BLAST’a

Zgromadzenie członków rodziny białkowej

Zadanie

Znajdowanie członkówrodziny białkowej

Wykorzystanie BLAST’a

PSI-BLAST

- bardziej czuły niż BLAST: znajduje dopasowania, które BLAST nie znajdzie

- bardziej specyficzny niż BLAST: znajduje mniej fałszywych dopasowań

- wolniejszy niż BLAST

- pozwala na zidentyfikowanie bardzo odległych członków rodziny białka

Iteracje PSI-BLAST

PSI-BLAST – przykład

Leghemoglobina jest hemoproteiną wiążącą tlen znalezioną w brodawkach korzeniowych roślin motylkowych. Rośliny te pozostają w symbiozie z bakteriami posiadającymi zdolność wiązania azotu atmosferycznego (bakterie brodawkowe). Kompleks enzymatyczny – nitrogenaza odpowiedzialny za przekształcenie azotu cząsteczkowego do jonów amonowych może działać tylko w środowisku beztlenowym. Dlatego jej działanie w komórkach korzeni roślin jest możliwe po obniżeniu stężenia tlenu poprzez związanie go z leghemoglobiną. (źródło: Wikipedia)

-P69905 (HBA_HUMAN) Hemoglobina człowieka

-PSI-BLAST w NCBI

Kilka wskazówek dot. używania PSI-BLAST’a


Wyszukiwarka

Podobne podstrony:
elementy bioinformatyki wyklad2
Bioinformatyka wykład 1
Bioinformatyka wykład 3
elementy bioinformatyki wyklad4
bioinformatyka wyklad #6
bioinformatyka wyklad #3
Bioinformatyka wykłady
bioinfoI wyklad01
elementy bioinformatyki wyklad3
bioinfoI wyklad03
bioinfoI wyklad02
Bioinformatyka wyklad #4
elementy bioinformatyki wyklad1
Bioinformatyka wykładMocx
bioinformatyka wyklad #2
bioinfoI wyklad04
Bioinformatyka wykład ocx
elementy bioinformatyki wyklad2

więcej podobnych podstron