bioinfo2009 wyk


Wykład 1

Bioinformatyka - to dyscyplina zajmująca się stosowaniem narzędzi matematycznych i informatycznych do rozwiązywania problemów z nauk biologicznych. Z bioinformatyką powiązane są: genomika, proteomika, metabolomikai transkryptomika

Cele bioinformatyki

Etapy sekwencjonowania genom genomów

Kompletnie zsekwencjonowane genomy

KRĘGOWCE (2)

ROŚLINY (2)

OWADY (1)

GRZYBY (10)

PIERWOTNIAKI (6)

NICIENIE (1)

Wykład 2

The gene is a union of genomic sequences encoding a coherent set of potentially overlapping functional products.

Zasoby pierwotne i wtórne

1) Pierwotne bazy danych

2) Wtórne bazy danych

Problemy w bazach danych

Wykład 3

GENOMIKA. MAPOWANIE GENOMÓW MAPY GENOMICZNE

Genomika strukturalna

1) Mapowanie genomu:

2) Sekwencjonowanie

Genomika porównawcza

Genomika funkcjonalna

Mapa genetyczna / Mapa fizyczna

0x01 graphic

Mapy genetyczna

1cM = 1% rekombinacji (1 crossing - over na 100 mejoz)

u ludzi to ok.0,7 - 1 Mb

Mapy fizyczna

pary zasad - pz (ang. bp, kbp)

Jeżeli markery A i B są na tym samym chromosomie, częstość rekombinacji jest > 0 i < 0.5

Jeżeli markery A i B są na różnych chromosomach, częstość rekombinacji jest = 0.5.

Marker genetyczny - polimorficzna sekwencja DNA (specyficzna) z jednego miejsca na chromosomie, używana do mapowania genetycznego, może być związana z fenotypem.

Jest to podstawowe narzędzie genetyka

klasa I (markery fenotypowe)

klasa II (markery DNA)

Markery DNA

RFLPs (Restriction Fragment Lenght Polymorphisms)

- tylko dwie formy alleliczne

- dużo miejsc cięcia w dużych genomach

SLPs (Simple Sequence Length Polymorphisms)

- minisatelity

- mikrosatelity

VNTRs (Variable Number of Tandem Repeats)

STRs (Short Tandem Repeats)

Zalety:

Wady:

Analiza SNP umożliwia wykrycie polimorfizmu pojedynczego nukleotydu w obrębie badanej sekwencji. Klasycznie polega to na amplifikacji określonego fragmentu genomu w reakcji PCR i sekwencjonowaniu uzyskanego produktu.

Zaletą tej techniki jest wysoka wydajność identyfikacji polimorfizmu w obrębie badanej sekwencji, wadą jest wysoki koszt analizy

Analiza sprzężeń

zaburzenia w analizach sprzężeń:

Mapowanie fizyczne

Wykład 4

EWOLUCJA GENOMÓW

Własności kodu genetycznego

Ewolucja genomów w wyniku:

Transpozony - to moduły DNA zdolne do przenoszenia się z jednego miejsca genomu w inne, na zasadzie transpozycji; transpozycja jest rekombinajcą nieuprawnioną, bowiem nie wymaga komplementarności, czyli odcinek transpozonu nie musi być komplementarny w stosunku do fragmentu DNA w który zostanie wstawiony

Wykład 5

Dopasowanie sekwencji Sequence alignment

Uliniawianie sekwencji - to sposób porównywania sekwencji pierwszorzędowej DNA, RNA bądź białek w celu identyfikacji regionów podobnych, które mogą być wynikiem funkcjonalnych, strukturalnych bądź ewolucyjnych związków pomiędzy sekwencjami. Uliniowione sekwencje rezyduów nukleotydów bądź aminokwasów zwykle są przedstawiane jako wiersze macierzy Pomiędzy znaki wstawiane są przerwy w taki sposób, aby zapewnić jak największą zgodność porównywanych sekwencji.

Ułożenie dwóch sekwencji biopolimerów (DNA, RNA lub białka) w celu zidentyfikowania regionów podobieństwa istotnego ze względów ewolucyjnych, strukturalnych lub funkcjonalnych (procedura oraz jej efekt).

Podobieństwo porównywanych sekwencji (similarity) może świadczyć o:

Podobieństwo porównywanych sekwencji (similarity) może wynikać z:

Różnice między sekwencjami świadczą o mutacjach, które zaszły po rozdzieleniu się sekwencji od wspólnego przodka

Porównywanie sekwencji jest bardzo pomocne w:

Dopasowanie par sekwencji:

Dot matrix - zastosowanie

Wykład 6

Programowanie dynamiczne - porównuje każdą parę znaków dwóch sekwencji i tworzy dopasowanie

Uwzględnia wszystkie możliwe przyrównania uwzględniając:

- dopasowanie (match): +1

- niedopasowanie (mismatch): -1

- przerwa (gap): -1

AGA--TTGATACCCA

AGACATTAA---CTA

Programowanie dynamiczne uwzględnia każdą dodawaną parę znaków i z powrotem przelicza optymalne dopasowanie

sekwencja 1: GATACTA

sekwencja 2: G A T T A C C A

0x01 graphic

0x01 graphic

Dopasowanie globalne - przyrównuje sekwencje na całej długości; wykorzystuje tak dużo znaków, jak to jest tylko możliwe.

Dopasowanie lokalne - przyrównuje fragmenty sekwencji, które wykazują największe podobieństwo; poszukuje najlepiej pasujących regionów; znajduje regiony konserwowane. Gdy obliczana wartość punktacji w macierzy jest mniejsza od zera, to wartość ta jest ustawiana na zero, a dopasowanie ulega zakończeniu do tego miejsca i rozpoczynany jest nowe` dopasowanie od nowego miejsca

Prosty system punktacji:

match: +1 +1

mismatch: -1 0

gap: -1 -1

Zaawansowany system punktacji (nadawanie różnych wag dla niedopasowań i przerw w zależnosci od ich długości):

sekwencje DNA

Match = +1

Mismatch = -3

Gap penalty = -5

Gap extension penalty = -2

sekwencje białkowe - Macierz Blossum62

Gap open penalty = -11

Gap extension = -1

Czy punktacja dopasowanie jest znacząco większa od punktacji oczekiwanej dla dopasowania losowych sekwencji o tej samej długości i składzie?

3 > Z - brak homologii

3 < Z < 6 - istnieje homologia

Z > 6 - silna homologia

Istotność dopasowania

Bit score - znormalizowana punktacja uwzględniająca warunki jego naliczania i przyjęte systemy punktacji (parametry lambda i K)

Jeżeli spodziewamy się znaleźć przynajmniej 3 dopasowania o punktacji >= S, to prawdopodobieństwo tego że znajdziemy co najmniej jedno wynosi 0,95. Programy z grupy BLAST posługują się wartością E zamiast bezpośrednim prawdopodobieństwem ze względu na łatwiejsze rozróżnienie

Dopaspwanie wielu sekwencji

Metody

Metody aproksymacyjne

Metody iteracyjne - wielokrotnie przeprowadzają dopasowania podgrup sekwencji, a następnie wykonują przyrównanie tych podgrup w dopasowanie globalne wszystkich sekwencji. Podgrupy są wybierane ze względu na ułożenie na drzewie filogenetycznym lub losowo.

0x01 graphic

Wykład 7

FILOGENETYKA

Podstawowe założenia w filogenetyce molekularnej

Węzeł - reprezentuje jednostkę taksonomiczną (populację, organizm, gen). Może przedstawiać współcześnie istniejący takson, jak i jego przodkaze

Gałąź - obrazuje związki ewolucyjne między porównywanymi jednostkami taksonomicznymi.

Długość gałęzi - zazwyczaj reprezentuje liczbę zmian, które się zdarzyły w danej linii ewolucyjnej.

Korzeń - wspólny przodek dla wszystkich taksonów.

Liść - reprezentuje aktualnie analizowaną jednostkę taksonomiczną.

Mechanizmy ewolucji

0x01 graphic

Metoda maksymalnej parsymonii - MP

Metoda maksymalnej wiarygodności - Maksimum likelihood (ML)

Hipoteza zegara molekularnego (MC)

JEDNOSTKA PAM (Percent Accepted Mutation) - odległości między sekwencjami. ercent ccepted utation miara odleg ci ewolucyjnej mi dzy sekwencjami

1 PAM - którego, porównywanych odpowiada takiemu czasowi ewolucyjnemu, podczas kt rego, w por wnywanych sekwencjach,

zmianie ulegnie 1 aminokwas na 100 (ok. 1 mln lat)

Macierz PAM - porównanie identyczności białek powiązaniach selekcję porównanie blisko spokrewnionych sekwencji białek (ponad 85% identyczności) o znanych powiązaniach filogenetycznych; naliczenie 1572 zmian zaakceptowanych (przez selekcję

Wady

Macierz BLOSUM - (BLOcks Substitution Matrix)

Utworzona przez porównanie około 2000 zachowanych bloków (regionów sekwencji) w ponad 500 rodzinach białek o różnej odległości ewolucyjnej. Bloki są regionami sekwencji odpowiedzialnymi za podobną funkcję biochemiczną lub strukturalną

Macierze dla różnych odległości ewolucyjnych zostały wyliczone z porównania sekwencji odpowiednio odległych:

BLOSUM30 - bloki sekwencji o co najmniej 30% identyczności reszt aminokwasowych

BLOSUM62 - bloki sekwencji o co najmniej 62% identyczności reszt aminokwasowych

BLOSUM80 - bloki sekwencji o co najmniej 80% identyczności reszt aminokwasowych

UPMGA - Unweighted Pair Group Method with Arithmetic Mean

Wykład 8

Wykres Ramanchandarna

0x01 graphic

Modyfikacje posttranslacyjne

Białka transmembranowe

Regiony nieuporządkowane - disordered regions

Regiony nieuporządkowane - gdzie?

Wykład 9

Dopasowanie (alignment) strukturalne - struktura 3D domeny jednego białka jest nakładana na strukturę domeny drugiego białka tak, aby średnia odległość między odpowiednimi atomami struktur była możliwie jak najmniejsza;

Porównanie struktur - programy

Wykład 10

NMR - magnetyczny rezonans jądrowy; oddziaływania momentów magnetycznych jąder atomowych z zewnętrznym polem magnetycznym wykorzystuje się protony, C13, N15

- najwięcej rozwiązanych struktur

- krystalizacja!

-białka w roztworze, ale ograniczenia wielkości białek, kosztowne znakowanie izotopowe

-duże struktury, np. kompleksy, zwykle z użyciem struktur krystalografia elementów

Oddziaływania van der Waalsa

Wykład 13

Analiza skupień (clustering) - poszukiwanie grup genów o podobnych profilach ekspresji

Analiza wzbogacenia zbiorów genów (gene set enrichment analysis) - poszukiwanie cech, w które pewne grupy genów, np. skupienia (klastry), są „wzbogacone” - np. anotacji funkcjonalnych

0x01 graphic



Wyszukiwarka

Podobne podstrony:
Wyk+éady[1], Biotechnologia 3 rok 1 i 2 sem, Bioinformatyka
EDI wyk
Wyk ad 5 6(1)
zaaw wyk ad5a 11 12
Wyk 02 Pneumatyczne elementy
Automatyka (wyk 3i4) Przel zawory reg
Wyk ECiUL#1 2013
wyk II
Wyk 07 Osprz t Koparki
budownictwo stany skupenia wyk 3
6 wykˆad WiĄzania chemiczne[F]
Wyk ECiUL#9S 2013
Wyk ad II

więcej podobnych podstron