Bioinformatyka wykład 1

Bioinformatyka - wykład 1

  1. Czym jest Bioinformatyka?

  1. Bionformatyka - definicja

Definicja (robocza) przyjęta przez NIH17.07.2000 (http://www.bisti.nih.gov/docs/CompuBioDef.pdf ) Bioinformatics Definition Committee:

  1. Terminologia

Genom – materiał genetyczny zawarty w podstawowym(haploidalnym) zespole chromosomów.

Transkryptom jest to zestaw cząsteczek mRNA lub ogólniej transkryptów obecny w określonym momencie w komórce, grupie komórek lub organizmie. Transkryptom w

przeciwieństwie do genomu jest tworem bardzo dynamicznym.

Proteom (z ang. protein component of the genome) - zestaw białek występujących w organizmie, tkance, komórce lub przedziale komórkowym. W przeciwieństwie do genomów, proteomy nieustannie zmieniają się w odpowiedzi na różne czynniki.

  1. „Wielkoskalowe” projekty biologiczne -przykłady

Sekwencjonowanie kompletnego genomu, Próbkowanie transkryptomu (EST)

Równoczesna analiza ekspresji tysięcy genów (mikromacierze DNA, SAGE), Próbkowanie proteomu, Modelowanie metabolizmu, Symulacje,Bioróżnorodność

  1. Rola bioinformatyki

Sterowanie i zarządzanie danymi, Analiza surowych danych, statystyczne opracowanie i zgłębianie danych, Przechowywanie i dostęp do baz danych, Analiza wyników w kontekście biologicznym.

  1. Bioinformatyka zastosowania (przykładowe)

  1. in vivo, in vitro, in silico

Tradycyjne badania biologiczne przed erą bioinformatyki:

Bioinformatyka to biologia in silico (łac. w krzemie) tj. eksperyment w krzemie, z którego wykonane są mikroprocesory komputerów.

„Pierwsza informacja”

1. Sekwencja aminokwasowa (białkowa)

2. Sekwencja nukleotydowa (DNA, RNA)

Sekwencja białkowa

Białka są utworzone z aminokwasów połączonych wiązaniami peptydowymi. Sekwencje białkowe zwyczajowo są zapisywane „w kierunku” od N-końca do C-końca. Przeciętna „długość białka” w organizmie człowieka to ok. 400 aminokwasów. „Długość najdłuższego” białka tytyny (łączy włókna miozynowe z linią Z w sarkomerze mięśni poprzecznie prążkowanych) to ok. 30,000 aminokwasów, m.cz. 3-4,2 MDa (gen człowieka zawiera 363 eksony i koduje 34.350 aa).

Struktura białka

Białka posiadają dobrze określoną strukturę 3D (trójwymiarową).Dzisiaj już wiadomo, że nie jest to zawsze prawda !!!!! Hydrofobowe aminokwasy znajdują się w rdzeniu cząsteczki białka. Hydrofilowe aminokwasy znajdują się na powierzchni cząsteczki białka. Kendrew i Perutz w 1958r nagroda Nobla za krystalograficznie poznanie struktury białek hemowych (mioglobina).

DNA – Kwas Deoxyrybonukleinowy. Genomy i geny zbudowane są z DNA. DNA jest podstawowym materiałem zapewniającym dziedziczenie. J. Watson i F. Crick 1953r., nagroda Nobla w 1962 r. Sekwencje DNA tworzą 4 nukleotydy opartena zasadach azotowych:

Adenina A (puryna)

Guanina G (puryna)

Cytozyna C (pirimidyna)

Tymina T (pirymidyna)

w RNA Tyminę (T) zastępuje Uracyl (U)

Sekwencje DNA mogą być bardzo długie. Chromosomy człowieka zawierają setki milionów nukleotydów.

Dwuniciowy DNA. Sekwencje DNA zawsze mają dwie nici. Nici są komplementarne i mają przeciwną orientację. Umownie dla wygody zapisujemy nić tylko w kierunku 5’ -> 3’.Programy przeszukujące bazy danych, poszukujące geny, …na ogół automatycznie uwzględniają oba kierunki (choć nie zawsze!).

Sekwencja palindromowa DNA - cel większości enzymów restrykcyjnych, miejsca wiązania białek regulatorowych.

Sekwencje RNA: RNA zbudowane jest z 4 nukleotydów:

A, G, C, U

U to Uracyl

RNA nie zawiera Tyminy (T), Uracyl zastępuje Tyminę w RNA, RNA jest jednoniciowy. Występuje w postaciach: mRNA, tRNA, siRNA (ang. small RNA), miRNA (ang. micro RNA).

Drugorzędowe struktury RNA:

RNA może tworzyć struktury drugorzędowe. Struktura tworzona jest przy pomocy pojedynczej nici RNA. Struktury drugorzędowe złożone są ze spinek, ramion, pętli, wybrzuszeń, …

Jak długa jest sekwencja ?

Rozmiar białka jest wyrażany w liczbie aminokwasów lub w Daltonach

Długości sekwencji DNA i RNA są wyrażane w:

Poniższe terminy mają to samo znaczenie przy określaniu długości

sekwencji:

Genomy w liczbach:

Rozmiar

Liczba genów

Najbardziej upakowany zwierzęcy genom (2011 r.)Daphnia pulex

Genom człowieka:

Rozmiar: 3 x 109 nt haploidalnego genomu, 25% to sekwencje wysoce powtarzalne,

25-30% to umiarkowanie powtarzalne sekwencje. Rozmiar genu: od 900 do >2.000.000 nt (w tym introny). Proporcja genomu kodującego białka: 5-7%. Liczba genów: ok. 22,5 tys. Liczba chromosomów: 22 autosomalne,1 chromosom płciowy. Rozmiar chromosomu: 5 x 107 do 5 x 108 zasad.

Kod genetyczny (standardowy)

DNA jest transkrybowane do RNA z użyciem komplementarnych nukleotydów. RNA podlega translacji na sekwencję aminokwasową z użyciem kodu genetycznego:

Sześć ramek odczytu sekw. DNA (1-3)

Ramki odczytu sekwencji DNA

Tylko jedna z sześciu ramek (poza nielicznymi wyjątkami) jest wykorzystywana w danym regionie kodującym DNA. Kodujący obszar sekwencji pozbawiony kodonów STOP nazywamy otwartą ramką odczytu (ang. ORF = Open Reading Frame). Obszar ten potencjalnie może ulec translacji na białko. ORF nie jest tożsamy z genem!

Bioinformatyka – zastosowania:

Jak większość badaczy wykorzystuje bioinformatykę?

odnajduje cechy wspólne sekwencji

odnajduje pozycje ewolucyjnie konserwatywne

jest podstawą tworzenia drzew filogenetycznych

jest podstawą przewidywania struktury przestrzennej cząsteczki białka.

Bioinformatyka pozwala na zdobywanie realnej wiedzy przez wykonanie wirtualnych eksperymentów (in-silico)


Wyszukiwarka

Podobne podstrony:
elementy bioinformatyki wyklad2
Bioinformatyka wykład 3
elementy bioinformatyki wyklad4
bioinformatyka wyklad #6
bioinformatyka wyklad #3
Bioinformatyka wykłady
bioinfoI wyklad01
elementy bioinformatyki wyklad3
bioinfoI wyklad03
bioinfoI wyklad02
Bioinformatyka wyklad #4
elementy bioinformatyki wyklad1
Bioinformatyka wykładMocx
bioinformatyka wyklad #2
Bioinformatyka wykład 5
bioinfoI wyklad04
Bioinformatyka wykład ocx
elementy bioinformatyki wyklad2

więcej podobnych podstron