Seminarium :
Algorytmy biologii
obliczeniowej.
WPROWADZENIE
Justyna Zakręt
Alicja Kubicka
Zarys historyczny
V I - V w . p . n . e – p i e r w s z e te o r i e d z i e d z i c z n o ś c i
X I I I – X I X w . n . e – r o z w ó j g e n e ty k i ( p r z y c z y n ą r o z w o j u te j g a ł ę z i
w i e d z y ,
s ta ł o s i ę d ą ż e n i e d o d o s k o n a l e n i a o d m i a n z b ó ż i b y d ł a )
1 8 2 2 - 1 8 8 4 - a u s tr y j a c j i m n i c h G r z e g o r z M e n d e l i j e g o
o b s e r w a c j e g r o s z k u
1 9 0 9 - W i l h e l m J o h a n n s e n – n a z w a n i e j e d n o s te k
o d p o w i e d z i a l n y c h z a p r z e n o s z e n i e c e c h g e n e m i
p o c z ą te k X X w . - T . H . M o r g a n i w s p ó ł p r a c o w n i c y z U n i w e r s y t e tu
C o l u m b i a – o b s e r w u j ą m u s z ę o w o c ó w k ę
1 9 1 0 - T . H . M o r g a n – g e n y tw o r z ą c h r o m o s o m
1 9 5 3 - F . C r i c k i J . W a t s o n – D N A j e s t d u ż ą c z ą s te c z k ą w
k s z t a ł c i e p o d w ó j n e j s p i r a l i )
Prawa Mendla to reguły przekazywania
cech
Zostały sformułowane w
przez
Mendla podczas jego
badań na groszku pachnącym.
W uwspółcześnionej postaci,
uwzględniającej naszą obecną wiedzę o
chromosomach i genach, brzmią następująco:
1.Pierwsze prawo Mendla- Prawo czystości
gamet - każda gameta wytwarzana przez
z danej
pary
. Wynika z tego, że każda
płciowa musi zawierać po jednym genie z
każdej pary alleli.
2.Drugie prawo Mendla- Prawo niezależnej
segregacji cech - geny należące do jednej
pary alleli są dziedziczone niezależnie od
genów należących do drugiej pary alleli.
Prawa Mendla
Od szczegółu do ogółu
Ludzkie chromosomy
Chromosom od greckiego
chromo
– barwa
i
soma
- ciało
Chromosomy
•najważniejsze składniki jąder
komórkowych
•Siedlisko czynników dziedzicznych
•Zbudowane z silnie barwiącej je
chromatyny
•W skład chromatyny wchodzą
długie cząsteczki DNA, RNA i białka
histynowe
•Każdy organizm posiada we
wszystkich
swych komórkach taką samą
liczbę
chromosomów
Chromosomy cd..
•Osobniki diploidalne posiadają w komórkach
somatycznych po
dwa takie same zestawy
chromosomów ( jeden od
organizmu matczynego
drugi od organizmu ojcowskiego);
•Liczba chromosomów ich kształt i wielkość są dla
danego
gatunku stałe i charakterystyczne
• U człowieka występują 22 pary chromosomów homologicznych
(jednakowych) i jedna para chromosomów płciowych
(różnych od siebie).
chromosomy cd..
Specjalne metody barwienia
Pozwalają dostrzec szczegóły
budowy, chromosomów.
Każdy z nich ujawnia po
wybarwieniu unikalny wzór
jasnych i ciemnych prążków.
KWASY NUKLEINOWE
• Budowa kwasów nukleinowych
• DNA
• RNA
DNA
deoxyribonucleic acid
kwas deoksyrybonukleinowy
Formy DNA
RNA
ang. ribonucleic acid
struktura kwasu rybonukleinowego
• mRNA
• tRNA
Biosynteza białka.
Opis cząsteczki
Wygląd cząsteczki
Liczba aminokwasów
Peptydy
od 2
Oligopeptydy
kilka - kilkanaście
Polipeptydy
poniżej 100
Białka
powyżej 100
Budowa białek
Biosynteza białka
to proces
doprowadzający do wytworzenia w pełni
funkcjonalnych cząsteczek białek Proces
ten ma miejsce stale w każdej żywej
komórce.
Synteza białka jest to procesem wieloetapowym, na który
składają się:
1.
transkrypcja
- przepisanie informacji z
DNA
na
RNA
,
proces ten odbywa się w
jądrze komórkowym
2.
translacja
- RNA przedostaje się z jądra komórkowego
do
cytoplazmy
komórki i tam następuje odkodowanie
informacji zawartej w RNA i na tej podstawie tworzony
jest łańcuch polipeptydowy
3.ukształtowanie struktury drugo- i trzeciorzędowej, czyli
odpowiednie zwinięcie się łańcucha aminokwasów
4.potranslacyjna modyfikacja cząsteczki białkowej, ten
etap nie zawsze występuje, polega najcześciej na
doczepieniu do cząsteczki białka różnych cukrów
złożonych (glikozylacja)
Krótka charakterystyka poszczególnych etapów.
Transkrypcja
Kod genetyczny
Translacja
Geny
Przepływ informacji
Geny
Założenia teorii Hunta Morgana :
-geny to jednostka dziedziczenia
-geny znajdują się w chromosomach
i maja tam swoje ściśle
określone miejsce
-geny ułożona są liniowo
Egzon –
(spotykane również ekson)
odcinki kodujące
Intron - odcinki nie kodujące
Genom
Zespół genów zawarty w pojedynczym zespole chromosomów
danego organizmu
do 1973 - zlokalizowano 60 ludzkich genów w 22 chromosomach
do 1981 – 400
do 1993 - 2150
Ludzki genom to 3 miliardy par zasad w haploidalnym ludzkim
genomie.
Każdy gen ma 10 000 par zasad.
Ponad 4 tysiące chorób
genetycznych
wynika z dziedziczenia
zmutowanego
genu. Niektóre z nich to :
-karłowatość
-Zwłóknienie torbielowate
-Pląsawica Huntingtona
-Niedokrwistość sierpowata
-Talassemia (choroba krwi)
-Zespół Downa – dodatkowa
kopia
chromosomu 21
Choroby wynikające z
dziedziczenia
„genów predysponujących”
-Choroby serca
-Cukrzyca
-Niektóre typy nowotworów
Choroby genetyczne
Choroby ludzkie zlokalizowane w
Chromosomie X
„Wiedza nigdy nie rozstrzygnie
jednego problemu bez
stworzenia dziesięciu nowych"
Bernard
Shaw
Narzędzia bioinformatyczne
i miejsce informatyki
Pole dla informatyki
katalogowanie informacji biologicznych (bazy danych,
wyszukiwanie sekwencji, adnotacji, danych
numerycznych w bazach danych)
analiza sekwencji DNA (składanie sekwencji,
adnotacja,
wyszukiwanie sekwencji kodujących,
motywów,
markerów)
analiza sekwencji genomów, porównywanie genomów
ustalanie ewolucyjnych relacji pomiędzy zbiorami
sekwencji /
organizmów
genotypowanie (używane między innymi do
wyszukiwania genów
odpowiedzialnych za choroby genetyczne, w
ustalaniu
ojcostwa, kryminalistyce)
analiza ekspresji genów (głównie ang. microarrays
analysis)
Pole dla informatyki
cd..
analiza sekwencji białek (porównywanie sekwencji,
wyszukiwanie
domen i motywów, przewidywanie własności
fizyko- chemicznych, drugo- i trzecio-rzędowej
struktury białka,
lokalizacji w obrębie komórki)
katalogowanie funkcji genów/białek, analiza dróg
metabolicznych
(np metabolizm lipidów)
oraz dróg sygnałowych (np od receptora na
powierzchni komórki
poprzez kaskadę kinaz do
czynników
transkrypcyjnych)
modelowanie układów biologicznych (np. kinetyka
szeregu reakcji
enzymatycznych w komórce)
morfometria / analiza obrazu?
tworzenie nowych algorytmów i metod statystycznych
do
analizy danych biologicznych
Algorytmy biologii
obliczeniowej
MEDYCYNA
INŻENIERIA
GENETYCZNA
SĄDOWNICTWO
GENETYKA
GENETYKA
MIKROORGANIZMÓW
BIOARCHEOLOGIA
ANTROPOLOGIA
EWOLUCJONIZM
???
Co warto pamiętać
Sekwencje nukleotydowe DNA(RNA) przedstawione
są jako szeregi jednoliterowych symboli !!!
(dla aminokwasów stosuje się czasem oznaczenia trzyliterowe).
Sekwencja białka – alfabet 20 – literowy ( dla 20
aminokwasów występujących w białkach).
Dla DNA i RNA – alfabet 4 literowy
Banki genów
Mapa fizyczna a
genetyczna
Mapa fizyczna (molekularna)
Odległość fizyczna.
Mapa genetyczna (klasyczna)
– pokazuje względne położenie
genów w chromosomie a nie
szczegóły molekularne.
Odległość genetyczna.
W ustaleniu położenia genu na chromosomie pomaga
porównanie mapy fizycznej i genetycznej
Algorytmy związane z mapami
fizycznymi i genetycznymi
Shortest Covering String Problem
n – liczba klonów
m – liczba sond
d
ij
– macierz hybrydyzacji
d
ij
=1 jeżeli klon C
i
zawiera sonde p
j
d
ij
= 0 w przeciwnym wypadku
S-ciąg nad alfabetem próbek p
1
,...,p
m
Ciąg S pokrywa klon C jeżeli istnieje
podciąg ciągu S zawierający
dokładnie taki sam układ sond jak C
(porządek sond jest pomijany)
Sekwencjonowanie
Sekwencjonowanie - jeden z etapów
analizy genu,.
Sekwencjonowanie na zasadzie hybrydyzacji
genomowej wykorzystywane jest w :
-nowoczesnym tworzeniu map genetycznych
-Diagnozowanie chorób genetycznych i wirusowych
-medycynie sądowej
na podstawie sekwencji istnieje możliwość
ustalenia kolejności
aminokwasów w białku, które jest kodowane
przez dany gen
Algorytm
Shortest Superstring Problem
NP.-trudny
Dane : zestaw ciągów s
1
,...s
n
Znaleźć najkrótszy ciąg s taki że każdy z s
i
pojawia
się w S jako podciąg ciągu s
W roku 1988 zaproponowano
nowe rozwiązanie
z wykorzystaniem
DNA (array )
Analiza porównawcza
Porównywanie genów ma znaczenie dla badań ewolucyjnych
Opracowano metodę szacowania podobieństwa sekwencji
DNA pochodzącego z różnych gatunków.
Algorytm LCS (Longest Common Subsequence)
Dane : dwa ciągi V=v1,...vn ; W=w1,...wm
Znaleźć ich największy wspólny podciąg.
TO JUŻ JEST
KONIEC
;)