Bioinformatyka skrypt3


Spis treści
5 Budowa kwasów nukleinowych ...................................................................................................... 68
5.1 Nukleotydy ............................................................................................................................... 68
5.2 Aaocuch polinukleotydowy ...................................................................................................... 71
5.3 Nić komplementarna ............................................................................................................... 71
6 Centralny dogmat Biologii Molekularnej ....................................................................................... 74
7 Przepływ informacji genetycznej .................................................................................................... 76
7.1 Kod genetyczny ....................................................................................................................... 77
7.2 Rodzaje Mutacji ....................................................................................................................... 80
7.3 Poziomy mutacji ...................................................................................................................... 81
Skrypt Bioinformatyka DRAFT Strona 67
5 Budowa kwasów nukleinowych
5.1 Nukleotydy
Kwasy nukleinowe (DNA i RNA) zbudowane są z nukleotydów.
Nukleotydy zbudowane są z reszty cukrowej, zasady azotowej i reszty fosforanowej.
Reszta cukrowa występująca w kwasach nukleinowych to pentoza: w DNA - deoksyryboza, która w
pozycji 2 ma wodór zamiast grupy -OH (D-Deoksyryboza, 2-Deoksy-D-ryboza), a w RNA - ryboza.
(Rysunek)
H H
5' 5'
OH OH
C C
H H
OH OH
O O
1' 1'
4' 4'
H H H H
H H
2' 2'
3' 3'
OH OH OH H
Rysunek. Ryboza i deoksyryboza.
Zasady azotowe występujące w kwasach nukleinowych to puryny (R): adenina (A) i guanina (G),
oraz pirymidyny (Y): tymina (T), cytozyna (C) i uracyl (U). W DNA występują A, G, T i C, w RNA
zamiast T występuje U.
Poza tymi pięcioma najbardziej znanymi zasadami w DNA i RNA występują jeszcze ich
zmodyfikowane wersje. W DNA: 5-metylocytydyna (m5C), a RNA: pseudourydyna (),
dihydrourydyna (D), inosyna (I), rybotymidyna (rT) i 7-metylguanosyna (m7G).
Skrypt Bioinformatyka DRAFT Strona 68
puryny (R) pirymidyny (Y)
H H
N
H
6
6
N N
7
5 3
5
1
H 8
2
4 4 2
9
3
1
N
H H
H
N N
H
adenina (A) guanina (G) tymina (T) cytozyna (C) uracyl (U)
Nukleozydy powstają w wyniku połączenia zasady azotowej z pentozą (węgiel C1) wiązaniem N--
glikozydowym. Zasady połączone z rybozą tworzą rybonukleozydy, a z deoksyrybozą -
deoksyrybonukleozydy.
dA dG dT dC
rA rG rU rC
Skrypt Bioinformatyka DRAFT Strona 69
Reszta fosforanowa to reszta kwasu ortofosforowego, czyli nukleotydy są jego estrami: 5'-fosforany
nukleozydów.
5'adenozyno monofosforan (AMP) :
deoksy 5'adenozyno monofosforan (dAMP) :
Skrypt Bioinformatyka DRAFT Strona 70
5.2 Aańcuch polinukleotydowy
Nukleotydy łączą się wiązaniem fosfodiestrowym tworząc łańcuchy polinukleotydowe (DNA lub
RNA)
(rysunek: http://en.wikipedia.org/wiki/File:PhosphodiesterBondDiagram.png)
[....]
5' i 3' koniec łańcucha
więcej o nici DNA
[....cdn]
v
5.3 Nić komplementarna
Skrypt Bioinformatyka DRAFT Strona 71
[....]
wiązania wodorowe między nukleotydami, pary komplementarne, nić komplementarna
[....]
DNA i RNA - jedno i dwuniciowe, różne formy helis DNA
Skrypt Bioinformatyka DRAFT Strona 72
(Rysunek: http://en.wikipedia.org/wiki/File:A-DNA,_B-DNA_and_Z-DNA.png)
A-DNA, B-DNA, Z-DNA
Skrypt Bioinformatyka DRAFT Strona 73
6 Centralny dogmat Biologii Molekularnej
" informacja genetyczna przechowywana jest w sekwencji zasad polimeru DNA
" trójki (tryplety) zasad DNA kodują 20 naturalnych aminokwasów
" sekwencja aminokwasów w białku determinuje jego strukturę
" sekwencja i struktura determinują funkcję
Bioinformatyka
Skrypt Bioinformatyka DRAFT Strona 74
Złożoność informacji i procesów komórkowych
Człowiek posiada 1013 KOMÓREK!  każda ma identyczny skład DNA o długości około 3,2x109pz
Ł ... identyczny skład, ale zróżnicowane typy komórek i różne funkcje tkanek
Ł ... z 3,2x109pz tylko 1.5% koduje białka!
Wielkość genomu nie koreluje się ze złożonością organizmu
wśród bezkręgowców i kręgowców można znalezć większe genomy od ludzkiego
- jeden z gatunków ameby ma aż 100x więcej DNA niż człowiek
- na ogół genomy prokariotyczne są mniejsze od eukariotycznych
- genom prokariotyczny ma wielkość poniżej 5Mpz (np. Escherichia coli 4,64 Mpz)
Gen/Genom
Skrypt Bioinformatyka DRAFT Strona 75
GENOM...
7 Przepływ informacji genetycznej
Skrypt Bioinformatyka DRAFT Strona 76
7.1 Kod genetyczny
-translacja
Otwarte ramki odczytu (ORF)
otwarte ramki odczytu  ORF (Open Reading Frame). wszystkie możliwe sekwencje DNA
rozpoczynające się kodonem ATG (kodon inicjujący translację) i kończące TAG, TAA lub TGA
(kodony  stop ) w tej samej fazie odczytu.
Skrypt Bioinformatyka DRAFT Strona 77
1' sekwencja czytana od pierwszego nukleotydu: +1, pierwsza ramka odczytu
2' sekwencja czytana od drugiego nukleotydu: +2, druga ramka odczytu
3' sekwencja czytana od trzeciego nukleotydu: +3, trzecia ramka odczytu
sekwencja nici komplementarnej czytana od pierwszego nukleotydu: -1, czwarta ramka odczytu
sekwencja nici komplementarnej czytana od drugiego nukleotydu: -2, piąta ramka odczytu
sekwencja nici komplementarnej czytana od trzeciego nukleotydu: -3, szósta ramka odczytu
Skrypt Bioinformatyka DRAFT Strona 78
Skrypt Bioinformatyka DRAFT Strona 79
7.2 Rodzaje Mutacji
J.T. den Dunnen, S.E. Antonarakis: Hum Genet 109(1): 121-124, 2001
Zmienność sekwencji (sequence variation)
mutacje - zmiany odpowiedzialne za choroby
polimorfizm - zmiany nie wywołujące chorób, spotykane w częściej niż w 1% populacji
Rodzaje mutacji
chromosomowa - aberracja chromosomowa to zmiana liczby lub struktury chromosomów.
genomowa - utrata lub pojawienie się dodatkowych pojedynczych chromosomów, lub
zwielokrotnieniu całego genomu (poliploidalność)
genowa - zmiana dziedziczna zachodząca w genie, na poziomie kwasu
dezoksyrybonukleinowego DNA
Skrypt Bioinformatyka DRAFT Strona 80
7.3 Poziomy mutacji
Opis zmian powinien być dokonywany na najbardziej podstawowym poziomie. Np. w przypadku
DNA na sekwencji genomowej lub cDNA
Zmiany opisuje się względem sekwencji pierwotnej zdeponowanej w bazie danych: GenBank, EMBL,
DDJB, SWISS-Prot.
Poziomy:
" DNA
" RNA
" Białko.
Mutacje DNA
Substytucja
Substytucja (zamiana) oznaczana przez  >
76A > C nukleotyd 76A zamieniony na C
88+1G > T (IVS2 +1G > T) G zamieniony na T w +1 intronu 2, pozycja 88-89 w odniesieniu
do cDNA (+1 : ATG kodon inicjujący translacje, -1: brak zasady 0)
Delecja
Delecja (deletion)  del za nukleotydem oznaczającym delecje
76_78del (76_78delACT) oznacza usunięcieACT zmiejsca 76 to 78
82_83del (82_83delTG) oznacza usunięcie TG z sekwencji
ACTTTGTGCC (G jest 82 nukleotydem) wynik: ACTTTGCC
Insercja
Insercja (insertions)  ins między nukleotydami, oznaczającymi miejsce wstawienia. (uwaga: czasami
dodaje się "^"- np. 83^84insTG)
76_77insT oznacza wstawienie T między nukleotydami 76 a 77
83_84insTG oznacza wstawienie TG do sekwencji powtórzeń tandemu TG
ACTTTGTGCC (G jest 83 nukleotydem) ACTTTGTGTGCC.
insercja/delecja
Skrypt Bioinformatyka DRAFT Strona 81
insertion/deletions (indels)
delecja/insercja (delins) delecja, po której następuje insercja
112_117delinsTG
lub 112_117delAGGTCAinsTG
lub 112_117>TG
oznacza zastąpienie nukleotydów 112 to 117 (AGGTCA) przez TG
Powtórzenia
Powtórzenia krótkiej sekwencji (variability of short sequence repeats), np..:
ACTGTGTGCC (A jest 1991 nukleotydem)
1993(TG)3-6 sekwencja zawiera od miejsca 1993 TG-dwunukleotyd, który powtarza się w
populacji 3-6 razy
Duplikacje
duplikacje (duplications) oznaczane przez  dup ponukleotydzie oznaczajacym miejsce duplikacji
77_79dupCTG nukleotydy 77 do 79 są powielone
82_83dupTG (lub 83_84insTG)
(short tandem repeats lub single nucleotide stretches) insercja TG do sekwencji powtórzeń
tandemu TG:
ACTTTGTGCC (A jest 76 nukleotydem) ACTTTGTGTGCC
Inwersja
Inwersja (inversions) oznaczana  inv za nukleotydem oznaczającym miejsce rozpoczęcia inwersji. -
obrócenie sekwencji o 180o
203_506inv ( 203_506inv304) znacza, że 304 nukleotydy od 203 do 506 zostały odwrócone
Inne mutacje DNA:
translokacja
zmienność w obrębie różnych alleli (choroby recesywne):
o [zmiany w 1] + [zmiany w 2]
zmienność w obrębie tego samego allela
o [zmiana 1;2;3]
Skrypt Bioinformatyka DRAFT Strona 82
Allel jest to jedna z wersji genu w określonym locus na danym chromosomie homologicznym.
Mutacje białka
Substytucja (zamiana, mutacje punktowe)
 cicha zamiana nukleotydów nie powodująca zmian w sekwencji aminokwasowej
błędna (missense)
W26C zamiana 26-tego tryptofanu na cysteine
nonsensowna (nonsense)
W26X zamiana 26-tego tryptofanu na kodon STOP
p.? lub p.0 początkowa metionina (initiating Methionine M1) zaminiona np. na V (M1V -
niepoprawnie oznaczeni), - nie powstaje żadne białko
Delecja
Delecja oznaczana przez  del
K29del w sekwencji CKMGHQQQCC (C jest 28 ak) (usunięcie 29 lizyny) CMGHQQQCC
Q35del w sekwencji CKMGHQQQCC (C jest 28 ak) CKMGHQQCC
C28_M30del usunięcie 3 aminokwasów od Cysteiny 28 do Metioniny 30
Duplikacja
Duplikacja oznaczana przez  dup
G31_Q22dup w sekwencji CKMGHQQQCC (C jest 28 ak) (duplikacja od G31 doQ33)
CKMGHQGHQQQCC
H34_Q35dup CKMGHQHQCC (C jest 28 ak) CKMGHQHQHQCC
(lub insercja duplikująca tandem HQ: Q35_C36insHQ)
Insercja
Insercja oznaczana przez  ins (uwaga czasami używany jest separator  ^ : Q83^C84insQ)
K29_M29insQSK wstawienie sekwencji QSK między Lyzynę 29 (K) and Metioninę 30 (M)
CKMGHQQQCC CKQSKMGHQQQCC
Q35_C36insQ : CKMGHQQQCC CKMGHQQQQCC (lub insercja duplikująca Q35dup)
Skrypt Bioinformatyka DRAFT Strona 83
Insercja/delecja
Insertion/deletions (indels) delecja trójki nukleotydów, po której nastapiła insercja inne trójki:
C28_K29delinsW delecja dwóch trójek nukleotydów kodujących Cysteine 28 i Lysine 29,
zastąpionych kodonem tryptofanu
C28delinsWV usunięcie trójki nukleotydów kodujących cysteinę i wstawienie kodonów
Tryptofanu (W) i waliny (V)
Przesunięcie ramki
frame shifting mutations: fs
ć% R97fsX121 (lub R97fs)
przesunięcie ramki odczytu, zmieniające argininę (R97) w pierwszy amiokwas nowej ramki
zakończonej po 23 aminokwasach (X121)= kodon STOP w pozycji 121 łańcucha białkowego.
Skrypt Bioinformatyka DRAFT Strona 84


Wyszukiwarka