GENETYKA
b) ciągu odpowiednio ułożonych kropek i kresek.
posługujemy się pewnym, umownym systemem pozwalającym zachować niezbędną informację. Taki umowny
ZBIÓR REGUŁ ZAPISU MOŻEMY NAZWAĆ KODEM DANEGO SYSTEMU
UWAGA: Przykład alfabetu Morsea jest o tyle nieszczęśliwy, że jest to system podwójnego kodowania (zastanów się, dlaczego?).
Wróćmy teraz do postawionych na początku rozdziału pytań. Wydaje mi się, że łatwiej będzie Ci zrozumieć te zagadnienia, jeśli dobrze uświadomisz sobie, co przenosi informację genetyczną i co powstaje po ..uruchomieniu” informacji. Otóż, jak zapewne doskonale już wiesz, DNA jest liniowym polimerem zbudowanym z czterech rodzajów nuklcotydów połączonych wiązaniami fosfodiestrowymi. Oznacza to praktycznie, że nośnik informacji genetycznej składa słę jedynie z czterech różnych znaków (można przyjąć, że są nimi zasady występujące w DNA). Tvmczasem białka są polimerami zbudowanymi aż z dwudziestu różnych aminokwasów (na szczęście połączonych liniowo wiązaniami peptydowymi; por. jednak MOLEKULARNE PODŁOŻE ... ROZDZ: 2).
Rzecz w tym. iż najbardziej logiczne jest. aby
LINIOWE UŁOŻENIE NUKLEOTYDÓW ZNALAZŁO ODZWIERCIEDLENIE W LINIOWYM UŁOŻENIU AMINOKWASÓW
Ponadto ważne jest, ażeby „przekładanie" informacji z DNA na białko odbywało się wg pew nych stałych reguł w każdym genie. Faktycznie okazało się, że informacja genetyczna każdego organizmu zapisana jest w oparciu o pewien zbiór prawideł, które nazwano kodem genetycz> nym. Wreszcie logiczne jest też założenie, że owe prawidła — ściślej reguły kodu genetycznego — powinny być jak najprostsze, co zmniejsza ryzyko popełniania błędów. Przypomnij sobie „opc-rację”dokonaną na zdaniu: „Ala ma kota" w kontekście zbliżającej się matury z polskiego, złożoności naszego języka ojczystego i związanego z tym ryzyka popełniania błędów.
Naszą analizę rozpocznijmy od 1953 roku, gdy znany już był model DNA Watsona i Cricka W tym czasie Amerykanin George Gamow przedstawił pewną hipotezę, która okazała się później fałszywa, ale istotnie przybliżała moment odkrycia zagadki kodu życia (tak często, nieco eufemistycznie, nazywa się kod genetyczny). Gamow jako pierwszy założył, że liniowy układ nuklcotydów powinien znaleźć odwzorowanie w liniowym układzie aminokwasów (przypominam, że najważniejsza z punktu widzenia budowy i właściwości białka jest jego struktura I-rzędowa, czyli właśnie sekwencja aminokwasów).
Gamow doskonale zdawał sobie sprawę z niemożności przyjęcia reguły: jeden nukleotyd koduje jeden aminokwas, np. A — alaninę, T — glicynę, C — leucynę, G — walinę (co z pozostałymi 16-toma aminokwasami ?). Ten sposób kodowania można nazwać jedynkowym, a jego wadą jest zbyt mała pojemność informacyjna, ponieważ 4' = 4 (matematycznie rzecz ujmując,
jest to ilość jednoliterowych kombinacji na zbiorze czteroliterowym). Więcej możliwości dawa-|oby przyjęcie, że kod ma charakter dwójkowy. W takim systemie dwa kolejne, leżące obok siebie nuklcotydy stanowią jednostkę informacyjną kodującą jeden aminokwas, np. AA — glicyna. AG — walina, AC — leucyna, AT — alanina, GG — prolina, GC — izoleucyna itd. Wówczas liczba kombinacji wynosiłaby 4: = 16, ale i to jest niewystarczające. W tej sytuacji najprostszą, spełniającą wymóg zakodowania 20 aminokwasów kombinacją byl układ trójkowy, np. AAA — fenyloalanina, CAA — walina. AGA — seryna itd. Przyjęcie, że
(\) KOD GENETYCZNY JEST TRÓJKOWY
dawało możliwość zaszyfrowania informacji o większej liczbie różnych aminokwasów, ponieważ 4' = 64. Faktycznie dzisiaj wiadomo, że trzy leżące obok siebie nukleotydy tworzą podstawowy jednostkę informacyjną (coś w rodzaju trzyliterowego „wyrazu”) kodującą jeden aminokwas. Taka trójka nuklcotydów nazwana została później kodonem (pojęcie to odnieść można z powodzeniem zarówno do DNA jak i do mRNA; por. Ryc. 15).
uuu |
UCU |
UAU |
UGU |
Fenyloalanina |
Seryna |
Tyrozyna |
Cysteina |
uuc |
UCC |
UAC |
UGC |
Fenyloalanina |
Seryna |
Tyrozyna |
Cysteina |
UUA |
UĆA |
UAA |
UGA |
Leucyna |
Seryna |
Terminator translacji |
Terminator translacji |
UUG |
UCG |
UAG |
UGG |
Leucyna |
Seryna |
Terminator translacji |
Tryptofan |
CUU |
ecu |
CA U |
CGU |
Leucyna |
Prolina |
Histydyna |
Arginina |
CUC |
CCC |
CAC |
CCC |
Leucyna |
Prolina |
Histydyna |
Arginina |
CUA |
CC A |
CAA |
CGA |
Leucyna |
Prolina |
Glutamina |
Arginina |
CUG |
CCG |
CAG |
CGG |
Leucyna |
Prolina |
Glutamina |
Arginina |
AUU |
ACU |
AAU |
AGU |
Izoleucyna |
Trconina |
Asparagina |
Seryna |
AUC |
ACC |
AAC |
AGC |
Izoleucyna |
Trconina |
Asparagina |
Seryna |
AUA |
ACA |
AAA |
AGA |
Izoleucyna |
Trconina |
Lizyna |
Arginina |
AUG |
ACG |
AAG |
AGG |
.. Metionina — START |
Treonina |
Lizyna |
Arginina |
GUU |
GCU |
GAU |
GGU |
Walina |
Alanina |
Asparagiman |
Glicyna |
GUC |
GCC |
GAC |
GGC |
Walina |
Alanina |
Asparaginian |
Glicyna |
GUA |
GCA |
GAA |
GGA |
Walina |
Alanina |
Glutaminian |
Glicyna |
GUG |
GCG |
GAG |
GGG |
Walina |
Alanina |
Glutaminian |
Glicyna |
15. Tzw. tabela kodu genetycznego. Zwróć uwagę, ze podano w mej trójki mRNA (dlaczego przyjęto taki sposób zapisu wyjaśnię później).
Kolejnym, tym razem błędnym, założeniem Gamowa było przyjęcie, że DNA służy jako bezpośrednia matryca do biosyntezy białka. Inaczej mówiąc, według tego badacza synteza białek
35