200405 3574

background image

SLIM FILMS

j´zyka genów

E w o l u c j a

56

ÂWIAT NAUKI MAJ 2004

KODONY – trzyliterowe „wyrazy” DNA

i RNA – opisujà 20 aminokwasów,

z których powstajà tysiàce bia∏ek.

Stephen J. Freeland i Laurence D. Hurst

Koniec prac nad sekwencjonowaniem

ludzkiego genomu – trzech miliardów par nukleotydów strzegàcych przepi-
su na istot´ ludzkà – naukowcy og∏osili Êwiatu 14 kwietnia 2003 roku.
Mimo to badacze nie potrafià jeszcze wy∏owiç spoÊród genowych „Êmie-
ci” wszystkich funkcjonalnych genów. Podobnie nadal wyzwaniem jest
dok∏adne zrozumienie zarówno regulacji aktywnoÊci genów, jak i wp∏y-
wu zawartej w nich informacji na kodowanie bia∏ek. Trudno wi´c dziwiç
si´ Francisowi S. Collinsowi, dyrektorowi Projektu Poznania Ludzkiego
Genomu, ˝e og∏aszajàc osiàgni´cia w∏asnej grupy, nazwa∏ je zaledwie
„koƒcem poczàtku”.

Collins nawiàza∏ te˝ wtedy do wydarzenia sprzed 50 lat, do „poczàt-

ku poczàtku”, kiedy James D. Watson i Francis H. Crick odkryli struk-
tur´ czàsteczki DNA. To by∏ niezwykle ekscytujàcy moment dla nauki, po-
niewa˝ badacze wiedzieli, ˝e czàsteczka ta zawiera tajemnic´ ˝ycia.
Dzi´ki niej organizmy przechowujà wzorzec wszystkich swoich cech,
który potem przetwarzajà w ˝ycie. Odgadywanie, jak ta przemiana si´
dokonuje, zaj´∏o naukowcom ca∏e lata. By∏o ju˝ wiadomo, ˝e alfabet
DNA sk∏ada si´ jedynie z czterech liter, a zatem informacja zakodowa-
na w podwójnej helisie musi zostaç tak˝e odczytana wed∏ug pewnych
regu∏. Dzisiaj rozumiemy, ˝e litery te mówià komórkom, które z 20
istniejàcych w przyrodzie aminokwasów po∏àczyç w ∏aƒcuch, tak by
powsta∏y tysiàce bia∏ek wyst´pujàcych w miliardach form ˝ycia. Ca∏y
o˝ywiony Êwiat nieustannie oddaje si´ szaleƒstwu odszyfrowywania
informacji – gdy sk∏adane sà jaja, kie∏kujà nasiona, rozrastajà si´ grzy-
by czy dzielà si´ bakterie.

Jednak w tamtych czasach niewiele wiadomo by∏o na temat komór-

kowych struktur i mechanizmów, które przek∏adajà j´zyk DNA na j´-

Nasz kod genetyczny

jest niezwykle

wyrafinowanym

systemem,

który chroni

˝ycie przed

katastrofalnymi

b∏´dami

i jednoczeÊnie

nap´dza proces

ewolucji.

CC G

A U G

U G A

CAA

G A U

background image
background image

zyk bia∏ek. Dlatego kod genetyczny pró-
bowano z∏amaç za pomocà ró˝nych mo-
deli matematycznych. Chocia˝ na po-
czàtku wiele propozycji by∏o b∏´dnych
(niektóre z nich wyjàtkowo spektaku-
larnie), kreatywnoÊç ich twórców fascy-
nuje do dziÊ. Odszyfrowanie kodu pod
koniec lat szeÊçdziesiàtych niemal roz-
czarowa∏o naukowców. Wariant, któ-
rym pos∏u˝y∏a si´ przyroda, okaza∏ si´
znacznie mniej elegancki ni˝ niejedna
z hipotez.

Dopiero odkrycia ostatnich lat ujaw-

ni∏y, jak bardzo wyrafinowany jest kod

genetyczny. Nagle sta∏o si´ jasne, dla-
czego rzàdzà nim proste zasady, które
przetrwa∏y jakieÊ 3 mld lat doboru natu-
ralnego. DziÊ mo˝emy udowodniç, ˝e
regu∏y kodu nie sà sztywne i mogà przy-
Êpieszaç ewolucj´, równoczeÊnie chro-
niàc ˝ycie przed katastrofalnymi w skut-
kach b∏´dami w procesie syntezy bia∏ek.
Prace nad kodem genetycznym dostar-
czy∏y równie˝ pomys∏ów na rozwiàza-
nie niektórych problemów genomiki.
Gdy cofamy si´ do samego poczàtku, by
zrozumieç zasady rzàdzàce tym „kodem
˝ycia”, odkrywamy narz´dzia do dal-
szych badaƒ.

Kiedy mówimy „kod” i „odkodowa-

nie”, poj´cia te traktujemy ca∏kiem do-
s∏ownie. Instrukcje genetyczne zawar-
te sà w DNA i RNA, biochemicznych
czàsteczkach zwanych kwasami nukle-
inowymi. G∏ównym budulcem i budow-
niczym organizmów sà jednak zupe∏nie
inne czàsteczki – bia∏ka. Chocia˝ we-
d∏ug tradycyjnej definicji gen to sekwen-
cja nukleotydów, która opisuje budow´
pojedynczego bia∏ka, genetyczne „zda-
nie”, które ten opis zawiera, musi naj-
pierw zostaç przet∏umaczone z jednego

systemu symboli na zupe∏nie inny. Mo˝-
na to porównaç do przek∏adu z alfabe-
tu Morse’a na j´zyk polski.

Z∏amanie kodu

WATSON I CRICK

odkryli struktur´ DNA w

1953 roku. Ju˝ wtedy wiadomo by∏o, ˝e
geny zapisywane sà czteroliterowym al-
fabetem. Funkcj´ liter pe∏nià cztery typy
nukleotydów, które ró˝nià si´ od siebie
zasadami: adeninà, cytozynà, guaninà i
tyminà (odpowiednio A, C, G i T). Tworzà
one szczeble w dobrze dziÊ wszystkim
znanej skr´conej drabinie DNA. Alfabet

bia∏ek natomiast sk∏ada si´ z 20 ró˝nych
aminokwasów. Te genetyczne s∏owa mu-
szà zatem sk∏adaç si´ z kilku nukleoty-
dów, aby mo˝liwe by∏o ich precyzyjne
oznakowanie. Z czterech liter mo˝na
utworzyç tylko 16 dwuliterowych s∏ów
(czyli tzw. kodonów). JeÊli s∏owa sà trzy-
literowe, otrzymamy a˝ 64 kodony, czy-
li du˝o wi´cej, ni˝ mamy aminokwasów.

Naukowcy nie potrafili te˝ dok∏adnie

powiedzieç, jak informacja zapisana w
genach przek∏adana jest na bia∏ka. DziÊ
rozumiemy, ˝e na zapis genu sk∏adajà si´
trzyliterowe kodony, które okreÊlajà po-
szczególne aminokwasy. Aby uk∏ad tych
liter-zasad w genie przet∏umaczyç na ko-
lejnoÊç tworzàcych „∏aƒcuszek” amino-
kwasów, potrzeba kilku etapów. Na po-
czàtku gen zostaje skopiowany. Kopia
jednak nie jest identyczna – nowo po-
wsta∏y kwas to nie drugi DNA, ale RNA.
Ró˝nià si´ one od siebie jednà zasadà
– zamiast tyminy (T) w RNA wyst´puje
uracyl (U). W ten sposób powstaje tzw.
informacyjny RNA (mRNA). Nast´pnie
w procesie zwanym translacjà zapisany
w mRNA gen odczytywany jest przez ma-
szyneri´ komórkowà po trzy litery naraz.

W translacji uczestniczà tak˝e czàsteczki
transportujàcego RNA (tRNA) – komór-
kowi „kurierzy” – które dostarczajà po-
szczególne aminokwasy potrzebne do bu-
dowy ∏aƒcucha powstajàcego bia∏ka.

Na poczàtku lat pi´çdziesiàtych proces

ten by∏ wielkà niewiadomà, intrygujàcà
zagadkà matematycznà. Pierwszà pro-
pozycj´ jej rozwik∏ania przedstawi∏ nie
biolog, ale fizyk, George Gamow, bar-
dziej znany jako twórca teorii Wielkie-
go Wybuchu. Gamow, znajàc budow´
czàsteczki DNA, opublikowa∏ w 1954 ro-
ku niezwykle elegancki „kod karo”, któ-

ry mia∏ t∏umaczyç, jak z czteroliterowe-
go alfabetu powstaje 20 aminokwasów.

Wed∏ug wysnutej przez Gamowa teo-

rii w ka˝dym skr´cie podwójnej helisy
tworzy si´ przestrzeƒ w kszta∏cie rombu,
którego wierzcho∏ki wyznaczone sà
przez cztery nukleotydy. Przestrzenie te
mia∏yby tworzyç z DNA matryc´, wzd∏u˝
której aminokwasy uk∏ada∏yby si´ w
okreÊlonej, determinowanej przez nu-
kleotydy kolejnoÊci. W ka˝dym rombie
jeden z nukleotydów nie wnosi∏ ˝adnej
dodatkowej informacji, a pozosta∏e trój-
ki nukleotydów (taka trójka mo˝e po-
wstaç na 64 sposoby) tworzà grupy ko-
donów „znaczàcych”. Model zak∏ada∏
te˝, ˝e kodony te zachodzà na siebie –
ka˝dy nukleotyd, wyjàwszy te z pozycji
kraƒcowych, jednoczeÊnie mia∏ nale˝eç
do trzech innych kodonów. Wspó∏cze-
Êni Gamowowi teoretycy bardzo cenili
ide´ tak efektywnej kompresji danych.
Niestety, nied∏ugo póêniej odkryto ∏aƒ-
cuchy aminokwasów, które nie mog∏y
byç kodowane zgodnie z tà teorià.

W tym samym czasie wyniki doÊwiad-

czeƒ wskazywa∏y, ˝e DNA i aminokwa-
sy nie oddzia∏ujà ze sobà bezpoÊrednio.
Crick przedstawi∏ wi´c hipotez´ o po-
Êredniczàcych w tym procesie tzw.
czàsteczkach adaptorowych i w 1957 ro-
ku sformu∏owa∏ regu∏y ich dzia∏ania. W
uproszczeniu adaptory rozpoznawa∏y tyl-
ko te 20 z 64 kodonów, które okreÊla∏y
20 amionokwasów, pozosta∏e trójki zaÊ
by∏y kodonami „nonsensownymi”, bez
przypisanego znaczenia. W kodzie tym,
zamiast zachodzenia kodonów na siebie,
Crick zaproponowa∏ brak znaków prze-
stankowych. Puste kodony by∏y niewi-

58

ÂWIAT NAUKI MAJ 2004

n

Genetyczny przepis na produkcj´ bia∏ka okreÊlony jest trzyliterowymi „s∏owami”,

zwanymi kodonami. Ka˝dy z nich okreÊla jeden z 20 aminokwasów lub jeden
ze znaków okreÊlajàcych „zatrzymanie odczytu”. KiedyÊ uwa˝ano, ˝e uk∏ad kodonów
i ich znaczenie (czyli przypisanie okreÊlonego aminokwasu) jest losowy.

n

Niedawno okaza∏o si´ jednak, ˝e powstanie i utrwalenie tego systemu jest wynikiem

doboru naturalnego. Symulacje komputerowe wyjaÊniajà tego przyczyn´.
W porównaniu z alternatywnymi kodami hipotetycznymi naturalny kod nadzwyczaj
skutecznie zmniejsza szkody powodowane przez b∏´dy powsta∏e w genach
oraz podczas t∏umaczenia zapisu genetycznego na bia∏ka.

Przeglàd /

Kod ˝ycia

Cz´Êç kodonów okaza∏a si´ nadliczbowa, wielu badaczy uwa˝a∏o wi´c,
˝e

KOD

GENETYCZNY

JEST

DZIE¸EM

PRZYPADKU.

CC G

background image

doczne dla czàsteczek adaptorowych, tak
wi´c nie trzeba by∏o oznaczaç poczàtku
i koƒca odczytu genu. Pomys∏ by∏ tak pro-
sty, ˝e od razu zyska∏ aprobat´; oczywi-
Êcie do czasu, kiedy wyniki badaƒ wyka-
za∏y, ˝e ta pi´kna teoria jest b∏´dna.

Utrwalony przypadek?

BADANIA

z poczàtku lat szeÊçdziesiàtych

pokaza∏y, ˝e (przynajmniej w probów-
ce) synteza bia∏ek jest mo˝liwa tak˝e na
podstawie kodonów uznawanych za
nonsensowne. Do roku 1965 rozszyfro-
wano znaczenie wszystkich 64 mo˝li-
wych do utworzenia trójek nukleotydów.
Naukowcy nie dopatrzyli si´ w tym ja-
kiejÊ przejrzystej regu∏y matematycznej.
Niektóre kodony okaza∏y si´ nadliczbo-
we, cz´Êç aminokwasów zatem opisana
jest przez dwa, cztery, a nawet szeÊç ko-
donów. Po wszystkich pe∏nych entuzja-
zmu spekulacjach wielu badaczom
prawdziwy kod genetyczny wyda∏ si´ po
prostu dzie∏em przypadku.

Kiedy z∏amano kod, naukowcy odkry-

li, ˝e tym samym systemem pos∏ugujà
si´ tak ró˝ne organizmy, jak cz∏owiek i
bakteria. Wydawa∏o si´, ˝e przez miliard

lat, który up∏ynà∏ od momentu podzia∏u
Êwiata ˝ywego na trzy królestwa (obec-
nie wyró˝nia si´ najcz´Êciej pi´ç kró-
lestw – przyp. red.) nie powsta∏y ˝adne
warianty tego systemu. Dlatego w∏aÊ-
nie poj´cie „utrwalonego przypadku”,
tak proste i przekonujàce, a ukute przez
samego Cricka w 1968 roku, na d∏ugo
zdominowa∏o myÊlenie naukowców.
„Przypisanie kodonów do ich amino-
kwasów by∏o ca∏kowicie losowe” – na-
pisa∏. Lecz od momentu, gdy kod poja-
wi∏ si´ w formie, jakà znamy, sta∏ si´
fundamentem ˝ycia, i jakakolwiek dal-
sza zmiana by∏aby katastrofalna.

Dobór naturalny postulowany przez

Darwina opiera si´ na za∏o˝eniu, ˝e
ma∏a zmiana w pojedynczym genie mo-
˝e okazaç si´ cenna, jeÊli spowoduje, ˝e
organizm lepiej przystosuje si´ do Êro-
dowiska. Manipulacja w regu∏ach kodu
by∏aby jednak równoznaczna z wpro-
wadzeniem zmian w niezliczonych
miejscach materia∏u genetycznego, co
doprowadzi∏oby do ca∏kowitego spara-
li˝owania metabolizmu. To tak, jakby
porównaç efekt jednej literówki do
skutków zmiany uk∏adu klawiatury.

To atrakcyjne w swej prostocie rozu-

mowanie jest jednak zbyt uproszczo-
ne. Chocia˝ wi´kszoÊç organizmów ma
standardowy kod genetyczny, to wiemy
przynajmniej o 16 jego wariantach roz-
proszonych po ró˝nych ga∏´ziach ewo-
lucyjnego drzewa, kiedy okreÊlonym
kodonom przypisywane sà inne znacze-
nia. Podstawy kodu pozostajà zawsze
te same: trójki nukleotydów sà przek∏a-
dane na j´zyk aminokwasów. Ale pod-
czas gdy w wi´kszoÊci organizmów ko-
don CUG oznacza aminokwas zwany
leucynà, dla wielu gatunków grzybów
z rodzaju Candida oznacza on seryn´.
Obecne w wi´kszoÊci komórek mito-
chondria – maleƒkie generatory ener-
gii – majà w∏asny genom i u wielu z
nich tak˝e wytworzy∏y si´ znaczenia ko-
donów inne ni˝ standardowe. Na przy-
k∏ad w mitochondrialnym genomie
dro˝d˝y piekarnianych (Saccharomyces
cerevisiae
) czterem z szeÊciu kodonów,
które normalnie kodujà leucyn´, przy-
pisana jest treonina.

W latach dziewi´çdziesiàtych, po ko-

lejnych odkryciach wariantów kodu ge-
netycznego, sta∏o si´ jasne, ˝e nie jest

MAJ 2004 ÂWIAT NAUKI

59

L

UCY READING

PRZEPIS NA ˚YCIE

Drugi nukleotyd kodonu

P

ier

wszy nukleotyd k

odonu

U

C

A

G

U

C

A

G

UUU Fenyloalanina
UUC Fenyloalanina
UUA Leucyna
UUG Leucyna

CUU Leucyna
CUC Leucyna
CUA Leucyna
CUG Leucyna

AUU Izoleucyna
AUC Izoleucyna
AUA Izoleucyna
AUG Metionina

GUU Walina
GUC Walina
GUA Walina
GUG Walina

UCU Seryna
UCC Seryna
UCA Seryna
UCG Seryna

CCU Prolina
CCC Prolina
CCA Prolina
CCG Prolina

ACU Treonina
ACC Treonina
ACA Treonina
ACG Treonina

GCU Alanina
GCC Alanina
GCA Alanina
GCG Alanina

UAU Tyrozyna
UAC Tyrozyna
UAA STOP
UAG STOP

CAU Histydyna
CAC Histydyna
CAA Glutamina
CAG Glutamina

AAU Asparagina
AAC Asparagina
AAA Lizyna
AAG Lizyna

GAU Asparaginian
GAC Asparaginian
GAA Glutaminian
GAG Glutaminian

UGU Cysteina
UGC Cysteina
UGA STOP
UGG Tryptofan

CGU Arginina
CGC Arginina
CGA Arginina
CGG Arginina

AGU Seryna
AGC Seryna
AGA Arginina
AGG Arginina

GGU Glicyna
GGC Glicyna
GGA Glicyna
GGG Glicyna

IDENTYCZNY CZY PODOBNY?
Wiele z 64 istniejàcych kodonów oznacza
te same aminokwasy. Dzi´ki temu
wi´kszoÊç bia∏ek mo˝e byç zapisana
w genach na ró˝ne sposoby.
Synonimiczne kodony ró˝nià si´
od siebie jednà z trzech liter (zwykle
ostatnià), dzi´ki czemu mo˝na u∏o˝yç je
wed∏ug pewnego wzoru. Kodony
opisujàce aminokwasy, które
zachowujà si´ podobnie w Êrodowisku
wodnym, majà kodony ró˝niàce si´
od siebie ostatnià literà. Majàce
takà samà pierwszà liter´ najcz´Êciej
kodujà aminokwasy b´dàce swoimi
prekursorami lub produktami.
Jak si´ okaza∏o, w∏aÊnie te cechy
kodu majà fundamentalne znaczenie
dla przetrwania organizmów,
a dodatkowo mogà przyÊpieszaç
tempo ewolucji.

SEKWENCJ¢ GENU OPISUJÑCEGO BIA¸KO mo˝na porównaç do zdania zbudowanego z trzyliterowych s∏ów (kodonów tworzonych
przez trójki nukleotydów). Ka˝dy kodon symbolizuje jeden z 20 aminokwasów lub sygna∏ „stop” (zatrzymania odczytu). Maszyneria
komórkowa przek∏ada geny DNA na ich odpowiedniki w RNA. Trzynukleotydowe kodony RNA zapisuje si´ literami A, C, G i U. Geny
RNA, odczytywane kodon po kodonie, stanowià wzór, wed∏ug którego budowane sà ∏aƒcuchy aminokwasowe. Stosowane przez przy-
rod´ oznaczenia aminokwasów (poni˝ej) zosta∏y rozszyfrowane na poczàtku lat szeÊçdziesiàtych. Jednak prawdziwe znaczenie wzo-
ru, na którym opiera si´ kod, przez kilkadziesiàt lat by∏o niedoceniane.

background image

OCHRONA BIA¸EK

STWORZONY PRZEZ PRZYROD¢ KOD minimalizuje efekty b∏´dów genetycznych, zarówno wynikajàcych z mutacji w samych genach, jak
i tych, które powstajà podczas translacji (procesu przepisywania) genu na bia∏ko. Sekwencja genu jest t∏umaczona na kolejnoÊç odpowied-
nich aminokwasów okreÊlajàcych trójwymiarowà struktur´ bia∏ka (1, 2 i 3). Nawet gdy na skutek b∏´du wstawiony zostaje z∏y aminokwas,
jest on chemicznie tak podobny do w∏aÊciwego, ˝e powstajàce bia∏ko niewiele si´ zmienia. Rzadkim wyjàtkiem od tej regu∏y jest zmiana po-
wodujàca groênà chorob´ – niedokrwistoÊç sierpowatokrwinkowà.

1

KIEDY GEN ulega ekspresji, czyli zostaje aktywowany (na górze
z lewej
), najpierw jest kopiowany w RNA, którego alfabet sk∏ada si´

z czterech nukleotydów – adeniny, cytozyny, guaniny i uracylu.
Ten tzw. informacyjny RNA (mRNA) przenosi genetyczny przepis
na bia∏ko z jàdra komórkowego do cytoplazmy, gdzie zostaje odczytany.

2

ORGANELLA KOMÓRKOWE, zwane rybosomami, odczytujà mRNA
kodon po kodonie. W tym samym czasie inny typ RNA, transportujàcy

RNA (tRNA), chwyta wolne aminokwasy i przenosi je do rybosomu,
gdzie zostajà dodane do rosnàcego ∏aƒcucha bia∏kowego. Ka˝dy tRNA
na jednym koƒcu wià˝e si´ z trzynukleotydowym kodonem w mRNA,
a na drugim ma przyczepiony pojedynczy aminokwas.

3

POWSTAJÑCE BIA¸KO przybiera trójwymiarowy kszta∏t, okreÊlony
przez powinowactwo aminokwasów do wody. Aminokwasy hydrofobowe

majà tendencj´ do chowania si´ we wn´trzu bia∏ka, pozostawiajàc cz´Êci
hydrofilowe (np. glutaminian) na zewnàtrz, wystawione na oddzia∏ywania
z wodà cytoplazmy komórkowej. Czàsteczka hemoglobiny (z prawej)
sk∏ada si´ z czterech ∏aƒcuchów aminokwasowych: dwóch ∏aƒcuchów
alfa (niebieski) i dwóch beta (˝ó∏ty).

B¸ÑD KRYTYCZNY. Hemoglobina jest bardzo dobrze zbadanà czàsteczkà. Naukowcy znajà kilka
mutacji w genie kodujàcym jej cz´Êç bia∏kowà, które pozostajà nieme (nie powodujà choroby).
Ale b∏àd, którego skutkiem jest zamiana aminokwasu hydrofilowego na hydrofobowy, mo˝e
zmieniç kszta∏t i funkcj´ powsta∏ego bia∏ka. W przypadku niedokrwistoÊci sierpowatokrwinkowej
mutacja polegajàca na zmianie pojedynczego nukleotydu w wyjÊciowym genie ∏aƒcucha
beta-hemoglobiny zmienia kodon GAG na GUG (powy˝ej). Powoduje to wymian´ „lubiàcego wod´”
glutaminianu na hydrofobowà walin´. Na powierzchni hemoglobiny powstajà wtedy „nielubiàce
wody” wysepki, które przyciàgajà si´ wzajemnie. Czàsteczki zmutowanej hemoglobiny sklejajà si´
ze sobà i tworzà sztywne w∏ókna nadajàce czerwonej krwince kszta∏t sierpa.

Jàdro

DNA

mRNA

mRNA

Glutaminian

NORMALNA

HEMOGLOBINA

NIEPRAWID¸OWA
HEMOGLOBINA

Walina

¸aƒcuch
aminokwasów
zwija si´
w trójwymiarowe
bia∏ko

tRNA

mRNA

Kodon

Cytoplazma

Rybosom

¸aƒcuch aminokwasów

Aminokwas

AUG

AUG GUG CAU CUG ACU

CCU

GUG

GAG

AAG

UCU

GCC

GUU

ACU

GCC

GUG CAU CUG ACU CCU

GAG

GAG

AAG

UCU

GCC

GUU

ACU

GCC

background image

on niezmienny. Wr´cz odwrotnie – kod
mo˝e ewoluowaç, co oznacza, ˝e w prze-
sz∏oÊci tak˝e podlega∏ ewolucji. Dlate-
go wzorzec, wed∏ug którego poszczegól-
ne aminokwasy przypisane sà danym
kodonom, nieprzypadkowo przetrwa∏
miliardy lat doboru naturalnego. W rze-
czywistoÊci system ten znakomicie mini-
malizuje skutki zdarzeƒ losowych.

Uszkodzenia kontrolowane

KA

˚DY SYSTEM KODOWANIA

obarczony jest

ryzykiem b∏´du. Jednak nie wszystkie
pomy∏ki sà tak samo szkodliwe. W j´zy-
ku polskim samog∏oski i spó∏g∏oski bar-
dzo si´ ró˝nià, tak wi´c zamiana „z” na
„a” utrudniz aroaumienie anzcaeniz te-
go adzniz. G∏oski „s” i „z” wymawia si´

podobnie, wi´c takie sdanie bes wi´k-
szego wyzi∏ku mo˝na srosumieç. Gdy
prawdopodobieƒstwo wystàpienia b∏´-
du podczas kodowania jest du˝e, dobry
kod powinien opieraç si´ na strategii
zmniejszajàcej skutki pomy∏ki.

B∏´dy mogà przybieraç ró˝ne formy.

Czasem zmiana zachodzi w wyjÊcio-
wym genie – nazywamy jà wówczas
mutacjà. Niekiedy wadliwy adaptor
(tRNA) wià˝e si´ do transkryptu genu
(mRNA), wstawiajàc w ∏aƒcuch bia∏-
kowy nieprawid∏owy aminokwas [ilu-
stracja na sàsiedniej stronie
]. Nawet w
czasach, gdy naukowcy byli przekona-
ni o przypadkowoÊci kodu, zauwa˝ali,
˝e kod jest tak skonstruowany, by kon-
sekwencje poszczególnych b∏´dów by∏y
jak najmniejsze. Ju˝ w 1965 roku Carl
R. Woese, zatrudniony wówczas w Uni-
versity of Illinois, zaobserwowa∏, ˝e po-
dobne do siebie kodony (ró˝niàce si´
jednà literà) zwykle oznaczajà podob-
ne aminokwasy. Pomy∏ki, które mogà
si´ gdzieÊ przydarzyç, nie spowodujà
powa˝nego uszkodzenia bia∏ka.

Poj´cie „podobieƒstwa” aminokwa-

sów nie jest proste. Czàsteczki te ró˝nià
si´ wieloma cechami, poczàwszy od
wielkoÊci i kszta∏tu, a skoƒczywszy na
∏adunku elektrycznym. Woese i inni ba-
dacze zauwa˝yli, ˝e kodony z dwiema
takimi samymi literami zwykle kodujà
aminokwasy z podobnymi sk∏onnoÊcia-
mi do przyciàgania lub odpychania czà-
steczek wody. Ta cecha jest niezwykle

istotna dla ostatecznej postaci i funk-
cjonalnoÊci bia∏ka. Nowo utworzony
∏aƒcuch aminokwasów zwija si´ w
okreÊlonà form´, zale˝nie od tego jak
rozmieszczone sà w nim aminokwasy
hydrofobowe („nielubiàce wody”). Ami-
nokwasy te majà tendencj´ do takiego
sklejania si´ ze sobà, by uniknàç kon-
taktu z wodnà cytoplazmà komórkowà.
Aminokwasy hydrofilowe („lubiàce wo-
d´”) pozostajà zaÊ na zewn´trznej po-
wierzchni bia∏ka.

Kod genetyczny ma wi´c wyjàtkowà

cech´ – b∏àd polegajàcy na zmianie jed-
nego nukleotydu najcz´Êciej nie pociàga
za sobà powa˝nych konsekwencji. Ami-
nokwas, który powstaje na podstawie
b∏´dnej matrycy, jest cz´sto taki sam lub

podobny do prawid∏owego, przynaj-
mniej jeÊli chodzi o jego hydrofobowoÊç.
Zmiana w koƒcowym produkcie – bia∏-
ku – jest zatem stosunkowo nieszkodli-
wa. Jak wydajna jest ta naturalna ochro-
na kodu przed usterkami? To pytanie
zadaliÊmy sobie w roku 1998, kiedy za-
braliÊmy si´ do analizy wczeÊniejszych
obserwacji innych naukowców.

Testowanie wzorca

ZACZ

¢LIÂMY OD ILOÂCIOWEJ OCENY

hydro-

fobowoÊci wszystkich 20 aminokwasów.
Nast´pnie u˝yliÊmy tych danych do obli-
czenia wartoÊci, którà nazwiemy wspó∏-
czynnikiem b∏´du kodu genetycznego.
ZdefiniowaliÊmy go jako Êrednià zmia-
n´ hydrofobowoÊci aminokwasu, nast´-
pujàcà wskutek wszystkich mo˝liwych
zmian jednoliterowych w 64 istniejàcych
kodonach. WartoÊç ta informuje o podat-
noÊci kodu na b∏´dy, ale sama w sobie
ma niewielkie znaczenie. ZamierzaliÊmy
si´ dowiedzieç, jak wykszta∏cony przez

natur´ system kodowania wypada na tle
kodów alternatywnych.

Aby wygenerowaç hipotetyczne kody

alternatywne, musieliÊmy przyjàç jakieÊ
za∏o˝enia dotyczàce rzeczywistych ogra-
niczeƒ, które wp∏ywajà na dzia∏anie
kodu w Êwiecie DNA, RNA i amino-
kwasów. Na przyk∏ad zauwa˝ono, ˝e
najcz´stsze b∏´dy podczas przek∏adania
mRNA na odpowiedni aminokwas po-
wstajà na trzeciej literze kodonu. W tym
miejscu oddzia∏ywanie mi´dzy tRNA i
mRNA jest najs∏absze, co Crick nazwa∏
zasadà wahad∏a lub zasadà tolerancji.
A synonimiczne kodony – takie, które
kodujà ten sam aminokwas – zwykle ró˝-
nià si´ tylko ostatnià z trzech liter, tak
wi´c pomy∏ki wynikajàce z „wahni´cia”

podczas translacji nie majà znaczenia i
odczytywany jest poprawny aminokwas.

Chocia˝ tworzenie grup synonimicz-

nych kodonów samo w sobie zmniejsza
wspó∏czynnik b∏´du, zasada wahad∏a
nie jest przystosowaniem, lecz wynika
raczej z przyczyn biochemicznych. Dla-
tego, na wszelki wypadek, prowadzàc
nasze obliczenia, rozpatrywaliÊmy tyl-
ko kody majàce t´ cech´. Dodatkowo
trzem kodonom „stop” nie mo˝na przy-
pisaç wartoÊci okreÊlajàcej hydrofobo-
woÊç aminokwasu. Dlatego w kodach
alternatywnych zastosowaliÊmy trzy
takie same kodony „stop”.

Przy tych za∏o˝eniach technicznych

prostà metodà wygenerowania alterna-
tywnych kodów by∏ losowy rozk∏ad 20
aminokwasów mi´dzy 20 mo˝liwych
grup kodonów. Mimo ograniczeƒ otrzy-
maliÊmy i tak oko∏o 2.5 × 10

18

kombina-

cji, czyli mniej wi´cej tyle, ile sekund
up∏yn´∏o od powstania Ziemi. Wzi´li-
Êmy wi´c spoÊród tych kombinacji du˝à

MAJ 2004 ÂWIAT NAUKI

61

TIM J. TOLP

A (

sàsiednia str

o

na

)

Kod mo˝e ewoluowaç, a

AMINOKWASY

PRZYPISANE SÑ

danym kodonom

NIEPRZYPADKOWO.

STEPHEN J. FREELAND i LAURENCE D. HURST do badaƒ nad biologià ewolucujnà wyko-
rzystujà bioinformatyk´. Freeland jest profesorem bioinformatyki w University of Maryland w
okr´gu Baltimore, gdzie stara si´ prze∏o˝yç odkrycia dotyczàce ewolucji kodu genetycznego
na praktyczne zastosowania w badaniach genomowych. Studenci testujà jego teorie, prze-
kszta∏cajàc ludzki gen nowotworowy tak, by ulega∏ ekspresji w bakterii Escherichia coli (nie-
które jej kodony sà przypisane innym aminokwasom ni˝ u cz∏owieka). Freeland doktoryzowa∏
si´ z teorii ewolucji w University of Cambridge pod kierunkiem cz∏onka Royal Society, Lau-
rence’a Hursta, który jest obecnie profesorem genetyki ewolucyjnej w University of Bath w
Wielkiej Brytanii. Badania Hursta koncentrujà si´ na zrozumieniu struktury i ewolucji syste-
mów genetycznych, g∏ównie ewolucyjnych poczàtków powstania p∏ci, kolejnoÊci genów na chro-
mosomach, zjawisku imprintingu i kodu genetycznego.

O

AUTORACH

CC G

background image

losowà prób´ i obliczyliÊmy ich wspó∏-
czynnik b∏´du. StwierdziliÊmy, ˝e z prób-
ki oko∏o miliona alternatywnych kodów
jedynie 100 ma ni˝szy wspó∏czynnik b∏´-
du ni˝ kod naturalny [ramka poni˝ej].

Wyniki naszych obliczeƒ by∏y jeszcze

bardziej zaskakujàce, gdy wprowadzi-
liÊmy dodatkowe ograniczenia. Odzwier-
ciedla∏y one znane nam wzory mutowa-
nia DNA oraz sposób, w jaki geny
ulegajà nieprawid∏owemu odczytowi
podczas przepisywania informacji na
RNA. Po zastosowaniu tych elementów
z „prawdziwego Êwiata” wspó∏czynnik

b∏´du kodu zmniejszy∏ si´ nawet o kil-
ka rz´dów wielkoÊci. Rozwiàzanie przy-
rody okaza∏o si´ gorsze od zaledwie jed-
nej mo˝liwoÊci na milion.

Nadzwyczajny brak wra˝liwoÊci ko-

du naturalnego na b∏´dy jest wynikiem
doboru naturalnego. Takie jest najprost-
sze wyt∏umaczenie. Byç mo˝e kiedyÊ ist-
nia∏o wiele kodów, ale organizmy, któ-
rych zapisy by∏y najbardziej odporne na

b∏´dy, mia∏y wi´kszà szans´. Obecny kod
genetyczny po prostu wygra∏ t´ walk´ o
przetrwanie. DziÊ wiemy, ˝e warianty
kodu mogà istnieç, takie przypuszcze-
nie wydaje si´ wi´c rozsàdne.

Twierdzenie, ˝e minimalizowanie b∏´-

dów by∏o g∏ównym motorem ewolucji
wiodàcej do ustalenia regu∏ kodu gene-
tycznego, bywa jednak oceniane kry-
tycznie. Wyrafinowane programy kom-
puterowe z pewnoÊcià mogà wyodr´bniç
lepszy kod ni˝ naturalny, nawet jeÊli
opierajà si´ na za∏o˝eniu, ˝e „dobry” kod
to taki, który minimalizuje zmian´ hy-

drofobowoÊci aminokwasu w wyniku
b∏´dów. Kody komputerowe sà jednak
ograniczone kryteriami wprowadzony-
mi przez programist´. Dlatego wi´k-
szoÊç opisanych do tej pory „lepszych”
kodów oparta jest na uproszczonych
rozwa˝aniach o typach b∏´dów, które
przytrafiajà si´ w Êwiecie realnym. Na
przyk∏ad nie bierze si´ w nich pod uwa-
g´ zjawiska wahad∏a, przez co algoryt-

my nie korzystajà z zysków wynikajà-
cych z grupowania synonimicznych ko-
donów w blokach, w których trójki ró˝-
nià si´ jedynie ostatnià literà.

To uproszczenie uwydatnia kolejny

problem zwiàzany z optymalizacjà ko-
dów stworzonych przez cz∏owieka. Do-
bór naturalny jest „Êlepym twórcà” – ku
idealnemu rozwiàzaniu podà˝a po
omacku, wybierajàc najlepsze rozwià-
zanie z puli wariantów wyst´pujàcych
w danym momencie. Kiedy to w∏aÊnie
mamy na uwadze, robiàc symulacj´ do-
boru naturalnego, znów okazuje si´, ˝e

stopieƒ minimalizowania b∏´dów w na-
turalnym kodzie genetycznym robi wra-
˝enie: zwykle w warunkach takiej selek-
cji zaledwie mniej ni˝ 3% losowych
kodów teoretycznych ewoluuje do po-
dobnej odpornoÊci na b∏´dy.

KiedyÊ twierdzono, ˝e hipoteza karo

Gamowa oraz kod Cricka pozbawiony
znaków przestankowych by∏y lepsze ni˝
kod naturalny. DziÊ komputery mogà
wygenerowaç jeszcze doskonalsze mate-
matycznie kody. Jednak tworzenie co-
raz lepszych zapisów bez brania pod
uwag´ procesu ewolucji jest ma∏o przy-
datne w zrozumieniu pot´gi kodu natu-
ralnej selekcji.

Od teorii do praktyki

KOD NATURALNY

w rzeczywistoÊci to nie

tylko produkt doboru naturalnego. Mo-
˝e tak˝e dzia∏aç jako mechanizm przy-
Êpieszajàcy ewolucj´. W∏aÊciwoÊci ko-
du, które pozwalajà minimalizowaç
wp∏yw b∏´dów dzi´ki istnieniu bloków
synonimicznych kodonów oraz bioche-
micznego podobieƒstwa aminokwasów,
przynoszà coÊ wi´cej ni˝ sprawnà kon-
trol´ uszkodzeƒ. „Mniejsze” mutacje, w
odró˝nieniu od drastycznych zmian, sta-
tystycznie dajà lepsze zyski. A zatem
dzi´ki minimalizowaniu efektów jakiej-
kolwiek mutacji kod jednoczeÊnie zwi´k-
sza prawdopodobieƒstwo, ˝e mutacja
genu b´dzie prowadziç do poprawienia
bia∏ka, które powstanie.

Poznawanie czynników, które ufor-

mowa∏y kod, i ich sposobu kszta∏towania
ewolucji, jest czymÊ wi´cej ni˝ okazjà
do podziwiania przyrody jako genialne-
go twórcy pierwotnego oprogramowa-

62

ÂWIAT NAUKI MAJ 2004

L

UCY READING

Minimalizujàc efekty mutacji,

KOD

ZWI¢KSZA

PRAWDOPODOBIE¡STWO

POPRAWIENIA

powstajàcego bia∏ka.

Sprawdzamy zapis

U

SZKODZENIA BIA¸EK powsta∏e
w wyniku mutacji zachodzàcych

w genie lub nieprawid∏owej translacji
sà minimalizowane, jeÊli podstawiane
b∏´dne aminokwasy majà podobne
sk∏onnoÊci do przyciàgania lub odpychania
czàsteczek wody (hydrofobowoÊç).
JeÊli wspó∏czynnik b∏´du zdefiniujemy
jako Êrednià zmian´ w hydrofobowoÊci
aminokwasu, spowodowanà przez wszystkie
mo˝liwe jednonukleotydowe zmiany
we wszystkich mo˝liwych kodonach,
to wysoki wspó∏czynnik b∏´du oznacza,
˝e kod jest bardzo podatny na b∏´dy,
a niski – ˝e kod minimalizuje szkody.
WygenerowaliÊmy du˝à losowà prób´
alternatywnych kodów i stwierdziliÊmy,
˝e tylko 100 kodów na milion ma ni˝szy
wspó∏czynnik b∏´du ni˝ kod naturalny
(na górze z prawej). Kiedy do modelu
wprowadziliÊmy dodatkowe wzorce
ze Êwiata rzeczywistego, tj. sposób,
w jaki geny mutujà oraz jak ulegajà
b∏´dnemu odczytowi, kod naturalny
by∏ „gorszy” od zaledwie jednej
na milion mo˝liwoÊci (z prawej).

Wspó∏czynnik b∏´du

21 000

15 000

9000

3000

Liczba k

odów z okreÊlonym

wspó∏czynnikiem b∏´du

4.0

6.4

8.8

11.2

13.6

Kod naturalny
5.19

Wspó∏czynnik b∏´du

25 000

20 000

15 000

10 000

5000

0

2.0

4.4

6.8

9.2

11.6

Kod naturalny
2.63

Liczba k

odów z okreÊlonym

wspó∏czynnikiem b∏´du

CC G

background image

nia. Badania te mogà tak˝e byç pomoc-
ne przy rozwiàzywaniu cz´Êci proble-
mów, które w∏aÊnie teraz pojawiajà si´
w laboratoriach genetycznych.

Bogate zasoby wst´pnych sekwencji

genomowych przetrzàsane sà w poszu-
kiwaniu genów – to jedno z najwa˝-
niejszych zadaƒ dzisiejszej biologii
molekularnej. Badania te sà jednak
ograniczone, poniewa˝ polegajà jedy-
nie na odnajdowaniu genów podobnych
do tych, które ju˝ znamy. ZnajomoÊç
sposobów przenoszenia mutacji w DNA
za poÊrednictwem kodu genetyczne-
go mo˝e te poszukiwana u∏atwiç. Po-
zwoli nam to rozpoznaç geny, które
wcale nie sà do siebie podobne, bo dro-
gi ich ewolucji rozesz∏y si´ (na skutek
zmiany w genomie) ju˝ bardzo dawno
temu. Prawdopodobnie b´dziemy wi´c
tak˝e w stanie ustaliç funkcje kodowa-
nych przez te geny bia∏ek. Na podsta-
wie analizy kodonów opisujàcych bia∏-
ko i ich umiej´tnoÊci minimalizowania
skutków b∏´dów dowiemy si´ czegoÊ
o kszta∏cie czàsteczki, który wynika
z sekwencji aminokwasowej. Dostanie-
my narz´dzie, które umo˝liwi wyjaÊ-
nienie, jak ró˝ne zmiany wp∏ywa∏yby
na wielkoÊç, ∏adunek lub hydrofobo-
woÊç aminokwasów.

ÂwiadomoÊç istnienia organizmów z

innym ni˝ standardowy kodem gene-
tycznym mo˝e pomóc nam zmieniç
poglàd na badane przez nas geny. Po-
niewa˝ kod genetyczny jest niemal uni-
wersalny dla wszystkich form ˝ycia, ru-
tynowo ju˝ badamy interesujàce nas
geny, przenoszàc je do ró˝nych organi-
zmów. Na przyk∏ad gen odpowiedzial-
ny za rozwój nowotworu u cz∏owieka
wprowadzamy do bakterii Escherichia
coli
i czekamy, a˝ wyprodukuje ona
ludzkie bia∏ko. Czasami koƒczy si´ to
niepowodzeniem: bia∏ko nie powstaje
w ogóle lub produkowane jest ze zbyt
ma∏à wydajnoÊcià. Zdarza si´ te˝, ˝e ta-
kie bia∏ko nieco ró˝ni si´ od orygina∏u.

Tego typu problemy zwalniajà tempo

badaƒ naukowych. Teraz jednak wiemy,
˝e niepowodzenia mogà równie˝ wyni-
kaç z faktu, ˝e poszczególne organizmy
wolà wykorzystywaç okreÊlone kodony
i preferencje te zale˝à od gatunku. Na
przyk∏ad w standardowym kodzie argi-
nina przypisana jest szeÊciu kodonom.
Ludzkie geny najcz´Êciej u˝ywajà jedy-
nie dwóch z nich, AGA i AGG. Jednak
w bakterii E. coli bardzo rzadko spoty-
kamy AGA, a jeÊli nawet si´ ten kodon

pojawia, cz´sto zostaje b∏´dnie odczy-
tany. Wiedzàc o tej ró˝norodnoÊci, mo˝-
na zaprojektowaç wariant ludzkiego ge-
nu, który b´dzie lepiej dzia∏a∏ w komórce
E. coli.

W laboratorium jednego z nas, Ste-

phena J. Freelanda, opracowywany jest
w∏aÊnie program komputerowy, dzi´ki
któremu biolodzy molekularni b´dà mo-
gli obróciç teoretyczne rozwa˝ania w
u˝yteczne narz´dzia in˝ynierii genetycz-
nej. Pomo˝e on na przyk∏ad odszukaç
geny w sekwencjach DNA i przewidy-
waç kszta∏ty powstajàcych z nich bia-
∏ek. Obaj natomiast badamy, w jaki spo-
sób kod powsta∏. Interesuje nas, jak RNA

zaczà∏ oddzia∏ywaç z aminokwasami i
jak ten zwiàzek rozwinà∏ si´ w system
kodujàcy oraz w jaki sposób alfabet ami-
nokwasowy powi´ksza∏ si´ na poczàtku
ewolucji [ramka powy˝ej].

Naukowcy liczà tak˝e, ˝e uda im si´

znaleêç odpowiedzi na wiele innych py-
taƒ. Na przyk∏ad dlaczego istnieje tylko
20 aminokwasów? Dlaczego niektóre
aminokwasy majà przypisane po szeÊç
kodonów, a inne tylko jeden lub dwa?
Czy i to zwiàzane jest z minimalizowa-
niem skutków b∏´du? Z∏amanie kodu ge-
netycznego by∏o w rzeczywistoÊci jedy-
nie poczàtkiem drogi do poznania jego
prawdziwego znaczenia.

n

MAJ 2004 ÂWIAT NAUKI

63

ALEXIS ROSENFELD

Science Photo Librar

y/Photo R

esear

chers, Inc.

Ewolucja kodu

W

CO NAJMNIEJ 16 ORGANIZMACH z oddzielnych ga∏´zi ewolucyjnych kodonom
przypisane sà aminokwasy inne ni˝ standardowo. Wiele gatunków zielonego

glonu z rodzaju Acetabularia odczytuje powszechnie znaczàce „stop” kodony UAG i UAA
jako glicyn´. Kodon CUG, który normalnie oznacza leucyn´, w komórkach grzybów
z rodzaju Candida jest t∏umaczony jako seryna. Istnienie takich ró˝nic pokazuje,
˝e kod ulega procesowi ewolucji. We wszystkich królestwach Êwiata ˝ywego nietypowy
21 aminokwas, selenocysteina, jest niekiedy
wstawiany w odpowiedzi na standardowy kodon
„stop” UGA. Selenocysteina tworzona jest przez
chemicznà modyfikacj´ seryny, kiedy ta wcià˝ jest
po∏àczona z tRNA w rybosomie. W podobny sposób
w komórkach bakterii w∏aÊciwych i archeanów
powstaje 22 aminokwas, pyrolizyna, w miejscu
oznakowanym przez kodon „stop” UAG.

Kod z poczàtków ˝ycia na Ziemi prawdopodobnie

nie zawiera∏ oznaczeƒ dla a˝ 20 aminokwasów.
Te bardziej z∏o˝one powstajà na skutek
biochemicznych modyfikacji aminokwasów
podstawowych. W przypadku kilku gatunków
bakterii glutamina produkowana jest z pokrewnego
biochemicznie zwiàzku – glutaminianu, podczas
gdy jest on wcià˝ po∏àczony ze swoim tRNA.
Mo˝emy stàd wnioskowaç, ˝e nowe aminokwasy
powstawa∏y prawdopodobnie dzi´ki modyfikacjom
mniejszej grupy aminokwasów pierwotnych. Zdoby∏y one dla siebie zestaw tRNA
i kodonów wczeÊniej przypisanych ich prostszym chemicznie prototypom. Zapewne
podobny by∏ mechanizm powstawania odmian standardowego kodu genetycznego.
Odkrycia te rodzà kolejne pytania. Ile jest wariantów kodu genetycznego? Czy standardowy
kod naturalny w przysz∏oÊci b´dzie okreÊla∏ wi´cej typów aminokwasów?

PLECHA morskiego glonu z rodza-
ju Acetabularia
jest pojedynczà
komórkà osiàgajàcà rekordowà
d∏ugoÊç 5 cm.

A Quantitative Measure of Error Minimization in the Genetic Code. David Haig i Laurence

D. Hurst; Journal of Molecular Evolution, tom 33, nr 5, s. 412-417; XI/1991.

The Invention of the Genetic Code. Brian Hayes; American Scientist, tom 86, nr 1, s. 8-14; I-II/1998.
The Genetic Code Is One in a Million. Stephen J. Freeland i Laurence D. Hurst; Journal of Mole-

cular Evolution, tom 47, nr 3, s. 238-248; IX/1998.

Geny i ˝ycie. Andrzej Jerzmanowski; Prószyƒski i S-ka, 2001.
The Case for an Error-Minimizing Genetic Code. Stephen J. Freeland, Nick Keulmann i Tao Wu;

Origins of Life and Evolution of the Biosphere, tom 33, nr 4-5, s. 457-477; X/2003.

Wi´cej informacji na temat ewolucji kodu genetycznego mo˝na znaleêç na stronie internetowej

laboratorium Stephena J. Freelanda: www.evolvingcode.net

JEÂLI CHCESZ WIEDZIEå WI¢CEJ


Wyszukiwarka

Podobne podstrony:
200405 3587
20040520195728id 25234
200405 3557
200405 3594
4567 3574 ZarzadzenieNrR 34 2015
200405 3556
200405 3560
200405 3568
200405 3582
200405 3584
200405 3579
200405 3548
200405 3586
200405 3549

więcej podobnych podstron