background image

 

1

 

INTERNETOWE BAZY DANYCH JAKO NARZĘDZIA W BIOLOGII 

MOLEKULARNEJ. MODYFIKACJE DNA  IN SILICO 

 

ZAGADNIENIA DO PRZYGOTOWANIA 
Kwasy nukleinowe  – budowa i funkcje. Organizacja genomu wirusów, bakte-
rii i organizmów eukariotycznych. Replikacja. Transkrypcja. Translacja. 

 

WPROWADZENIE 

Genbank 

http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html

 

 
Entrez Browser 

http://www.ncbi.nlm.nih.gov/sites/gquery

 

 

Gen-Bank jest powszechnie dostępną, internetową bazą danych, zawierającą se-

kwencje DNA poszczególnych genów, znajdującą się przy National Center for Bio-
technology  Information  (NCBI)  w  USA.  Jest  częścią  przedsięwzięcia  jakim  jest 
międzynarodowa współpraca w tworzeniu bazy danych zawierającej sekwencje nu-
kleotydowe  (Nucleotide  Sequence  Database  Collaboration).  W  ramach  tej  współ-
pracy trzy instytucje: DNA DataBank of Japan (DDBJ), European Molecular Bio-
logy Laboratory (EMBL) oraz GenBank codziennie wymieniają i uzupełniają wła-
sne zasoby zgromadzonych sekwencji nukleotydowych poszczególnych genów. 
Poszczególne rekordy bazy danych GenBank zawierają : 
- zwięzły opis sekwencji, 
- nazwę naukową i taksonomiczną organizmu, z którego pochodzi dana sekwencja, 
- tabelę zawierającą opis cech danej sekwencji. 

By  ułatwić  dostęp  do  ogromnej  ilości  informacji  zgromadzonej  w  GenBank, 

tworzone  są  różnego  rodzaju  podzbiory  gromadzące  informacje  według  określo-
nych wymogów.   
 
1. Gene 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene

 

 

Jest  to  baza  danych  zawierająca  informacje  na  temat  poszczególnych  genów.  

Umożliwia ona dostęp do sekwencji (zarówno intronów jak i eksonów), podstawo-
wych  danych  literaturowych  dotyczących  danego  genu,  miejsca  jego  położenia  w 
chromosomie, składu aminokwasowego białka, które koduje i jego funkcji.   
 
2. OMIM

TM

 - Online Mendelian Inheritance in Man

TM 

   

http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim

 

 
-  baza  danych  zawierająca  katalog  genów  i  zaburzeń  genetycznych,  opracowana 
przez Dr. Victora A. McKusicka i jego kolegów z Johns Hopkins University. Baza 

background image

 

2

ta  adresowana  jest  głównie  do  lekarzy  i  specjalistów  zajmujących  się  chorobami 
genetycznymi.  Poszczególne wady genetyczne opisane są w taki sposób, że zawie-
rają zarówno odnośniki do piśmiennictwa naukowego jak i pełny zestaw informacji 
dotyczący  danej  choroby  dziedzicznej,  rodzaju  defektu  genetycznego,  jego  lokali-
zacji itp.  Bazą tą można się również posługiwać wówczas, gdy chcemy się dowie-
dzieć,  jakie  choroby  genetyczne  są  związane z poszczególnymi genami czy chro-
mosomami. 
 
3.  Single Nucleotide Polymorphism (SNP) 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp

 

 

Baza  ta  gromadzi  informacje  dotyczące  mutacji  punktowych  występujących  w 

genach, które mogą mieć wpływ na proces regulacji ich ekspresji. Oprócz informa-
cji na temat miejsca lokalizacji mutacji i jej charakterystyki, w bazie tej można zna-
leźć  także  informacje  na  temat  częstości  jej  występowania  w  badanych  popula-
cjach, a także odnośniki do danych literaturowych, na podstawie których uzyskano 
te dane. 
 
 
4. Nucleotide  

http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore

 

 

Jest to baza gromadząca sekwencje nukleotydowe różnych fragmentów genomu 

ludzkiego  i  innych  gatunków.  Szczególnie  użyteczna  bywa  ona  wówczas,  gdy 
chcemy znaleźć w jednym fragmencie zarówno sekwencję określonego genu, jak i 
sekwencje  przylegające  do  obszaru  zajmowanego  przez  dany  gen,  np.  sekwencje 
regulatorowe. 
 
 
5. Books 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=books

 

 

Ta witryna prowadzona przez National Center for Biotechnology Information w 

USA  jest  godna  polecenia  dla  wszystkich,  którzy  chcieliby  uzyskać  mocne  teore-
tyczne  podstawy  do  praktycznego  wykorzystania  wiedzy  zgromadzonej  w  powyż-
szych bazach danych. Zawiera ona bowiem dostępne „on line” książki poświęcone 
biochemii, biologii molekularnej i biologii komórki. 
 
 
CZ

ĘŚĆ DOŚWIADCZALNA 

 
 

Celem ćwiczeń jest zapoznanie się z podstawowymi źródłami informacji na te-

mat ludzkiego genomu oraz nabycie umiejętności posługiwania się nimi. 

background image

 

3

 
1. Wyszukiwanie sekwencji cDNA genu z internetowej bazy danych Gene. 
 

Wpisać do wyszukiwarki internetowej adres WWW bazy danych Gene: 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene

 

 
Po  uzyskaniu  połączenia  internetowego  z  bazą  danych  Gene,  w  okienku  wyszuki-
wania”for” wpisać nazwę genu, którego sekwencję chcemy znaleźć. 

Nazwę  genu  dla  każdego  dwuosobowego  zespołu  biorącego  udział  w  ćwicze-

niach poda prowadzący zajęcia. Poniżej są pokazane kolejne czynności, jakie nale-
ż

y wykonać w ramach realizacji niniejszego ćwiczenia na przykładzie genu MMP3 

dla metaloproteinazy 3: 
1 Do okienka wyszukiwania „for” wpisać nazwę genu: mmp3. 
2. Jako rezultat wyszukiwania pojawi się szereg rekordów zawierających informa-

cję na temat genu dla metaloproteinazy.  

3. Każdy opis rekordu zawiera: 

a. nazwę białka oraz nazwę gatunku, w którym to białko występuje, 
b. nazwy innych rekordów, w których informacja o powyższym genie występuje 
(Other Aliases), 
c. inne określenia (nazwy) wyszukiwanego genu (Other Designations), 
d. lokalizację chromosomową genu (Chromosome), 
e. numer genu (GeneID). 

 
Wybrać rekord zawierający informację na temat genu ludzkiej metaloproteinazy 3, 
„klikając” na nazwę MMP3 (jest to rekord nr 1). 
 

Po zapoznaniu się z zawartością rekordu, na zaliczenie należy przygotować 

krótką charakterystykę białka kodowanego przez wyszukiwany gen na podstawie 
informacji uzyskanej tą drogą. 
 

Następnie „kliknąć” na symbol oznaczający produkt(y) transkrypcji wyszukane-

go genu (Transcripts and products). W przypadku genu MMP3, produkt ten 
oznaczony jest symbolem: NC_000011. „Klikając” na oznaczenie NC_000011 
rozwinie się małe okienko wyboru, w którym jest możliwość wyboru sposobu pre-
zentacji informacji – wybrać „genebank”. 
 

Po zapoznaniu się z opisem rekordu, podać liczbę nukleotydów tworzących cD-

NA wyszukanego genu. 
 
2. Wyszukiwanie informacji na temat chorób genetycznych zwi

ązanych z dys-

funkcj

ą określonych genów. 

 
1. Połączyć się z bazą OMIM

TM

,  

adres WWW: 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim

 

background image

 

4

 

Po połączeniu się z bazą wpisać do okienka wyszukiwania nazwę genu podaną 
przez osobę prowadzącą zajęcia, a następnie, po otwarciu rekordu zawierającego 
opis zaburzeń związanych z danym genem, podać opis przykładów wadliwych alle-
li tego genu występujących w określonych chorobach. 
 
3. Wyszukiwanie informacji na temat znanych mutacji punktowych wyst

ępu-

j

ących w określonym genie. 

 
1. Połączyć się z bazą Single Nucleotide Polymorphism (SNP): 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp

 

Wpisać do okienka wyszukiwania nazwę genu podaną przez osobę prowadzącą 
zajęcia.  
2. Podać numery dwóch rekordów opisujących dwie mutacje punktowe w da-
nym genie. 

3. Na podstawie uzyskanych w bazie informacji podać częstość ich występowania. 
 
4. Wyszukiwanie informacji o sekwencji nukleotydowej 

 
Połaczyć się z bazą Nucleotide 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore

 

Wyszukać sekwencję nukleotydową zawierającą  gen wskazany  przez osobę pro-
wadzącą zajęcia, a następnie podać: 
1. jego locus w genomie, 
2. numer sekwencji nukleotydowej kodującej eksony danego genu. 
 
5. Korzystanie z dost

ępnych „on line” anglojęzycznych podręczników do bio-

logii molekularnej i biochemii. 

 

Połączyć się  z domeną internetową: „Books” 

http://www.ncbi.nlm.nih.gov/sites/entrez?db=books

 

zawierającą dostępne „on line” podręczniki. 
Zgodnie ze wskazówkami  zapoznać się z dostępnymi w tej domenie podręczni-
kami. 
 
Uwaga: 

Powyższe ćwiczenia wymagają bardzo ścisłej współpracy z osobami prowadzą-

cymi. Realizowane są one w zespołach dwuosobowych, gdzie każdy zespół ma 
własne, indywidualne zadania do realizacji.