1
INTERNETOWE BAZY DANYCH JAKO NARZĘDZIA W BIOLOGII
MOLEKULARNEJ. MODYFIKACJE DNA IN SILICO
ZAGADNIENIA DO PRZYGOTOWANIA
Kwasy nukleinowe – budowa i funkcje. Organizacja genomu wirusów, bakte-
rii i organizmów eukariotycznych. Replikacja. Transkrypcja. Translacja.
WPROWADZENIE
Genbank
http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html
Entrez Browser
http://www.ncbi.nlm.nih.gov/sites/gquery
Gen-Bank jest powszechnie dostępną, internetową bazą danych, zawierającą se-
kwencje DNA poszczególnych genów, znajdującą się przy National Center for Bio-
technology Information (NCBI) w USA. Jest częścią przedsięwzięcia jakim jest
międzynarodowa współpraca w tworzeniu bazy danych zawierającej sekwencje nu-
kleotydowe (Nucleotide Sequence Database Collaboration). W ramach tej współ-
pracy trzy instytucje: DNA DataBank of Japan (DDBJ), European Molecular Bio-
logy Laboratory (EMBL) oraz GenBank codziennie wymieniają i uzupełniają wła-
sne zasoby zgromadzonych sekwencji nukleotydowych poszczególnych genów.
Poszczególne rekordy bazy danych GenBank zawierają :
- zwięzły opis sekwencji,
- nazwę naukową i taksonomiczną organizmu, z którego pochodzi dana sekwencja,
- tabelę zawierającą opis cech danej sekwencji.
By ułatwić dostęp do ogromnej ilości informacji zgromadzonej w GenBank,
tworzone są różnego rodzaju podzbiory gromadzące informacje według określo-
nych wymogów.
1. Gene
http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene
Jest to baza danych zawierająca informacje na temat poszczególnych genów.
Umożliwia ona dostęp do sekwencji (zarówno intronów jak i eksonów), podstawo-
wych danych literaturowych dotyczących danego genu, miejsca jego położenia w
chromosomie, składu aminokwasowego białka, które koduje i jego funkcji.
2. OMIM
TM
- Online Mendelian Inheritance in Man
TM
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
- baza danych zawierająca katalog genów i zaburzeń genetycznych, opracowana
przez Dr. Victora A. McKusicka i jego kolegów z Johns Hopkins University. Baza
2
ta adresowana jest głównie do lekarzy i specjalistów zajmujących się chorobami
genetycznymi. Poszczególne wady genetyczne opisane są w taki sposób, że zawie-
rają zarówno odnośniki do piśmiennictwa naukowego jak i pełny zestaw informacji
dotyczący danej choroby dziedzicznej, rodzaju defektu genetycznego, jego lokali-
zacji itp. Bazą tą można się również posługiwać wówczas, gdy chcemy się dowie-
dzieć, jakie choroby genetyczne są związane z poszczególnymi genami czy chro-
mosomami.
3. Single Nucleotide Polymorphism (SNP)
http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp
Baza ta gromadzi informacje dotyczące mutacji punktowych występujących w
genach, które mogą mieć wpływ na proces regulacji ich ekspresji. Oprócz informa-
cji na temat miejsca lokalizacji mutacji i jej charakterystyki, w bazie tej można zna-
leźć także informacje na temat częstości jej występowania w badanych popula-
cjach, a także odnośniki do danych literaturowych, na podstawie których uzyskano
te dane.
4. Nucleotide
http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore
Jest to baza gromadząca sekwencje nukleotydowe różnych fragmentów genomu
ludzkiego i innych gatunków. Szczególnie użyteczna bywa ona wówczas, gdy
chcemy znaleźć w jednym fragmencie zarówno sekwencję określonego genu, jak i
sekwencje przylegające do obszaru zajmowanego przez dany gen, np. sekwencje
regulatorowe.
5. Books
http://www.ncbi.nlm.nih.gov/sites/entrez?db=books
Ta witryna prowadzona przez National Center for Biotechnology Information w
USA jest godna polecenia dla wszystkich, którzy chcieliby uzyskać mocne teore-
tyczne podstawy do praktycznego wykorzystania wiedzy zgromadzonej w powyż-
szych bazach danych. Zawiera ona bowiem dostępne „on line” książki poświęcone
biochemii, biologii molekularnej i biologii komórki.
CZ
ĘŚĆ DOŚWIADCZALNA
Celem ćwiczeń jest zapoznanie się z podstawowymi źródłami informacji na te-
mat ludzkiego genomu oraz nabycie umiejętności posługiwania się nimi.
3
1. Wyszukiwanie sekwencji cDNA genu z internetowej bazy danych Gene.
Wpisać do wyszukiwarki internetowej adres WWW bazy danych Gene:
http://www.ncbi.nlm.nih.gov/sites/entrez?db=gene
Po uzyskaniu połączenia internetowego z bazą danych Gene, w okienku wyszuki-
wania”for” wpisać nazwę genu, którego sekwencję chcemy znaleźć.
Nazwę genu dla każdego dwuosobowego zespołu biorącego udział w ćwicze-
niach poda prowadzący zajęcia. Poniżej są pokazane kolejne czynności, jakie nale-
ż
y wykonać w ramach realizacji niniejszego ćwiczenia na przykładzie genu MMP3
dla metaloproteinazy 3:
1 Do okienka wyszukiwania „for” wpisać nazwę genu: mmp3.
2. Jako rezultat wyszukiwania pojawi się szereg rekordów zawierających informa-
cję na temat genu dla metaloproteinazy.
3. Każdy opis rekordu zawiera:
a. nazwę białka oraz nazwę gatunku, w którym to białko występuje,
b. nazwy innych rekordów, w których informacja o powyższym genie występuje
(Other Aliases),
c. inne określenia (nazwy) wyszukiwanego genu (Other Designations),
d. lokalizację chromosomową genu (Chromosome),
e. numer genu (GeneID).
Wybrać rekord zawierający informację na temat genu ludzkiej metaloproteinazy 3,
„klikając” na nazwę MMP3 (jest to rekord nr 1).
Po zapoznaniu się z zawartością rekordu, na zaliczenie należy przygotować
krótką charakterystykę białka kodowanego przez wyszukiwany gen na podstawie
informacji uzyskanej tą drogą.
Następnie „kliknąć” na symbol oznaczający produkt(y) transkrypcji wyszukane-
go genu (Transcripts and products). W przypadku genu MMP3, produkt ten
oznaczony jest symbolem: NC_000011. „Klikając” na oznaczenie NC_000011
rozwinie się małe okienko wyboru, w którym jest możliwość wyboru sposobu pre-
zentacji informacji – wybrać „genebank”.
Po zapoznaniu się z opisem rekordu, podać liczbę nukleotydów tworzących cD-
NA wyszukanego genu.
2. Wyszukiwanie informacji na temat chorób genetycznych zwi
ązanych z dys-
funkcj
ą określonych genów.
1. Połączyć się z bazą OMIM
TM
,
adres WWW:
http://www.ncbi.nlm.nih.gov/sites/entrez?db=omim
4
Po połączeniu się z bazą wpisać do okienka wyszukiwania nazwę genu podaną
przez osobę prowadzącą zajęcia, a następnie, po otwarciu rekordu zawierającego
opis zaburzeń związanych z danym genem, podać opis przykładów wadliwych alle-
li tego genu występujących w określonych chorobach.
3. Wyszukiwanie informacji na temat znanych mutacji punktowych wyst
ępu-
j
ących w określonym genie.
1. Połączyć się z bazą Single Nucleotide Polymorphism (SNP):
http://www.ncbi.nlm.nih.gov/sites/entrez?db=snp
Wpisać do okienka wyszukiwania nazwę genu podaną przez osobę prowadzącą
zajęcia.
2. Podać numery dwóch rekordów opisujących dwie mutacje punktowe w da-
nym genie.
3. Na podstawie uzyskanych w bazie informacji podać częstość ich występowania.
4. Wyszukiwanie informacji o sekwencji nukleotydowej
Połaczyć się z bazą Nucleotide
http://www.ncbi.nlm.nih.gov/sites/entrez?db=nuccore
Wyszukać sekwencję nukleotydową zawierającą gen wskazany przez osobę pro-
wadzącą zajęcia, a następnie podać:
1. jego locus w genomie,
2. numer sekwencji nukleotydowej kodującej eksony danego genu.
5. Korzystanie z dost
ępnych „on line” anglojęzycznych podręczników do bio-
logii molekularnej i biochemii.
Połączyć się z domeną internetową: „Books”
http://www.ncbi.nlm.nih.gov/sites/entrez?db=books
zawierającą dostępne „on line” podręczniki.
Zgodnie ze wskazówkami zapoznać się z dostępnymi w tej domenie podręczni-
kami.
Uwaga:
Powyższe ćwiczenia wymagają bardzo ścisłej współpracy z osobami prowadzą-
cymi. Realizowane są one w zespołach dwuosobowych, gdzie każdy zespół ma
własne, indywidualne zadania do realizacji.