Bazy danych DNA i RNA:
Istnieją 3 podstawowe bazy GenBank(USA), EMBL (Europe) & DDBJ (Japan), w kórych można wyszukiwać informacji o genach.
Zadanie 1.Wyszukać informacje o genie WWOX u człowieka
Wejdź na stronę główna NCBI (http://www.ncbi.nlm.nih.gov/), wybierz bazę `'GENE'' i wpisz `'WWOX''
Otrzymaliśmy 23 rekordy u różnych organizmów, wybieramy pierwszy rekord dotyczący człowieka.
Ze strony tej możemy wyczytać następujące informacje o genie WWOX u człowieka
Symbol genu, pełna nazwa genu ( official symbol)
Odnośniki do innych baz ENSEMBL, HUMAN PROTEIN REFERENCE DATABASE, OMIM (see ralated)
Organizm z jakiego pochodzi (organism)
Pochodzenie, rodowód (lineage)
Inne skróty genu (also know as)
Krótka charakterystyka (summary)
W podrozdziale ,, Genomic regions, transcripts, and products'' wyświetla się mapa zawierająca odnośniki do sekwencji genomowej, transkryptów (mRNA) i białkowej:
Sekwencja genomowa; numer NC_000016.9, gdzie można pobrać sekwencje genu w różnych formatach: FASTA i GenBank, Graphics
Format Fasta
Homo sapiens chromosome 16, GRCh37 primary reference assembly
>ref|NC_000016.9|:78133551-79246564 Homo sapiens chromosome 16, GRCh37 primary reference assembly
GCAGTGCGCAGGCGTGAGCGGTCGGGCCCCGACGCGCGCGGGTCTCGTTTGGAGCGGGAGTGAGTTCCTG
AGCGAGTGGACCCGGCAGCGGGCGATAGGGGGGCCAGGTGCCTCCACAGTCAGCCATGGCAGCGCTGCGC
Format GeneBank
Opis formatu:
LOCUS [nr rekordu, długość cząsteczki, topologia, kod działu i data],
DEFINITION [zawartość biologiczna rekordu],
ACCESSION [numer dostępu, odnośnik który powinien być cytowany],
VERSION [nr wersji, nr GI - geneinfo id],
DBSOURCE [źródłowa baza danych],
KEYWORDS, SOURCE [z jakiego organizmu pochodzi sekwencja],
ORGANISM [nazwa naukowa organizmu, nazwa angielska i krótka taksonomia],
REFERENCE,
COMMENT [rzadko, odnośnik do poprzedniej wersji lub nowego rekordu],
FEATURES [charakterystyk sekwencji, opis regionów, właściwości odnośnik do
CDS (sekwencji kodującej), funkcja biologiczna sekwencji],
ORIGIN [sekwencja],
// [koniec rekordu]
Format graficzny pozwalający na przeszukiwanie sekwencji np. pozwala na wyszukiwanie sekwencji w określonej pozycji
Istnieje możliwość zapisywania określonych sekwencji w danym formacie (rozwijając download)
transkryptów - skrót NM_......
białka- skrót NP_.....
Podrozdział Genomic context- pozwala na dokładne poznanie lokalizacji i genów leżących na tym samych chromosomie,
p oznacza krótkie ramię, q - długie ramię
Wejść w Mapviewer
Podrozdział Bibliography:
Połaczenie z PubMed
Podrozdział Interactions: związek z innymi genami
Podrozdział General gene information: markery zdeponowane do analizy tego genu
Podrozdział Phenotypes- w jakich fenotypach chorobowych gen bieże udział
Podrozdział Homology- pokazuje homologię tego genu u różnych organizmów
Podrozdział Ontology- Opisuje właściwości genów i ich produktów w organizmie na poziomie funkcji produktów białkowych, roli w procesach biologicznych, struktury komórkowej.
Podrozdział General protein information- informacje na temat produktu białkowego genu
Podrozdział NCBI Reference Sequences (RefSeq)- posiada odnośniki do sekwencji referencyjnych w bazie NCBI zarówno sekwencji genomowej, mRNA jak i białka.
Zadanie 2 do samodzielnego wykonania:
Wyszukać informacje na temat ludzkiego genu PTEN.
Podać pełna nazwę genu
Podać inne alternatywne skróty tego genu
Podać numer dostępu do sekwencji :
Genomowej
mRNA
białka
zapisać na pulpicie sekwencję białka w formacie FASTA i GeneBank
podać lokalizację genu PTEN
podać jakie geny leżą od końca 5' i 3' względem genu PTEN na tym samym chromosomie
podać w jakich stanach chorobowych zanotowano zmiany w genie PTE
Zadanie 3.Przeszukiwanie sekwencji promotorowych w bazie EMBL-EBI ( www.ebi.ac.uk)
W okno Search Box wpisz symbol U43589
Wejdź w bazę Nucleotide
Dany rekord można oglądać w różnych formatach, wejdź w format SRN
Co oznacza symbol wprowadzony do search box
Na którym chromosomie znajduje się ten gen?
Określ położenie promotora
Podaj sekwencję promotorową
Otwórz stronę główną w nowej zakładce i wpisz w oknie wyszukiwania „human ob gene, promoter exon 1”
Wejdź w rekord U48621
Co zawiera dana sekwencja
Wejdź w sekwencję exonową i porównaj ją z sekwencją rekordu U43589 (Różnice w liczbie wziętych par zasad wynikają z rozpatrywanego regionu).
Zadanie 4. do samodzielnego wykonania.
Znajdź dokładną sekwencję promotora ludzkiego genu WWOX w bazie EMBL-EBI.
Sprawdź ile miejsc inicjacji posiada ten promotor i w jakiej pozycji
Zadanie 5.Baza ENSEMBL (www.ensembl.org/index.html)
Wspólny projekt EMBL -EBI oraz Sanger Institute.
Wyszukiwanie informacji o genie MYO6 u człowieka
Wyświetliły się 3 rekordy: 2 dotyczące genów i 1 markerów
Wybierać ,,gene'': dostaliśmy 2 wyniki z dwóch różnych baz, wybieramy ENSEMBL
Ze strony tej można wyczytać następujące informacje
Pełna nazwa genu
Lokalizacja
Ilość transkryptów i produktów białkowych z numerami ID
Jak odczytać dodatkowe informacje o transkryptach:
Wejść w `'splice variants''; wybrać pierwszy transkrypt ENST00000369985-opis tego transkryptu:
z ilu składa się eksonów:33, długość transkryptu: 5,651pz, długość białka podana w resztach aminokwasów: 1,262
-Jak odczytać i zapisać dodatkowe informacje o eksonach i intronach w transkrypcie?
wejść w `'exons'': otrzymuje się obraz sekwencji z podziałem na introny i eksony, na niebiesko zapisano sekwencje intronów, na czarno eksonów, na zielono sekwencje flankujące na końcu 3' i 5', na purpurowo sekwencja nie ulegająca translacji tzw. UTR ( Untranslated Region)można odczytać długość ich sekwencji .
*aby podejrzeć całą sekwencje intronów należy konfigurować stronę (configure this page): pokaż całą sekwencje intronową(Show full intronic sequence, save and close)
Można również odnaleźć informacje na temat polimorfizmów;
Jeśli chcemy otrzymać informacje o wszystkich polimorfizmach dla wszystkich transkryptów należy wejść w zakładkę `' gene'', a następnie `'variation table''
W bazie tej istnieje kod (Ambiguity code)wg IUPAC (International Union of Pure and Applied Chemistry)
Oznaczenia do tabelek o polimorfizmach genaów:
Alternate residues. - aminokwasy wymieniane w sekwencji białkowej.
Przykładowe typy SNP:
Non-synonymous (nie-synonimiczny)-wymiana nukleotydu powoduje kodowanie innego aminokwasu
Synonymous (synonimiczny)-tzw. mutacja cicha, nowo powstała trójka kodująca jest synonimiczna z wyjściową, dlatego też sekwencja aminokwasów w białku tez nie ulegnie żadnej zmianie
frameshift variation-zmiana ramki odczytu
Stop lost -utrata kodonu stopu.
Jeśli chcemy wybrać tylko określony rodzaj SNP, można konfigurować stronę `'configure this page''i zaznaczyć w `'Select Variation Type''np.non-synonymous
*jeśli zaś chcemy znaleźć informacje o SNP dla określonego transkryptu to należy wybrać transkrypt np. ENST00000369985 i wejść w zakładkę `'Variations''
Zadanie 6 do samodzielnego wykonania:
Korzystając z bazy ENSEMBL wyszukaj informacji na temat ludzkiego genu bcl2:
Rozwiń skrót genu
Na którym chromosomie znajduje się ten gen
Ile ma tran skryptów i który jest najdłuższy
Podać długość transkryptu 1, ile zawiera eksonów i z ilu aminokwasów składa się jego produkt białkowy
jakie rodzaje polimorfizmów wystepują w transkrypcje BCL2-001 i jakie allele SA wymieniane
ile opisano polimorfizmów synonimicznych w całym tym genie?
Bazy genomowe NCBI
Genome - baza zawierająca informacje o całych zsekwencjonowanych genomach
Zadanie7.
W bazie Genome wyszukaj genom mitochondrialny bizona
wpisz: Bubalus bubalis
a) Ile genów znajduje się w mitochondrium bizona?
b) Jaka jest zawartość par GC?
c) Ile jest pseudogenów?
d) Jaki jest procent sekwencji kodujących?
e) Czy ten genom jest kolisty czy liniowy?
f) Odnajdź w genomie gen cytb - wpisz pod tabelką symbol genu
g) jakie geny znajdują się w genomie w pobliżu genu cytb
Zadanie 8 do samodzielnego wykonania:
Sprawdź powyższe informacje o genomie mitochondrialnym Mus musculus molossinus (podgatunek myszy domowej)
Z ilu składa się genów?
Ile zawiera RNA strukturalnych?
Jaką ma długość genom mitochondrialny u tego organizmu?
Jak jest zawartość dinukloetydu GC i sekwencjo kodujących?
Podać jakie geny znajdują się w najbliżej genu COX3 od jego 5' i 3' końca?
Zadanie 9.
Wyszukiwanie informacji dotyczących sekwencji mitochondrium psa domowego (Canis lapus)
Wpisz w bazie `'Genome'' Canis lupus
a) podaj liczbę genów
b) jaką pozycję (w pz) ma nukleotyd stanowiący początek sekwencji kodującej cytochrom b (CYTB)?
Wejść w liczbę białek jaka się wyświetliła, wyszukać nazwę genu CYTB w tabelce
c) jaką długość( w aminokwasach) ma białko ATP8?
d) na której nici (sensowej/antysensowej) leży gen kodujący podjednostkę 6 dehydrogenazy NADH?
Zadanie 10 do samodzielnego wykonania
Podaj następujące informacje dotyczące kompletnej sekwencji chloroplastu eugleny (Euglena gracilis):
a) podaj liczbę białek
b) jaką pozycję (w pz) ma nukleotyd stanowiący początek sekwencji kodujacej białko D2 fotosystemu II (photosystem II protein D2, psbD)?
c) jaką długość ( w aminokwasach)ma białko rybosomalne rps18?
d) na której nici (sensowej/antysensowej) leży gen kodujący białko czynnik elongacji Tu (tufA)
Długość sekwencji
intron
ekson
Nie cała sekwencja intronowi( są ……..)
[numer ID dla SNP(Single Nucleotide Polimorfism). Wpisz cytat z dokumentu albo podsumowanie interesującej kwestii. Pole tekstowe można umieścić w dowolnym miejscu w dokumencie. Użyj karty Narzędzia pól tekstowych, aby zmienić formatowanie pola tekstowego cytatu.]
typ, efekt SNP
pozycja aminokwasu w sekwencji.
Jaki allel jest wymieniany na jaki
Jakie aminokwasy są wymieniane na jakie
pozycja aminokwasu w sekwencji
Nazwa genu o symbolu U43589, co zawiera
Typ cząsteczki i długość
Sekwencja promotora z zawartością poszczególnych nukleotydów
Lokalizacja genu
Położenie promotora
sekwencję otaczającą promotor , sam promotor i exon 1
Początek i koniec sekwencji kodującej dane białko
Typ nici na której jest kodowane białko(+sensowna, - nonsensowna)
Długość białka w aminokwasach