LABORATORIUM BIOINFORMATYKI ZAAWANSOWANEJ
ĆWICZENIE nr 1
TEMAT: Dopasowanie wielosekwencyjne: CLUSTAL W, MUSCLE, T-COFFEE, CDD
WYDZIAŁ: BIOTECHNOLOGII I NAUK O ŻYWIENIU CZŁOWIEKA
KIERUNEK: BIOTECHNOLOGIA
ROK AKADEMICKI: 2011/2012
DATA WYKONANIA ĆWICZENIA : 15.05.2012
DZIEŃ TYGODNIA : WTOREK
GODZINA : 14.00 – 16.00
IMIĘ I NAZWISKO | NUMER ALBUMU |
---|---|
Michał Orzechowski | 178387 |
OCENA ZE SPRAWOZDANIA …………………
UWAGI PROWADZĄCEGO: …………………………………………….…..………………………………….………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………
……………………………………………………………………………………
PODPIS ……………………
Wstęp teoretyczny.
Globiny.
Globiny są hemoproteinami, które wiążą i transportują tlen. Tą rodzinę cechuje zbiór różnorodnych homologicznych domen białkowych, w tym:
(1) tetrameryczne hemoglobiny kręgowców, które są głównym białkowym składnikiem erytrocytów oraz transportują tlen w krwiobiegu,
(2) drobnoustrojowe flavohemoglobiny, które są powiązane z C-końcową, zależną od FAD, domeny reduktazy,
(3) homodimermalne bakteryjne hemoglobiny, np. z Vitreoscilla,
(4) roślinne leghemoglobiny (symbiotyczne hemoglobiny, biorą udział w metabolizmie azotu w kłączach roślin),
(5) hexacoordinate globins roślin nie-symbiotycznych i hexacoordinate globins z bakterii i zwierząt, występują tu globiny tj. neuroglobiny,
(6) hemoglobina bezkręgowców, które mogą wystąpić w tandemowych powtórzeniach (7) myoglobiny monomeryczne znaleźone w tkance mięśniowej zwierząt.
Programy do tworzenia dopasowań wielosekwencyjnych.
Analiza sekwencji obejmuje stosowanie różnych metod bioinformatycznych do określenia funkcji biologicznej i/lub struktury genów i białek, które one kodują.
Narzędzia takie jak ClustalW2 jest stosowanie do wyrównywania sekwencji DNA lub białka w celu wyjaśnienia ich pokrewieństwa, jak również ich ewolucyjnego pochodzenia.
MUSCLE - MUltiple Sequence Comparison by Log-Expectation, czyli dopasowanie progresywne z iteracyjną optymalizacją drzewa przewodniego. Narzędzie to zapewnia lepszą średnią dokładność, jak i jednocześnie lepszą szybkość niż ClustalW2 lub T-Coffee, w zależności od wybranych opcji.
T-Coffee - dopasowanie progresywne oparte na spójności/zgodności. Wielokrotne dopasowywanie sekwencji przez program, który pozwala na łączenie wyników z kilku metod dopasowania.
Ćwiczenie 1.
Otwieram stronę Europejskiego Instytutu Bioinformatyki http://www.ebi.ac.uk/
Następnie z zakładek TOOLS z górnego paska wybieram Sequence Analysis, po czym wybieram interesujący nas program
Dokonuję dopasowań dla sekwencji z pliku globiny.txt
Wyniki otwieram w Jalview
3.
a) Z obserwacji określonego obszaru sekwencji aminokwasowej białek porównywanych trzema programami zauważyłem pewne różnice. Programy te dopasowują sekwencję wstawiając przerwy.
Np. w sekwencji Globiny nicienia/1-136 program clustalw2 wstawił przerwę w sekwencji 57-70 AA, program MUSCLE wstawił ja w miejscu 55-68 AA, a T-COFFE w pozycji 51-64 AA.
b) Porównując dopasowania różnych programów można stwierdzić że różnią się one między sobą. Histydyna konserwatywna w dopasowaniu clustalw2 nie posiadała pełnego dopasowania we wszystkich sekwencjach. W tym programie konserwatywne histydyny były zlokalizowane na 105, jak i na 108 pozycji aminokwasowej. Program MUSCLE i T-COFFE we wszystkich porównywanych sekwencjach zlokalizował ją na tych samych pozycjach i była to lokacja 108AA.
4.
CLUSTAL
hemoglobina_beta_ludzka/1-147 --------MVHLTPEEKSAVTALWGKVN--VDEVGGEALGRLLVVYPWTQRFFESFG-DL
Hemoglobina_A_bydleca/1-141 ----------VLSAADKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF--DL
mioglobina_ludzka/1-154 ---------MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFK-HL
hemoglobina_rozwielitki/1-302 ----------LLSAHERSLIRKTWDQAK-KDGDVAPQVLFRFVKAHPEYQKMFSKFA-NV
neuroglobina_ludzka/1-151 -----------MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQF
glb-28_nicienia/1-172 SASPATCRDLTISPEHQKLIKRSWNRIP--KAQFGRASLEAFITAAQVTHAIFVDK----
GLoBina_nicienia/1-136 -------------------------------SNCGSTITRRMMARKSTIGDILDRS----
hemoglobina_beta_ludzka/1-147 STPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKG-TFATLSELHCDKLH------VDPE
Hemoglobina_A_bydleca/1-141 SH-----GSAQVKGHGAKVAAALTKAVEHLDDLPG-ALSELSDLHAHKLR------VDPV
mioglobina_ludzka/1-154 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEA-EIKPLAQSHATKHK------IPVK
hemoglobina_rozwielitki/1-302 PQSE-LLSNGNFLAQAYTILAGLNVVIQSLFSQEL-MANQLNALGGAHQPR----GATPV
neuroglobina_ludzka/1-151 SSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSS-LEEYLASLGRKHRAV----GVKLS
glb-28_nicienia/1-172 ---------ETENRHVKYFVDLVQSCVDNLENLETGVKPWLDLIGRGHANF----KITGK
GLoBina_nicienia/1-136 ----------TLDYHNLQIVEFLQKVMQSLDEPDK-ISKLCQEIGQKHAKYRRSKGMKID
hemoglobina_beta_ludzka/1-147 NFRLLGNVLVCVLAHHFG-KEFTPPVQAAYQKVVAGVANALAHKYH--------------
Hemoglobina_A_bydleca/1-141 NFKLLSHSLLVTLASHLP-SDFTPAVHASLDKFLANVSTVLTSKYR--------------
mioglobina_ludzka/1-154 YLEFISECIIQVLQSKHP-GDFGADAQGAMNKALELFRKDMASNYKELGFQG--------
hemoglobina_rozwielitki/1-302 MFEQFGGILEEVLAEELG-SGFTAEARQAWKNGLAALVAGIAKNLKKAEDLADPQTKLTP
neuroglobina_ludzka/1-151 SFSTVGESLLYMLEKCLG-PAFTPATRAAWSQLYGAVVQAMSRGWDGE------------
glb-28_nicienia/1-172 HWEKFGESLLTTATEWNGPGRRHKETVKAWMVMSSFLADRLAHASRLAHHSPMLTPRVQL
GLoBina_nicienia/1-136 YWDKLGEAITETIREYQG-WKIHRESLRAATVLVSYVVDQLRFGYSRGLHVQGSRETKED
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
mioglobina_ludzka/1-154 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 HQIRDVQRSWENIRNDRNALVSSIFVKLFKETPRIQKFFAKFANVAVDSLAGNAEYEKQI
neuroglobina_ludzka/1-151 ------------------------------------------------------------
glb-28_nicienia/1-172 LTGRSAFEFNN-------------------------------------------------
GLoBina_nicienia/1-136 DEE---------------------------------------------------------
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
mioglobina_ludzka/1-154 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 ALVADRLDTMISAMDDKLQLLGNINYMRYTHTERGIPRAPWEDFSRLLLDVLGSKGVSTD
neuroglobina_ludzka/1-151 ------------------------------------------------------------
glb-28_nicienia/1-172 ------------------------------------------------------------
GLoBina_nicienia/1-136 ------------------------------------------------------------
hemoglobina_beta_ludzka/1-147 ---------------------
Hemoglobina_A_bydleca/1-141 ---------------------
mioglobina_ludzka/1-154 ---------------------
hemoglobina_rozwielitki/1-302 DLDSWKGVLAVFVNGVSPIKK
neuroglobina_ludzka/1-151 ---------------------
glb-28_nicienia/1-172 ---------------------
GLoBina_nicienia/1-136 ---------------------
MUSCLE
mioglobina_ludzka/1-154 ---------MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFD-KFKHL
Hemoglobina_A_bydleca/1-141 ----------VLSAADKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFP-HF-DL
hemoglobina_beta_ludzka/1-147 --------MVHLTPEEKSAVTALWGKVNVD--EVGGEALGRLLVVYPWTQRFFE-SFGDL
neuroglobina_ludzka/1-151 -----------MERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQF
hemoglobina_rozwielitki/1-302 ----------LLSAHERSLIRKTWDQAKKDG-DVAPQVLFRFVKAHPEYQKMFS-KFANV
GLoBina_nicienia/1-136 -------------------------------SNCGSTITRRMMARKSTIGDILD------
glb-28_nicienia/1-172 SASPATCRDLTISPEHQKLIKRSWNRIPKA--QFGRASLEAFITAAQVTHAIFV------
mioglobina_ludzka/1-154 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHE----AEIKPLAQSHA---TKHKIPVK
Hemoglobina_A_bydleca/1-141 SH-----GSAQVKGHGAKVAAALTKAVEHLDDLP----GALSELSDLHA---HKLRVDPV
hemoglobina_beta_ludzka/1-147 STPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLK----GTFATLSELHC---DKLHVDPE
neuroglobina_ludzka/1-151 SSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSS-LEEYLASLGRKH----RAVGVKLS
hemoglobina_rozwielitki/1-302 PQSELL-SNGNFLAQAYTILAGLNVVIQSLFSQEL-MANQLNALGGAH----QPRGATPV
GLoBina_nicienia/1-136 --------RSTLDYHNLQIVEFLQKVMQSLDEPDK-ISKLCQEIGQKHAKYRRSKGMKID
glb-28_nicienia/1-172 -------DKETENRHVKYFVDLVQSCVDNLENLETGVKPWLDLIGRGH----ANFKITGK
mioglobina_ludzka/1-154 YLEFISECIIQVLQSKHPGD-FGADAQGAMNKALELFRKDMASNY-KELGFQG-------
Hemoglobina_A_bydleca/1-141 NFKLLSHSLLVTLASHLPSD-FTPAVHASLDKFLANVSTVLTSKY-R-------------
hemoglobina_beta_ludzka/1-147 NFRLLGNVLVCVLAHHFGKE-FTPPVQAAYQKVVAGVANALAHKY-H-------------
neuroglobina_ludzka/1-151 SFSTVGESLLYMLEKCLGPA-FTPATRAAWSQLYGAVVQAMSRGW-DGE-----------
hemoglobina_rozwielitki/1-302 MFEQFGGILEEVLAEELGSG-FTAEARQAWKNGLAALVAGIAKNL-KKAEDLADPQTKLT
GLoBina_nicienia/1-136 YWDKLGEAITETIREYQGWK-IHRESLRAATVLVSYVVDQLRFGYSRGLHVQGSRETKED
glb-28_nicienia/1-172 HWEKFGESLLTTATEWNGPGRRHKETVKAWMVMSSFLADRLAHAS-RLAHHSPMLTPRVQ
mioglobina_ludzka/1-154 ------------------------------------------------------------
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
neuroglobina_ludzka/1-151 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 PHQIRDVQRSWENIRNDRNALVSSIFVKLFKETPRIQKFFAKFANVAVDSLAGNAEYEKQ
GLoBina_nicienia/1-136 DEE---------------------------------------------------------
glb-28_nicienia/1-172 LLTGRSAFEFNN------------------------------------------------
mioglobina_ludzka/1-154 ------------------------------------------------------------
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
neuroglobina_ludzka/1-151 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 IALVADRLDTMISAMDDKLQLLGNINYMRYTHTERGIPRAPWEDFSRLLLDVLGSKGVST
GLoBina_nicienia/1-136 ------------------------------------------------------------
glb-28_nicienia/1-172 ------------------------------------------------------------
mioglobina_ludzka/1-154 ----------------------
Hemoglobina_A_bydleca/1-141 ----------------------
hemoglobina_beta_ludzka/1-147 ----------------------
neuroglobina_ludzka/1-151 ----------------------
hemoglobina_rozwielitki/1-302 DDLDSWKGVLAVFVNGVSPIKK
GLoBina_nicienia/1-136 ----------------------
glb-28_nicienia/1-172 ----------------------
T-COFFE
GLoBina_nicienia/1-136 -------------------------------SNCGSTITRRMMARKSTIG----------
Hemoglobina_A_bydleca/1-141 ----------VLSAADKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF----
glb-28_nicienia/1-172 SASPATCRDLTISPEHQKLIKRSWNRIPKA--QFGRASLEAFITAAQVTHAIFV------
hemoglobina_beta_ludzka/1-147 MV--------HLTPEEKSAVTALWGKVNVD--EVGGEALGRLLVVYPWTQRFFESF-GDL
hemoglobina_rozwielitki/1-302 ----------LLSAHERSLIRKTWDQAKKDG-DVAPQVLFRFVKAHPEYQKMFSKF-ANV
mioglobina_ludzka/1-154 M---------GLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKF-KHL
neuroglobina_ludzka/1-151 M-----------ERPEPELIRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQF
GLoBina_nicienia/1-136 ----DILDRSTLDYHNLQIVEFLQKVMQSLDEPDK-ISKLCQEIGQKHAKYRRSKGMKID
Hemoglobina_A_bydleca/1-141 ---DLSHGSAQVKGHGAKVAAALTKAVEHLDDLPGA----LSELSDLHAHKL---RVDPV
glb-28_nicienia/1-172 -------DKETENRHVKYFVDLVQSCVDNLENLETGVKPWLDLIGRGHANF----KITGK
hemoglobina_beta_ludzka/1-147 STPDAVMGNPKVKAHGKKVLGAFSDGLAHLDNLKG----TFATLSELHCDKL---HVDPE
hemoglobina_rozwielitki/1-302 PQ-SELLSNGNFLAQAYTILAGLNVVIQSLFSQEL-MANQLNALGGAHQPR----GATPV
mioglobina_ludzka/1-154 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAE----IKPLAQSHATKH---KIPVK
neuroglobina_ludzka/1-151 SSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSS-LEEYLASLGRKHRAV----GVKLS
GLoBina_nicienia/1-136 YWDKLGEAITETIREYQGWK-IHRESLRAATVLVSYVVDQLRFGYS-------------R
Hemoglobina_A_bydleca/1-141 NFKLLSHSLLVTLASHLPSD-FTPAVHASLDKFLANVSTVLT------------------
glb-28_nicienia/1-172 HWEKFGESLLTTATEWNGPGRRHKETVKAWMVM----SSFLADRLAHASRLAHHSPMLTP
hemoglobina_beta_ludzka/1-147 NFRLLGNVLVCVLAHHFGKE-FTPPVQAAYQKVVAGVANALAH-----------------
hemoglobina_rozwielitki/1-302 MFEQFGGILEEVLAEELGSG-FTAEARQAWKNGLAALVAGIAKNLKKAEDLADPQTKLTP
mioglobina_ludzka/1-154 YLEFISECIIQVLQSKHPGD-FGADAQGAMNKALELFRKDMASNYK--------------
neuroglobina_ludzka/1-151 SFSTVGESLLYMLEKCLGPA-FTPATRAAWSQLYGAVVQAMSR-----------------
GLoBina_nicienia/1-136 ---------------------------------GLHV-----------------------
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
glb-28_nicienia/1-172 ---------------------------------RVQLLTG--------------------
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 HQIRDVQRSWENIRNDRNALVSSIFVKLFKETPRIQKFFAKFANVAVDSLAGNAEYEKQI
mioglobina_ludzka/1-154 ------------------------------------------------------------
neuroglobina_ludzka/1-151 ------------------------------------------------------------
GLoBina_nicienia/1-136 ---------------------------------------------------QGSR-----
Hemoglobina_A_bydleca/1-141 ------------------------------------------------------------
glb-28_nicienia/1-172 ------------------------------------------------------------
hemoglobina_beta_ludzka/1-147 ------------------------------------------------------------
hemoglobina_rozwielitki/1-302 ALVADRLDTMISAMDDKLQLLGNINYMRYTHTERGIPRAPWEDFSRLLLDVLGSKGVSTD
mioglobina_ludzka/1-154 ------------------------------------------------------------
neuroglobina_ludzka/1-151 ------------------------------------------------------------
GLoBina_nicienia/1-136 -------------ETKEDDEE
Hemoglobina_A_bydleca/1-141 -----------------SKYR
glb-28_nicienia/1-172 -------------RSAFEFNN
hemoglobina_beta_ludzka/1-147 ------------------KYH
hemoglobina_rozwielitki/1-302 DLDSWKGVLAVFVNGVSPIKK
mioglobina_ludzka/1-154 ---------------ELGFQG
neuroglobina_ludzka/1-151 ----------------GWDGE
Ćwiczenie 2.
Otwieram stronę www.ncbi.nlm.nih.gov
Wybieram Conserved Domains jako bazę danych dla poszukiwań dla globin
Numer dostępowy dla globin w bazie conserve domains w @NCBI: cd01040. W raporcie wykonywanym na zajęciach jako numer dostępowy globin podałem cd1067, co było błedną odpowiedzią. Zapewne przez nieuwagę po wybraniu z listy wyszukań globin do raportu skopiowałem numer dostępowy Source z ramki Links po lewej stronie.
Jest to fenyloalanina na 45 pozycji.
Porównując wyniki z ćwiczenia 1 jedynie programy cluslaw2 i muscle wyróżniły fenyloalaninę jako aminokwas konserwatywny. Program T-Coffe tego nie zrobił.
Najbardziej wiarygodnym programem okazał się program MUSCLE, gdyż wyróżnił on oba konserwatywne aminokwasy – histydynę i fenyloalaninę.
Ćwiczenie 3.
>nieznana_sekwencja IRQSWRAVSRSPLEHGTVLFARLFALEPDLLPLFQYNCRQFSSPEDCLSSPEFLDHIRKVMLVIDAAVTNVEDLSSL
Przy wykonywaniu zadania skorzystałem z programu protein blast w bazie BLAST na stronie @NCBI. Program ten pomógł mi zidentyfikować sekwencję jako członka rodziny globin.
Do programu tego skopiowałem naszą nieznaną sekwencję i rozpocząłem szukanie przez kliknięcie przycisku blast.
Następnie kliknąłem czerwoną ramkę „globin” i wybrałem kod dostępowy cd01040.
Wykonałem formatowanie wyników (wybranie hypertextu, 4 bitów i top listed selection)
Po wykonaniu powyższych czynności stwierdzam że najbardziej konserwatywnym aminokwasem jest fenyloalanina na pozycji 45. Natomiast histydyna nie została znaleziona, gdyż podana nasza „nieznana sekwencja” jest za krotka.