bioinf, bioinf kol 1 grupaD


Bioinformatyka

Kolokwium 1, grupa D

11.05.2015

Imię: x

Nazwisko: x

Instrukcje

Wypełnij odpowiednie miejsca w niniejszym pliku odpowiedziami. Zmień nazwę pliku według schematu:

Imie_Nazwisko_bioinf_kolokwium1_grupa_D

Plik wyślij na adres mbereta@pk.edu.pl

Zadania

  1. Za jakiego organizmu pochodzi, jaki gen i jakie białko koduje następujący fragment sekwencji:

GTGTTTACCCTTAATTTATTCCTGTATATTATTCCAATCCTATTAGCAGTAGCTTTTCTA

ACTTTAATCGAACGAAAAGTTCTAGGTTATATACAATTTCGAAAAGGGCCAAACATTGTA

GGACCATATGGATTACTTCAACCATTCGCTGATGCAATTAAATTATTCACTAAAGAACCT

CTTCAACCTCTTACATCTTCCTGATCTATATTTATCTTAGCCCCAATTTTAGCACTTACC

ATTGCCCTAACAATCTGAACCCCACTACCCATACCAAATGCACTTCTAGACTTAAACCTG

GGTCTATTGTTTATTCTCTCTATATCAGGCCTATCAGTATACTCGATCCTATGATCAGGA

TGAGCATCCAATTCAAAATACGCTTTAGTAGGAGCTCTACGAGCTGTAGCCCAAACAATC

TCATATGAAGTTACACTAGCAATTATTCTATTATCCGTTATACTAATTAATGGTTCTTAC

ACCATAAAAACTCTTTCTATCACACAAGAAAACTTATGACTGATTTTTACAACATGACCT

TTAGCTATAATATGATTTATCTCAACCCTAGCAGAGACTAATCGAGCTCCCTTTGACTTA

ACAGAAGGGGAATCTGAACTAGTATCAGGATTTAACGTTGAATACGCATCAGGCCCATTT

GCCATATTCTTTCTAGCAGAATATGCTAATATCATCGCCATAAATGCCTTAACAACTATT

TTATTTTTAGGTTCATCTATAAGCCTATTAACTCCTAATATTAATACCTTAATTTTTGTG

ATCAAAACTCTTCTACTAACTATCACATTCTTATGAATCCGAGCTTCGTATCCTCGCTTT

CGATACGACCAACTTATATACCTCCTATGAAAAAATTTCTTACCTTTAACATTAGCTCTA

TGCCTATGATTTATCTCTATACCAATTTCAATGTCATGCATTGCGCCACAAATATAA

Odpowiedź:

Organizm: _______________

Gen: ____________________

Białko: __________________

  1. Z archiwum ENA pobierz rekord o numerze dostępu AF193276. Wczytaj plik do programu UGENE. Odpowiedz na pytania

    1. Ile razy w sekwencji genu pol występuje wzorzec „GGGAG”. Ewentualne wyniki wyszukiwania tego wzorca nie powinny na siebie zachodzić. 5

    2. Na jakiej pozycji zaczyna się ostatnie wystąpienie wzorca z punktu a? 3118

    3. Jaka jest długość najdłuższego powtarzającego się wzorca w genie tat? 6

    4. Ile jest takich powtórzeń wzorców? 1091

    5. Wypisz pierwszy i ostatni z tych powtarzających się wzorców: ATGGAG oraz GACCCG

    6. Wypisz kolejno wszystkie odległości w jakich pojawiają się powtórzenia znalezione w punkcie d: _______________

  1. Przeanalizuj sekwencje z pliku zad3_sekwencje.fasta.

    1. Z której sekwencji (sekwencja_2, sekwencja_3 czy sekwencja_4) pochodzi krótsza sekwencja sekwencja_1? 3

    2. Jaka zmiana/zmiany została wprowadzona w sekwencji_1 w stosunku do dłuższej oryginalnej sekwencji, wskazanej jako odpowiedź w punkcie (a) (mutacja/insercja/delecja/inna)? delecja

    3. Jakiego fragmentu/fragmentów dotyczy punkt (b)? CGAAACC

  1. Wykorzystaj dane z pliku CytBProt.txt oraz algorytm dopasowania pary sekwencji Smitha-Watermana ze strony http://www.ebi.ac.uk/Tools/psa/ (macierz BLOSUM62, kara za utworzenie przerwy 10, kara za wydłużenie przerwy 0.5) i odpowiedz na pytanie: z sekwencji kodującej białko jakiego organizmu z największym prawdopodobieństwem pochodzi poniższy fragment sekwencji aminokwasów:

HIGRGLYYTSYLHESTWNIGVILMATAFGGYVLPWGQMSFWGAAVITNLLSATPYVGSTVVPWIWGGPSVDNATLALHFLLPFALLAS

    1. Psa

    2. Rekina

    3. Aligatora

    4. Żaby

Odpowiedź: c. Aligatora

Dla najlepszego dopasowania, jaka jest:

  1. Jakość dopasowania: 441.0

  2. Długość lokalnego dopasowania: 96

  3. Liczba wstawionych przerw: 8

  4. Wartość procentowego podobieństwa: 89.6%

  1. Sekwencja z pliku zad5_sekwencja.fasta zawiera nieznany gen. Wiadomo, że jest on podobny do genu pewnego organizmu, którego kompletny mitochondrialny genom znajduje się w bazie.

    1. Znajdź w bazie ENA rekord, o którym mowa powyżej. Jaki jest jego numer dostępu? _____

    2. Do jakiego genu ze znalezionego rekordu najbardziej jest podobny nieznany gen? CAB4

    3. Jaka jest długość genu znalezionego w punkcie b? 525 bp

    4. Wykonaj dopasowanie nieznanego genu oraz genu znalezionego w punkcie b. Użyj wersji globalnej algorytmu dopasowania pary sekwencji przy karze za rozpoczęcie przerwy 5 oraz karze za wydłużenie przerwy 0.5. Nie uwzględniaj kar za przerwy na początku oraz końcu dopasowania. Jakie są:

      1. Jakość otrzymanego dopasowania 2390.5

      2. Liczba wstawionych przerw 34

      3. Długość dopasowania 528

      4. Wartość procentowego podobieństwa 92,8%

    5. Wykonaj dopasowanie poniższej sekwencji oraz translacji genu znalezionego w punkcie b. Użyj wersji lokalnej algorytmu dopasowania pary sekwencji przy karze za rozpoczęcie przerwy 5 oraz karze za wydłużenie przerwy 1.0. Użyj macierzy punktacji BLOSUM90.

MMQLMLYASTLITSFIFIQMNHPLAMGLMLLIQTIQICMLTGLMAKSFWFSYILFLIFLGGMKLTTILVLFIYVTSLASNEMFSLSMSLFIFSMILIINLMTILILLDKSSISFFIQNNEMQSIYNLNMFLQENSLNLQKLYNYPTNLMNYLLITLIAVVKITKLFYGPLRPMN

Jakie są:

      1. Jakość otrzymanego dopasowania 953.0

      2. Liczba wstawionych przerw 20

      3. Długość dopasowania 184

      4. Wartość procentowego podobieństwa 89,1%



Wyszukiwarka

Podobne podstrony:
bioinf, bioinf kol 1 grupaD (1)
Bioinformatyka6
bioinformatyczneBD lab1
Bioinformatyka4
sss teoria, Biotech, BIOTECHNOLOGIA, Semestr V, Spec. Bioinf, SSS, Egzamin
bioinformatyka w13 2008 9 web
bioinformatyka w2 2008 web
cw1 Zadania, Biotech, BIOTECHNOLOGIA, Semestr V, Spec. Bioinf, SSS, LAB, Lab 2
bioinformatyka w9 2008 web
elementy bioinformatyki wyklad2
Kol II GrupaD 12
bioinformatyka Bioinf8
bioinformatyka w6 2008 web
bioinformatyka, Bioinf11, 1
Bioinformatyka wykład 1
16 bioinformatryka
bioinfo-pyt odp-1, BIOINFORMATYKA
Bioinformatyka wykład 3
bioinformatyka w11 2008 web

więcej podobnych podstron