bioinformatyka, Bioinf4, EMBOSS @ TERMINAL


EMBOSS @ TERMINAL

Dokumentacja wszystkich programów z pakietu EMBOSS znajduje się np. na stronie

http://emboss.sourceforge.net/apps/cvs

Zanim użyjesz jakiegokolwiek programu przeczytaj do czego służy i jak działa.

  1. Ściągnijdo nowego podkatalogu sekwencje uniprot:ypt7_yeast i uniprot:lysc_chick. Użyj do tego programów seqret oraz entrez. Jaka jest różnica między nimi?

Każdy program jeśli zostanie uruchomiony z opcją -help (np. seqret -help) pokaże podstawowe informacje o sobie. Bardziej wyczerpujące informacje uzyskasz jeśli zastosujesz opcje -help - verbose (np.; seqret -help - verbose)

  1. Podaj funkcje tych białek i znajdź numer EC, jeśli istnieje.

  2. Ściągnij sekwencj nukleotydowe kodujące te białka. Obejrzyj je i znajdź miejsca inicjacji i terminacji transkrypsji (pole CDS)

  3. Utwórz własną sekwencje nukleotydową (nie krótszą niż 100 nukleotydów) za pomocą dowolnego edytora (np. nano lub gedit). Zapisz swoją sekwencje w formacie FASTA (seqret). Przetłumacz swoją sekwencje na białko (transeq). Jak długie białko udało Ci się otrzymać?

  4. Ściągnij do swojego katalogu sekwencje nukleotydową o identyfikatorze m21050. W której ramce odczytu ta sekwencja daje najdłuższy produkt w postaci białka? (showorf).

  5. Przetłumacz sekwencje białka uniprot:ypt7_yeast na sekwencje nukleotydową? (backtranseq)

  6. Czy białko opsd_xenla posiada regiony transmembranowe (tmap, jako „graph type” wpisz „png”). Obejrzyj powstały plik wybranym programem (np. Applications Accessories File Browser). Ile regionów zostało przewidzianych?

  7. Znajdź program do przewidywania struktury drugorzędowej białka (np. poprzez dokumentacje w sieci lub specjalnym programem : wossname). Spróbuj przewidzieć strukturę II rzędową białka atf4_human. Policz ile jest helis o długości co najmniej 15 aa.

  8. Znajdź potencjalne miejsca wiązania przeciwciał do białka atf4_human (antigenic). Przeczytaj co tak naprawdę robi metoda Kolaskar & Tongaonkar.

  9. Zrób mapę restrykcyjną sekwencji j01749. Potraktuj sekwencje jako koliste DNA. Ile jest miejsc cięcia przez enzym BanI (-help - verbose pomogą znaleźć odpowiednią opcję)

  10. Czy białko o identyfikatorze p17547 posiada motywy sekwencji związane z funkcją? Znajdź opcję programu umożliwiającą wyświetlanie opisu znalezionych motywów.

  11. Ile białek ludzkich (uniprot:*_human) zawiera dokładnie dwa motywy „SPKK”? Ściągnij jedno ze znalezionych białek i zobacz, jakie inne funkcjonalne motywy są w nim obecne. Uwaga! Przeszukanie wszystkich białek w bazie UNIPROT może zająć nawet kilka minut.

  12. Skonstruuj następujący wzór : glicyna, cysteina, od 1 do 3 dowolnych aminokwasów, cysteina, prolina, od 8 do 10 dowolnych aa, 2 cysteiny, 2 dowolne aa, jeden z nasjępujących : prolina, kwas asparaginowy, kwas glutaminowy, asparagina. (jednoliterowe nazwy aa znajdziesz np. w polskiej wiki www.pl.wikipedia.org ) . Ile białek posiada w/w motyw sekwencji? Jaka rolę funkcjonalną on pełni? Jeśli przeszukiwanie trwa bardzo długo przenieś je w tło i obejrzyj wynik na następnych ćwiczeniach.

Bioinformatyka 2006/07 3.2007



Wyszukiwarka