Pobierz sekwencję spod adresu apex.ibb.waw.pl/cwicz/sekwencja.tfa. Czy w tym białku znajduje się sekwencja sygnałowa? Użyj serwerów SignalP (www.cbs.dtu.dk/services/SignalP) i PSORT (http://psort.nibb.ac.jb).
Białko o numerze P35525 jest białkiem błonowym. Znajdź helisy transmembranowe w tym białku używajac serwerów PredictProtein (http://www.embl-heidelberg.de/predictprotein/predictprotein.html) i TMHMM (www.cbs.dtu.dk)
Czy N-końcowa częśc białka znajdująca się w cytoplazmie ma homologi w bazie sekwencji białek o znanych stukturach? (Mpsearch w EBI na bazie PDB)
Znajdź sekwencję białka o numerze GI 30681809 (gene index z NCBI)
Sprawdź, czy sekwencja zawiera peptyd sygnałowy lub regiony transmembranowe.
METODY ZNAJDOWANIA SEKWENCJI KODUJĄCYCH
Do swojego katalogu skopiuj sekwencję genembl : hshbb. Plik ten zawiera rejon kodujący beta-globiny u człowieka. Dla tego fragmentu DNA sekwencje kodujące zostały znalezione eksperymentalnie. Celem ćwiczenia jest porównanie wyników eksperymentalnych z wynikami trzech metod znajdowania sekwencji kodujacych. UWAGA : przy analizie pliku najlepiej posługiwać się liniami oznaczonymi CDS. W liniach tych podane są eksony z których złożone jest dane białko (np. CDS join( 54790. .54881,55010..55232,56131. .56259) oznacza że białko zbudowane jest z trzech eksonów położonych między nukleotydami 54790-54881 ; 55010-55232 ; 56131-56259).
Użyj (świadomie, czytając opis metody która jest stosowana) co najmniej trzech z następujących serwisów do przewidywania eksonów w sekwencji hshbb :
Policz, ile eksonów zostało prawidłowo rozpoznanych. Ile sekwencji nie kodujących zostało fałszywie rozpoznanych jako eksony?
Bioinformatyka 2006/07 ćw9