Bioinformatyka
Wykład I
Marcin Gołębiewski Ph.D.
Zakład Biotechnologii
Wydział Biologii i Nauk o Ziemi
Uniwersytet Mikołaja Kopernika
22 lutego 2010
Marcin Gołębiewski Ph.D.
Czym będziemy się zajmować?
Wstępne wymagania: znajomość matematyki na poziomie
szkoły średniej, podstawowe wiadomości z biologii
molekularnej.
Cel przedmiotu: nauczenie świadomego posługiwania się
narzędziami bioinformatycznymi i krytycznej interpretacji
wyników.
Marcin Gołębiewski Ph.D.
Czym będziemy się zajmować? I
Treści przedmiotu:
Przedmiot bioinformatyki; podstawy obsługi systemów
unixowych
Biologiczne bazy danych, korzystanie z zawartych w nich
informacji - system Entrez
Przeszukiwanie sekwencyjnych baz danych - BLAST; ocena
istotności uzyskanych wyników.
Przeszukiwanie sekwencyjnych baz danych - przeszukiwanie
profilami: PSI-BLAST
Konstrukcja alignmentów wielu sekwencji - ClustalW i
ClustalX
Analiza filogenetyczna: metody odległościowe,
oszczędnościowe i maksymalnego prawdopodobieństwa -
pakiet PHYLIP
Marcin Gołębiewski Ph.D.
Czym będziemy się zajmować? II
Analiza filogenetyczna: przygotowanie danych wejściowych,
dobór metody, ocena wyników
Przewidywanie struktur białek: przewidywanie struktury
II-rzędowej, III-rzędowej, modyfikacji posttranslacyjnych,
wykrywanie funkcjonalnych motywów, identyfikacja
zakonserwowanych domen - narzędzia ze strony Expasy
Sekwencjonowanie i składanie sekwencji: metody
sekwencjonowania, obróbka odczytów - pakiet
phred/phrap/consed
Sekwencjonowanie i składanie sekwencji: składanie, końcowa
obróbka sekwencji (finishing)
Analiza sekwencji genomowych: przewidywanie genów i
sekwencji regulacyjnych - Glimmer i GlimmerHMM
Analiza sekwencji genomowych: anotacja (opis) sekwencji,
zgłaszanie sekwencji do baz danych - program Sequin
Marcin Gołębiewski Ph.D.
Czym będziemy się zajmować? III
Projektowanie primerów i sond do hybrydyzacji
Materiały dla studentów: A. D. Baxevanis i B. F. F. Ouellette
(red.) “Bioinformatyka. Podręcznik do analizy genów i białek”.
Marcin Gołębiewski Ph.D.
Zasady zaliczenia
Ćwiczenia: przekrojowe zadanie praktyczne.
Wykład: egzamin pisemny.
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Przedmiot bioinformatyki
Bioinformatyka jest dyscypliną pomocniczą biologii
Gałęzią biologii teoretycznej
Zajmuje się wykorzystaniem komputerów do wspomagania
prowadzenia badań w wielu dziedzinach biologii, m. in. w:
taksonomii
biologii molekularnej
biochemii
biofizyce
Wspomaganie to polega na gromadzeniu, udostępnianiu i
przetwarzaniu danych różnego typu
Przetwarzanie zgromadzonych danych może prowadzić do
nowych odkryć, należy jednak pamiętać że:
bioinformatyka umożliwia predykcje, które muszą być zawsze
zweryfikowane doświadczalnie!
Marcin Gołębiewski Ph.D.
Czym zajmuje się bioinformatyka - przykłady
Przewidywanie funkcji białek (na podstawie struktury,
podobieństwa, zakonserwowanych elementów etc.)
Składanie odczytów z sekwencjonowania w całą sekwencję
genomową
Projektowanie sond do hybrydyzacji i primerów do PCR
Symulacje reakcji enzymatycznych
Symulacje procesów biologicznych np. zwijania się białek,
oddziaływania cząsteczek biologicznych
Przeszukiwaniem baz publikacji
Marcin Gołębiewski Ph.D.
Oprogramowanie
Proste zadania, takie jak projektowanie primerów, czy
konstrukcja dopasowań sekwencji (alignmentów) można
wykonać na dowolnym komputerze, istnieją programy
działające pod systemem Windows.
Większość obliczeń, jakie się przeprowadza jest jednak dużo
bardziej czasochłonna - wymaga większych mocy
obliczeniowych i automatyzacji.
Z powyższych względów w bioinformatyce powszechnie stosuje
się systemy z rodziny Unix - np. linuxy.
Marcin Gołębiewski Ph.D.
Rodziny systemów GNU Linux
Systemy linuxowe dzielą się na kilka rodzajów, w zależności od
sposobu “pakietowania” oprogramowania.
Systemy “redhatopodobne”: pakiety rpm, np. Fedora, RedHat
Enterprise Linux, Suse, CentOS, PLD.
Systemy “debianopodobne”: pakiety deb, np. Debian, Ubuntu,
Xubuntu, Kubuntu etc.
Systemy “kompilowane”: wszystkie programy kompilowane ze
źródeł, np. Gentoo, Linux from scratch.
Slackware - dystrybucja oparta o pakiety tgz.
Marcin Gołębiewski Ph.D.
Obsługa linuksa w trybie graficznym
Praca z systemem linuksowym w trybie graficznym nie różni
się zasadniczo od pracy w Windows.
Nie da się pracować bez zalogowania - podania nazwy
użytkownika (loginu) i hasła.
Popularne skróty klawiaturowe działają tak samo (Ctrl-C -
kopiuj, Ctrl-V - wklej, Ctrl-Z - cofnij itp.)
Wygląd może się dosyć mocno różnić w zależności od
używanych programów i ustawień - trzeba się na początku
przyjrzeć ikonom i menu.
Programy “windowsowe” nie działają z zasady w innych
systemach, dlatego pod linuksem używa się
“niemikrosoftowych” odpowiedników
Marcin Gołębiewski Ph.D.
Oprogramowanie pod linuksem I
Programy potrzebne do “zwykłej” pracy z komputerem (biuro
+ internet + multimedia) dostępne są za darmo dla każdego.
W większości systemów instalowane są automatycznie, nie
trzeba się martwić zakupem licencji i instalowaniem osobnych
programów
Niektóre wysoce specjalistyczne programy występują wyłącznie
w wersji dla Windows (CorelDraw, Adobe Illustrator,
AutoCAD), ale większość ma “wolne”, darmowe odpowiedniki.
Dużo oprogramowania bioinformatycznego nie ma wersji
“windowsowych”.
Marcin Gołębiewski Ph.D.
Podstawowe programy
Pakiet biurowy - OpenOffice.org (www.openoffice.org)
Przeglądarka internetowa - Firefox, Chrome, Opera
Odtwarzacz muzyczny - Audatious, Rhythmbox, Amarok
Odtwarzacz filmów - Totem, Mplayer, Xine
Obróbka grafiki rastrowej - GIMP
Obróbka grafiki wektorowej - Inkscape
Telefonia internetowa - Skype, Telepathy
Komunikator - Pidgin, Kadu
Marcin Gołębiewski Ph.D.