background image

Oblicza bioinformatyki: genomika regulatorowa 

Bartek Wilczynski (UW)-bioinformatyk 
Model biologiczny = developmental clock work (removing genes, one at a time, to see how the clock 
works). Przyklad: cykl zycia muszki owocowej. Nie widac roznic, roznice w zakodowaniu DNA  mutacja 
genow w eksperymentach. Muszki owocowe sa bardzo „mechaniczne”. 
Geny HOX = chromosomy lab, Dfd, Antp, Abd-B. 
Te geny sa zachowane rowniez w ssakach i w czlowieku. Te geny maja silny wplyw na wyglad i 
funkcjonalnosc danego organizmu. W ssakach te geny powtarzaja sie, sa duplikowane.  
 
Jak inicjuje sie transkrypcje genow? Kodowanie bialka, transkrypcja tlumaczona na sekwencje 
aminokwasow. Inicjacja transkrypcji zaangazowana w to, ze komorki roznia sie od siebie  dzieki 
czynnikom transkrypcyjnym (CRM, enhancer)=sekwencje regulatorowe; promotor=”most”. 
Za pomoca metodbiochemicznych mozemy znalezc dokladne miejsce gdzie nastapi wiazanie miedzy 
czynnikiem transkrypcyjnym i genomem. 
 
ChIP-on-Chip 
Genomic DNA  cross-link and shear  ip matrix, antibodyczyszczenie 
Chip sequecing 
 
Problem znajdowania czynnikow wiazan transkrypcyjnych. Bierzemy pod uwage te, ktory czynnik znajduje 
sie najblizej bialek. Pozycja opisywana za pomoca specyficznych macierzy pozycyjnych.  
Np. 
A  

12 

C  

12 

 

.......itd 

 
Poboczne nukleotydy maja mniejszy wplyw na dane wiazanie. 
Zwykle w macierzy normalizuje sie wszystkie kolumny do 1. 
Moga istniec rozne macierze. Jak wiedziec ktora jest dobra dla danego wiazania? 
 
Claude Shannon – „ojciec” teorii kodow 

∑i ∑ j p

ij

log

2

(p

ij

 / b

j

 )  

information content of the motif = prawdopodobienstwo wystapienia 

danego nukleotydu w danym miejscu (p

ij

) i w jakimkolwiek miejscu (b

j

Logarytm ilorazu p/b to iloraz szans. 
 
Najlepsza  macierz – ta, ktora ma najwiecej informacji w kodzie.  
 
Consensus method: 
- Greedy algorithm 
- dependant on sequence ordering 
- take only a few “most” informants algorithms 
 
Gibbs sampling = probnik Gibbs’a 
 
REGULACJA bardziej skomplikowana. 
Czynnik transkrypcyjny, Geny “eve&skip” 
 
 
 

background image

Different models of enhancer action
- enhanceosome 
- information display (billboard) 
 
conservation of enhancer elements (schemat) 
 
Te dwa modele maja wplyw na konsekwenkcje ewolucji, podlegaja procesie ewolucyjnemu.  
 
Wyszukiwanie sekwencji regulatorowych (searching for enhanceosome-like sequences) przez pewien 
model. Jest to mozliwe. 
 
Searching for billboard-like enhancers: poslugiwanie sie okna w ktorym wystepuja zbiory bialek, ktore 
nakladaja sie na siebie.  Mozna interpretowac to dla wiekszej ilosci gatunkow. Non possiamo assumere un 
esatto ordine o spaziatura tra gli elementi della stessa fila.  
 
 
Podsumowanie: 
bioinformatyka =miejsce spotkan inspirujacych problemow  
informatyka pomaga odpowiedziec na duza ilosc pytan