Wstęp
Wraz ze wzrostem poziomu złożoności organizmu, coraz dłuższe geny odznaczają się większą ilością DNA niekodującego białek. Oszacowano, że dla niższych organizmów eukariotycznych, takich jak Dictyostelium i Plasmodium średnio jeden intron przypada na 1000 par zasad (Palmer i Logsdon, 1991). Ilość ta wzrasta do 3-4 w przypadku roślin i grzybów a maksimum, około 6 osiąga u zwierząt. Badania sekwencji intronowych wskazują, że nie są one tylko śmieciami i zbędnym balastem, którego organizmy w trakcie ewolucji nie chciały się pozbyć, ale pełnią niejednokrotnie istotne funkcje regulujące ekspresję genów.
W genach owadzich pochodzenia jądrowego jak dotąd znaleziono introny tak zwane spliceosomalne, które wycinane są z pierwotnych transkryptów za pomocą wielocząsteczkowych kompleksów rybonukleoproteinowych złożonych z małych jądrowych rybonukleoprotein (snRNP, ang., smali nuclear rybonucleotideprotein). Wszystkie introny spliceosomalne zawierają charakterystyczne sekwencje na końcach 5' i 3' oraz miejsce rozgałęzienia, umożliwiające ich precyzyjne wycinanie z prekursorowych cząsteczek mRNA (pre-mRNA). Od rodzaju tych sekwencji zależy, przez jaki spliceosom intron będzie wycinany. Introny spliceosomalne tworzą dwie grupy, U2- i U12-zależnych (Sharp i Burge, 1997). Analizując pierwotnie sekwencje ludzkich genów stwierdzono, że około 99,9% intronów jest wycinanych przez U2-zależny splicosom, pozostałe 0,1% należy do klasy U12-zależnej, która ze względu na rzadkość występowania jest słabiej poznana (Jackson, 1991). Późniejsze analizy i komputerowe poszukiwania intronów typu U12 wykazały, że w ekspresjonowanych sekwencjach genomu człowieka występuje ich około 404 (Levine i Durbin, 2001). Ogólnie stwierdzono, że u kręgowców intronów klasy U12 w porównaniu z U2 jest od 0,15 do 0,34%, a u innych eukariontów jest jeszcze mniej (Burge i wsp., 1998a; Levine i Durbin, 2001).
Ta niewielka grupa intronów była pierwotnie identyfikowana dzięki nietypowym sekwencjom sygnałowym w miejscu tworzenia rozgałęzienia oraz odmiennym dinukleotydom AU na końcu 5' i AC na końcu 5' (Jackson, 1991; Hall i Padgett, 1994). Klasyczne introny U2-zależne posiadają sekwencję 5'GU-AG3' na odpowiednich końcach. Późniejsze badania pokazały, że terminalne sekwencje 5'AU-AC3' nie są ściśle wymagane, aby introny były U12-zależne, ponieważ znaleziono w bazach danych wiele intronów U12 z końcowymi dinukleotydami 5'GU-AG3' i nie tylko (Sharp i Burge, 1997; Burge i wsp., 1998a; Wu i Krainer, 1999). Ponadto, zidentyfikowano niewielką liczbę U2-zależnych intronów posiadających dinukleotydowe zakończenia 5'AU-AC3', charakterystyczne dla intronów U12, co potwierdziło, że do prawidłowej klasyfikacji intronów spliceosomalnych, poza analizą końcowych nukleotydów, niezbędne jest zbadanie całych miejsc splicingowych (Dietrich i
17