nieprawdziwych wniosków. Także w jaki sposób jest identyfikowana sekwencja genu eukariotycznego? Są różne możliwe sposoby, powiemy o kilku z nich:
1-kryterium jest wykorzystywanie kodonów, przypomnę ze kodony, nie wszystkie potencjalne kodony dla Danego aminokwasy są w każdym organizmie równie często i chętnie wykorzystywane ,np. dla Leu mamy kodony następujące : TTA, TTG, CTG, CCC, CTC ,CTA ale dla człowieka kodon który najszczesciej jest wykorzystywany jest CTG a bardzo rzadko wykorzystywane są takie jak TTA CTA, z kolei dla Val która ma 4 kodony najczęściej wykorzystywane są CTG, 4-krotnie częście niż CTA. Dlaczego tak jest? Niewiadomo. A jaka jest rola biologiczna, czemu ewolucja tak pobiegła? Niewiadomo. Natomiast ta informacja ta pozwala na identyfikowanie prawdziwych, realnych sekwencji eksonu, bo ona będą zwierały trójki które są charakterystyczne dla danego organizmu. Gdybyśmy wzięli jakąś sekwencje dowolną z genomu człowieka przetłumaczyli na język kodonów i zauważylibyśmy że w tym tłumaczenia tkwi cały szereg nietypowych kodonów to moglibyśmy stwierdzić że '“łumaczenie jest błędne. W sekwencjach intronowychz któ®ej takie trójki oczywiście nic nie znaczą ,ale mogą istnieć.
Następna informacją który można brać pod uwagę przy identyfikacje genu eukariotycznego są sekwencje rozgraniczające, graniczne pomiędzy intronami i eksonami, na biologii molekularnej była mowa że na granicy pomiędzy intronem na 5' końcu i 3' można wyróżnić charakterystyczne sekwencje, które na schemacie są napisane jako sekwencja konsensusowe, czyi uzgodnione uwspólnine. Oczywiście w Realu te sekwencje się różna ,nie są takie konsensusowe ale ją podobne a wiedza na temat tej sekwencji umożliwia czasami na wyekstrahowanie informacji o granicy sekwencji intronowej i eksonowej,zarówno na 5' i 3' końcu, w niektórych intronach mamy charakterystyczne elementy wewnątrz,które pozwalają na rozróżnienie sekwencji intronowej.
Następnym element który może umożliwić identyfikacje sekwencji genu ,są sekwencje regulatorowe. Poznano jest podczas badania funkcji poszczególnych genu, a ta informacje pozwala nam poszukiwać sekwencje regulatorowe w poznanej sekwencji genomu. Oczywiście również te mają wersje realną i wersje konsensusową, które przy pomocy technik bioinformatycznych można wyróżnić w ten sposób znaleźć sekwencje która jest sekwencją promotorową i wiem gdzie go szukać.
Dodatkową strategią może być występowanie wysp CTG , u wielu genomów kręgowców charakterystycznym elementen są wyspy CTG czyli powtarzające jest ciągi reszt C i G ,takie ciągi