Za pomocą metod statystycznych możliwe jest też wyznaczenie pojedynczych genów, które znacząco zmieniają swoją ekspresję dla różnych stanów organizmów. W ten sposób otrzymujemy informacje o genach, które mogą być związane z badanym zjawiskiem.
Głębsza analiza pozwala na wyznaczenie powiązań pomiędzy określonymi wzorcami ekspresji oraz odpowiadającymi im cechami. Wzorce nie tylko mogą być wykorzystywane do klasyfikacji. Stanowią one również podstawę do wyznaczania zależności między genowych bardziej złożonych niż koekspresja. Metody analizy wykorzystują między innymi ideę wzorców wyłaniających [31] oraz znane klasyfikatory, w tym oparte o teorię zbiorów przybliżonych [21].
W pracy zajmuję się analizą danych pochodzącą z ostatniej z prezentowanych tu klas zagadnień. Skupiam się na identyfikacji istotnych genów oraz grup genów, które są silnie związane z danym zjawiskiem.
Praca ma podstawowe zadanie wprowadzenia czytelnika w tematykę badania ekspresji genów. Porusza elementarne zagadnienia dotyczące prowadzenia eksperymentów i analizy ich rezultatów. Pokazuje obecne zaawansowanie dziedziny oraz cele, jakie w jej zakresie stawia przed sobą bioinformatyka.
Rozpatrywana jest klasa eksperymentów, które wykorzystują do badania ekspresji genów technologię mikromacierzy. W szczególności skupiam się na doświadczeniach dających punkt wyjścia do uczenia pod nadzorem.
W pracy zaprezentowana została ścieżka analizy danych związanych z ekspresją, której celem jest określenie grup genów zależnych odpowiedzialnych za regulację określonych procesów. Obejmuje ona kolejno: wstępny wybór genów znaczących za pomocą metod statystycznych, dyskretyzację wartości ciągłych oraz wyznaczanie relacji pomiędzy grupami genów i określoną w eksperymencie klasą decyzyjną. Do badania grup genów wykorzystane zostały niezależnie podejścia związane z teorią zbiorów przybliżonych i pojęciem wzorców wyłaniających.
Ponadto dane na temat ekspresji zostały wykorzystane jako tło do porównania postaci i własności zbioru reduktów względnych otrzymanych dla pewnej tablicy decyzyjnej z przestrzenią wzorców wyskakujących wyznaczonych dla rodziny baz danych odpowiadających tej tablicy. W szczególności na podstawie obu pojęć zaproponowano miary istotności pojedynczych genów, które zostały następnie porównane z oszacowaniami statystycznymi.
Rozdział 2 daje ogólne rozeznanie w biologicznych podstawach analizy ekspresji genów. Dużo miejsca poświęcone jest technologii mikromacierzy oraz sposobowi prowadzenia i dokumentowania doświadczeń.
Rozdział 3 precyzuje formalny opis danych otrzymywanych w wyniku eksperymentów. Stanowi on punkt wyjścia do kolejnych etapów analizy danych. W rozdziale tym wprowadzony jest również główny przykład, który będzie śledzony w całej pracy.
9