Drugi typ stanowi biblioteka cDNA. Jest ona populacją specyficznych, jednoniciowych cząsteczek kwasu DNA, określanych mianem cDNA. Cząsteczki te uzyskuje się poprzez odwrotną transkrypcję kwasu DNA na matrycowym RN A wytwarzanym w komórkach danego organizmu. Łańcuchy RNA można prosto wyizolować ze środowiska komórki poprzez wykorzystanie ich własności magnetycznych. Istotną cechą stosowanego podejścia jest nieobecność w uzyskanym produkcie tych sekwencji łańcucha, które zostały wycięte na etapie składania. W ten sposób cDNA zawiera wyłącznie materiał efektywny z punktu widzenia syntezy białek. Zauważmy dodatkowo, że badając określone narządy lub tkanki rozpatrywanego organizmu uzyskujemy bardziej wyrazisty obraz tej części genomu, który ulega w nich najsilniejszej ekspresji. W ten sposób dla wybranej grupy komórek otrzymujemy większe stężenie kopii zestawu genów, które są związane z jej funkcjonowaniem w aktualnym stanie. Fakt ten dostarcza wiedzy na temat powiązania określonych genów z rolą pełnioną przez komórkę, ale jednocześnie utrudnia stworzenie reprezentatywnej biblioteki.
Dla organizmów prokariotycznych na ogół buduje się biblioteki genomowe. Uzasadnione to jest zarówno stosunkowo małym rozmiarem całości materiału genetycznego, jak i dużą niestabilnością matrycowego RNA, która utrudnia otrzymywanie cDNA. W przypadku organizmów eukariotycznych dużo bardziej użyteczne jest sporządzanie bibliotek cDNA, gdyż zawierają one wyłącznie sekwencje transkrybowane, a więc opisują profil syntetyzowanych w komórce białek. Z tego względu biblioteki te są powszechnie wykorzystywane w badaniach nad ekspresją genów.
Pomiar wielkości ekspresji jest podstawowym źródłem informacji na temat znaczenia oraz funkcji genów. Informacja na temat wysokości poziomów ekspresji może być wykorzystywana wielorako. Po pierwsze stanowi podstawę do opisu zachowania komórki wobec danych warunków środowiskowych lub zastosowanego leczenia, co pozwala na konstrukcję skutecznych klasyfikatorów. Z drugiej strony pomiar jest dobrym punktem wyjścia do bezpośredniego odkrywania wiedzy na temat funkcjonalności poszczególnych genów.
Obok rozszerzenia zakresu informacji dotyczących działania organizmów żywych, badania mają znakomity zakres zastosowań praktycznych. Są one szczególnie cenne dla medycyny pozwalając na identyfikację przyczyn chorób (również o podłożu genetycznym), a także na dokładne testowanie wpływu proponowanych lekarstw na organizmy chore. W przemyśle często wykorzystywane są do wykrywania toksyn na podstawie reakcji mikroorganizmów na dane środowisko.
Poprawny pomiar ekspresji powinien jednocześnie dawać odpowiedź na temat istotnego dla danej sytuacji zakresu genomu. Wczesne metody, między innymi szeregowa analiza ekspresji genów (Serial Analysis of Gene Expresion, SEGA), mogły śledzić wyłącznie zachowanie pojedynczych genów. Okazują się one nieprzydatne w badaniu złożonych zależności międzygenowych. Wymóg jednoczesnego pomiaru dla dużej liczby genów spełniła dopiero technologia oparta o analizę mikromacierzy (GEMA - Gene Expression Microarray Analysis). W pracy badanie ekspresji genów jest utożsamiane z GEMA, gdyż jest to obecnie jedyne efektywnie stosowane podejście. Mikromacierze znajdują również zastosowanie w identyfikacji sekwencji genetycznych, np. wyodrębnianiu genów.
Technologia mikromacierzy pozwala monitorować transkrypcję genów w danej sytuacji i badać jak aktywność określonych genów objawia się w fenotypie. Dla pojedynczego pomiaru wynikiem jest wektor wartości, które odpowiadają genom organizmu. W zależności od celu
15