Technologie Informacyjne dla Chemików 15
STRATEGIE PRZESZUKIWANIA INTERNETOWYCH BAZ STRUKTUR CHEMICZNYCH
Grzegorz Fic1*, Grażyna Nowak2
1Zakład Informatyki Chemicznej, 2Katedra Chemii Fizycznej,
Politechnika Rzeszowska, al. Powstańców Warszawy 6,35-959 Rzeszów, *gfic@prz.edu.pl
W ciągu niespełna 20 lat Internet stał się największym na świecie zbiorem informacji, w tym także informacji z zakresu chemii i dziedzin pokrewnych. Jednakże, nawet najcenniejsza informacja staje się dopiero wówczas użyteczną, gdy potrafimy do niej dotrzeć i ją odzyskać. W [1] przedyskutowano wybrane metody i narzędzia odzyskiwania zasobów chemicznych dostępnych w Internecie, w [2] internetowe wyszukiwarki (ogólne, naukowe i specjalistyczne-chemiczne) informacji chemicznej, katalogi (ogólne i tematyczne) zasobów WWW z zakresu chemii i dziedzin pokrewnych oraz internetowe zasoby z zakresu chemii analitycznej, w [3] internetowe zasoby z zakresu chemii i technologii organicznej, w [4] zasoby związane z chromatografią, zaś w [5] internetowe zasoby z zakresu chemii nieorganicznej. W niniejszej pracy przedyskutowano wybrane zagadnienia związane z pozyskiwaniem informacji z internetowych baz struktur chemicznych.
Strategie wyszukiwania informacji o strukturach chemicznych
Współcześnie w internetowych serwisach chemicznych stosowane są następujące strategie przeszukiwania zbiorów (baz) struktur i związków chemicznych: wyszukiwanie tekstowe (elementami kwerendy wyszukiwawczej mogą być: nazwa, fragment nazwy, autor, producent, dystrybutor i inne);
wyszukiwanie struktur o określonym wzorze sumarycznym (kwerenda: pełny lub częściowy wzór sumaryczny);
wyszukiwanie tekstowo-liczbowo-logiczne (np. nazwa, zdefiniowane przedziały wartości różnych parametrów fizycznych, chemicznych, biologicznych oraz wartości logiczne zaistnienia określonych cech, rys. 1);
wyszukiwanie wszystkich struktur tożsamych ze zdefiniowaną w kwerendzie wyszukiwawczej (Exact);
wyszukiwanie wszystkich struktur zawierających podstrukturę zdefiniowaną w kwerendzie (Substructure);
wyszukiwanie wszystkich struktur będących podstrukturami struktury zdefiniowanej w kwerendzie (Superstructure);
wyszukiwanie struktur podobnych - wyszukiwane są wszystkie struktury spełniające zdefiniowane przez użytkownika warunki podobieństwa strukturalnego (Similarity), wyszukiwanie prekursorów, tj. struktur, z których można otrzymać zdefiniowaną strukturę (Precursors, stosowana m.in. w bazie BioPath [7]),
Flex - jeden z najnowszych typów strategii, stosowany m.in. w wyszukiwarce bazy NLM (National Library of Medicine) ChemIDplus [8]. Wyszukiwane są struktury posiadające identyczne szkielety jak zdefiniowana struktura, przy czym podczasbadania tożsamości rozpatrywane są stereochemiczne i tautomeryczne właściwości