Technologie Informacyjne dla Chemików 17
Technologie Informacyjne dla Chemików 17
(CH2)m
R1= ,
lj-CH,
Rys. 3. Po lewej - przykład struktury Markusha. Po prawej - typy zmienności struktur Markusha: 1. zmienność podstawników (podstawnik może mieć postać jednej ze zdefiniowanych podstruktur, np. R3 = metyl lub etyl), 2. zmienność homologów (pod-stawnik jest jednym z przedstawicieli danego szeregu homologów, np. R4 = alkil), 3. zmienność pozycji (zdefiniowany podstawnik może wystąpić w jednej z kilku wskazanych pozycji, tutaj R5 = amina może wystąpić przy dowolnym atomie pierścienia, chociaż, biorąc pod uwagę fakt, iż niektóre pozycje są już zajęte przez inne podstawniki, R5 może być położony w pozycji orto lub meta w stosunku do grupy OH), 4. Zmien-ność licze
bności (definiuje się dozwolone krotności występowania jakiegoś fragmentu-meru struktury, np. m =1-3).
o o |
A |
'■ u A'C'A A = any |
o \ 0=0 o 0=0 o 0=0 X |
5. 601 cAS bondl = {single, double) |
o 0=0 o o 0-0 o | ||
2- O A, $, = {C, H) |
dc od | ||
6. O $, = {C, H) A = any bondl = {single, double) |
ff ? ? H'C'H | ||
1A A = any - {H> |
A od A |
Rys. 4. Przykłady rozmytych podstruktur. W polach numerowanych przedstawiono definicje podstruktur rozmytych, po ich prawej stronie - wszystkie lub niektóre podstruktury spełniające te definicje (poz. 1: pod-struktura zdefiniowana ostro, bez rozmytości).
W podstrukturach rozmytych atrybuty określające właściwości węzłów-atomów (np. rodzaj atomu, liczba sąsiadów, liczba wolnych elektronów, położenie atomu -w pierścieniu, układzie aromatycznym, łańcuchu alifatycznym i inne) lub/oraz krawędzi-wiązań (np. typ wiązania, położenie przestrzenne) mogą przyjmować więcej niż jedną wartość - dla każdego atrybutu określa się zbiory dozwolonych lub zakazanych wartości. Każda rozmyta podstruktura reprezentuje zatem nie jedną, ale zbiór konkretnych podstruktur. Informacje o rozmytości podstruktur wprowadza się z wykorzystaniem specjalnych formularzy lub za pomocą specjalnej notacji SMATRS [10], należącej do rodziny notacji SMILES.
Oprócz wykorzystania koncepcji rozmytych podstruktur w formułowaniu kwerend wyszukiwawczych w systemach do przeszukiwania zbiorów struktur chemicznych znalazły one również inne zastosowania, m.in. w: opisach patentów chemicznych, badaniach korelacji struktura-właściwości (np. qsar Quantitative Structure-Activity Rela-tionship), opisach bibliotek kombinatorycznych (w syntezie kombinatorycznej).
Podobieństwo struktur chemicznych
Podstawą do określenia podobieństwa dwóch struktur chemicznych jest wyznaczenie dla każdej z nich tzw. Fingerprint (odcisk palca), charakteryzującego dwuwymiarową strukturę cząsteczki chemicznej. Istnieje kilka typów Fingerprints [11]. Pierwszy bazuje na koncepcji Structural Keys (klucza struktury). Jest to wektor, którego poszczególne elementy określają występowanie w cząsteczce określonej podstruktury: 1 - podstruktura obecna, 0 - brak podstruktury. Tutaj zasadniczym problemem jest zależność