W niniejszym artykule pokazana jest nowa metoda automatycznego usuwania wieloznaczności w tekście, czyli automatycznego wyznaczania właściwego znaczenia pojęć. Proponowana metoda wykorzystuje zależności semantyczne pomiędzy pojęciami zapamiętane w zbudowanej uprzednio dla języka polskiego sieci semantycznej. Działanie metody opiera się na wskazaniu najbardziej prawdopodobnego znaczenia pojęcia wieloznacznego biorąc pod uwagę kontekst użycia owego pojęcia w badanym dokumencie.
Pozbawianie pojęć wieloznaczności
Przeszkodami w usuwaniu wieloznaczności są najczęściej: brak wystarczającego kontekstu, metafory tworzące wieloznaczne askryptory pojęć - na przykład „kraj kwitnącej wiśni, zjawisko homonimii (tzw. „wieloznaczność właściwa”, której przykładem jest pojęcie „zamek”: zamek błyskawiczny, zamek królewski, zamek w drzwiach, zamek hokejowy), czy powszechnie występujące zjawisko metonimii1. Przykładami metonimii są: metonimia przyczyny (np. czytam
Słowackiego zamiast czytam utwory Słowackiego), metonimia skutku (np. pot zamiast wysiłek), metonimia miejsca (np. Biały Dom zamiast prezydent USA), metonimia narzędzia, metonimia zawartości, metonimia oznaki czy metonimia konkretu.
Celem disambiguacji jest lepsze odwzorowanie konceptów (słów, kolokacji) z dokumentów we właściwe pojęcia, a dzięki temu lepsze dopasowanie informacji wywnioskowanej z dokumentów do potrzeb informacyjnych użytkownika systemu wyszukiwania informacji.
Metonimia (zamiennia) to w literaturze środek stylistyczny mająca na celu zastąpienie nazwy jakiegoś przedmiotu lub zjawiska nazwą innego, pozostającego z nim w uchwytnej zależności. Jednak z figury tej korzysta się także często w codziennym języku.