Dariusz Ceglarek Wprowadzenie
Zjawisko polisemii (wieloznaczności pojęciowej) dotyczy każdego języka naturalnego i oznacza, że jednemu słowu (lub związkowi frazeologicznemu) odpowiada wiele znaczeń, czyli że różne pojęcia nazywane są tak samo.
Disambiguacja pojęciowa (ujednoznacznianie pojęć), czyli wybór właściwego znaczenia dla pojęcia, które posiada wiele znaczeń i pojawiło się w dłuższej sentencji, nie sprawia człowiekowi większej trudności w jego codziennym życiu. Może poza występującymi w codziennym życiu żartami, które zazwyczaj opierają się na parainformacji powstającej z wieloznaczności pojęć: „Możesz na mnie liczyć, powiedział informatykowi jego komputer". Natomiast podczas przetwarzania tekstu przez program operujący na tekście, wieloznaczność stanowi znaczący problem.
Każdemu pojęciu odpowiada w języku naturalnym zapis w postaci wyrazu, kolokacji1 lub związku frazeologicznego (np. „puścić farbę”, „jabłko Adama”) będących jego odzwierciedleniem. Zapis pojęcia w języku naturalnym będziemy dalej nazywać konceptem. Celem disambiguacji jest stworzenie przetwarzałnej przez systemy informacyjne reprezentacji dokumentu, tak aby w analizowanym dokumencie - na podstawie pochodzącej z niego treści - wyodrębnić jednostki odpowiadające znaczeniu informacyjnemu konceptów z tekstu.
Kolokacja to związek semantyczny, którego znaczenie wynika z połączenia znaczeń kilku słów wchodzących w jego skład (np. ..wirus komputerowy”).