słów. Wartości parametru p oraz szerokości okienka zostały wyznaczone eksperymentalnie, przyczyniając się do stosunkowo wysokiej jakości disambiguacji.
Tabela 2: Wyniki disambiguacji pojęć metodą analizy globalnej i metodą analizy lokalnej. Źródło: obliczenia własne
Liczba doku men tów |
Liczba pojęć wielo- znacz- nych |
Metoda globalna |
Metoda lokalna |
Wielkość artykułu (liczba słów) | ||
Liczba poprawnych rozpoznań polisemii |
Skutecz ność metody w % |
Liczba poprawnych rozpoznań polisemii |
Skutecz ność metody w % | |||
45 |
324 |
256 |
79,01 |
267 |
82,41 |
331 |
40 |
703 |
538 |
76,53 |
581 |
82,65 |
558 |
26 |
1289 |
968 |
75,02 |
1074 |
83,24 |
1136 |
razem |
2316 |
1761 |
76,04 |
1921 |
82,94 |
671 |
Uzyskane wyniki (umieszczone w tabeli 1) obu zaproponowanych metod są obiecujące i są porównywalne do innych metod disambiguacji pojęć z wykorzystaniem sieci semantycznej [KhMH2004], [Navi2004], czy klasteringu kontekstu pojęć [PuPe2004], Warte podkreślenia jest, że zastosowano je z powodzeniem dla bogatego w fleksję języka jakim jest język polski. Zaprezentowana tu metoda globalna, badająca znaczenie pojęcia na podstawie kontekstu całego dokumentu z wykorzystaniem sieci semantycznej ma skuteczność disambiguacji około 76%, z tym, że skuteczność ta maleje wraz ze wzrostem rozmiaru dokumentów. Metoda lokalna okienka tekstowego korzystająca z sieci semantycznej daje najlepsze rezultaty. Skuteczność disambiguacji pojęć tą metodą która oscyluje wokół 83%, jest wyjątkowo wysoka i stabilna przy wzroście wielkości dokumentu tekstowego.