4265276064

4265276064



zorganizowanych w tzw. synsety. Każdy synset zawiera słowa które są wzajemnie synonimami, a odnośniki pomiędzy synsetami reprezentują relacje hiperonimii i hiponimii tworząc w ten sposób tezaurus, w którym występuje około 27 000 słów polisemicznych. W chwili obecnej relacje występujące w WordNecie, to relacje hiperonimii, hiponimii, synonimii, metonimii, homonimii i antonimii. Obejmowanie tych relacji czyni z WordNetu pełnowartościową sieć semantyczną dla języka angielskiego. Wobec braku powszechnie dostępnej analogicznej struktury dla języka polskiego autor posłużył się zbudowaną w ramach projektu SeNeCa1 w Katedrze Informatyki Ekonomicznej Akademii Ekonomicznej w Poznaniu strukturą, którą można określić jako sieć semantyczna dla języka polskiego. Zawiera ona 96 000 słów i kolokacji i zawiera 830 000 odmian słów, w tym 11 700 pojęć jest wieloznaczne. Pojęcia w sieci połączone są ze sobą, relacjami hiperonimii i hiponimii, synonimii, meronimii, homonimii oraz konotacjami.

Eksperyment

W eksperymencie postawiono zadanie wyznaczenia - na podstawie posiadanej sieci semantycznej - właściwego znaczenia pojęć (konceptów) w zbiorze dokumentów poprzez analizę bliskości pojęciowej pomiędzy konceptem wieloznacznym a konceptami, które wystąpiły razem z nim w dokumencie. W ramach eksperymentu sprawdzono dwie nowe metody disambiguacji pojęć.

W pierwszej metodzie wyznacza się znaczenie każdego konceptu wieloznacznego wykorzystując powiązania semantyczne (w sieci semantycznej) pomiędzy nim a wszystkimi konceptami, które pojawiły się w badanym dokumencie. Wpływ na wybór właściwego znaczenia

1

Zadaniem projektu SeNeCa (Semantic NetWork and Categorization, http://seneca.kie.ae.poznan.pl) jest automatyzacja rozbudowy sieci semantycznej dla języka polskiego.



Wyszukiwarka

Podobne podstrony:
W spektroskopii atomowej stosuje się specjalne lampy zawierające atomy, które są pobudzane do emisji
DSC08815 [ www potrzebujegotowki pl ] sób pionowy praed$iębiorstv, które są wzajemnie zainteresowane
ar4 doświadczenia w kwestiach życia praktycznego, które są podstawa i przedmiotem odnośnych wywodów.
ar4 doświadczenia w kwestiach życia praktycznego, które są podstuwn i przedmiotem odnośnych wywodów.
słowa kwantyfikujące: .każdy”, „niektóre”,,żadne” Słowa kwantyfiknjące decydują o tzw.
im III U3 Intormi(>finf *Zasady oceny testu Każdy test zawiera 24 zadania, za które można ot
) ECDLZasady oceny testu Każdy test zawiera 32 zadania, za które można uzyskać łącznie 32 punkty.
Slajd25 Ciekłe i stałe woski Grupa surowców kosmetycznych określanych jako stałe woski zawiera subst
istrukcja A do ćwiczeń głoska na Początku i na Końcu cz 3 Wyodrębnianie głosek zaczynających i końc
istrukcja B do ćwiczeń głoska na Początku i na Końcu cz 3 Szukanie słowa, które nie kończy się taką
skanowanie0030 3 A ii A W V A hO vV i i Al 3. Wyrazy o różnym znaczeniu i tym samym brzmieniu. - Mam
Krew jako materiał analityczny Materiałem analitycznym może być tzw. krew „pełna” czyli zawierająca

więcej podobnych podstron