4265276052

4265276052



ZASTOSOWANIE SIECI SEMANTYCZNEJ

DO DISAMBIGUACJI POJĘĆ W JĘZYKU POLSKIM

Dariusz Ceglarek Wprowadzenie

Zjawisko polisemii (wieloznaczności pojęciowej) dotyczy każdego języka naturalnego i oznacza, że jednemu słowu (lub związkowi frazeologicznemu) odpowiada wiele znaczeń, czyli że różne pojęcia nazywane są tak samo.

Disambiguacja pojęciowa (ujednoznacznianie pojęć), czyli wybór właściwego znaczenia dla pojęcia, które posiada wiele znaczeń i pojawiło się w dłuższej sentencji, nie sprawia człowiekowi większej trudności w jego codziennym życiu. Może poza występującymi w codziennym życiu żartami, które zazwyczaj opierają się na parainformacji powstającej z wieloznaczności pojęć: „Możesz na mnie liczyć, powiedział informatykowi jego komputer". Natomiast podczas przetwarzania tekstu przez program operujący na tekście, wieloznaczność stanowi znaczący problem.

Każdemu pojęciu odpowiada w języku naturalnym zapis w postaci wyrazu, kolokacji1 lub związku frazeologicznego (np. „puścić farbę”, „jabłko Adama”) będących jego odzwierciedleniem. Zapis pojęcia w języku naturalnym będziemy dalej nazywać konceptem. Celem disambiguacji jest stworzenie przetwarzałnej przez systemy informacyjne reprezentacji dokumentu, tak aby w analizowanym dokumencie - na podstawie pochodzącej z niego treści - wyodrębnić jednostki odpowiadające znaczeniu informacyjnemu konceptów z tekstu.

1

Kolokacja to związek semantyczny, którego znaczenie wynika z połączenia znaczeń kilku słów wchodzących w jego skład (np. ..wirus komputerowy”).



Wyszukiwarka

Podobne podstrony:
img047 (8) 94 in antyczny. Na przykład, semantycznej strukturze „pies” odpowiada w języku polskim st
img047 (8) 94 mantyczny. .Na przykład, semantycznej strukturze „pies” odpowiada w języku polskim str
Tabela 1: Algorytm disambiguacji pojęć z wykorzystaniem relacji leksykalnych przechowywanych w sieci
CCF20110310005 (2) „contact” ale mają w języku polskim nieco inny zakres zastosowania. Można mieć k
Załącznik nr 2. Tomasz Mroczek - Autoreferat w języku polskim W pierwszym podejściu [7] zastosowałem
Załącznik nr 2. Tomasz Mroczek - Autoreferat w języku polskim
Zał. nr 4 do ZW WYDZIAŁ ELEKTRYCZNY KARTA PRZEDMIOTU Nazwa w języku polskim: Sieci
zawiera pewną niewielką ilość fonemów; w języku polskim jest ich (według różnych obliczeń) około
img080 (30) Polecana literatura w języku polskim E. Aronson, Człowiek — istota społeczna, PWN, Warsz
img125 125 Rozdział 10. Przykłady konkretnych zastosowań sieci neuronowych10.2 Rozwiązywanie problem

więcej podobnych podstron