Fleksja w działaniu.
Automatyczna analiza
fleksyjna
Marek Łaziński
Gramatyka opisowa języka
polskiego
Schematyczny indeks a tergo
polskich form wyrazowych (J.
Tokarski, Z. Saloni 1992)
Zakończenia w indeksie to nie
końcówki.
-ubie
-ubie
-ubie
-ubie
-ubie
-ije
-ije
-ije
-ije
mIV: przegub-
nI: łubi-e
żIV: zgub-a
A: belzebub-i
IX: skub-ie
Xa: bi-ć
żI: żmi-ja
A: żmi-i
mI: kij-
Automatyczna analiza
fleksyjna
Analizator SAM Krzysztofa Szafrana 1993-99
Moduł analizy w KSJP 1996 (później USJP i
PWN-Oxford)
Analizator Morfeusz M. Wolińskiego:
http://nlp.ipipan.waw.pl/~wolinski/morfeusz/
Sieciowe wyszukiwarki morfologiczne
(ww.szukacz.pl)
Dezambiguacja morfologii w NKJP i w
systemach tłumaczących, np. Translatica
(2005)
Analizator morfologiczny
SAM
Przeszukuje wyrazy od lewej, odcinając kolejno litery i
wyszukuje pozostałe ciągi w indeksie zakończeń. W
wypadku supletywizmu zakończeniem jest cały ciąg, np.
tygodnia, drę,
Po znalezieniu zakończenia w indeksie program zamienia je
na zakończenie formy hasłowej z dołączoną
charakterystyką gramatyczną.
Próbujemy odcinać od lewej: -łodzią -odzią -dzią —zią —ią —ą
Zakończenia -łodzią brak; -odzią pasuje, bo po dodaniu do części
niezmiennej zakończenia hasłowego otrzymujemy ł-ódź (żV)
Krótsze zakończenie –dzią przysługuje rzeczownikom kadź, piędź,
żerdź bez wymiany o:ó.
Analizator można nauczyć rozpoznawać wyrazy, których nie ma w
słowniku, np. sliperetką > -ą: sliperetka.
Analizator nie rozpozna form homonimicznych, np. dźwignie
(dźwignąć Va, dźwignia żI), proponuje też interpretacje nadmiarowe
np. rozpozna fromę chlebu tak jak skarbu, ślubu, trybu (mIII).
Morfeusz
Znakowanie morfosyntaktyczne
NKJP
Program Morfeusz proponuje tagi morfologiczne
<tok><orth>Porządek</orth>
<lex><base>porządek</base><ctag>subst:sg:acc:m3</ctag></lex>
<lex><base>porządek</base><ctag>subst:sg:nom:m3</ctag></lex></tok>
<tok><orth>dzienny</orth>
<lex><base>dzienny</base><ctag>adj:sg:acc:m3:pos</ctag>/lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m1:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m3:pos</ctag> </lex> </tok>
Dezambiguacja (ujednoznacznienie) statystyczna
<tok><orth>Porządek</orth>
<lex><base>porządek</base><ctag>subst:sg:acc:m3</ctag></lex>
<lex disamb=
H
1
H
>
<base>porządek</base><ctag>subst:sg:nom:m3</ctag> </lex> </tok>
<tok>
<orth>dzienny</orth>
<lex><base>dzienny</base><ctag>adj:sg:acc:m3:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m1:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m2:pos</ctag></lex>
<lex disamb="1">
<base>dzienny</base><ctag>adj:sg:nom:m3:pos</ctag> </lex> </tok>
Interpretacje NKJP -
ciekawostki
...dopieroż [dopierożyć:impt:sg:sec:perf] by go wzięli
na ozory...
Problem wszakoż [wszakożyć:impt:sg:sec:imperf]
polega na tym, że...
Twórczość Chopina [chopinać:fin:sg:ter:imperf] to
także przeżycia...
...w okolicach Limy [lić:fin:pl:pri:imperf] najgorsze są
warunki...
Ojciec od l [lić:impt:sg:sec:imperf] . 30. prowadził
mleczarnię...
Gdy uczynił pierwszy wyło [wyć:praet:sg:n:imperf]m
[być:aglt:sg:pri:imperf:nwok] w obronie...
na czy [czy:qub] m [m:subst:sg:acc:m3] to polega...