w13 fl

background image

Fleksja w działaniu.

Automatyczna analiza

fleksyjna

Marek Łaziński

Gramatyka opisowa języka

polskiego

background image

Schematyczny indeks a tergo

polskich form wyrazowych (J.

Tokarski, Z. Saloni 1992)

Zakończenia w indeksie to nie

końcówki.

-ubie

-ubie

-ubie

-ubie

-ubie

-ije

-ije

-ije

-ije

mIV: przegub-

nI: łubi-e

żIV: zgub-a

A: belzebub-i

IX: skub-ie

Xa: bi-ć

żI: żmi-ja

A: żmi-i

mI: kij-

background image

Automatyczna analiza

fleksyjna

Analizator SAM Krzysztofa Szafrana 1993-99

Moduł analizy w KSJP 1996 (później USJP i
PWN-Oxford)

Analizator Morfeusz M. Wolińskiego:
http://nlp.ipipan.waw.pl/~wolinski/morfeusz/

Sieciowe wyszukiwarki morfologiczne
(ww.szukacz.pl)

Dezambiguacja morfologii w NKJP i w
systemach tłumaczących, np. Translatica
(2005)

background image

Analizator morfologiczny

SAM

Przeszukuje wyrazy od lewej, odcinając kolejno litery i
wyszukuje pozostałe ciągi w indeksie zakończeń. W
wypadku supletywizmu zakończeniem jest cały ciąg, np.
tygodnia, drę,

Po znalezieniu zakończenia w indeksie program zamienia je
na zakończenie formy hasłowej z dołączoną
charakterystyką gramatyczną.

Próbujemy odcinać od lewej: -łodzią -odzią -dzią —zią —ią —ą

Zakończenia -łodzią brak; -odzią pasuje, bo po dodaniu do części
niezmiennej zakończenia hasłowego otrzymujemy ł-ódź (żV)

Krótsze zakończenie –dzią przysługuje rzeczownikom kadź, piędź,
żerdź
bez wymiany o:ó.

Analizator można nauczyć rozpoznawać wyrazy, których nie ma w
słowniku, np. sliperetką > -ą: sliperetka.

Analizator nie rozpozna form homonimicznych, np. dźwignie
(dźwignąć Va, dźwignia żI), proponuje też interpretacje nadmiarowe
np. rozpozna fromę chlebu tak jak skarbu, ślubu, trybu (mIII).

background image

Morfeusz

background image

Znakowanie morfosyntaktyczne

NKJP

Program Morfeusz proponuje tagi morfologiczne

<tok><orth>Porządek</orth>
<lex><base>porządek</base><ctag>subst:sg:acc:m3</ctag></lex>
<lex><base>porządek</base><ctag>subst:sg:nom:m3</ctag></lex></tok>
<tok><orth>dzienny</orth>
<lex><base>dzienny</base><ctag>adj:sg:acc:m3:pos</ctag>/lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m1:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m3:pos</ctag> </lex> </tok>

Dezambiguacja (ujednoznacznienie) statystyczna

<tok><orth>Porządek</orth>
<lex><base>porządek</base><ctag>subst:sg:acc:m3</ctag></lex>
<lex disamb=

H

1

H

>

<base>porządek</base><ctag>subst:sg:nom:m3</ctag> </lex> </tok>

<tok>

<orth>dzienny</orth>
<lex><base>dzienny</base><ctag>adj:sg:acc:m3:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m1:pos</ctag></lex>
<lex><base>dzienny</base><ctag>adj:sg:nom:m2:pos</ctag></lex>
<lex disamb="1">
<base>dzienny</base><ctag>adj:sg:nom:m3:pos</ctag> </lex> </tok>

background image

Interpretacje NKJP -

ciekawostki

...dopieroż [dopierożyć:impt:sg:sec:perf] by go wzięli
na ozory...

Problem wszakoż [wszakożyć:impt:sg:sec:imperf]
polega na tym, że...

Twórczość Chopina [chopinać:fin:sg:ter:imperf] to
także przeżycia...

...w okolicach Limy [lić:fin:pl:pri:imperf] najgorsze są
warunki...

Ojciec od l [lić:impt:sg:sec:imperf] . 30. prowadził
mleczarnię...

Gdy uczynił pierwszy wyło [wyć:praet:sg:n:imperf]m
[być:aglt:sg:pri:imperf:nwok] w obronie...

na czy [czy:qub] m [m:subst:sg:acc:m3] to polega...


Document Outline


Wyszukiwarka

Podobne podstrony:
wde w13
W13 Pomiary częstotliwości i czasu ppt
W13 ziemne odbiory i dokładność
nw asd w13
W13 Znieczulenia miejscowe, Medycyna Ratunkowa - Ratownictwo Medyczne
bioinformatyka w13 2008 9 web
Carens FL 3
DSaA W13 String Matching
w13
FL KL 1
FL
W13
W13, Studia
Wymiana filtra przeciwpyłkowego alfa76 po fl
stata w13

więcej podobnych podstron