4126969169

4126969169



APARAT POJĘCIOWY WYBRANYCH SYSTEMÓW PRZETWARZANIA... 27

wo to stanowi samodzielny leks. Segmentacja izolowanych zdań nie może być więc przeprowadzona w sposób mechaniczny.

W ogólnym przypadku leksy w tekście nie układają się więc w ciąg, ale z powodu takich wieloznaczności segmantacyjnych tworzą tzw. acykliczny graf skierowany. Woliński sformułował przykład, który pokazuje, że pewne wieloznaczności na poziomie czysto syntaktycznym są nie do usunięcia:

Miałem miał.

Oprócz takiej interpretacji, jak w przy kładzie «Czy miał posypany chodnik? Miałem miał.», są też dwie inne, w których pierwszy leks jest, lub nie jest rzeczownikiem:

Mial+em miał.

Czytelnicy zaznajomieni z korpusem IPI PAN zorientow'ali się już zapewne, że proponowane przeze mnie pojęcie 1 e k s u pokrywa się niemal całkowicie ze stosowanym w dokumentacji korpusu i - co może ważniejsze, interfejsie użytkownika programu Poliąarp - pojęciem segmentu.

Drugie interesujące nas pojęcie, mianowicie leksem, w omawianych pracach definiowany jest niejawnie, ale w1 sposób bardzo precyzy jny - dla każdego leksu w jego opisie wskazany jest leksem, który'jest przez dany leks reprezentowany. W najprostszym przypadku wystarczy' w tym celu wskazać formę podstawową, bardziej skomplikowane przypadki omawia Woliński w arty'kule [25] (s. 43).

5. Leksy a wyrazy

Jak pamiętamy, leksy są ciągami znaków piśmiennych. Zgodnie z koncepcją przedstawioną wr artykule [7] będziemy leksy' traktować jako kształty odpowiednich wyrazów. Zgodnie z terminologią wprowadzoną w' książce [2] i dodatkowo uza-sadnionąm.in. w artykule [5] rozróżniamy wyrazy' morfologiczne i morfosyntaktycz-ne. Wyniki analizatora Wolosza bliższe są pojęciu wyrazu morfologicznego, podczas gdy w' korpusie IPI PAN mamy do czynienia z wyrazami morfosyntaktycznymi. Przyjrzyjmy się dokładniej fragmentowi korpusu w formacie XCES:

<tok>

<orth>Pisze</orth>

<lexdisamb=T’><base>pisać</base><ctag>fin:sg:ter:imperf</ctag></lex>

</tok>

Leks Pisze ma tylko jedną interpretację (disamb=”1 ”) w postaci wyrazu morfologicznego o następujących własnościach

-    forma podstawowa pisać wskazuje na odpow iedni leksem;

-    klasa fleksyjna fin wskazuje na typ fleksemu nazyw'any formą nieprzeszłą, co determinuje pozostałe w łasności morfosyntaktyczne:



Wyszukiwarka

Podobne podstrony:
APARAT POJĘCIOWY WYBRANYCH SYSTEMÓW PRZETWARZANIA... 29 Bibliografia [1]    Bień,
APARAT POJĘCIOWY WYBRANYCH SYSTEMÓW PRZETWARZANIA... 21 w licznych publikacjach, dostępnych na tej s
APARAT POJĘCIOWY WYBRANYCH SYSTEMÓW PRZETWARZANIA...
APARAT POJĘCIOWY WYBRANYCH SYSTEMÓW PRZETWARZANIA... 25 Napisem nazywać będę dowolną sekwencją znakó

więcej podobnych podstron