Wykład 6. Formalny opis składni języka polskiego (wg Szpakowicza)
Pierwszą próbę formalnego opisu składni języka polskiego podjął w ramach pracy doktorskiej
Stanisław Szpakowicz (maj 1978). Celem pracy było opracowanie opisu języka polskiego w postaci
przydatnej do implementacji komputerowej. W wyniku analizy zdania określana jest
powierzchniowa struktura zdania, która odzwierciedla jego własności składniowe.
Na podstawie pracy powstał program napisany w języku Prolog, uruchomiony na komputerze
CDC Cyber 72 pod koniec lat siedemdziesiątych. W latach osiemdziesiątych program testowano na
komputerach ODRA 1300 (analizie poddano około 300 zdań o różnej składni).
Opracowany w pracy model gramatyki akceptuje zdania, które spełniają warunki:
" dopuszczalne są zdania oznajmujące (pojedyncze i złożone) zawierające orzeczenie oraz
pytania
" nie są akceptowane konstrukcje eliptyczne, zdania oraz frazy z domyślnym orzeczeniem oraz
tzw. równoważniki zdań
" nie są akceptowane zdania z mową niezależną oraz z wtrąceniem
" frazy powinny być ciągłe
" szyk wyrazów w zdaniu powinien być nienacechowany (naturalny)
" nie są akceptowane zdania niepoprawne pod względem interpunkcyjnym
W procesie rozpoznawania związków składniowych wyrazu z innymi wyrazami w zdaniu
zasadnicze znaczenie mają jego własności fleksyjne. Istotnym elementem każdej gramatyki języka
naturalnego jest podział słownictwa tego języka na klasy wyrazów charakteryzujące się podobnymi
cechami. Klasyczny podział na rzeczowniki, czasowniki, przymiotniki itd. jest często niewy-
starczający. Grupowanie wyrazów w klasy odbywa się na podstawie podobieństw właściwości
fleksyjnych. W pracy przyjęto siedem kategorii fleksyjnych:
" przypadek (mianownik, dopełniacz, celownik, biernik, narzędnik, miejscownik)
" rodzaj (męskoosobowy np. "chłopiec", "starosta"; męskożywotny np. "pies", "aligator";
męskorzeczowy np. "autobus", "przeciąg"; żeński np. "pani", "obfitość"; nijaki np. "dziecko",
"pole"; przymnogi np. "skrzypce", "drzwi")
" liczba (pojedyncza, mnoga)
" osoba (pierwsza, druga, trzecia)
" stopień (równy, wyższy, najwyższy)
" tryb (oznajmujący, rozkazujący, warunkowy)
" czas (przeszły, nieprzeszły)
W celu opisu własności fleksyjnych wyrazów wprowadzono następujące pojęcia:
- właściwa kategoria fleksyjna: kategoria wyrazu, która wyznacza podział leksemu zawierającego
ten wyraz (np. przypadek dla rzeczownika, rodzaj dla przymiotnika itp.)
- selektywna kategoria fleksyjna: kategoria, której określoną wartość dany wyraz narzuca innemu
wyrazowi związanemu z nim składniowo np.
"do domu", "przed domem" - przyimek wpływa na przypadek rzeczownika
"biała grzywa", "białe tango" - rzeczownik wpływa na rodzaj przymiotnika
- wymagania składniowe: kategoria, która decyduje o typie członu (wyrazu, frazy lub zdania)
związanego składniowo z danym wyrazem np.
"mogę czytać" wyraz "mogę" wymaga bezokolicznika
Na podstawie powyższych własności fleksyjnych dokonano podziału słownictwa na klasy:
Kategoria fleksyjna Wymag. Przykład
Klasa leksemów
właściwa selektywna
składn.
1. Rzeczownik p, l p, r0, l, o0 koń, gąbka, piwo
2. Zaimek rzeczowny p, l0 p, r0, l0,o0 ja, ktoś, niczego
3. Przymiotnik p, r, l, s - chyży, zimny, kolorowy
4. Zaimek przymiotny p, r, l - taki, ten, jakiś
5. Przysłówek s - głęboko, ciasno, gorąco
6. Zaimek przysłowny - - tutaj, kiedy, tak
7. Liczebnik p, r - jeden, dwoje, pięciu
8. Przyimek - p przed, nad, ku
9. Spójnik - - i, albo, że
10. Osobnik r, l, o, t,c - +
10.1. Rozkaznik l, o, t0, c0 - + graj, szukajmy
10.2. Obecnik l, o, t0, c0 - + czekam, przepiszą, idą
10.3. Przeszlik r, l, o, t0, c0 - + znałem, minęło, oddaliście
11. Bezosobnik c - + czyszczono, pito
12. Bezokolicznik - - + palić, stworzyć, zamknąć
13. Odsłownik p, l p, r0, l, o0 + przechodzenie, sprzedania
14. Imiesłów przymiotnikowy p, r, l - +
14.1. Imiesłów czynny p, r, l - + czytający, pisząca,
14.2. Imiesłów bierny p, r, l - + kierowany, przyjęci
15. Imiesłów przysłówkowy - - + idąc, stojąc, przyznawszy
16. Partykuła - - nie, by, czy
l, o -
17. Czasownik posił. "być" będą
2
Autor stosuje dosyć niekonwencjonalne nazewnictwo klas wyrazów. Nazwy te pozwalają jednak
na rozpoznanie właściwego znaczenia klasy:
osobnik osobowa forma czasownika
rozkaznik czasownik w trybie rozkazującym
obecnik czasownik w czasie terazniejszym lub przyszłym prostym
przeszlik forma osobowa czasu przeszłego lub trybu przypuszczającego
bezosobnik forma zakończona na "-no" lub "-to", czasowniki typu "trzeba", "można", itp.
odsłownik - rzeczownik odsłowny lub odczasownikowy
Partykuła to nieodmienna część mowy (lub luzny morfem) spełniająca w zdaniu funkcję
pomocniczą, polegającą na modyfikacji sensu wyrazu lub wypowiedzi.
Cechy składniowe wyrazów ustala się szukając tych wyrazów w odpowiednim słowniku. Słownik
zawiera postać graficzną wyrazu oraz wartości jego kategorii składniowych. W słowniku
umieszczone są w sposób jawny wszystkie formy fleksyjne danego wyrazu wraz z odpowiednim
opisem. Przykłady haseł słownikowych:
przykład(rzeczownik, mianownik, męskorzeczowy, l. poj., os. 3)
książkę(rzeczownik, biernik, żeński, l. poj., os. 3)
podał(przeszlik, męskoosobowy, l. poj., os. 3, t. ozn., PZ.BIER, NIC, NIC)
kupili(przeszlik, męskoosobowy, l. mn. os. 3, t. ozn. PZ.BIER, NIC, NIC)
widzi(obecnik, l. poj. os. 3, PZ.BIER, NIC, NIC)
mała(przymiotnik, mianownik, żeński, l. poj., st. równy)
Ogólna postać reguły zastępowania
lewa_strona = prawa strona .
lewa_strona to jednostka składniowa (symbol nieterminalny)
prawa_strona to dowolny (ewent. pusty) ciąg jednostek składniowych, symboli terminalnych
(wyrazów) i warunków.
Nazwy jednostek składniowych zapisywane są wielkimi literami. Symbole terminalne
poprzedzone są znakiem #. Symbol terminalny może być również zmienną. Parametry występujące
w regułach zapisuje się w nawiasach i oddziela przecinkami. Parametry mogą być:
" stałe (o wartościach ustalonych) zapisywane są dużymi literami,
" zmienne (wartość ustalana w toku analizy) zapisywane są małymi literami (mogą zawierać
cyfry).
3
Jeżeli szyk kilku kolejnych elementów pewnej konstrukcji składniowej jest swobodny, to należy
podać reguły dla wszystkich możliwych ustawień tych elementów. W celu ułatwienia zapisu takich
reguł można zastosować nawias [...]. Elementy zawarte w takim nawiasie posiadają szyk swobodny.
Wartości parametrów i powiązania między nimi można dodatkowo ograniczyć, wprowadzając
do nich warunki. Przykładem warunku jest procedura określenia rodzaju złożonej frazy
rzeczownikowej (np. rzeczowników połączonych spójnikiem "chłopiec i dziewczyna"):
-UZGR(r1, r2, r)
Na podstawie ustalonych wartości parametrów r1 i r2 zostaje określona wartość parametru r.
Reguły opisujące strukturę zdania (72)
Symbolem początkowym gramatyki jest jednostka składniowa o nazwie ZDANIE:
ZDANIE
= ZDANIEZAOŻ ZNAKKOCCA
= PYTANIE #? .
ZNAKKOCCA
= #.
= #; .
ZDANIEZAOŻ
= ZDANIESZER
= ZDANIESZER PRZEC SPÓJRÓW ZDANIESZER
= SPÓJPOCZ ZDANIESZER PRZEC ZDANIESZER
= ...
ZDANIESZER
= ZDANIEPOJ
= ZDANIEPOJ SPÓJSZER ZDANIESZER .
ZDANIEPOJ
= ZDANIEELEM(nr, r, l, o, tr, cz, neg) nr typ zdania elementarnego
= ...
ZDANIEELEM (1, r, l, o, tr, cz, neg)
= [SZFRZ(r, l, o) SZFCZ(OSOB, r, l, o, tr, cz, neg)] .
ZDANIEELEM (2, r, l, o, tr, cz, neg)
= SZFCZ(BEZOS, r, l, o, tr, cz, neg)] .
4
Przeanalizujmy wybrane reguły. Zdanie szeregowe składa się z jednego lub więcej zdań
pojedynczych. Druga, rekurencyjna reguła pozwala dowolnie zwiększać liczbę zdań pojedynczych.
Ilustruje to następujący przykład:
"(Pójdę do domu) i (poczytam książkę) albo (przejrzę gazetę)"
Powyżej przedstawiono dwie z trzech reguł opisujących strukturę zdania elementarnego. Zdania
elementarne typu 1, to zdania zbudowane z grupy podmiotu i grupy orzeczenia. Grupy te powinny
być zgodne pod względem rodzaju, liczby i osoby. W ogólnym przypadku kolejność grup może być
dowolna. Przykład takiej konstrukcji:
"(Ty i ja) (pójdziemy do domu)"
Zdania elementarne typu 2, to zdania zawierające wyłącznie grupę orzeczenia. Centralnym
elementem takiej grupy jest bezosobnik:
"kupiono i wdrożono patent na hodowlę kijanek"
Na koniec tej grupy reguł zostaną omówione reguły opisujące strukturę zdań pytających:
PYTANIE
= PART(CZY) ZDANIEZAOŻ
= ZAIMPS(DLACZEGO) ZDANIEZAOŻ ZAIMPS zaimek przysłówkowy
= ...
Druga reguła umożliwia analizę następującego pytania:
"Dlaczego ona nie przyszła?"
Reguły opisujące frazę rzeczownikową (39)
Omawianie reguł opisujących strukturę frazy rzeczownikowej zostanie poprzedzone kilkoma
przykładami, które ilustrują zróżnicowanie oraz możliwą złożoność takiej frazy (przez podkreślenie
zaznaczono główny element frazy):
- dom
- najstarszy dom w okolicy
- dom, którego dach pomalowany był na niebiesko
- największa ulewa od czasu, kiedy jego dziadek przeprowadził się do tego miasteczka
- kobieta, dziecko i pies
5
Najbardziej ogólną jednostką składniową opisującą strukturę frazy rzeczownikowej jest szereg
fraz rzeczownikowych SZFRZ:
SZFRZ(p, r, l, o)
= FRZ(p, r, l, o) .
SZFRZ(p, r, MNOGA, o)
= SPÓJLEWY(nr) FRZ(p, r1, l1, o1) SPÓJPRAWY(nr) FRZ(p, r2, l2, o2)
-UZGR(r1, r2, r) -UZGO(o1, o2, o) .
Szereg fraz rzeczownikowych może być pojedynczą właściwą frazą rzeczownikową (oznaczenie
FRZ) lub może składać się z dwóch takich fraz połączonych spójnikiem nieciągłym. W drugim
przypadku fraza otrzymuje kategorię liczby mnogiej. Kategoria rodzaju i osoby zostaje określona
na podstawie własności fraz składowych. Przykład takiej konstrukcji ilustruje następujący fragment
zdania:
"zarówno bicie głową w mur, jak też czarna rozpacz bramkarza ..."
FRZ(p, r, l, o)
= FRZ1(p, r, l, o) . FRZ1 pojedyncza fraza rzeczownikowa
FRZ(p, r, MNO, o)
= FRZ1(p, r1, l1, o1) SPÓJSZER FRZ(p, r2, l2, o2)
-UZGR(r1, r2, r) -UZGO(o1, o2, o) .
FRZ1(p, r, l, o)
= FRZ1W(p, r, l, o) FRZ1W prosta fraza rzeczownikowa
= [FRZ1W(p, r, l, o) OKOL] .
Właściwa fraza rzeczownikowa składa się z jednej lub kilku pojedynczych fraz rzeczownikowych
połączonych spójnikami ( w tym przypadku otrzymuje ona kategorię liczby mnogiej). Oto przykład
właściwej frazy rzeczownikowej:
"(my, których pokonano), (napastnik drużyny przeciwnej) oraz (bardzo zmęczeni stoper i
skrzydłowy)"
Pojedyncza fraza rzeczownikowa składa się z prostej frazy rzeczownikowej lub z prostej frazy
rzeczownikowej połączonej z okolicznikiem. W drugim przypadku kolejność tych elementów jest
dowolna. Przykład pojedynczej frazy rzeczownikowej (wyróżniono okolicznik):
"(po przerwie) smutek i żal, którym nie można się dziwić"
6
Do opisu frazy rzeczownikowej pojawiają się kolejno, tworząc hierarchię, następujące jednostki
składniowe: KRZPODRZ konstrukcja rzeczownikowa ze zdaniem podrzędnym, KRZDOP
konstrukcja rzeczownikowa z dopełniaczem, KRZATR konstrukcja rzeczownikowa z atrybutami,
KRZ konstrukcja rzeczownikowa właściwa, itd. Na końcu dochodzimy do jednostki składniowej
RZECZSKA rzeczownik składniowy, która reprezentuje:
- zaimek rzeczowny osobowy np. "on",
- rzeczownik np. "rozpacz",
- konstrukcję czasownikową, której centrum stanowi odsłownik np. "bicie głową w mur".
Reguły opisujące frazę czasownikową (66)
Na początek rozpatrzmy przykłady kilku fraz czasownikowych:
- kupił samochód
- wierzę, że o tym nie zapomnisz
- wczoraj bez żadnego namawiania przewiózł fotel samochodem z mieszkania ciotki do
pracowni za 200 zł
- kupił używany samochód, naprawił go i sprzedał za dwukrotnie wyższą cenę
Najbardziej ogólną jednostką składniową opisującą strukturę frazy czasownikowej jest szereg
fraz czasownikowych SZFCZ:
SZFCZ(wd, r, l, o, tr, cz, neg) wd wyróżnik derywacyjny
= FCZ(wd, r, l, o, tr, cz, neg)
= FCZ(wd, r, l, o, tr, cz, neg) PRZEC SPÓJRÓW FCZ(wd, r, l, o, tr, cz, neg)
= FCZ(wd, r, l, o, tr, cz, neg) PRZEC KSPÓJ(wz) FCZ(wd, r, l, o, tr, cz, neg)
-ALT(wz, (DLATEGO, ŻE).(A, TAKŻE).(JAK, RÓWNIEŻ) ... )
KSPÓJ konstrukcja spójnikowa (patrz wyżej)
Szereg fraz czasownikowych składa się z jednej właściwej frazy czasownikowej lub dwu takich
fraz, połączonych spójnikami równorzędnymi, konstrukcjami spójnikowymi lub spójnikami
nieciągłymi np.:
"wyjął, pokroił chleb i podał go dziecku"
"zrobił to, mimo że nie miał czasu"
Właściwe frazy czasownikowe tworzące szereg muszą mieć te same cechy składniowe, zarówno te
same wartości kategorii składniowych (rodzaj, osoba, liczba, itd.) jak też identyczną wartość
negacji.
7
FCZ(wd, r, l, o, tr, cz, neg) FCZ właściwa fraza czasownikowa
= FCZ1(wd, r, l, o, tr, cz, neg)
= FCZ1(wd, r, l, o, tr, cz, neg) SPÓJSZER FCZ(wd, r, l, o, tr, cz, neg)
FCZ1(wd, r, l, o, tr, cz, neg) FCZ1 pojedyncza fraza czasownikowa
= FCZ1W(wd, r, l, o, tr, cz, neg) FCZ1W prosta fraza rzeczownikowa
= [ FCZ1W(wd, r, l, o, tr, cz, neg) OKOL]
= OKOL FCZ1W(wd, r, l, o, tr, cz, neg) OKOL
Właściwa fraza czasownikowa składa się z jednej lub kilku pojedynczych fraz czasownikowych,
połączonych spójnikami szeregowymi. Pojedyncza fraza czasownikowa to prosta fraza
czasownikowa, która może być opatrzona okolicznikami. Oto przykład właściwej frazy
czasownikowej (w nawiasach wyróżniono pojedyncze frazy czasownikowe, przez podkreślenie
zaznaczono okoliczniki):
"(przysunął się do kredensu bez wahania), (szybko wyjął i pokroił chleb) i (zaraz podał go
dziecku z uśmiechem)"
Prosta fraza czasownikowa to konstrukcja w czasie przyszłym (z negacją lub bez), albo konstrukcja
czasownikowa osobowa lub bezosobowa np.:
- "nie będę mieć czasu",
- "wyjął i pokroił chleb",
- "wyjęto i pokrojono chleb".
Jednostki funkcyjne
Wyrazy funkcyjne odgrywają szczególną rolę w analizie zdania, ponieważ dostarczają
podstawowych informacji o jego strukturze. Do wyrazów funkcyjnych zalicza się wyrazy
niesamodzielne, takie jak: przyimki, spójniki i partykuły, oraz zaimki. Wyrazy te poddawane są
dalszemu podziałowi, zgodnie z typami konstrukcji w których występują. W związku z tym
występuje kilka typów spójników np. szeregowe, równorzędne, początkowe, nieciągłe:
SPÓJRÓW
= SPÓJNIK(f) -ALT(f, ALE. AŻ. BO. CHOCIAŻ. CHOĆ. DOPÓKI. GDYŻ. JEDNAK.
JEŚLI.JEŻELI.LECZ. NATOMIAST.NIM.PONIEWAŻ. ... )
SPÓJSZER
= SPÓJNIK(ALBO)
= SPÓJNIK(I)
8
= SPÓJNIK(LUB)
= SPÓJNIK(ORAZ)
= PRZEC .
Złożoność modelu
Liczba jednostek elementarnych (klas wyrazów) - 20
Liczba wyrazów funkcyjnych (spójniki i zaimki) - około 100
Liczba jednostek składniowych (nieterminale) - około 100
Liczba reguł - około 270
Przykład analizy zdania (1)
Wynik analizy zdania: "Nikogo ojciec nie widzi".
9
Znaczenie symboli występujących na rysunku:
ZAIMRZNEG zaimek rzeczowny negatywny
ZAIMRZ zaimek rzeczowny
ZDANIENWYM zdanie z nieuwzględnionym wymaganiem
ORZECZNWYM orzeczenie z nieuwzględnionym wymaganiem
DCZSI derywat czasownikowy z się
OBEC obecnik
Przykład analizy zdania (2):
Wynik analizy zdania złożonego (za pomocą nawiasów oznaczono jednostki składniowe wyróż-
nione podczas analizy):
(Jeżeli ((zbyt trudno) było (zanalizować (takie zdanie))), to (autor ((przeprasza czytelników) i (musi
(z żalem) (stwierdzić (, że (albo (((ta cała) praca) została zle (przez niego) (obmyślona i napisana)),
albo (((przykład (, który podał,)) szwankuje) i (trzeba (go zmienić))))))))).)
10
Wyszukiwarka
Podobne podstrony:
W6C w6 zmienne dynamiczne wskazniki funkcjiw6 paleoklimatw6MSI AiR w6 2004W6W6 Układy regulacji i dynamika AiS 2013SI5301 w1w6 TRBW6 Układy regulacji i dynamika AiS 2013TB W6 623CW6 Instalacje bezpieczenstwa w obiektach budowlanychw6W6w6w6więcej podobnych podstron