4.
WPROWADZENIE DO NAUKI O JĘZYKU
3003-41A1NJ
STUDIA DZIENNE FILOLOGII POLSKIEJ
2008/2009
Prof. dr hab. Marek Świdziński
Zakład Językoznawstwa
Komputerowego
Instytut Języka Polskiego UW
e-mail: m.r.swidzinski@uw.edu.pl
Konsultacje: środa 13.30-14.30,
pok. 1
Strona przedmiotu — szukaj pod:
http://www.mswidz.republika.pl/
1.
Przedmiot językoznawstwa
.
2.
Cechy definicyjne języka naturalnego.
3.
Formalne rozumienie języka.
4.
Struktura języka I: morfologia.
5.
Struktura języka II: składnia.
6.
Podstawy leksykologii. Leksykografia.
7.
Zróżnicowanie języków świata. Podstawy
typologii.
–2
Program wykładu
Do wykładów 1 i 2
Minimalny system znaków jest zbiorem:
A.
jedno-,
B.
dwu-,
C.
trzy-,
D.
czteroelementowym.
Znakiem prostym jest słowo:
A. dom, B. gram, C. wtem, D. domem.
System zapisu ułamków zwykłych nie jest
językiem naturalnym, bo:
A. ma ograniczony słownik, B. nie ma morfologii,
C. jest komunikacyjnie lokalny, D. zawiera kreskę
ułamkową.
–3
Pytania testowe
Wykład 4
Wykład 4
Struktura
Struktura
j
j
ę
ę
zyka
zyka
I:
I:
morfologia
morfologia
–4
Iksiński zna język A:
A.
zna słówka (SUROWIEC),
B.
umie rozbierać wyrażenia (ANALIZA),
C.
umie łączyć słówka w wyrażenia (SYNTEZA).
Co to jest znajomość czynna / bierna?
Jak szacować stopień znajomości?
Różne kombinacje A.-C.
–5
Znajomość języka
Składniki kompetencji językowej
A.
słownik
,
B.
gramatyka,
C.
gramatyka.
Jedna gramatyka – czy dwie gramatyki?
–6
Dwie gramatyki?
Łacina:
ARMAVIRUMQUECANOTROIAEQUIPRIMU
SABORISITALIAMFATOPROFUGUSLAVIN
AQUEVENITLITORA
Arma virumque cano, Troiae qui primus ab
oris Italiam, fato profugus, Lavinaque
venit litora
‘czyny męża-i śpiewam, Troi który pierwszy od
wybrzeży do-Italii, losem miotany, lawińskich-
i przybył brzegów’
–7
Analiza tekstu
Angielski:
Our Father who art in heaven,
hallowed be thy name.
Thy kingdom come.
Thy will be done on earth, as it is in
heaven.
Give us this day our daily bread,
and forgive us our trespasses,
as we forgive those who trespass
against us,
and lead us not into temptation,
but deliver us from evil.
–8
Analiza tekstu
Koreański:
anna-nun ku-eykey pyenci-lul sey-pen-ul ponay-
ess-ta.
‘Anna-TOP on-dla list-OB trzy-raz-OB posłać-PRZE-
OZN’
Anna to mu trzykrotnie list wysłała.
–9
Analiza tekstu
Polski:
Goście są uwiedzeni urodą ich najmłodszych
córek.
–10
Analiza tekstu
Szukanie słówek w słowniku
Arma virumque cano Troiae qui primus ab
oris Italiam fato profugus Lavinaque
venit litora
virumque => VIR
Italiam => ITALIA
venit => VENIO
–11
Lematyzacja
Our Father who art in heaven,
hallowed be thy name.
Thy kingdom come.
Thy will be done on earth, as it is in heaven.
Give us this day our daily bread,
and forgive us our trespasses,
as we forgive those who trespass against us,
and lead us not into temptation,
but deliver us from evil.
art => BE
thy => THOU (???)
trespasses => TRESPASS
–12
Lematyzacja
anna-nun ku-eykey pyenci-lul sey-pen-ul
ponay-ess-ta.
anna => ANNA
ku => KU
ponay => PONAY
ul => UL
–13
Lematyzacja
Polski:
Goście są uwiedzeni urodą ich najmłodszych
córek.
goście => GOŚĆ
są => BYĆ
uwiedzeni => UWIEŚĆ // UWIEDZIONY
urodą => URODA
ich => ONI // ONE
najmłodszych => MŁODY
córek => CÓRKA
–14
Lematyzacja
Wnioski:
Słownik
nie jest
zbiorem słów (wypisanych
z tekstu).
Słowa są upakowane
w leksemy
(= hasła
słownikowe). Dotyczy to przytłaczającej
większości JN w świecie.
Słowa
nie są
najprostszymi znakami.
W gramatyce są reguły:
budowy słów (
MORFOLOGIA
)
budowy wyrażeń (
SKŁADNIA
).
–15
Słowa a znaki proste
„Słownik” morfemów
M = {-ank-, -ą, -czyta-, dyskretn-, dziś,
-ent-, -i, -k-, koch-, -ł-, od, ‑ość-, prze-,
-y, -ów, stud-, wiadom-, -
}
Konstrukcje morfologiczne:
o
Surowiec: morfemy, konstrukcje
morfologiczne.
o
Produkt: słowa.
–16
Punkt wyjścia: morfemy
Poprawne:
studentki
przeczytały
dyskretną
wiadomość
kochanków
Dewiacyjne:
*studentanki
*czytałk
*dyskretn
*przewiadomośćą
*kochów
–17
Konstrukcje morfemowe
Gramatyka słów: morfologia.
Są języki, dla których
Gramatyka = Morfologia
–18
Gramatyka słów
„Słownik” słów:
S = {dyskretną, dziś, przeczytały,
kochanków, od, studentki, wiadomość}
Konstrukcje składniowe:
o
Surowiec: słowa, konstrukcje składniowe.
o
Produkt: wyrażenia (frazy lub zdania).
–19
Punkt wyjścia: słowa
Poprawne:
Studentki przeczytały dziś dyskretną
wiadomość od kochanków.
Dyskretną od kochanków wiadomość
studentki dziś przeczytały.
Przeczytały dziś od kochanków
wiadomość dyskretną studentki.
Dewiacyjne:
*Studentki wiadomość dziś od dyskretną
kochanków przeczytały.
–20
Konstrukcje składniowe
Gramatyka wyrażeń: składnia
.
Są języki, dla których
Gramatyka = Składnia
.
–21
Gramatyka wyrażeń
Gramatyka języka polskiego obejmuje:
morfologię i
składnię.
Polski — język wysoce fleksyjny (
HIL
=
highly inflecting language).
Słowa polskie przeważnie
nie są
znakami
prostymi.
–22
Języki wysoce fleksyjne
Co to znaczy słowo?
Ile słów
mamy
mamy poniższym zdaniu:
Mamy mamy, drogie mamy, młodsze od
niejednej mamy, ale mamy lubią
wasze mamy.
–23
Słowo, forma wyrazowa, leksem
Odpowiedzi:
6 - 5 - 4 - 3 - 2 - 1 - 0...
–24
Słowo, forma wyrazowa, leksem
Rozróżnienia:
a. jednostki
konkretnej
(fizycznego
wystąpienia pewnego obiektu) i jednostki
abstrakcyjnej
— klasy wystąpień;
[ang. token — type]
b. jednostki
niezinterpretowanej
i jednostki
zinterpretowanej
.
–25
Słowo, forma wyrazowa, leksem
•
słowo
— napis między spacjami lub
znakami interpunkcyjnymi;
•
forma wyrazowa
— słowo z interpretacją
gramatyczną (część mowy, ewentualne
wartości kategorii fleksyjnych, ewentualnie
nazwa jednostki słownikowej);
•
leksem
— zbiór form wyrazowych o tym
samym odniesieniu do rzeczywistości (i o
podobnym kształcie).
–26
Słowo, forma wyrazowa, leksem
Słowo
mamy
reprezentuje 5 różnych form
wyrazowych:
(a) czasownikową o wartości pierwszej osoby liczby
mnogiej czasu teraźniejszego
(
mamy(1os,mno,ter)
)
(b) rzeczownikową o wartości dopełniacza liczby
pojedynczej (
mamy(dop,poj)
);
(c) rzeczownikowa o wartości mianownika liczby
mnogiej (
mamy(mian,mno)
);
(d) rzeczownikowa o wartości biernika liczby mnogiej
(
mamy(bier,mno
) );
(e) rzeczownikowa o wartości wołacza liczby mnogiej
(
mamy(woł,mno)
).
–27
Słowo, forma wyrazowa, leksem
o
Słowa typu
mamy
—
hominimy
.
o
Rozwiązywanie homonimii:
dehomonimizacja
o
LEKSEM
hasło słownikowe.
o
Odgadywanie leksemu:
lematyzacja
o
SŁOWNIK
(składnik systemu językowego):
zbiór form wyrazowych.
o
Zbiór leksemów (a więc — zbiór zbiorów
form wyrazowych) —
LEKSYKON
.
–28
Słowo, forma wyrazowa, leksem
Typ A:
STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ,
KOCHANEK
Typ B:
DZIŚ, DYSKRETNY, OD
Typ A.:
podzielne słowotwórczo (
derywaty
).
Typ B.: niepodzielne słowotwórczo.
–29
Reguły gramatyki
Gramatyka – zbiór reguł, które robią:
słowa z morfemów
FLEKSJA
[ leksemy z leksemów
słowotwórstwo ]
wyrażenia ze słów i innych wyrażeń
SKŁADNIA
Słowotwórstwo – słabo gramatyczne.
–30
Reguły gramatyki
Leksemy — zbiory form wyrazowych:
STUDENTKA = {studentka,studentki,
studentce,..., studentki, studentek,
studentkom,...}
PRZECZYTAĆ = {przeczytam, przeczytasz,
przeczyta,..., przeczytałem,
przeczytałam, przeczytałeś,...,
przeczytaj, przeczytajmy,...,
przeczytałbym, przeczytałabym,
przeczytałbyś,..., przeczytać,
przeczytawszy}
–31
Przedmiot fleksji
WIADOMOŚĆ = {wiadomość, wiadomości,
wiadomości,..., wiadomościom,...}
KOCHANEK = {kochanek, kochanka,
kochankowi,..., kochankowie, kochanków,
kochankom,...}
DZIŚ = {dziś}
DYSKRETNY = {dyskretny, dyskretna, dyskretne,
dyskretnego, dyskretnej, dyskretnego,
dyskretnemu, dyskretnej, dyskretnemu,...,
dyskretni, dyskretne, dyskretnych,
dyskretnym,..., dyskretniejszy,...,
najdyskretniejszy,...}
OD = {od, ode}
–32
Przedmiot fleksji
Fleksja – opis leksemów jako zbiorów form
wyrazowych.
–33
Zadanie opisu fleksyjnego
Jak zinterpretować // odczytać słowo
tonie
,
żeby znaleźć w leksykonie odpowiedni
leksem?
TON
TONA
TOŃ
TONĄĆ
1.
Rozpoznać słowo jako formę wyrazową.
2.
Podzielić na składniki (temat fleksyjny,
końcówka).
Lub inaczej: podzielić na
część wspólną i część różną
.
3.
Poszukać w leksykonie.
–34
Analiza morfologiczna
Ad 1.:
To jest w dobrym
tonie
.
Jasio
tonie
w rzece.
Tonie
się rozstąpiły przed Świtezianką.
Przyglądałem się
tonie
.
Poprzestali na
tonie
.
W złym środowisku Jan pływa, w dobrym
tonie
.
Jasio zgłębia
tonie
w rzece.
–35
Analiza morfologiczna
Ad 2.:
tonie
ton(i)-
-e
lub:
ton/ie
tonie-
-Ø
to/nie
Analogicznie jak
trop(i)-
-e
chuc(i)-
-e
słom(i)-
-e
pęknie-
-Ø
–36
Analiza morfologiczna
Ad 3.:
tonie
Leksem
A
TON
jak
TROP
TONA
jak
SŁOMA
TOŃ
jak
CHUĆ
TONĄĆ
jak
PĘKNĄĆ
–37
Analiza morfologiczna
Fleksja jako fragment opisu gramatycznego
fleksja głębinowa:
opis uporządkowania
form wyrazowych w leksemy (= szkolny
rozbiór gramatyczny
);
fleksja powierzchniowa:
opis struktury
morfemowej form wyrazowych i
klasyfikacja leksemów odmiennych ze
względu na strukturę morfemową jego
form (= szkolne
„tematy”, „końcówki”
i
„wymiany głoskowe”
).
–38
Dwa poziomy fleksji
Leksemy odmienne i nieodmienne
STUDENTKA, PRZECZYTAĆ, WIADOMOŚĆ,
DYSKRETNY, WIADOMOŚĆ, KOCHANEK
DZIŚ
A następujące leksemy:
EMU, OD, MUZEUM, STEREO, SUPER ???
–39
Odmienność // nieodmienność
Jaki mamy pożytek z fleksji?
Semantyczny:
Chłopiec
śpi. :
Chłopcy
śpią.
Śpię
. :
Śpisz
.
:
Śpi
.
Mży
. :
Mżyło
. :
Będzie mżyło
.
............................
–40
Funkcje opozycji fleksyjnych
Składniowy:
Ten
chłopiec śpi. :
Ci
chłopcy śpią.
Ten
chłopiec śpi. :
Ta
dziewczyna śpi. :
To
widmo śpi.
bez
mamy
: o
mamie
: za
mamę
Semantyczno-składniowy:
Mama
zabiła gęś. :
Mamę
zabiła gęś. :
Zabił gęś
mamą
.
Pięć
mam
płacze. : Kuzynka
mamy
płacze.
–41
Funkcje opozycji fleksyjnych
Kategorie gramatyczne fleksyjne
Kategorie fleksyjne:
opozycje w zbiorze form
wyrazowych w poprzek leksemu.
Wartości kategorii fleksyjnych:
człony takich
opozycji.
Przypadek
,
Osoba
,
Czas
ale:
mianownik
,
trzecia
,
przyszły
Język fleksyjny:
taki, w którym fleksja służy składni.
–42
Opozycja = kategoria fleksyjna
Klasyfikacja gramatyczna leksemów polskich
Zygmunta Saloniego
Mamy leksem LX. Pytamy kolejno:
(1) czy jest
odmienny
;
(2) czy odmienia się przez
przypadek
;
(3) czy odmienia się przez
osobę
;
(4) czy odmienia się przez
rodzaj
;
(5) czy odmienia się przez
liczbę
;
(6) czy jest
samodzielny
składniowo;
(7) czy pełni funkcję
łączącą
;
(8) czy ma
rząd
.
–43
Typologia leksemów: części mowy
–44
Typologia leksemów: części mowy
RZECZ
owniki
PRZYM
iotniki
LICZ
ebniki
CZAS
owniki
CZAS NIEWL
— czasowniki niewłaściwe
PART-PRZYS
— partykuło-przysłówki
SPOJ
— spójniki
PRZYIM
ki
WYK
rzykniki
–45
Typologia leksemów: części mowy
Paradygmat
–46
JEŚĆ
Formy finitywne:
O s o b o w e:
[1]
T R Y B:
[1a] o z n a j m u j ą c y
[2]
C Z A S:
[2a] t e r a ź n i e j s z y
[3]
O S O B A
[4]
L I C Z B A:
[4a] pojedyncza
[4b] mnoga
[3a]
1os
jem
jemy
[3b]
2os jesz
jecie
[3c]
3os je
jedzą
[2b] p r z e s z ł y
[3]
O S O B A:
[4]
L I C Z B A:
[5]
R O D Z A J:
[4a] pojedyncza
[4b] mnoga
[3a] 1os
[5a] m
jadłem
[5d] mos
jedliśmy
-m ... jadł
-śmy ... jedli
[5b] ż
jadłam
[5e] nmos
jadłyśmy
-m ... jadła
śmy ... jadły
[5c] n
jadłom
-m ... jadło
[3b] 2os
[5a] m
jadłeś
[5d] mos
jedliście
-ś ... jadł
-ście ... jedli
[5b] ż
jadłaś
[5e] nmos
jadłyście
-ś ... jadła
-ście ... jadły
[5c] n
jadłoś
-ś ... jadło
[3c] 3os
[5a] m
jadł
[5d] mos
jedli
[5b] ż
jadła
[5e] nmos
jadły
[5c] n
jadło
–47
[2c] p r z y s z ł y
[3]
O S O B A:
[4]
L I C Z B A:
[5]
R O D Z A J :
[4a] pojedyncza
[4b] mnoga
[3a] 1os
będę ... jeść
będziemy ... jeść
jeść ... będę
jeść ... bedziemy
[5a] m
będę ... jadł
[5d] mos
będziemy ... jedli
jadł ... będę
jedli ... będziemy
[5b] ż
bedę ... jadła
[5e] nmos
będziemy ... jadły
jadła ... bedę
jadły ... będziemy
[5c] n
będę ... jadło
jadło ... będę
[3b] 2os
będziesz ... jeść
będziecie ... jeść
jeść ... będziesz
jeść ... będziecie
[5a] m
będziesz ... jadł
[5d] mos
będziecie ... jedli
jadł ... będziesz
jedli ... będziecie
[5b] ż
bedziesz ... jadła
[5e] nmos
będziecie ... jadły
jadła ... bedziesz
jadły ... będziecie
[5c] n
będziesz ... jadło
jadło ... będziesz
[3c] 3os
będzie ... jeść
będą ... jeść
jeść ... będzie
jeść ... będą
[5a] m
będzie ... jadł
[5d] mos
będą ... jedli
jadł ... będzie
jedli ... będą
[5b] ż
będzie ... jadła
[5e] nmos
będą ... jadły
jadła ... będzie
jadły ... będą
[5c] n
będzie ... jadło
jadło ... będzie
[1b] r o z k a z u j ą c y
[2]
O S O B A:
[3]
L I C Z B A:
[3a] pojedyncza
[3b] mnoga
[2a] 1os ______
jedzmy
[2b] 2os jedz
jedzcie
[2c] 3os niech je
niech jedzą
–48
[1a] w a r u n k o w y
[2]
O S O B A:
[3]
L I C Z B A:
[4]
R O D Z A J:
[4a] pojedyncza
[4b] mnoga
[3a] 1os
[5a] m
jadłbym
[5d] mos
jedlibyśmy
bym ... jadł
byśmy ... jedli
byłbym ... jadł
bylibyśmy ... jedli
jadł ... byłbym
jedli ... bylibyśmy
bym ... był ... jadł
byśmy ... byli ... jedli
.................................................................
N i e o s o b o w e:
Bezosobnik
[1]
T R Y B:
[1a] oznajmujący
[1b] warunkowy
jedzono
jedzono by
by ... jedzono
Formy niefinitywne:
Bezokolicznik
jeść
Imiesłów współczesny
jedząc
Imiesłów uprzedni
_________
1.
Znajomość języka A: znajomość słówek i reguł
budowy / rozbioru wyrażeń.
2.
Słownik to zbiór leksemów (= haseł słownikowych).
3.
Dla „słownika” morfemów – gramatyka słów:
morfologia.
4.
Dla „słownika” słów – gramatyka wyrażeń:
składnia.
5.
Polski – język wysoce fleksyjny (HIL =
H
ighly
I
nflecting
L
anguage).
6.
Terminy: słowo – forma wyrazowa – leksem.
7.
Słowotwórstwo jest w niewielkim stopniu
gramatyczne.
8.
Gramatyka języka polskiego obejmuje morfologię
(= fleksję) i składnię.
9.
Fleksja głęboka (paradygmaty) i powierzchniowa
(wypełnienie klatek paradygmatu).
–49
Podsumowanie