2.
WPROWADZENIE DO NAUKI O JĘZYKU
3003-41A1NJ
STUDIA DZIENNE FILOLOGII POLSKIEJ
2008/2009
Prof. dr hab. Marek Świdziński
Zakład Językoznawstwa
Komputerowego
Instytut Języka Polskiego UW
e-mail: m.r.swidzinski@uw.edu.pl
Konsultacje: środa 13.30-14.30,
pok. 1
Strona przedmiotu — szukaj pod:
http://www.mswidz.republika.pl/
1.
Przedmiot językoznawstwa.
2.
Cechy definicyjne języka naturalnego.
3.
Formalne rozumienie języka.
4.
Struktura języka I: morfologia.
5.
Struktura języka II: składnia.
6.
Podstawy leksykologii. Leksykografia.
7.
Zróżnicowanie języków świata. Podstawy
typologii.
–2
Program wykładu
Wykład 2
Wykład 2
Cechy definicyjne j
Cechy definicyjne j
ę
ę
zyka
zyka
naturalnego
naturalnego
–3
Jak opisać JN — strukturalnie?
Model —
urządzenie funkcjonujące
jak
oryginał.
Co jest tym oryginałem (= obiektem opisu)?
Umowa: JN NS.
Co modelujemy?
Kompetencja idealnego NS’a.
–4
Modelowanie
Kompetencja NS’a — umiejętność:
a. odróżniania wyrażeń poprawnych od
niepoprawnych,
b. interpretowania ( rozumienia) wyrażeń
poprawnych,
c. wytwarzania wyrażeń poprawnych.
–5
Kompetencja językowa
Zdanie poprawne nie musi być sensowne:
Słowiki pokąsały nas po ołówku.
Colorless green ideas sleep furiously.
Umarł ten nieśmiertelny żonaty kawaler.
Wyrażenie sensowne nie musi być zdaniem
poprawnym:
* Słowikie kląskać w ogrodu.
* … you is my baby…
* Kupi pan pięć kilogramy cementu?
–6
Poprawność a sensowność
–7
Opis (= model) języka naturalnego
•
Opis JN to — przy pewnych założeniach —
jego
gramatyka
.
• Jest konwencjonalny i arbitralny.
• Model to idealizacja:
wyostrzenie
uogólnienie
uproszczenie
• Istnieje
nieograniczenie wiele
poprawnych modeli (= opisów) danego JN.
Model JN
Opisywany obiekt to czarna skrzynka.
Językoznawca potrzebuje danych
empirycznych.
Dane:
teksty rzeczywiste,
teksty preparowane,
sądy NS’a o nich.
Zbiór tekstów – korpus.
–8
Dane empiryczne
Korpusy tekstów
Dziś – bardzo wiele korpusów na nośniku informacji.
Na przykład:
http://korpus.pwn.pl/
http://korpus.pl/
PELCRA
LOB Corpus (Lancaster—Oslo/Bergen) 1971-
1978
BNC (British National Corpus)
.....
–9
Korpusy
–10
Korpusy
Korpus PWN
–11
Korpus PWN
Korpusy
–12
Korpus PWN
Korpusy
Korpus PWN
–13
–PELCRA ‘Polish-English
Language Corpora for
Research and Application’
(Uniwersytet Łódzki)
Korpusy
–14
BNC
Korpusy
Tekst – wytwór NS’a: produkt kompetencji
językowej.
„Po rzeczach ich poznacie je”
(Ewangelia).
Rozróżnienie langue – parole (F. de
Saussure)
mowa – mówienie
system – tekst
–15
Tekst
System:
jeden jedyny
abstrakcyjny
zamknięty
pozaczasowy
Tekst:
jeden z bardzo wielu
konkretny
będący elementem zbioru otwartego
zlokalizowany w czasie i przestrzeni
linearny
–16
System a tekst
Teksty:
mówione
pisane
(śpiewane)
brajlowskie
e-mailowe
sms-owe
migowe (SJM)
.........
Reprezentują one
odmiany diakrytyczne
JN.
–17
Typologia tekstów
Dwu-(trój-)poziomowość znaku
Znak ma:
kształt (formę)
treść (funkcję)
Składniki kształtu znaku – cegiełki
asemantyczne:
diakryty
.
Hierarchia składników tekstu:
diakryty
znaki proste
znak złożone
–18
Poziomy znaku
Jan pije
od wczoraj
.
Znaki
Znak złożony: od + wczoraj
Znaki proste: od
wczoraj
Nieznaki
Diakryty:
o, d, w, c, z, o, r, a, j
–19
Znaki i diakryty
Diakryty
Diakryty języka naturalnego:
głoski, allofony, fonemy
litery, grafemy
„sześciopunkty”
.......
Ale także:
elementy składowe „cegiełek”: piksele,
krzywe, pociągnięcia pędzla,..., cechy
artykulacyjne lub akustyczne,...
–20
Znaki i diakryty
Jednostki tekstu reprezentują jednostki systemu.
JT –
okaz
(token), JS –
typ
(type).
Jakie JS są reprezentowane przez następujące JT:
mamami, MAMAMI, mamami
kot, kota, kotu
kupić, napisać, jeść
Kto przyszedł?, Umrzesz ty., Wszyscy tu
wczoraj rzygali.
–21
Okaz i typ
Empirysta
•
ogląda próbki (okazy)
•
widzi typy
•
opisuje typy
Procedury analityczne:
•
segmentacja
(= wyodrębnienie „najprostszych
składników”)
•
strukturyzacja
(= uchwycenie „konstrukcji”)
Główne techniki:
•
substytucja
•
hipotezy analogii
–22
Badanie empiryczne: podstawy
mamyczas, mamygotówkę,
mamydużodługów:
czas = gotówkę = dużodługów
śpimy, czytamy, jemy:
śpi = czyta = je
śpię, śpisz, śpi:
ę = sz =
Symbol =: równoważność dystrybucyjna
(swobodna wymienność).
Polowanie na opozycję...
–23
Substytucja
małego, nowego, drugiego: mał- =
now- = drugi-
dzieciśpią, wszyscyśpią,
czterykobietyśpią:
dzieci = wszyscy = czterykobiety
śpiiśpi, mamęiojca,
wczorajiprzedwczoraj:
ZDANIE + i + ZDANIE = RZECZOWNIK + i +
RZECZOWNIK = PRZYSŁÓWEK + i +
PRZYSŁÓWEK
–24
Hipoteza analogii
Jaświdziałwczorajżukazczarnymiskrzydełk
ami
wtedyśmystanęliwpoprzekjezdni
mójsynsięwszystkiegoboi
żydkarabinnosi
–25
Segmentacja
Jaś
widziałwczorajżukazczarnymiskrzydełkami
Bo:
On
widziałwczorajżukazczarnymiskrzydełkami
Jaś
umarł
Jaświdziałwczorajżukazczarnymi
skrzydełkami
Bo:
Jaświdziałwczorajżukazczarnymi
nóżkami
skrzydełkami = nóżkami
–26
Segmentacja
Jaświdział
wczoraj
żukazczarnymiskrzydełkami
Bo:
Jaświdział
przeddziesięciomadniami
żukazczarnymiskrzydełkami
wczoraj =
przeddziesięciomadniami
Substytucja udana!!!
–27
Segmentacja
Nie: Jaświdziałw
czorajżukazczarnymiskrzydełkami
Nie: Jaświdział
wczorajżuka
zczarnymiskrzydełkami
Nie:
Jaświdziałwczorajżukazczarnymiskrzy
deł
kami
–28
Segmentacja
wtedyśmy
stanęli
w poprzek
jezdni
-śmy... stanęli
(nieciągłość)
w poprzek
(całość)
mój syn
się
wszystkiego
boi
\---------------------------/
się... boi
(nieciągłość)
żydka rabin
nosi
czy
żyd karabin
nosi
–29
Segmentacja
Postulat: staramy się dzielić
„na dwa”
...
Technika
substytucji
.
Równoważność dystrybucyjna = swobodna
wymienność.
Polowanie na opozycję – szukanie minimalnych
różnic kształtu:
par minimalnych
.
–30
Segmentacja
•
Szukamy
różnic kształtu
.
•
Najmniejsza różnica:
a.
COŚ – NIC
.
b.
cecha a – cecha
nie-a
a.
Doniczka z pelargonią w oknie jako znak:
możesz wejść
.
Opozycja
DONICZKA :
–31
Szukanie opozycji
1.
Znaki zerowe
(puste):
Jaś- (bo: Jasia, Jasiowi, Jasiem,...)
czytał-- (bo: czytałem, czytało,
czytaliśmy,...)
Końcówki zerowe (puste)
umarł (bo: Jan umarł)
Podmiot domyślny
ale
nie: wczoraj- (miałem czas)
nie: że- (przyjdę, nie mówiłem)
nie: za- (domem jest sad)
–32
Kłopoty z parami minimalnymi
2.
Wariancja
(= „synomimia”)
Kształt1 Kształt2, ale Znaczenie1 =
Znaczenie2
(profesorz)y – (profesor)owie
(stoł)ów – (kosz)y – (szkół) – (kośc)i
(nauczy)ciel – (gr)acz – (piek)arz – (łow)ca
– (mont)er
taksówkarz – złotówa – taryfiarz
Masz czas? – Czy masz czas?
–33
Kłopoty z parami minimalnymi
Wariancja –
zabezpieczenie systemu
.
Problem: które różnice kształtu są
funkcjonalnie istotne (
= relewantne
)?
Nieistotne (nierelewantne):
profesorz- – profesor-; -owie – -y
-ciel – -acz – -arz – -ca – -er
Istotne (
relewantne
):
nauczy- – gr- – pie- – łow- – mont
-owie – ów – -om ...
–34
Kłopoty z parami minimalnymi
–35
=
Kłopoty z parami minimalnymi
3.
Neutralizacja
(= honomimia,
wieloznaczność, polisemia)
Kształt1 = Kształt2, ale Znaczenie1 Znaczenie2
dziewczyny: dop, poj – mian, mno – bier, mno –
woł, mno od DZIEWCZYNA
mam: dop, mno od MAMA; 1os, poj, ter od MIEĆ;
2os, poj, roz od MAMIĆ
Strzeż kolegi ojca.: ojca (czyjego?) – kolegi
(czyjego?)
Neutralizacja opozycji –
defekt systemu
.
Wszystkie JN mają ten defekt!!!
–36
Kłopoty z parami minimalnymi
–37
Zepsuty semafor
Kłopoty z parami minimalnymi
Jaświdziałwczorajżukazczarnymiskrzydełkami
Jaś
widziałwczorajżukazczarnymiskrzydełkami
widziałwczoraj
żukazczarnymiskrzydełkami
widział
wczoraj
żuka
zczarnymiskrzydełkami
–38
Strukturyzacja
* Jaświdziałwczorajżuka
zczarnymiskrzydełkami
? widział
wczorajżukazczarnymiskrzydełkami
* żukaz
czarnymiskrzydełkami
* zczarnymi
skrzydełkami
* skrzydeł
kami
–39
Strukturyzacja
–40
Strukturyzacja
Z czego jest zrobiony (lub:
robi się
) tekst:
a.
z liter, głosek lub sylab,
DIAKRYTY
b.
z morfemów,
ZNAKI
c.
ze słów,
d.
z fraz,
e.
ze zdań,
f.
z wypowiedzeń?
–41
Jednostki elementarne
Nasi nowi fleciści, których wysłano na
urlop, powiedzieli swemu dyrygentowi, że
nie wrócą.
Ad a.: diakryty
Litery
n/a/s/i n/o/w/i f/l/e/c/i/ś/c/i k/t/ó/r/y/c/h
w/y/s/ł/a/n/o n/a u/r/l/o/p
–42
Jednostki elementarne
Głoski
n/a/ś/i/n/o/v’/i/f/l/e/ć/i/ś/ć/i/k/t/u/r/
y//v/y/s/u,/a/n/o/n/a/u,/u/r/l/o/p...
Sylaby
na/śi/no/v’i/fle/ći/śći/ktu/ry
/vy/su,a/no/na/u,ur/lop...
Tekstu nie robi się z diakrytów!!!
Opis diakrytów nie należy do
gramatyki.
–43
Jednostki elementarne
Ad b.-f.: znaki
Morfemy
nas/i now/i flec/iśc/i któr/ych wy/sła/no na
urlop/
powiedzie/l/i/
sw/emu
dyryg/ent/ow/i że nie wróc/ą
Słowa
Nasi nowi fleciści, których wysłano na
urlop, powiedzieli swemu dyrygentowi, że
nie wrócą.
–44
Jednostki elementarne
Frazy
a.
o
nasi nowi fleciści, których wysłano na
urlop,
o
powiedzieli
o
swemu dyrygentowi
o
, że nie wrócą
b.
o
nasi nowi fleciści
o
, których wysłano na urlop
–45
Jednostki elementarne
o
nasi
o
nowi fleciści
o
nowi
o
fleciści
o
których
o
wysłano
o
na urlop
o
na
o
urlop
o
swemu
o
dyrygentowi
–46
Jednostki elementarne
Zdania
nasi nowi fleciści, których wysłano na
urlop, powiedzieli swemu dyrygentowi, że
nie wrócą
, których wysłano na urlop
, że nie wrócą
–47
Jednostki elementarne
Konstrukcje
Znak złożony to
konstrukcja
.
Podstawowy problem:
łączliwość
.
Dwa typy konstrukcji:
- konstrukcje morfologiczne,
- konstrukcje składniowe.
Gramatyka JN „typu polszczyzny”:
- morfologia,
- składnia.
–48
Znaki złożone
Tematy:
fleciśc-
wysła-
SŁOWOTWÓRSTWO
dyrygent-
Formy wyrazowe:
nasi
fleciści
których
FLEKSJA
wysłano
urlop
–49
Morfologia
Frazy:
SKŁADNIA
o
nasi nowi fleciści, których wysłano na
urlop,
o
nasi nowi fleciści
o
nowi fleciści
Zdania:
SKŁADNIA
o
nasi nowi fleciści, których wysłano na
urlop, powiedzieli swemu dyrygentowi, że
nie wrócą
o
których wysłano na urlop
o
że nie wrócą
–50
Składnia
1.
Językoznawca opisuje kompetencję językową
NS’a, czyli buduje model JN.
2.
Opis JN to jego gramatyka.
3.
Dane empiryczne: korpus tekstów.
4.
Znaki mają trzy poziomy struktury: [diakryt –]
znak prosty – znak złożony.
5.
Poziomy abstrakcji: okazy i typy.
6.
Rozbieżności między kształtem a znaczeniem:
wariancja i neutralizacja.
7.
Dwa typy konstrukcji (czyli: znaków złożonych):
konstrukcje morfologiczne i konstrukcje
składniowe.
8.
Gramatyka języka polskiego obejmuje
morfologię i składnię.
–51
Podsumowanie