Aspekty ilościowe w języku -fonostatystka i fonotaktyka
(lingwistyka kwantytatywna)
kwantytatywny z łac. quantitativus `taki, który związany jest z liczbą przedmiotów; ilościowy'. Linwistyka kwantytatywna `językoznawstwo, w którym stosuje się metody ilościowe, statystyczne; lingwistyka statystyczna'. Antonimy: kwalitatywny, jakościowy
Fonostatystyka ustala częstość (frekwencję) występowania głosek lub fonemów w tekstach. Na podstawie danych ilościowych formułuje prawa ilościowe rządzące nimi. Można stwierdzić, iż statystyka jest jednym z kryteriów prawdy w językoznawstwie. Najdoskonalszym kryterium prawdy jest zaś bez wątpienia praktyka, która działa automatycznie, bez względu na to, czy teoretycy sobie tego życzą, czy nie.
frekwencja - jakiegoś elementu językowego jest to przeciętna częstość, z jaką dany element pojawia się w dowolnym tekście danego języka.
Ze względu na funkcję fonostatystyczną fonemy można podzielić na fonemy o randze wysokiej, średniej i niskiej.
[ranga - kolejny numer elementu językowego na liście porządkującej różne jednorodne elementy tekstu według odpowiadającej im częstości. Lista taka nosi nazwę listy rangowej. Element najczęstszy w tekście ma rangę nr 1.]
Fonotaktyka (grec. phone `głos, dźwięk' , taktikós `dotyczący porządkowania'
„Jest działem fonologii, którego przedmiotem jest analiza systemów fonologicznych w aspekcie ich syntagmatycznych właściwości. Celem fonotaktycznego opisu języka jest ustalenie zespołu ograniczeń dystrybucji (łączliwości) segmentów fonologicznych danego języka wyznaczających dopuszczalne w danym języku typy tekstowych struktur fonologicznych” (zob. Pawlik, 2005, s. 92).
[Z językoznawczego punktu widzenia można wyodrębnić zaburzenia mowy o charakterze suprasegmentalnym (zniesienie lub zniekształcenie określonych cech prozodycznych wypowiedzi, np. melodii, akcentu itp.) i zakłócenia o charakterze segmentalnym (dotyczą wadliwej wymowy poszczególnych głosek).
Zaburzenia suprasegmentalne i segmantalne są niezależne od siebie.
Zakłocenia segmentalne można podzielić na dwa podstawowe rodzaje:
- zaburzenia paradygmatyczne,
- i zaburzenia syntagmatyczne.
Pierwszy typ narusza w różny sposób inwentarz głosek lub fonemów, drugi zasady łączenia jednostek w większych strukturach, przede wszystkim w wyrazach. Zaburzenia syntagmatyczne można więc nazwać zaburzeniami struktury fonetycznej lub fonologicznej wyrazu (zob. Kania, 2001, s. 12)].
„W ramach fonologii wyodrębnia się fonotaktykę, która zajmuje się badaniem dopuszczalnych w języku ciągów głosek reprezentujących określone fonemy.” (D. Ostaszewska, J. Tambor, Podstawowe wiadomości z fonetyki i fonologii..., Katowice 1997, s.57)
„Przedmiotem badań fonotaktyki są najmniej dwuelementowe grupy jednostek fonetycznych (segmenty, głoski) lub fonologicznych (fonemy). Fonotaktyka zmierza do ustalenia reguł łączliwości jednostek elementarnych mowy lub języka, bada możliwości i ograniczenia w tworzeniu grup”(Rocławski, 1981)
Fonotaktyka - „Są to restrykcje dotyczące występowania pojedynczych fonemów (ograniczenia segmentalne) oraz zasady łączenia ciagów fonemów (ograniczenia sekwencyjne) w obrębie wyrazu, morfemu lub sylaby, które istnieją w danym języku. Oznacza to, że nie wszystkie głoski i fonemy oraz ich połączenia mogą pojawiać się w dowolnym kontekście, lecz że istnieją takie sytuacje, w których wiele z nich nie wystepuje.” (Szpyra-Kozłowska, 2002, s. 33-34)
- ograniczenia segmentalne mogą dotyczyć zarówno samogłosek, jak i spółgłosek, np.: *#y, *#ę, *#ą; *[d]#, *[z]#, *[v]#, *[g]#, *[b]#, *[ź]#, *[dz]#, *[dź]#;
- ograniczenia sekwencyjne mogą dotyczyć połączeń samych spółgłosek, samych samogłosek lub ciągów obu typów segmentów, np. grupy 2-spółgłoskowe, które nie występują w nagłosie wyrazów: *#j + spółgłoska (*#jr, *#jt, *#jb itd.);
*#mb, *#mp, *#mt, *#np, *#nb, *#nt, *#nd, *#pk, *#bg, *#tp, *#kk
- *właściwa dźwięczna + właściwa bezdźwięczna, np. *[zp], [*dp]…..,
- *właściwa bezdźwięczna + właściwa dźwięczna, np. *[tv],
- *[ly], *[źy], *[śy], *[ćy], *[dźy].
Język polski jest podawany jako przykład języka dopuszczającego wiele połączeń spółgłosek, które nie występują w innych językach, np.:
pstry, drgnąć, mdlić, kosmki, krnąbrny, państwo, sióstr, przestępstw, ptactw.
To właśnie takie przypadki sprawiają, iż język polski sprawia liczne problemy cudzoziemcom, którzy często nie potrafią wymówić ciągu kilku spółgłosek w jednym wyrazie. To nie pojedyncze dźwięki stanowią największy problem, ale ich skomplikowane połączenia.
Jeżeli przyjrzymy się istniejącym w danym języku wyrazom i morfemom, z łatwością stwierdzimy, że wykorzystują one tylko niewielki procent połączeń różnych fonemów. Oznacza to istnienie wielu luk - niewykorzystanych przez język ciągów segmentów. Są one dwojakiego rodzaju. Pierwsze z nich to tzw. luki przypadkowe - ciągi dopuszczalne przez ograniczenia fonotaktyczne danego języka, ale do tej pory w nim nieużywane. Są nimi np. nowe nazwy środka do czyszczenia dywanów, takie jak Dak, Plom czy Taz. Można je uznać za wyrazy potencjalne, które w przyszłości mogą stać się nazwami nowych produktów.
[Proszę zaproponować opartą na lukach przypadkowych nazwę dla nowych produktów: a/ czekoladek, b/ proszku do prania, c/ kaszki dla niemowląt. Proszę przedyskutować trafność tych propozycji.]
Inne przypadki to luki systemowe - ciągi pogwałcające ograniczenia fonotaktyczne języka. Nigdy nie mogą one stać się jego wyrazami, np. grnykpt, rboktn, mtnokf.
[Proszę wczuć się w rolę scenarzysty pracującego nad scenariuszem filmu scence-fiction, w którym przybysze z Kosmosu mają imiona niezgodne z polskimi zasadami fonologicznymi. Proszę zaproponować kilka takich imion.]
Fonotaktyka to dział fonologii zajmujący się budową ciągów fonemów w określonym języku. Fonotaktyka bada przede wszystkim możliwości występowania danego fonemu w określonym otoczeniu, czyli sumę jego pozycji wobec innych fonemów. Różnice fonotaktyczne, zachodzące pomiędzy dwoma językami, rodzą dodatkowe trudności przy opanowywaniu systemu fonicznego języka obcego. Prowadzi to do tzw. dewiacji fonotaktycznych, jak np. polska wymowa niemieckiej nazwy samochodu Wartburg *[varburk] zamiast [vartburk], ponieważ język polski nie posiada w śródgłosie grupy spółgłoskowej /rtb/. (A. Szulc, Słownik dydaktyki języków obcych).
Badania fonotaktyczne są żmudne i dlatego postęp był możliwy dopiero z chwilą włączenia komputerów do tego typu badań. Dotychczas najczęściej przedmiotem badań fonotaktycznych są grupy fonemowe, np. diady, triady, tetrady. Diady o wysokiej częstości są takie same we wszystkich odmianach stylistycznych. Istotne wahania rangi diady dla różnych odmian stylistycznych polszczyzny obserwujemy dopiero od pozycji 10.
Język nie wykorzystuje wszystkich połączeń fonemowych. W badanych przez B. Rocławskiego tekstach (433018 fonemów) wystąpiły 922 grupy dwufonemowe, co na teoretycznie możliwą liczbę 1521 (= 39 razy 39) połączeń stanowi 60,62%. Niewykorzystanie wszystkich połączeń charakterystyczne jest nie tylko dla języka polskiego. Takie jednak a nie inne połączenia lub brak takich a nie innych połączeń to właściwości systemów fonologicznych.
Poszczególne języki maja charakterystyczne dla siebie reguły łączliwości fonemów, nazywane regułami fonotaktycznymi. Oto kilka takich reguł rządzących polskim systemem fonologicznym:
1/ Nie ma spółgłoskowych fonemów dźwięcznych - innych niż fonemy sonorne na końcach wyrazów.
2. Nie ma grup dźwięcznościowo niejednorodnych.
3. Spółgłoski miękkie nie łączą się z [y].
4. Spółgłoski [k, g, l] nie łączą się w wyrazach rodzimych z sam. [y], ale takie połączenie może nastąpić w wyrazach pochodzenia obcego, jak np. kynologia
5. Grupy dwusamogłoskowe pojawiaja się zwłaszcza na granicy morfemów, np. zaobserwować, poobcierać, oraz w wyrazach pochodzenia obcego, np. kakao, oaza...
[zob. Breza E. (1991), Konsekwencje nietypowego połączenia samogłoska + samogłoska w języku polskim, Język Polski LXXI, s. 343-345]
„Nasza wiedza o funkcjonowaniu fonemów w języku polskim nie byłaby pełna, gdybyśmy nie poznali podstawowych informacji o frekwencji fonemów w tekstach mówionych i pisanych współczesnej polszczyzny oraz częstości grup fonemowych (zob. Rocławski, 1983, s. 226).” Nie można się z tym stwierdzeniem nie zgodzić. Informacje z zakresu fonostatystyki powinny być integralnie związane ze zdobywaną wiedzą z zakresu fonetyki i fonologii danego języka. To samo można zresztą powiedzieć o problemach dotyczących reguł łączliwości jednostek elementarnych mowy lub języka, czyli zagadnień dotyczących fonotaktyki. Wiedza z zakresu fonostatystyki i fonotaktyki ma bardzo wyraźny aspekt praktyczny. Jest bowiem rzeczą oczywistą, iż racjonalny dobór materiału językowego w terapii mowy, właściwym uszeregowaniu ćwiczeń ortofonicznych, ustaleniu optymalnej kolejności wprowadzania liter oznaczających poszczególne fonemy podczas nauki czytania i pisania w języku ojczystym oraz odpowiednie zaprogramowanie właściwych ćwiczeń podczas nauki języka obcego wymaga między innymi uwzględnienia frekwencji, z jaką dany element językowy pojawia się w tekstach konkretnego języka oraz wiedzy na temat dopuszczalnych w języku ciągów głosek reprezentujących określone fonemy.
W jakim stopniu zaś rzetelne badania statystyczne mogą wpłynąć na weryfikację pewnych uświęconych już tradycją „prawd”, pokazała w swoich badaniach M. Smoczyńska, która, analizując nieselektywne korpusy tekstowe siedmiorga dzieci w wieku do 5 lat (360000 słowoform), stwierdziła, iż „zaledwie 4,6% tych słowoform było utworzonych, bądź użytych niezgodnie z normą polskiego języka mówionego. Co więcej, tylko w najwcześniejszym okresie, do dwóch lat, udział procentowy form błędnych był stosunkowo wysoki (średnio 12,5%)” (Smoczyńska, 1997). Dane te upoważniły ją do podważenia zasadności wyodrębniania wśród różnych okresów rozwoju mowy dziecka okresu swoistej mowy dziecięcej, gdyż, jak zauważa Autorka, „nie jest ona tak swoista, jak sądził Kaczmarek”. Na podstawie przeprowadzonych badań M. Smoczyńska dochodzi do wniosku, że bez odpowiednich badań kwantytatywnych bardzo łatwo ulec złudzeniu percepcyjnemu, bowiem „wszelkie odchylenia, wszelkie formy niestandardowe dużo bardziej rzucają się w oczy niż to co poprawne, zwykłe, normalne (ibid.).”
Na ten fakt zwraca także uwagę J. Sambor, zdaniem której „badania statystyczne dostarczają często takich informacji o języku, których nie mogą ujawnić nawet bardzo dokładne analizy jakościowe” (Sambor, 1993). Z drugiej strony należy sobie także zdawać sprawę z faktu, że samą tylko frekwencją nie wyjaśnimy wszystkiego w języku. Zdarza się też, że aspekty ilościowe dotyczące jednej płaszczyzny języka mają wpływ na inny podsystem. Na przykład na przekształcenia fonetyczne istotny wpływ ma częstość występowania w tekście wyrazów i morfemów, a nie poszczególnych fonemów lub ich ciągów (zob. Dunaj, 1988).
Badania częstości występowania poszczególnych liter i ich połączeń w tekstach były w okresie międzywojennym prowadzone głównie w związku z kryptografią (gr. kryptos = ukryty 'pierwszy człon wyrazów złożonych oznaczający, że to, co nazywa drugi człon, jest ukryte, niewidoczne lub zamaskowane, np. kryptofaszysta, kryptoreklama itp.' pismo szyfrowane)
Polskie prace z zakresu fonostatystyki (i fonotaktyki) rozpoczęły się dopiero po wojnie.
Dawniej sądzono, że frekwencja fonemów w tekstach jest stała (zob. Guiraud, 1966, s.119; Zagadnienie i metody statystyki językoznawczej)
Ważnym czynnikiem różnicującym frekwencję jest przynależność tekstu do określonej odmiany stylistycznej języka. Częstość występowania fonemów jest więc uwarunkowana stylistycznie, a wyrazem tego uwarunkowania są wahania frekwencji. Wzrost frekwencji określonego fonemu musi wpłynąć na obniżenie frekwencji pozostałych fonemów lub tylko niektórych (wyjątkowo tylko jednego). Wysoka częstość niektórych fonemów uwarunkowana jest także ich obecnością w strukturze morfemów gramatycznych o wysokiej frekwencji.
W trakcie dotychczasowych badań fonostatystycznych odkryto istnienie fonemów „kluczy”, czyli zwiazku (korelacji) między przynależnością tekstu do określonej odmiany stylistycznej języka a rangą fonemu.
W języku polskim największą zmiennością pozycji na listach rangowych ustalonych dla tekstów należących do różnych odmian i pododmian stylistycznych języka charakteryzuje się fonem // . W tekstach odmiany artystycznej języka polskiego jest on na 10 pozycji, zaś w tekstach odmiany naukowej aż na 26. (Wysoka częstość występowania // w epice wiąże się p.w. z użyciem czasu przeszłego w utworze. Fonem // ze względu na wysoką częstość w tekstach języka pisanego artystycznego można nazwać „fonemem kluczem”.
Do tej nazwy mogą również pretendować fonemy o stosunkowo niskiej frekwencji w jakimś typie tekstów. Na przykład dla tekstów języka pisanego naukowego fonem // może być nazwany „fonemem kluczem” ze względu na niską (w stosunku do średniej częstości obliczonej dla wszystkich badanych odmian stylistycznych) częstość występowania. W tekstach języka naukowego również /ś/ pretenduje do miana „fonemu klucza” ze względu na niską częstość występowania.
Okazuje się, że półtora tysiąca słów stanowi liczbę niezbędną przy opanowywaniu jakiegokolwiek języka. Opanowanie takiego zasobu leksykalnego pozwala rozumieć ok. 80% tekstu potocznych rozmów prowadzonych w danym języku. (zob. Z. Kurzowa, H. Zgółkowa, Słownik minimum języka polskiego, Poznań 1992).
Autorzy podręczników przeznaczonych do nauki czytania i pisania na ogół nie uwzględniają parametrów fonostatystycznych przy doborze kolejności wprowadzania liter/fonemów. W przewodniku metodycznym do „Elementarza pierwszej klasy. Ele -mele” Maria Lorek, Eugenia Rostańskiej i Anna Kula wprowadzenie jako ostatniego dwuznaku `cz' motywują następująco: „Występuje on w wyrazie „czytam” i jest znakomitym uwieńczeniem nauki czytania.” (1994, s.35)
Glottodydaktycy wyraźnie podkreślają, iż „różnice fonotaktyczne, zachodzące pomiędzy dwoma językami, rodzą dodatkowe trudności przy opanowywaniu systemu fonicznego języka obcego. Prowadzi to do tzw. dewiacji fonotaktycznych [...]” (Szulc, 1994, s.69; zob. także: Sigurd, 1975, s.46)”