Statystyka leksykalna i słowniki elektroniczne.
Statystyka leksykalna- dział językoznawstwa statystycznego zajmujący się badaniem zależności występowania słownictwa.
lingwistyka kwantytatywna- dział językoznawstwa, w którym stosuje się metody ilościowe, statystyczne.
Podstawowe prawa statystyki
- Gilbert Zipf opisał zależności między częstością wyrazów, a ich rangą, długością i liczbą znaczeń. Wykazał, że wraz ze wzrostem częstości rośnie średnia liczba znaczeń wyrazów. Odkrył także zależność nazywana prawem Kyrłowa, mówiącą o strukturze wyrazów jedno i wielo znacznych. Wykazuję, że 1 znaczenie wyrazu podane w słowniku używane jest w 50% przypadków, drugie -25% natomiast 3 w 12%.
Liczebność słownictwa w języku i słownikach
Słownik języka polskiego pod red. Witolda Doroszewskiego liczy 11 tomów, ok. 130 000 jednostek.
Nie można określić ile wyrazów liczy język polski, to zależy od zakresu jaki obejmuję dany słownik.
Częstość wyrazu i sfery leksyki
Frekwencja- częstość występowania wyrazu, czyli liczba jego użyć w tekście o określonej długości. Dysponujemy słownikiem frekwencyjnym polszczyzny współczesnej (1990), a także dwoma słownikami podającymi częstość wyrazu w języku mówionym dzieci i dorosłych.
Najczęściej używane- spójniki (i, że) przyimki (na, w) czasowniki (być, mieć) przymiotniki (inny, nasz) Przysłówek (bardzo).
Najrzadziej używane- neologizmy lub wyrazy wychodzące z użycia.
F- wskaźnik frekwencji
D- wskaźnik dyspersji, czyli rozkładu częstości wyrazu w badanych stylach.
Założenie: 0<lub= D <lub= 100
Strefy leksyki:
- słownictwo gramatyczne D>lub=80,
- słownictwo podstawowe D>lub=50,
- słownictwo charakterystyczne F>lub=10 oraz D<lub=50,
- słownictwo rzadkie F<lub=5.
Wyrazy tematyczne i wyrazy klucze wg. Pierre Guiraud.
wyrazy tematyczne- wyrazy niegramatyczne, które mają najwyższe częstości w tekstach danego autora lub stylu, np. pieśń ludowa- las, płacz, dziewczyna, koń.
Wyrazy klucze- zawierają się w wyrazach tematycznych, są charakterystyczne dla danego autora, stylu, epoki, np. U słowackiego kochanka to anioł, dziewica, róża, gwiazda.
Słowniki elektroniczne
Przewyższają nad książkowymi, są łatwiejsze w obsłudze. Każdy edytor tekstu jest wyposażony w słownik elektroniczny.