16 Statystyka
• Z drugiej tabeli możemy na przykład obliczyć, jaki procent wszystkich wyrazów w tekście polskim stanowią wyrazy, które mają mniej niż cztery litery:
■ 100% « 29%
ĆWICZENIE B. Oblicz, jaki procent wszystkich wyrazów w tekście niemieckim stanowią wyrazy, które mają mniej niż 4 litery.
• Na diagramie wyraźnie widać, że długich wyrazów (dłuższych niż dziewięć liter) jest więcej w tekście niemieckim, a wyrazów, które mają od 7 do 9 liter, jest znacznie więcej w tekście polskim niż w niemieckim.
ĆWICZENIE C. W której z czterech wymienionych kategorii wyrazów różnica między liczbą wyrazów niemieckich i polskich jest najmniejsza?
Zbadaliśmy niezbyt długie próbki tekstów. Nie możemy więc mieć pewności, że odkryte prawidłowości dotyczą całego języka. Okazuje się jednak, że gdybyśmy zanalizowali w podobny sposób wiele różnych tekstów w języku niemieckim i polskim, otrzymalibyśmy bardzo podobne wyniki.
Czasami zebranie wszystkich danych na interesujący nas temat nie jest możliwe. W takich wypadkach statystycy zbierają tylko część danych, dobrze reprezentującą badane zjawisko (tzw. próbkę reprezentatywną), i na jej podstawie wyciągają wnioski.
Na przykład, Centrum Badania Opinii Społecznej (CBOS), badając oglądalność jakiegoś programu telewizyjnego, nie przepytuje wszystkich telewidzów. Wybierana jest pewna grupa osób (około 1000) w różnym wieku, różnej płci, o różnym wykształceniu i miejscu zamieszkania. Wyniki otrzymane w ten sposób pozwalają wyciągać wnioski dotyczące wszystkich telewidzów.
_Z HISTORII-
Dla sprawdzenia, czy wzrost dorosłego człowieka nie zmienia się, mierzono przez wiele dni — rano oraz wieczorem — wzrost kilkuset osób. Okazało się, że wyniki porannego mierzenia są przeciętnie o 2 cm większe od wyników pomiaru wieczornego. Oznacza to, że ludzie w ciągu dnia kurczą się nieco, a nocą trochę rosną.
I Oto dwa przykłady zastosowania metod statystycz-j nych. W 1985 roku odnaleziono w Anglii wiersz, I który stylem bardzo przypominał wiersze Szekspira. / Aby sprawdzić, czy autorem rzeczywiście był Szekspir, użyto metod statystycznych. Porównano częstotliwość występowania poszczególnych wyrazów w utworach Szekspira i w utworach innych, współ-] czesnych mu autorów oraz w badanym wierszu. Po ( dość skomplikowanej analizie uznano, że odnale-) ziony wiersz może być uznany za dzieło Szekspira.