150
Struktura Ilościowa tekstu skończonego
1
Stosunek len analizujemy również jako równanie względem y. W tekście Mądremu Nada liczba wyrazów zarejestrowanych jeden raz wynosi 6, — 0,6219, co odpowiada wartości 0,96 < y < 0,97; d2 = 0,7792, co daje wartość y 0,94 itd. Wartości y otrzymane w ten sposób znajdują się w prawej części wykresu, argumentem jest częstość >.
Z wykresu wynika, że z wyjątkiem kilku punktów dla małych rang, gdzie y przyjmuje stosunkowo małe wartości (0,85-0,90), i jednego punktu maksymalnego dla dużych rang, gdzie y 0,98, wartości parametru y są zadziwiająco stabilne i w sposób niesystematyczny zmieniają się w przedziale 0,92-r0,97.
W ten sposób, podobnie jak tekst Mądremu biada, zostało zbadanych kilka tekstów, których struktura jest mniej lub bardziej zbliżona do struktury tekstu idealnego. Podstawowe dane dotyczące tych tekstów można znaleźć w tabeli 2. Kilkakrotnie większą liczbę tekstów zbadaliśmy m. in. po to, by sprawdzić, na ile można uogólniać wnioski (zob. 5.), które wysnuliśmy z analizy materiału podstawowego.
5. 1°. Wśród zanalizowanych tekstów nie ma takiego, który spełniałby prawo Zipfa całkiem dokładnie, ale też nie spodziewaliśmy się, że odkryjemy takie teksty. Rozpatrzone teksty nie ujawniają jednak wyraźnych systematycznych odchyleń od tego prawa. Odchylenia są różnie ukierunkowane i różne co do wielkości.
Tak więc np. w tekście Pieklą, Damy pikowej (chodzi o formy wyrazowe), Wiele hałasu o nic stwierdzamy pewien nadmiar wyrazów o niskiej częstości, w tekście Mądremu biada, Laudi — ich liczba jest bliska oczekiwanej, w pozostałych tekstach widoczny jest pew ien brak tych wyrazów (y rośnie pod koniec słownika). W tekście Damy pikowej przy analizie z punktu widzenia form wyrazowych zaobserwować można znaczny nadmiar leksyki o małej częstości, zaś przy analizie dotyczącej wyrazów obserwuje się pewien brak wyrazów o niskiej częstości.
Praw ie regułą jest mniejsza w porównaniu z oczekiwaną częstość pierwszych według rangi wyrazów. Jednakże odchylenie parametru od wielkości charakterystycznej dla rang średnich nie jest ani konieczne, ani równe co do wielkości. Odchylenia te wynoszą zaw sze 3—5 wyrazów, przy czym są to wyrazy pomocnicze, które wyodrębnia się w sposób nieścisły. Są wśród nich np. spójniki. Ustalono, że częstość użycia spójników jest odwrotnie proporcjonalna do częstości użycia znaków przestankowych, ale te ostatnie nie wchodzą w skład słownika /16/.
2°. Teksty idealne albo bliskie idealnych odznaczają się pewną rozpiętością wartości y, specyficzną dla każdego języka, tj. dla danego języka nie można wskazać celnej wartości y, którą wykorzystuje on do budowy tekstów. Wartości takiej nie można wskazać nawet dla oddzielnego tekstu. Można jednak wskazać „pasmo" wartości y, w którym mieści się większość wartości dla tekstów idealnych tego ję/.yka. Wniosek ten nie jest w pełni zweryfikowany, choć oparty na badaniach jd/.iesiątków tekstów każdego z języków wymienionych w tabeli 3.