158 M. W, Arapow Ml
nimabue różni się od częstości wyrazu o tej randze (przytoczony wyżej stosunek jest oczywiście w praktyce złym sposobem określania wartości parametru y, chociażby dlatego że n może nie być jednoznacznie określony w tekście realnym, ale pozwala oszacować wstępnie wartość parametru y). Otrzymane w różny sposób wartości y należy zestawić. Kryterium idealności będzie bliskość ocen parametru y, otrzymanych różnymi sposobami, lub co najmniej brak wyraźnej tendencji zmiany y przy przechodzeniu od leksyki o wysokiej częstości do leksyki o małej częstości.
Spójrzmy, jak wyglądają w konkretnym tekście stosunki otrzymane drogą teoretyczną. Jako przykładem posłużmy się strukturą tekstu Mądremu biada według wyników otrzymanych przez Kunickiego /15/ (zob. tabela 1). Tekst Gribojedowa (bez didaskaliów, spisu osób itd.) zawiera N= 3343 różnych wyrazów przy długości całkowitej L tekstu wynoszącej 13 246 użyć wyrazów. Rozwiązując równanie (7') i przyjmując X <= L,
L-Ml (&-*-!)
1-y
otrzymujemy y = 0,93, z dokładnością do dwóch miejsc po przecinku8. Wychodząc od y = 0,93 można określić a = 38 i U — 40. W rzeczywistości n = 42, co zaś dotyczy punktu a, tj. granicy zbiorów A oraz P, to można ją określić zaledwie w przybliżeniu. Powinna ona znajdować się między n = 35 i n — 42 (kolejność klas jednostkowych jest naruszana przez kolejność klas 2).
jako równanie względem y przy n ^ a, tj. n ^ 38, wyliczamy pierwsze 36 wartości y (36, nie 38, ponieważ dalej następują trzy „zlepione” wartości częstości). Znajdują się one w ostatniej części wykresu (rys. 2), argumentem jest ranga.
/
/
Cii
Rys. 2. Wartości parametru w różnych częściach słownika komedii Gribojedowa Mądremu buida
Do wyliczenia y przy n > a korzystaliśmy ze wzoru, który pozwala określić udział d, wyrazów o częstości nie większej od i w słowniku danego tekstu (wzór ten łatwo wyprowadzić z (4*)):
Przy wartościach 0,80 < y < 1,20 można otrzymać właściwe przybliżenie, przyjmując Py ** Py-i = 0,651 (dokładne wartości (ly są przytoczone w /10/J.
6**