151
Struktura Holciom tek.itu skończonego
Prawo Zipfa jest to funkcja ciągła4 i zbiór liczb całkowitych, jakim jest struktura leksykalna, bezpośrednio jej nie odpowiada. Pragnęlibyśmy zastąpić funkcję (1) funkcją skokową która będzie zachowywała: I) w jakiejś postaci charakter zmiany hiperboli; 2) specyficzną dla hiperboli relację między obszarem zadania a powierzchnią hiperboli, tj. relację między długością słownika a długością tekstu. Taką właśnie funkcję skokową będziemy przyporządkowywać strukturze leksykalnej.
Ale zanim opiszemy budowę wymaganej funkcji skokowej przedstawiającej hiperbolę (1), zobaczmy, na czym polega podobieństwo jakościowe struktury leksykalnej, spełniającej wymienione wyżej wymagania 1-3 i hiperboli (I). Jeżeli zanalizujemy wartości funkcji / w kilku kolejno wybranych punktach, odpowiadających całkowitym i niewielkim wartościom /», to zauważymy, że wartości te znacznie się różnią. Dlatego przy zaokrąglaniu do najbliższych liczb całkowitych nie będą się one pokrywać. Każdej z małych liczb będzie odpowiadać własna wartość częstości /„. Jeżeli jednak rozpatrywane punkty n będą rzędu i większe, to różnica między wartościami funkcji w dwóch kolejno wybranych punktach n, n+l, których wartości będą równe liczbom całkowitym, będzie mniejsza od 1 i przejście do części całkowitych doprowadzi do tego, że wartości te liczbowo pokryją się. Dlatego w dziedzinie rang dużej wielkości zestawiać należy nie wartości funkcji z wartością obserwowanej częstości, lecz liczbę wyrazów o jednakowej częstości z długością interwału na osi n, w którym wartości f„ różnią się mniej niż o jednostkę.
Przejdźmy obecnie do bardziej szczegółowego przedstawienia problemu, choć ciągle jeszcze dalekiego od formalnej ścisłości. Ponieważ interesuje nas ty lko zasadnicza strona zagadnienia, ograniczymy się dla uproszczenia do rozpatrzenia szczególnego przypadku prawa Zipfa, gdy parametr y = / (zob. /10/, gdzie ściśle analizujemy sytuację bardziej ogólną).
Rozpatrzmy hiperbolę
/-=»° ® zadaną na odcinku [/, N]. Parametr a wybierzmy tak, żeby
gdzie /J odpowiada minimalnej wartości funkcji (2) na odcinku [/, A]. Porównując wartość/„ w punktach, których współrzędne są liczbami całkowitymi n — 1,2, widzimy, że dziedzina definicji (2) dzieli się na 2 części: na odcinku [/, </] różnica L-U,>U a na odcinku [o, 2V] ta sama różnica jest < 1. Łatwo zauważyć, żo
* Przyczyny, dla których wolimy korzystać z prawa Zipią w formie (I). bez tzw. poprawki Mandclbrola, sit rozpatrywane w naszej pracy /9/.