148 M. W. Arapow m
był zamknięty i energia swobodnie „wciekałaby" i „wyciekałaby” w czasie porównywalnym z okresem drgań wahadła, to otrzymanie jakiegokolwiek prostego opisu jego zachowania się byłoby trudne.
Analogia ta jest dla nas bardzo cenna co najmniej z dwóch względów. Przede wszystkim dlatego, że prawo Zipią ma postać zbliżoną do prawa zachowania energii. Pokazuje ono, że dla każdego wyrazu w słowniku (analogia z każdym położeniem wahadła) zachowana jest pewna wielkość — iloczyn rangi i częstości danego wyrazu. (Prawo Zipfa można oczywiście przepisać w postaci sumy, czasem jest to nawet wygodne). Prawo to jest po prostu ładne, a ponadto można z niego wyprowadzić wiele ważnych wniosków (zajmiemy się tym w 2.). Nie jest w nim jednak powiedziane, gdzie jest ono spełniane, co jest dla niego odpowiednikiem systemu zamkniętego. U podstaw statystyki leksykalnej leży przypuszczenie, że takim systemem zamkniętym jest każdy dostatecznie długi fragment wypowiedzi. Jako system zamknięty można rozpatrywać tekst ciągły dużej wielkości, całość otrzymaną za pomocą wybrania z tego tekstu co drugiego słowa lub całość wybraną z tego tekstu za pomocą tabeli liczb losowych. Hipoteza ta jest równoznaczna z hipotezą jednorodności statystycznej wypowiedzi.
Mowę w ujęciu klasycznym można by porównać z idealnym gazem w termostacie, którego każda myślowo wyodrębniona część daje pełne wyobrażenie o całym gazie. Postulat jednorodności jest bardzo silny, co znacznie ułatwia badanie języka w aspekcie ilościowym. Wtedy pozostaje tylko wziąć gotowe modele matematyczne, które z powodzeniem były stosowane w naukach przyrodniczych. Można np. swobodnie przeprowadzać analogie z termodynamiką (na tych analogiach oparte są prace 15', ,6/ i wiele innych rozwijających te idee).
W rzeczywistości nie ma nic niewłaściwego w tym, że bierze się gotowy aparat i wykorzystuje odpowiednie analogie. Błędem jest to, że aparat ten stosuje się jako jedyny możliwy, nie określając granic jego stosowalności oraz zgodności z danymi empirycznymi. Znane są dość liczne fakty, świadczące o tym, że wy obrażenie o mow ie jako zespole jednorodnym jest co najmniej za ogólne. Można wspomnieć chociażby pracę M. TćSitelowej /7/, która pokazała, że różne sposoby wyboru prowadzą do różniących się w sposób istotny wyobrażeń o zawartości leksykalnej tekstu. Można też wskazać na wywołane przez praktyczną konieczność próby zwiększenia jednorodności kosztem rozczłonkowania całej wypowiedzi na szereg „podjęzyków”. związanych z poszczególnymi dziedzinami przedmiotowymi, itd.
Po zapoznaniu się z literaturą dotyczącą statystyki językoznawczej powstaje wrażenie, że niektórzy językoznawcy są przekonani, iż matematycy udowodnili, że mowa to stochastyczny proces ergodyczny. Oczywiście udowodnienie czegoś podobnego w sposób matematyczny jest po prostu rzeczą niemożliwą. Matematycy uważają jedynie, że taka hipoteza w sposób właściwy wyjaśnia jednorodność statystyczną wypowiedzi, którą jakoby intuicyjnie wyczuwają lingwiści. Jednak lingwistę na pewno zdumiałaby swą nienaturalnością hipoteza statystycznej jednorodności tekstu, gdyby zastanowił się nad nią, a nie traktował jej jako nieuniknionych zaklęć rytualnych, które poprzedzają zastosowanie tak niezwykle efekty w nych formuł matematycznych.