240 M. W. Ar*p»w
inułowanio, ic struktur* podlega prawu Zipffc. Problem len Jest Mmli nie tuulny. Niezwykłe może wydawać się samo u jęcie zagadnienia. ponieważ ję/\ko mm>. i"V dostrzegają lu w ogóle ładnego problemu. Sprawy' tę wyjaśnimy dopiero w p lvm barrl/iej że zagadnienie może siać się jasne dopiero po wyjaśnieniu, na czym p>'lega stosunek między wypowiadanym lu a tradycyjnym, prawdopodobieństwu wym punkiem widzenia na strukturę leksykalni) tekstu (/oh. I
Aby przejść do badania realnych teksldw. nie wystarczy samo /budowanie idealnego. :■ punktu widzenia struktury leksykalnej, modelu tekstu skończonego Nie wystarczy wiedzieć, jnk wygląda tekst spełniający prawo Zipią, Trzeba choćby w przybliżeniu wyobra/ić sobie, na czym polega alternatywa „prawidłowej organ i zacji". W 3. przeanalizujemy strukturę tekstu skończonego w przeciwieństwie do struktury sumy tekstów skończonych.
Po dokonaniu powyższej analizy w rozdz. W będziemy mogli przystąpić do przeglądu materiału eksperymentalnego i w rozdz. V sformułujemy wnioski
W tekście będziemy wyróżniać zbiór Aj, i ■ /. 2.... wszystkich użyć danego wyrazu .v,. Będzie nas interesowała moc zbioru Aj. którą będziemy nazy wać często ścią wyrazu \t, /'(Aj) lub F,. Sumę wyrazów danego tekstu będziemy nazywać słownikiem danego tekstu l‘ == {Aj}, liczbę wyrazów w słowniku (lub długość słownika) będziemy oznaczali A', l iczbę wszystkich wyrazów słownika I występujących w tekście, czyli długość tekstu, oznaczymy /.. Jest rzeczą oczywistą, że
N
l. ■= V F(x,) — v
*P’ w
Wprowadzimy jeszcze pojęcie grup wyrazów o danej częstości F. oznaczając liczbę wyrazów w takiej grupie mF.
W ten sposób właściwy m przedmiotem naszych rozważań będzie nic tekst i nawet nie słownik tego tekstu, lecz zbiór parametrów liczbowych: ogólna liczba wyrazów w danym tekście l, (długość tekstu), liczba różnych wyrazów jV (długość słownika), zbiór częstości F,, liczba mf wyrazów o danej częstości F. Poddaliśmy tekst jak gdyby „sublimacji", otrzymując w wyniku tego sumę liczb, którą będziemy nazywali strukturą leksykalną tekstu. Będzie ona stanowiła tę rzeczywistość wyjściową — przedmiot naszych badań.
Należy pamiętać, że tekst nic określa jednoznacznie struktury leksykalnej, lak np. autorzy konkordancji tekstu sturoungidskiego poematu BeowulJ'przy jednym rozumieniu terminu „wyraz" i jednym sposobie identyfikacji wyrazów stwierdzili, że długość poematu wynosi 17 306 wyrazów, a słownik składa się / 5512 różnych wyrazów. Przy innym określeniu terminu „wyraz" długość tego samego tekstu wynosi około 21 800 wyrazów, w tym 7265 różnych /3/. Jest to oczywiście przypadek szczególny, ponieważ w języku slaroangiclskim granica między grupą wyrazową u wyrazem jest trudna do uchwycenia. Okazuje się jednak, że nawet w dokładnie zbadanych językach współczesnych różnice przy określaniu długości tekstu i słownika mogą wynosić do kilku procent ich długości. Cli. Muller 4' przytacza wy niki trzech obliczeń odnoszących się do dramatu P. Corncillo’a FolyeucU.