P1050331

P1050331



JERZY WORONCZAK (Wrocław)

O STATYSTYCZNYM OKREŚLENIU SPÓJNOŚCI TEKSTU

W opublikowanym w 1965 r. artykule pt. Metody obliczania wskaźników bogactwa słownikowego tekstów1 zająłem się szerzej dowodem, że wskaźniki określone formułą

(?)


.    = V/,(/,-!)-(/,-"»+?)    >2

Cm>0 " N(N— 1) ... (N-m+1) gdzie N oznacza długość próby liczoną w wyrazach, zaś/, frekwencje występujących w niej wyrazów różnych, są estymatorami nieobciążonymi miar różnorodności zaproponowanych przez I. J. Gooda.

(2)    cmfi = 2p"

i

gdzie p, oznaczają prawdopodobieństwa różnych wyrazów słownika. Innymi słowy,

0    ile tylko zostaną dotrzymane warunki losowego pobrania próby tekstu, którego ze względu na jego obszerność nie można przeanalizować w całości, długość próby będzie miała wpływ jedynie na dokładność oszacowania liczbowych właściwości całego tekstu, nie będzie natomiast niosła ze sobą żadnego systematycznego błędu oszacowania. Jeżeli próba będzie pochodzić z losowania niezależnego, to obliczone dla niej ze wzorów (1) wskaźniki będą estymatorami nieobciążonymi miar, które można by dla całego tekstu obliczyć ze wzorów (2), przy posłużeniu się zaś próbą uzyskaną z losowania bez zwracania będą one nieobciążonymi estymatorami wskaźników, jakie można obliczyć dla całego tekstu według wzorów (1). Ponieważ porównywanie cech liczbowych tekstów jest czystsze metodologicznie, jeśli również

1    całe teksty traktować jako próby, a obliczone dla nich wskaźniki jako estymatory, należy preferować pobieranie prób losowaniem bez zwracania, ze względu natomiast na szybko rosnące ze zwiększaniem m losowe wahania w oszacowaniu nie warto obliczać wskaźników dla m przekraczającego 3.

Wskaźniki, o których tu mowa, mają nader prostą interpretację: wyrażają one prawdopodobieństwo, że wyrazy wylosowane z tekstu czy też z jego próby w ni lo-

1 J- Woronczak, Metody obliczania wskaźników bogactwa słownikowego tekstów, [w zbiorze!: Poetyka > matematyka, Warszawa 1965, s. 145—163.


Wyszukiwarka

Podobne podstrony:
P1050334 107 O statystycznym określeniu spójności tekstu Rozwijając szerzej i uściślając tę ostatnią
P1050336 [■V O statystycznym określeniu spójności tekstu 160 Rys. 1. Zmiany wskaźników różnorod
P1050339 m O statystycznym określaniu spójności tekstu 171 Przejdźmy obecnie do prezentacji właściwe
P1050341 O statystycznym określeniu spójności tekstu [0] 173 obu utworów. Wyraźne rozbicie wykł
P1050337 170 Jerzy Woronczak[•] malncj długości tematycznie spójnych odcinków badanego tekstu. Odcin
P1050342 JERZY BARTMIŃSKI (Lublin) ORALNOŚĆ TEKSTU PIEŚNI LUDOWEJ W ŚWIETLE STATYSTYKI LEKSYKALNEJ 1
P1050332 106    Jerzy Woronczak    [2] sowa Iliach (dla wzor
P1050355 188 Jerzy Ilarlnmiśki [14] Wykres 5. Procent pokrycia tekstu przez r pierwszych najczę
P1050333 100 Jerzy Woronctak sowaniach (dla wzoru (I) — bez zwracania, dla (2) — niezależnych) będą
IMG?47 O inierteksiuatnoiii zespołu zagadnień, który określa się jako spójność tekstu — w ogólnym
img183 Podstawą wnioskowania statystycznego w teście Kołmogorowa-Smirnowa jest statystyka D określon
WSP J POLN238 301 Mechanizmy spójności tekstuMechanizmy spójności tekstu Kolejne zdania wypowiedzi z
WSP J POLN240 Mechanizmy spójności tekstu 303 w odbiorze. Ich interpretacja może się rozmijać z zami
WSP J POLN241a Mechanizmy spójności tekstu 305 cy, który w tej funkcji nazywany jest zaimkiem anafor
WSP J POLN25433716 680 - Indeks terminów i pojęć osobowość 479 palatalizacja 494 paradygmat) : spójn

więcej podobnych podstron