P1050312

P1050312



240    M. W. Ar*p»w

inułowanio, ic struktur* podlega prawu Zipffc. Problem len Jest Mmli nie tuulny. Niezwykłe może wydawać się samo u jęcie zagadnienia. ponieważ ję/\ko mm>. i"V dostrzegają lu w ogóle ładnego problemu. Sprawy' tę wyjaśnimy dopiero w p lvm barrl/iej że zagadnienie może siać się jasne dopiero po wyjaśnieniu, na czym p>'lega stosunek między wypowiadanym lu a tradycyjnym, prawdopodobieństwu wym punkiem widzenia na strukturę leksykalni) tekstu (/oh. I

Aby przejść do badania realnych teksldw. nie wystarczy samo /budowanie idealnego. :■ punktu widzenia struktury leksykalnej, modelu tekstu skończonego Nie wystarczy wiedzieć, jnk wygląda tekst spełniający prawo Zipią, Trzeba choćby w przybliżeniu wyobra/ić sobie, na czym polega alternatywa „prawidłowej organ i zacji". W 3. przeanalizujemy strukturę tekstu skończonego w przeciwieństwie do struktury sumy tekstów skończonych.

Po dokonaniu powyższej analizy w rozdz. W będziemy mogli przystąpić do przeglądu materiału eksperymentalnego i w rozdz. V sformułujemy wnioski

W tekście będziemy wyróżniać zbiór Aj, i ■ /. 2.... wszystkich użyć danego wyrazu .v,. Będzie nas interesowała moc zbioru Aj. którą będziemy nazy wać często ścią wyrazu \t, /'(Aj) lub F,. Sumę wyrazów danego tekstu będziemy nazywać słownikiem danego tekstu l‘ == {Aj}, liczbę wyrazów w słowniku (lub długość słownika) będziemy oznaczali A', l iczbę wszystkich wyrazów słownika I występujących w tekście, czyli długość tekstu, oznaczymy /.. Jest rzeczą oczywistą, że

N

l. ■= V F(x,) — v

*P’ w

Wprowadzimy jeszcze pojęcie grup wyrazów o danej częstości F. oznaczając liczbę wyrazów w takiej grupie mF.

W ten sposób właściwy m przedmiotem naszych rozważań będzie nic tekst i nawet nie słownik tego tekstu, lecz zbiór parametrów liczbowych: ogólna liczba wyrazów w danym tekście l, (długość tekstu), liczba różnych wyrazów jV (długość słownika), zbiór częstości F,, liczba mf wyrazów o danej częstości F. Poddaliśmy tekst jak gdyby „sublimacji", otrzymując w wyniku tego sumę liczb, którą będziemy nazywali strukturą leksykalną tekstu. Będzie ona stanowiła tę rzeczywistość wyjściową — przedmiot naszych badań.

Należy pamiętać, że tekst nic określa jednoznacznie struktury leksykalnej, lak np. autorzy konkordancji tekstu sturoungidskiego poematu BeowulJ'przy jednym rozumieniu terminu „wyraz" i jednym sposobie identyfikacji wyrazów stwierdzili, że długość poematu wynosi 17 306 wyrazów, a słownik składa się / 5512 różnych wyrazów. Przy innym określeniu terminu „wyraz" długość tego samego tekstu wynosi około 21 800 wyrazów, w tym 7265 różnych /3/. Jest to oczywiście przypadek szczególny, ponieważ w języku slaroangiclskim granica między grupą wyrazową u wyrazem jest trudna do uchwycenia. Okazuje się jednak, że nawet w dokładnie zbadanych językach współczesnych różnice przy określaniu długości tekstu i słownika mogą wynosić do kilku procent ich długości. Cli. Muller 4' przytacza wy niki trzech obliczeń odnoszących się do dramatu P. Corncillo’a FolyeucU.


Wyszukiwarka

Podobne podstrony:
P1050313 M. W. Arapow 146 iiiułowanie, że struktura podlega prawu Zipfa. Problem ten jest techniczni
Zdjęcie0164 2T"**5** «P**©W*. I roli KybułK %.20I0dhmrc tt) opis łlcksyjny (wskazać kategorie p
S6300476 W.*** •***>:,: <p» •w-SMj-fflr    Ir*#t ytjAfęam*    •
Obraz9 20 Rysunek 15 a - struktura z dyskretnymi układami zintegrowanymi Halla IC b
strona (16) §p
Zdjecie102 (2) ***r*row,M#* ^M
test1 2 I. Struktura IV rzędowa hemoglobiny: a ic ma znaczenia dla funkcjonowania tego białka b Jest
P1050322 fil] ____Struktura ifoSttowa tekstu skończonego    1,55 taka jest również id
P1050326 150 Struktura Ilościowa tekstu skończonego 1 Stosunek len analizujemy również jako równanie
14 Szkoła Podstawowa ar 14 ---—w Olsztynie SikohPodilswiiKALENDARZ ROKU SZKOLNEGO
DSC27 I*■TH >f •/> zi :^ -o~~ B Ąr^o, f f
scan0047 w nlćnPP, I Symbol lPĆ0~7- moc,A A 1A U—*—p. 2&5 /duX!oHi L< P iC~A^j j —
Przechwytywanie w trybie pełnoekranowym 07 20093132 Wstęp do nauki o komunikowaniu - Walery Pisare

więcej podobnych podstron