168 |
1 |
Wortmczak |
;v:________ - iii |
Dla porównania podaję tego samego rodzaju dane |
uzyskane dla odcinków | ||
różnej długości z partii |
Sprzysifienia S. |
Kisielewskiego1, |
obejmującej 8192 wyrazy: |
Długość |
średnia ilość |
Średnie wskaźniki różnorodności | |
odcinka |
wyrazów różnych |
Gooda | |
N |
W |
Ca.o |
CSo |
4 |
3,97 |
0,00537 |
0 |
6 |
3,89 |
0,00718 |
0.000110 |
8 |
7,79 |
0,00795 |
0,000174 |
16 |
15,03 |
0,00902 |
0,000237 |
32 |
28,50 |
0,00918 |
0,000284 |
64 |
52,73 |
0,00880 |
0,000255 |
128 |
95,56 |
0,00822 |
0,000220 |
236 |
170,38 |
0,00790 |
0,000208 |
312 |
300,88 |
0,00753 |
0.000200 |
1024 |
529,50 |
0,00718 |
0,000182 |
2048 |
911,00 |
0,00696 |
0,000173 |
4096 |
1547,50 |
0,00679 |
0,000171 |
8192 |
2553,00 |
0,00661 |
0,000163 |
Wskaźniki różnorodności dla obu tekstów przedstawiono również na rysunku 1. Widać tu wyraźnie, jak rażące są różnice między krzywymi opisującymi właściwości statystyczne tych dwu utworów. Podczas gdy dla Kisielewskiego krzywa zmian wskaźników ma typowy kształt podkowy (omówiony na poprzednich stronach), dla Lecą przybiera ona postać zbliżoną do zwierciadlanego odbicia litery L z załamaniem przy N = 8. Przebieg krzywej dla Myśli nieuczesanych da się podzielić na trzy części:
a) N — 2, 4, 8;
b) N = 16, 32, 64;
c) N= 128, 256, 512, 1024, 1856.
W części a wskaźnik c10 rośnie ze wzrostem N, osiągając maksimum (dla całego wykresu) przy N = 8, a więc dla całych 8-wyrazowych „myśli”. Zmiany te przebiegają normalnie, przy czym wartości wskaźnika mówią o większej różnorodności słownictwa Lecą niż Kisielewskiego, na co wskazuje też utrzymująca się w tej części zerowa wartość wskaźnika c30, informująca, że w żadnej z 8-wyrazowych „myśli” żaden wyraz nie występuje trzykrotnie i częściej.
Część b krzywej dla Lecą stanowi ze swym powolnym spadkiem wskaźnika c2f0 i szybkim wzrostem ć3 0 przejście od wartości wskaźników uwarunkowanych rzeczywistymi kontekstami do rozpoczynającego się już od IV = 128 obszaru ustabilizowanych wartości wskaźników, czyli do części c.
Stabilizacja wskaźników w części c wiąże się z brakiem związku kontekstowego między łączonymi tu w obszerniejsze pseudokonteksty „myślami” i jest bardzo wyraźna. Jeśli dla Lecą obliczymy dla wartości wskaźników odpowiadających N — 128, 256, 512 i 1024 iloraz uzyskany z podzielenia rozstępu (różnicy między najwyższą a najniższą wartością) przez wartość średnią, okaże się, że dla c} 0 wynosi
* S. Kisielewski, Sprzyslężente, Warszawa 1947.