Częstość liter oraz połączeń literowych 505
(Jassem i lobocz
y///s///sv/////A- |
' -- / -04.C |
^156,6= |
' 168.2 |
>j5_5.5'ć: | |
! Rocławski ) | |||||
625 |
= 163.9 = |
>'157,4.7 | |||
(Stoften ) | |||||
67. ; |
= 166 = |
' 1 | |||
A |
B |
C |
D |
E |
F |
46.9
50.2
Rysunek 1. Względna stałość struktury inwentarza polskich fonemów w badanych tekstach Qassem, Łobacz, 1971; Rocławski, 1981; Steffen, 1957)
Struktura inwentarza fonemów jest względnie stała nie tylko w pisanej i mówionej odmianie polszczyzny, lecz także w różnych stylach języka. Nie jest to cecha wyłączna polszczyzny, podobnie jest w innych językach tndo-europejskich.
Probabilistyczna struktura języka jest ważna z punktu widzenia procesu komunikacji, decyduje bowiem o stopniu przewidywalności jednostek w tekście, a tym samym o możliwości rozumienia tekstów uszkodzonych, niepełnych itp. Do badania tej struktur)’ metodami ścisłymi niezbędna jest znajomość częstości nie tylko pojedynczych liter i fonemów, ale też ich sekwencji dwu-, trzy- i czteroelementowych.
Tabela 3 podaje początkowe fragmenty list rangowych częstości polskich liter i ciągów dwuliterowych (gdzie pauza jest także „literą”), opracowanych na podstawie dłuższego fragmentu (50 tysięcy liter) powieści Jerzego Andrzejewskiego Popiół i dutment (May, 1963).
Tabela 3. Najczęstsze litery w Popiele i diamencie Andrzejewskiego
10 najczęstszych liter |
5 najczęstsza |
;xh par liter | |||
litera |
częstości w %o |
litera |
częstości w %o |
para liter |
częstości W %0 |
|-—- |
140 |
z |
55 |
ie |
25 |
a |
78 |
P |
37 |
20 | |
i |
77 |
s |
37 |
ni |
19 |
$ |
64 |
IV |
37 |
i• |
16 |
o |
61 |
c |
36 |
•po- |
14 |