196 Jerzy Barimlńskl [22]
Wykres 7. Stopień zgodności haseł w kolejnych partiach list rangowych mierzony w procentach
(zob. tab. 7)
%
0 12 3 4 5 6
Filiację możemy też w przybliżeniu oszacować opierając się na całych słownikach S, R i P. Wynik ogólny jest następujący. Słowniki S i P mają haseł wspólnych 497, R i PP — 564, S i R — 1471. Proste obliczenia procentu haseł zgodnych, jak to zrobiliśmy wyżej, tym razem nie dadzą się zastosować, ponieważ słowniki S, R, P mają różną długość. Użyjmy więc do mierzenia stopnia zgodności (C) haseł w porównywanych zbiorach łatwego do stosowania i interpretacji wzoru, stanowiącego modyfikację formuły używanej przez J. Mistrika dla obliczania dyskrepancji30:
_ L^Lj+Lj)
gdzie Lx = liczba haseł zgodnych, L, — liczba haseł zbioru pierwszego, L2 = liczba haseł zbioru drugiego.
Otrzymujemy dla relacji S—P wskaźnik C równy 0,30, dla relacji S—R wskaźnik C — 0,88, dla relacji R—P wskaźnik C — 0,37.
Interpretacja uzyskanych wskaźników jest podobna jak przy danych procentowych, gdyż C waha się od 0 (w przypadku całkowitej dysjunkcji zbiorów Z., i L2) do 1 <w przypadku pokrywania się elementów obu zbiorów). Najsilniej zbliżone są do siebie słowniki S i R, z obu zaś pieśniowych do słownika prozy bardziej się zbliża R (wskaźnik C jest większy) niż S. Zgodność słownictwa jest jednak różna w poszczególnych klasach gramatycznych, co za pomocą podanego wzoru możemy obliczyć dość dokładnie:
Tabela 8. Wartość |
wskaźnika |
C dla różnych |
części mowy |
S-R |
S-P |
R-P | |
rzeczownik |
0,87 |
0,25 |
0,27 |
czasownik |
0,89 |
0,32 |
0,35 |
przymiotnik |
0,86 |
0,22 |
0,24 |
30 Wzór Mistrika (Z kvaiitltallvneho yfskunui..., s. 242) ma posłań: O — -------