gdzie: t) = lgdy dwa dowolne, lecz różne obiekty r i s (para) znajdują się w tej samej grupie C' partycji P, oraz w tej samej grupie C., drugiej partycji P2, albo też gdy para obiektów (r, s) znajduje się w różnych grupach zarówno partycji P,, jak i partycji P2;
t] m = 0 gdy para obiektów (r, $) należy do tej samej grupy jednej partycji i do różnych grup partycji drugiej.
Istnieją zatem trzy możliwe układy przynależności dla każdej zl Iparobiek tów rozdzielanego zbioru, przy czym dwa pierwsze znamionują zgodność (?/(i = 1), zaś trzeci niezgodność {rjn = 0). W takim układzie Z rjm oznacza liczbę par obiektów pierwszego typu, czyli rozmieszczonych zgodnie. Współczynnik Randa przyjmuje wartości z przedziału [0, 1], przy czym wartość 1 przyjmuje wówczas, gdy grupowania są identyczne, zaś wartość 0, gdy nie ma żadnych podobieństw między partycjami, tzn. partycje mają charakter przypadkowy.
Przydatność współczynnika Randa w odniesieniu do dwóch partycji zawierających taką samą liczbę skupień jest duża, niemniej umożliwia on też porównanie dwóch partycji o różnych liczbach skupień. Anderberg (1973) daje przykład dwóch następujących partycji:
Tablica 4.7. Porównywane partycje
Partycja P, |
Partycja P2 | |||
Grupa Cu |
Grupa Cu |
Grupa Cu |
Grupa Cu |
Grupa Cu |
4 |
1 |
4 |
1 |
2 |
6 |
2 |
6 |
3 |
7 |
9 |
3 |
8 |
5 |
11 |
10 |
5 |
10 |
9 |
12 |
11 |
7 |
14 |
13 | |
14 |
8 |
15 | ||
12 | ||||
13 | ||||
15 |
Efektem zliczania par, a jest ich
715\
2
= 105, ze względu na przynależności do
tej samej grupy (1) oraz do grup różnych (0) w porównywanych partycjach jest tablica asocjacji (zob. tablica 4.8). Mamy więc 4 jednostki, które należą do grupy C„ partycji P, i równocześnie do grupy C12 partycji P,, czyli 6 par; 5 jednostek nalc żących do Cn i równocześnie do Cn, czyli 10 par; oraz 3 jednostki należące do C j, i równocześnie do C,2, czyli 3 pary. Łącznie takich par należących do tej samej grupy w obu partycjach jest zatem 19.0 zgodności świadczy także przynależność pary jednostek do różnych grup w obu partycjach (0, 0). Doliczamy się takich
par 42 Mamy więc Z «|n =61 i wartość współczynnika Randa W kontekście tablicy asocjacji współczynnik Randa można zdchmowat ul (a + d) /(a + b+CTd).
Tablica 4.8. Tablica asocjacji przynależności par obiektów do grup w poro wny wanych partycjach - współ czynnik Randa
Partycja P} |
Partycja P. | |||
o | ||||
} |
32 | |||
1_o |
12 |
42 |
Nieco inne podejście do badania zgodności uporządkowań przedstawili w 1968 roku H Borko, DA. Blankenship i R.C Burkei (zob Anderberg \973; Polegało ono na analizie przy należność i do grup w porównywanych party c>ach pojedynczych obiektów, a nie ich par Klasyfikując obiekty podane w tablicy 4 7 ze względu na tę przynależność, otrzymujemy tablicę kontygencyina w wymia rach 2x3 (zob. tablica 4.9), jako podstawa do obliczenia średnie] kontyngen-cyjności kwadratowej <p7, statystyki chi-kwadrat lub inne] miary zależności. Koncepcja ta umożliwia łatwiejsze porównanie w przypadku licznego zbioru obiektów i wydaje się bardziej naturalna
Tablica 4.9. Tablica kontyngencyjna podobieństwa zaklasy fiko wan obiektów
Partycja P, |
Partycja P; | ||||
cu |
Cn _| | ||||
[_ |
4 | ||||
L Qi |
» ______] |
4.7. Grupowanie podziałowe 4.7.1. Idea grupowania podziałowego
Grupowanie podziałowe <ang partitioning) polega na podziale zbioru n obiektów na określoną liczbę K rozłącznych grup * skupień . tak ze każdy obiekt należy do jednej i tylko jednej grupy 1 aki podział na K grup określany jest mianem K -podziału (ang K-partition) Liczba K grup jest określana przez badacza, jakkolwiek analizę przeprowadza się zwykle dla różnych liczb K Określenie liczby grup staje się czasami częścią metody grupowania