288
4 Anajiza skupi,.
i/\ to/ statystyki Ciowera
(4 114)
i jej odmiany w postaci ważonej sumy kwadratów101
(4.115)
które są miarami niezgodności (lub dopasowania) między macierzą odległości D a poziomami łączenia na dendrogramie.
Powyższe wskaźniki można uogólnić w formie metryki Minkowskiego
dla 0 < m < 1
max| drs — c
r. i
oraz
dla m = 0
Jardine i Sibson w roku 1968 zaproponowali serię względnych miar opartych ma metryce Minkowskiego, które można zapisać w następującej ogólnej postaci
m
gdzie 0< m < I Miary dopasowania według powyższej propozycji są niczym innym jak standaryzowanymi metrykami Minkowskiego, w których poprzez różniące się wartości m można różnicować wagi dużych lub małych różnic zarówno odległości, jak i wartości kofenetycznych (zob. Sneath i Sokal, 1973; Everitt, 1978). Wartości miar ó i óm =0 wskazują na dopasowanie doskonałe. Jardine i Sibson, objaśniając istotę miary, stosowali m — 1 / Z a więc analogicznie jak w przypadku znanego z zastosowań w niemetrycznym skalowaniu wielowymiarowym, a wprowadzonej w 1964 roku przez Kruskala mierze o nazwie STRESS (ang. standańzed residual sum of sąuare)
gdzie cn są elementami macierzy kofcnetycznej.
Wartości miary stress dla poszczególnych metod grupowania podano w ostatnim wierszu tablicy 4.6.
Zauważmy, że współczynnik korelacji kofcnetycznej i miary dopasowania 6 czy óm nie muszą dawać takiej samej oceny grupowania. Jeżeli bowiem założymy, że jakaś metoda grupowania hierarchicznego rozszerzyłaby proporcjonalnie
101 Pomysł na porównanie macierzy odległości (lub podobieństwa) przy użyciu tej miary jest przy pisywany J.A. Hartiganowi (1967 r.); zob. Anderberg (1973).