P3310046

P3310046



288


4 Anajiza skupi,.


i/\ to/ statystyki Ciowera


(4 114)


i jej odmiany w postaci ważonej sumy kwadratów101

(4.115)


WSK= £ wn(d„ -cj1

które są miarami niezgodności (lub dopasowania) między macierzą odległości D a poziomami łączenia na dendrogramie.

Powyższe wskaźniki można uogólnić w formie metryki Minkowskiego

dla 0 < m < 1

max| drs — c

r. i


(4.116)

oraz


dla m = 0


(4.117)


Jardine i Sibson w roku 1968 zaproponowali serię względnych miar opartych ma metryce Minkowskiego, które można zapisać w następującej ogólnej postaci

<5


m


(4.118)


gdzie 0< m < I Miary dopasowania według powyższej propozycji są niczym innym jak standaryzowanymi metrykami Minkowskiego, w których poprzez różniące się wartości m można różnicować wagi dużych lub małych różnic zarówno odległości, jak i wartości kofenetycznych (zob. Sneath i Sokal, 1973; Everitt, 1978). Wartości miar ó i óm =0 wskazują na dopasowanie doskonałe. Jardine i Sibson, objaśniając istotę miary, stosowali m — 1 / Z a więc analogicznie jak w przypadku znanego z zastosowań w niemetrycznym skalowaniu wielowymiarowym, a wprowadzonej w 1964 roku przez Kruskala mierze o nazwie STRESS (ang. standańzed residual sum of sąuare)


gdzie cn są elementami macierzy kofcnetycznej.

Wartości miary stress dla poszczególnych metod grupowania podano w ostatnim wierszu tablicy 4.6.

Zauważmy, że współczynnik korelacji kofcnetycznej i miary dopasowania 6 czy óm nie muszą dawać takiej samej oceny grupowania. Jeżeli bowiem założymy, że jakaś metoda grupowania hierarchicznego rozszerzyłaby proporcjonalnie

101 Pomysł na porównanie macierzy odległości (lub podobieństwa) przy użyciu tej miary jest przy pisywany J.A. Hartiganowi (1967 r.); zob. Anderberg (1973).


Wyszukiwarka

Podobne podstrony:
P3310046 288 4 Anajiza skupi,. i/ to/ statystyki Ciowera (4 114) i jej odmiany w postaci ważonej sum
P3310046 288 4 Anajiza skupi,. i/ to/ statystyki Ciowera (4 114) i jej odmiany w postaci ważonej sum
88763 P3200180 czy tez statystyki Gowera (4.114) (4.115) G= Z(dn-ca)2 i jej odmiany w postaci ważone
288 ARTYKUŁY Zaowocowało to serią projektów konwersji całości katalogów, co ma prowadzić do realizac
P5280978 260    _ "1"» w2u«wut my»l podobnie, pisząc, n jest to statystyczn
P5280978 (2) !W U ART A MAUKA-OAT myśl podobnie, pisząc, u jest to statystyczne lub Uoidm opisywar..
288 ARTYKUŁY Zaowocowało to serią projektów konwersji całości katalogów, co ma prowadzić do realizac
Dane wtórne - dane pierwotne • Dane wtórne-to statystyki nie gromadzone dla danego studium, lecz dla
14 K. 1 OTKAŃSKI. (288] wien. On to mając za sobą mieszczan niemieckich, chwycił za broń i połączył
Jak jest definicja statystyki t-studenta i przy jakich założeniach można ją stosować. Jest to statys
CO TO JEST ENERGETYKA? Aby powstała energia w postaci ciepła lub prądu musi nastąpić proces
Michał Wicinski, Aleksander Marciniak w poprzek błony to: wielkość cząsteczki oraz jej ładunek, grad

więcej podobnych podstron