284
= {<
drogramie. które traktuje sit,' fako poziomy, na których jednostki pojawiają się po raz pierwszy w skupieniu Odwołując się do przykładu 4.3 (zob. punkt 4.6.2), można na podstawie zamieszczonego tam dendrogramu zapisać macierz poziomów łączenia C ,_Ł — U „ 1 zw aną macierzą dendrogramu lub też macierzą
kofenetyczną
0 |
2,75 |
3,50 |
4,17 |
3,18 |
3,18 |
2,751 |
2,75 |
0 |
3,50 |
4.17 |
3,18 |
3,18 |
2,17 |
3,50 |
3,50 |
0 |
4,17 |
3,50 |
3,50 |
3,50 |
4.17 |
4,17 |
4,17 |
0 |
4,17 |
4,17 |
4,17 |
3,18 |
3,18 |
3,50 |
4,17 |
0 |
2,51 |
3,18 |
3,18 |
3,18 |
3,50 |
4,17 |
2,51 |
0 |
3,18 |
2,75 |
2,17 |
3,50 |
4,17 |
3,18 |
3,18 |
0 |
Znaczy to, że elementami macierzy kofenetycznej są poziomy łączenia, na których para obiektów łączy się w tym samym skupieniu pierwszy raz. Spełniają one nierówność ultrametryczną cn <max(r„,cw). Jednym z możliwych spo sobow oceny dopasowania jest obliczenie współczynnika korelacji według momentu iloczynowego między odpowiadającymi sobie odległościami w obu macierzach D i Cw, który odpowiednio do nazwry macierzy nosi nazwę współczynnika korelacji kofenetycznej (ang. cophenetic correlation coefficient).
n(n— 1)
2
Xdn-c„- Zdn Sc,
r.> B B r.j B T.s T r< f r<s r< t
n( n — 1) ,
-- 2 dl
y
\rc,
n{n- 1) „ ,
Z cl
\
2 c.
gdzie sumowanie rozciąga się na wszystkie n(n — 1) / 2 par obiektów. Współczynnik można zapisać także w postaci
Z (dn-d)(cn-ć)
ni
(dn-dY- 2 (c„-ć)
Wysokie wartości współczynnika wskazują, że dendrogram daje dobre podsumowanie obserwowanych różnic między obiektami lub podobieństw obiektów. Współczynnik korelacji kofenetycznej był badany przy założeniu, żc grupowane obiekty stanowią próbę losową pochodzącą z populacji o wielowymiarowym
:b'c
W*
%
id
ól