Rysunek. 4.2. Dendrogram
C A S E Labę1 Num
■npni(tv aelomeracyine | ||||
0 |
5 |
10 15 |
20 |
25 |
+-------- |
- - + - - | |||
- + |
1 | |||
◄- |
metody podziałowe |
Na podstawie dendrogramu możemy ustalić kolejność łączenia (przeglądając go od lewej strony do prawej) lub podziału (przeglądając od prawej do lewej).
W praktycznych zastosowaniach metody aglomeracyjne są wykorzystywane o wiele częściej niż metody podziałowe. Znane algorytmy dla metod podziałowych są mniej ekonomiczne i bardziej czasochłonne w porównaniu z metodami aglomeracyjnymi, dlatego dalej będziemy zajmować się tylko tymi ostatnimi. Tutaj wspominamy jedynie, że do znanych metod podziałowych należy metoda J.C.Gowera (1967), opisana w pracy [Marek, 1989] oraz metody zaproponowane przez L.Huberta (1973) przedstawione np. w pracach [Kucharczyk. 1982], [Grabiński. 1992],
Istnieje wiele metod aglomeracyjnych i mogą one prowadzić do różnych rozwiązań (różnej kolejności łączenia podzbiorów) dla tego samego zbioru obiektów. Dla tej samej metody istnieje wiele algorytmów, które na ogół prowadzą do tego samego rozwiązania, ale różnią się szybkością realizacji (efektywnością), co ma znaczenie dla czasu obliczeń.
Punktem wyjścia dla wszystkich metod aglomeracyjnych jest informacja zawarta w macierzy odległości między obiektami:
D = \dn\ | , gdzie d(J = d{Oj, O j) jest odległo:;. tą obiektów O, i Oj. 4.2
Macierz odległości uzyskujemy po ustaleniu zmiennych diagnostycznych (położeniu obiektów w przestrzeni grupowania) i metryki przestrzeni (określeniu dy). Ponieważ ma cierz odległości jest symetryczna z zerami na głównej przekątnej, wymaga to prz