P3200170

P3200170



Mk---------------------1^25^L^5$

liczanie odległości między obiektami i a nowo utworzonym skupieniem p wedłu odległości większej (zob. rysunek 4.7).

Rysunek 4.7. Zasada ustalania odległości w metodzie najdalszego sąsiada


Formalnie rzecz ujmując, w metodzie najdalszego sąsiada elementy macierzy odległości przekształca się sukcesywnie zgodnie z kryterium

(4.95)


d- = max(d^ ,du) zaś algorytm przeliczania odległości ma postać


(4.96)

Z wyjątkiem innej zasady przeliczania odległości między grupami, procedura postępowania jest tu analogiczna jak w poprzedniej metodzie, gdyż wynika z samej istoty grupowania hierarchicznego. A więc w każdym kolejnym kroku łączone są dwa obiekty bezwzględnie najbliższe, choć odległość jest ustalana według obiektu najdalszego w danym skupieniu. Jest to zatem procedura, która jest nastawiona na minimalizację największych międzygrupowych odległości (zob. rysunek 4.8).

O \


Rysunek 4.8. Odległość między skupieniami w metodzie najdalszego sąsiada

W przeciwieństwie do metody najbliższego sąsiada metoda najdalszego sąsiada skupia się na wewnętrznej spójności grup. Wykazuje ona tendencję do znajdowania grup spójnych, tworząc czasami kilka równoległych małych skupień. Obie metody, najbliższego i najdalszego sąsiada, ukierunkowane są na inne cele i zastosowane do tego samego zbioru danych dają zwykle znacznie różniące się re-

zultaly. Obie strategie są jednak czułe na występowanie jednostek oddalonych*" W przeciwieństwie do metody najbliższego sąsiada metoda najdalszego sąsiada wydłuża odległości (ang. spocę-dilaling) Obie metody, najbliższego sąsiada i naj dalszego sąsiada, są obecnie stosowane rzadko, ze względu na to że połączenia dwóch skupień na dowolnym etapie (poza pierwszym; są całkowicie określone przez mało reprezentatywne punkty w skupieniach, a nierzadko ekstremalne Bar dziej pożądane byłoby, aby skupienia reprezentowały jakieś punkty typowe (zob Pielou, 1984).

Przykład 4.4. (grupowanie hierarchiczne - metoda najdalszego sąsiada

Metoda najdalszego sąsiada zastosowana do macierzy odległości D * z przykładu 4.3 daje następujący dendrogram

Poziomy

Rysunek 4.9. Dendrogram (metoda najdalszego sąsiada

Sposób łączenia się obiektów. a zw łaszcza poziomy łączenia na dalszy ch eta pach, różnią się w tej metodzie od tego, co obserwowaliśmy w metodzie najbliższego sąsiada. Wyraźniejsze są tu skupienia: f 2,7). (1.3)oraz (4.5,6). Dzięki sięgnię ciu do odległości największych, poziom, na którym można by przerwać grupowanie hierarchiczne, jest łatwy do określenia (między 4.22 a 8,37). Nie znaczy to jednak, że w' tym konkretnym przypadku wykazaliśmy przewagę metody najdalszego sąsiada.

4.6.4. Metoda średniej grupowej

Kolejne strategie grupowania hierarchicznego mają na celu poszukiwanie pośredniej drogi między tym co daje strategia najbliższego sąsiada, a tym co zapewnia strategia najdalszego sąsiada.

Jednostka oddalona (ang outłiers).


Wyszukiwarka

Podobne podstrony:
img199 Dowodzi się wówczas, że najmniejsza wartość odległości między obiektami (których współrzędne
img199 Dowodzi się wówczas, że najmniejsza wartość odległości między obiektami (których współrzędne
85152 P3200110 (określenie rożnych typów odległości między grupami jednostek -N Hotcłlinga iuogolmcm
P3200168 264 4. Analiza skupień • Wyszukujemy w macierzy najmniejszą odległość między dwoma obiektam
66449 P3200183 294 294 (4.123) (4.124) Niezależnie od tego w pewnych kryteriach wykorzystuje się odl
Untitled Scanned 25 wcale nie dla regulowania odległości od obiektu 1), tylko dla istotnych racji es
odległość między poszczególnymi obiektami przeznaczonymi do składowania materiałów budowlanych
CCF20100418017 Tab, 8. Zalecane odległości między zazielenieniem a obiektami budowlanymi i elementa
skanuj0026 (46) 176 7. Ruch turystyczny Tabela 25. Liczba kongresów międzynarodowych zorganizowanych
skanuj0056 Przy wykonywaniu kilku pomiarów twardości powierzchni należy zachować taką odległość międ
Image08 (2) - 8 £ - częstotliwość [Hz] S - odległość między osiami kabli [cm] Dp^r - śtednia średnic
Image502 programuje się czas trwania impulsu Tu odległość między impulsami w parze T2 oraz odległość

więcej podobnych podstron