P3200187

P3200187



kolejnym szczeblom hierarchii są widoczne na dendrogramie. W grupowaniu po-dzialowy m lego nie widzimy i co najwyżej możemy testować różne podziały l wieloma różnymi liczbami skupień, a i tak trudno jest ocenić na oko, która z nich jest najwłaściwsza. Zaproponowano więc pewną liczbę metod, które mogą okazać się pomocne w konkretnej sytuacji. Większość metod nie ma formalnego charakteru i opiera się na wykresie wartości kryterium grupowania względem liczby grup. Duże zmiany poziomu na takim wykresie (powiedzmy wewnątrzgrupowej sumy kwadratów) mają stanowić pewną sugestię co do liczby skupień. Na przykład znaczny spadek tej sumy powinien sugerować większą liczbę skupień ,8. Rozwinięto jednak pewne bardziej formalne metody oceny. Są one znane jako reguły zatrzymania (ang. stopping rules). Pięć takich reguł, które wyróżniły się w badaniach, wymienia Gordon (1999). Niektóre reguły są określane jako ogólne, inne zaś jako lokalne.

W jakimś sensie z liczbą grup wiąże się problem badania izolacji i spójności grup wynikających z zastosowanej metody klasyfikacji. Zasadniczo wyniknął on z analizy porównawczej dwóch metod: najbliższego sąsiada i najdalszego sąsiada. Zdefiniowano w tym celu pojęcie „oddzielenia” (ang. moat) oraz „powiązania” (ang. connectedness) grupy. Oddzielenie danej grupy C należy rozumieć jako różnicę między poziomem , na którym uformowało się to skupienie, a ostatnim poziomem /i,.,, na którym wszystkie obiekty łączą się w jedną ostateczną grupę. Na przykład, owe oddzielenie dla skupienia obiektów (5, 6) w metodzie najbliższego sąsiada wynosi: 4,17—2,51=1,66, zaś w metodzie najdalszego sąsiada: 9,23— 2,51 = 6,72- W hierarchicznych metodach grupowania może dochodzić do poważnego zniekształcenia wyjściowych odległości i dlatego miara ta powinna być interpretowana ostrożnie. W metodzie najdalszego sąsiada oddzielenie będzie zwykle większe niż w metodzie najbliższego sąsiada Jednakże względnie duża wartość oddzielenia na dendrogramie w metodzie najbliższego sąsiada będzie wskazywać na grupę izolowaną.

4.9. Zastosowania analizy skupień

Literatura naukowa obfituje w przykłady zastosowań analizy skupień Zrozumiała idea metod grupowania oraz dostępność programów komputerowych sprawiły, iż są one stosowane nawet w nadmiarze. Studiując liczne przykłady grupowania, można co najwyżej rozważać, na ile poprawnie stosowano miary zróżnicowania

118 Wykres taki jest sporządzany na wzór wykresu osypiska w analizie głównych składowych. Podobnie subiektywne podejście stosowane jest na podstawie analizy dendrogramu w hierarchicznych metodach grupowania.


Wyszukiwarka

Podobne podstrony:
P3200186 kolejnym szczeblom hierarchii są widoczne na dendrogramie. W grupowaniu po działowym tego n
5. Regulacja elektroniczna 3. Wady i zalety energetyki fotowoltaicznej. instalacje wodne są widoczne
155 5 są widoczne na rys. 6.8, stanowiącym jego przekrój poprzeczny. Ciśnieniowa skrzynia korbowa je
Fuzariozy4 miękiszowej otaczającej naczynia. Zbrunatnienia są widoczne na przekroju łodyg, głównie w
Spoiny są odporne na działanie wysokiej temperatury i jej zmiany, nie szkodzi im duża wilgotność wzg
34 Badania geograficzne nad Polską północno-zachodnią. stwy są wydobywane na powierzchnię.1 Chodząc
Prezentowane wyniki są oparte na historycznych danych dotyczących wyceny Funduszu i nie stanowią gwa

więcej podobnych podstron