Metody grupowania obiektow, Wielowymiarowa analiza statystyczna, Panek, wap


METODY GRUPOWANIA OBIEKTÓW

Cele grupowania:

utworzenie jak najbardziej jednorodnych grup obiektów (skupień) ze względu na podobieństwo w zakresie wewnętrznej struktury charakteryzujących je zmiennych.

Kryteria grupowania:

Warunki grupowania:

zbiór obiektów O={O1,O2,...,On} dzielimy na podzbiory (grupy obiektów) 0x01 graphic
spełniające warunki:

0x01 graphic
,

(3.1)

0x01 graphic
, r,r'=1,2,...,z, rr', (3.2)

0x01 graphic
, r=1,2,...,z. (3.3)

METODY GRUPOWANIA OBIEKTÓW

METODY GRUPOWANIA OBIEKTÓW

UPORZĄDKOWANYCH LINIOWO

METODY DIAGRAMOWE

METODA PODOLEC

Założenia:

Wskaźnik poprawności grupowania:

0x01 graphic
, (3.4)

gdzie:

nw, nz - liczba powiązań odpowiednio wewnątrz i na zewnątrz wyodrębnionych grup obiektów,

npb, npd - liczba powiązań odpowiednio bliskich, wewnątrz grup obiektów i dalekich, na zewnątrz grup obiektów.

METODA SPÄTHA-SZCZOTKI

Funkcje dobroci grupowania:

0x01 graphic
, (3.5)

gdzie:

dii' - odległość między i-tym i i'-tym obiektem należącymi do r-tej grupy obiektów.

0x01 graphic
. (3.6)

0x01 graphic
, (3.7)

gdzie:

0x01 graphic
- odległość między środkiem ciężkości r-tej grupy i i-tym obiektem należącym do tej grupy.

Rozwiązanie quasi-optymalne

0x01 graphic
, t=2,...,n-1. (3.8)

0x01 graphic
, t=2,...,n-1. (3.9)

METODA MAKSYMALNEGO GRADIENTU

0x01 graphic
, i=1,...,n-1. (3.10)

METODA ODCHYLEŃ STANDARDOWYCH

gdzie:

0x01 graphic
- odpowiednio wartość średniej arytmetycznej i odchylenia standardowego zmiennej syntetycznej.

METODY AGLOMERACYJNE

METODY PODZIAŁU DENDRYTU

Ogólna charakterystyka:

NATURALNY PODZIAŁ DENDRYTU

0x01 graphic
,

gdzie:

d1,d2,...,dk - uporządkowane odległości wiązadeł.

0x01 graphic
, k=1,2,...,n-1, (3.12)

gdzie:

dk - długość k-tego wiązadła w uporządkowanym nierosnąco szeregu długości wiązadeł.

0x01 graphic
, k=1,2,...,n-1. (3.13)

0x01 graphic
, k,k'=1,2,...,n-1; kk'. (3.14)

PODZIAŁ MOCNY DENDRYTU

0x01 graphic
, k=1,2,...,n-1, (3.15)

przy czym:

0x01 graphic

0x01 graphic
k=1,2,...,n-2. (3.16)

0x01 graphic
. (3.17)

METODA HELLWIGA

0x01 graphic
, (3.18)

gdzie:

0x01 graphic
,

0x01 graphic
.

METODY PODZIAŁU DENDROGRAMU

Ogólna charakterystyka metod

METODY WYZNACZANIA

KRYTYCZNEJ WARTOŚCI ODLEGŁOŚCI

Analiza dendrogramu pod względem różnic odległości między kolejnymi etapami grupowania obiektów (odległości między kolejnymi węzłami, gdzie uformowała się kolejna grupa obiektów)

0x01 graphic
, h=2,3,...,n-1, (3.19)

gdzie:

dh - długość h-tej gałęzi drzewka,

0x01 graphic
- wartość krytyczna odległości odpowiadająca h-1 długości gałęzi drzewka.

Analiza wykresu przebiegu porządkowania nieliniowego

obiektów w postaci drzewka

Analiza dendrogramu pod względem stosunku odległości

między kolejnymi etapami grupowania

0x01 graphic
, h=2,..,n. (3.20)

Reguła Mojeny

0x01 graphic
, (3.21)

gdzie:

0x01 graphic
- odpowiednio średnia arytmetyczna i odchylenie standardowe długości gałęzi drzewka,

k - parametr, którego wartości według R. Mojeny powinny zawierać się w przedziale <2;5;350>.

METODY OPTYMALIZACJI

DANEGO GRUPOWANIA OBIEKTÓW

Ogólna charakterystyka

METODA k-ŚREDNICH

METODA FORGY-JANCEY'A

0x01 graphic
r=1,2,...,z. (3.27)

gdzie:

0x01 graphic
- jądro odpowiednio nowej i starej grupy obiektów,

0x01 graphic
- środek ciężkości nowej grupy obiektów,

α - parametr, przyjmujący w zależności od wersji metody, wartości 1, 2 i 1,5.

METODY OBSZAROWE

Ogólna charakterystyka

METODA KATOWICKA

METODY TAKSONOMII STRUKTUR

METODA ELIMINACJI WEKTORÓW

0x01 graphic
, i,i'=1,2,...,n, (3.31)

przy czym:

0x01 graphic
, (3.32)

gdzie:

pii' - miara podobieństwa i-tego i i'-tego obiektu.

0x01 graphic
, (3.33)

gdzie:

1 - wektor (n x 1) składający się z jedynek.



Wyszukiwarka