P3200053

P3200053



- znając środki ciężkości grup możemy dokonać wstępnego podziału obiektów przyporządkowując je do grupy o najbliższym środku ciężkości.

Następnie porównujemy otrzymane wyniki za pomocą pewnej miary oceny jakości grupowania. Oceniając jakość skupiania bierze się pod uwagę, że grupowanie jest poprawne, jeżeli odległości między obiektami należącymi do tego samego skupienia są znacznie mniejsze niż między obiektami należącymi do różnych skupień. Jedną ze stosowanych miar jest suma odległości między obiektami w tym samym skupieniu (total within-cluster distance between datapoints) lum suma odległości między obiektami a poszczególnymi środkami skupień (between points and their respective cluster centroids) [J.Solomon, J.C.Bezdek, 1980]. Miary te nie mogą być używane jako jedyne, gdyż maleją, gdy liczba skupień wzrasta.

Dlatego powstało wiele innych propozycji metod ustalania liczby klas. W polskiej literaturze są one opisane np. w {K.Migdał-Najman, K.Najman, 2005]. Tutaj zwrócimy uwagę na jedną z metod szacowania liczby skupień opracowaną przez SAS Institute i zaimplementowaną w programie SAS. Jest to metoda zwaną sześciennym kryterium grupowania (Cw-bic Clustering Criterion - CCC).

CCC jest jedną z metod szacowania liczby skupień w algorytmach analizy skupień, opartych na minimalizacji wewnątrzgrupowej sumy kwadratów (within-cluster sum of squ-ares). Do takich metod należy metoda minimalnej wariancji Warda (Ward's method) i metoda it-średnich. Idea metody polega na porównaniu obserwowanej wartości współczynnika R2 z aproksymacją wartości oczekiwanej E[R2] dla próby wylosowanej z rozkładu jednostajnego. Wzór obliczeniowy został skorygowany o empirycznie wyznaczony mnożnik zapewniający stabilizację wariancji. Dodatnie wartości współczynnika CCC oznaczają, że obserwowana wartość R2 jest większa niż należało oczekiwać, gdyby obiekty zostały wylosowane z rozkładu jednostajnego, zatem prawdopodobnie zbiór badanych obiektów można podzielić na różniące się od siebie skupienia. Badając zależność wartości CCC od liczby skupień uzyskanych w zastns. w:»:■«. n< lod/.ie grupowania można oszacować optymalną liczbę skupień, na które da s»v po.j/jelić /biór obiektów. Metoda nie daje definitywnej odpowiedzi, jak jest właściwa !w /b skupień i należy ją traktować jako wskazówkę w postępowaniu, biorąc również pod uwagę względy merytoryczne badanego problemu. Wiele stosowanych algorytmów grupowania jest opartych na minimalizacji wewnątrzgru-powej sumy kwadratów (within-cluster sum of squarcs), która może być obliczana jako ślad macierzy W tr(W). gdzie W = T B. gdzie T = X'X jest macierzą momentów (dla n


Wyszukiwarka

Podobne podstrony:
Wśród metod aktywizujących możemy dokonać wewnętrznego podziału. Według Jadwigi Krzyżewskiej
Znając konstrukcję kładu płaszczyzny nierzutującej możemy dokonać kładu dowolnego punktu leżącego w
skanuj0060 (55) © dokonać wstępnej segregacji z wytypowaniem poszkodowanych do natychmiastowej ewaku
Tak samo jak miało to miejsce w przypadku sprężarek tak i również w przypadku zaworow możemy dokonać
P2100775 4.77. Punkt S (est środkiem ciężkości trójkąta ABC. punkty A,. 8,, C. są środkami boków a p
Możemy również zmieniać kolejność slajdów w prezentacji. Przestawianie slajdów możemy dokonać między
T1AJJ12 potrafi dokonać wstępnej analizy ekonomicznej podejmowanych działań inżynierskich GiKl U09,
POMPY WYPOROWE - podział 2 W zależności od możliwości zmiany wydajności podczas pracy, możemy dokona
Twierdzenia wynikające ze wzorów na środki ciężkości: 1 Środek ciężkości bryły, figury płaskiej lub
Siuta Elementy prawa dla ekonomistów rodział 4 prawo karne (14) § 15. ŚRODKI PODDAJĄCE SPRAWCĘ P
41868 P1010233 (3) Środki ciężkości Niech punki o współrzędnych xf. yc. Ze - współrzędne środka
58 (177) 114 I. ŚRODKI CIĘŻKOŚCI Wprowadzenie środkiem ciężkości układu materialnego (linii,
środkiem ciężkości jądra, w którym skupione są ładunki dodatnie. Atom taki jest elektrycznie obojętn
CCF20101219004 (4) 20. Moment statyczny figury płaskiej względem osi xc, yc - środki ciężkości p -

więcej podobnych podstron