P3200186

P3200186



kolejnym szczeblom hierarchii są widoczne na dendrogramie. W grupowaniu po działowym tego nie widzimy i co najwyżej możemy testować różne podziały / wieloma rożnymi liczbami skupień, a i tak trudno jest ocenić na oko, która z nich jest najwłaściwsza. Zaproponowano więc pcw 114 liczbę metod, które mogą okazać się pomocne w konkretnej sytuacji. Większość metod nie ma formalnego cha rak teru i opiera się na wykresie wartości kryterium grupowania względem liczby grup. Duże zmiany poziomu na takim wy kresie (powiedzmy wewnątrzgrupowej sumy kwadratów) mają stanowić pewną sugestię co do liczby skupień. Na przykład znaczny spadek tej sumy powinien sugerować większą liczbę skupień118 Rozwinięto jednak pewne bardziej formalne metody oceny. Sq one znane jako reguły zatrzymania (ang. stopping rules). Pięć takich reguł, które wyróż.niły się w badaniach, wymienia Gordon (1999). Niektóre reguły są określane jako ogólne, inne zaś jako lokalne.

W jakimś sensie z liczbą grup wiąże się problem badania izolacji i spójności grup wynikających z zastosowanej metody klasyfikacji. Zasadniczo wyniknął on z analizy porównawczej dwóch metod: najbliższego sąsiada i najdalszego sąsiada. Zdefiniowano w tym celu pojęcie „oddzielenia” (ang. moat) oraz „powiązania" (ang. connectedness) grupy. Oddzielenie danej grupy C należy rozumieć jako różnicę między poziomem \, na którym uformowało się to skupienie, a ostatnim poziomem /i,    . na którym wszystkie obiekty łączą się w jedną ostateczną grupę. Na

przykład, owe oddzielenie dla skupienia obiektów (5, 6) w metodzie najbliższego sąsiada wynosi: 4.17 — 2,51= 1,66, zaś w metodzie najdalszego sąsiada: 9,23— 2.51= 6,72. W hierarchicznych metodach grupowania może dochodzić do poważnego zniekształcenia wyjściowych odległości i dlatego miara ta powinna być interpretowana ostrożnie. W metodzie najdalszego sąsiada oddzielenie będzie zwykle większe ni/ w metodzie najbliższego sąsiada. Jednakże względnie duża wartość oddzielenia na dendrogramie w metodzie najbliższego sąsiada będzie wskazywać na grupę izolowaną.

4.9. Zastosowania analizy skupień

Literatura naukowa obfituje w przykłady zastosowań analizy skupień. Zrozumiała idea metod grupowania oraz dostępność programów komputerowych sprawiły, iż są one stosowane nawet w nadmiarze. Studiując liczne przykłady grupowania, można co najwyżej rozważać, na ile poprawnie stosowano miary zróżnicowania 1

wyników ltd Metoda naukowa wymusza bowiem uv.avadn\ćmekażdej 1m1i|Vm nietod i technik w badaniu empiryc/.ny m

cv\u»w


W tym punkcie przedstawimy tylko kilka ciekawszych pryykUduw ta^u sowan. przy czym nie tyle ciekaw e rozwiązanie jest tu najważmejsze. \W ciekaw'n problem, do którego rozwiązania w s korzy stano metody gr upow anta wiciow y nwa rowego.

Przykład 4.1 3. (czynniki prowadzące do sukcesu w nauczaniu statystyki)

Wstęp do statystyki (rozumiany jako statystyka ogólna > jest przedmiotem nauczania studentów wielu akademickich dyscyplin i stanowi interesujące wezwanie zarówno dla studentów, jak i wykładowców Dla jednych studentów lest to przedmiot poważny, budzący obaw \, a dla innych jest to tylko jeden z wielu przedmiotów. Z drugiej strony wykładowcy traktują staty styky lako pizedmiot kluczowy dla sukcesu studenta w uczelni i o rosnącym znaczeniu dla powodzenia w zawodzie, równocześnie wiedząc, ze trudno jest nauc/ac. gdy emocje i postawy w grupie studentów' są zróżnicowane, od znudzenia do łrustracji i strachu Podejmowane są zatem badania czynników , które wpływają na powodzenie w na uczaniu statystyki. Badacze Schutz, Drogosz, \v hitc i Distetano (1998) przy wołują w:iele takich badan i wskazują na podstawowe wnioski Akceptując te zasadniczo, zwracają oni jednak uwagę na wyniki badan psychologicznych ukazujących znaczenie motywacji i strategii nauczania dla clektu nauczania Twierdzą oni, że łączenie tych dw óch elementów nic następuje, co dało asumpt do ich własnego badania.

Badanie przeprowadzono na 94 studentach, wsrod których było 78% kobiet, którzy wrpisali się na listę uczestników wykładów ze statystyki. Zastosowano na stępujące techniki badaw cze

1. Test matematyczny, składający się z 30 pytań - do oceny wyjściowej wiedzy

matematycznej uczestników (test obejmował podstawowe reguły malenia tyczne, które są potrzebne do standardówych obliczeń stalvsivcznveh).

2.    1 est wstępnej wiedzy statystycznej w zakresie rozumienia pojęć i relacji mię dzy pojęciami.

3.    Pomiar postaw studentów wobec statystyki (ang Surrey of Attitudes Towards Statistics - SATS) w dwóch spośród czterech zakresów najbardziej odpowied nich do badania osiągnięć w statystyce: skalę afektacji (pomiar stopnia poz\ ty wnych nastawień wobec statystyki) i skalę wartości (pomiar postaw wobec użyteczności, znaczenia i wartości statystyki w życiu osobistym i zawo dowym). Postawy w tym zakresie mierzono w 7 stopniowej skali l.ikerta (1 - zdecydowanie nic; 7 zdecydowanie tak)

1

Wykres taki jest sporządzany na wzór wykresu osypiska w analizie głównych okładowych. Po dobnie subiekt\Avne podejście stosowane jest na podstawie analizy dendrogramu w hierarchicznych metodach grupowania.


Wyszukiwarka

Podobne podstrony:
P3200187 kolejnym szczeblom hierarchii są widoczne na dendrogramie. W grupowaniu po-dzialowy m lego
5. Regulacja elektroniczna 3. Wady i zalety energetyki fotowoltaicznej. instalacje wodne są widoczne
155 5 są widoczne na rys. 6.8, stanowiącym jego przekrój poprzeczny. Ciśnieniowa skrzynia korbowa je
Fuzariozy4 miękiszowej otaczającej naczynia. Zbrunatnienia są widoczne na przekroju łodyg, głównie w
zamieniane są następnie na postać bitową. Sposób realizacji tego procesu w języku JAVA przedstawiono
Spoiny są odporne na działanie wysokiej temperatury i jej zmiany, nie szkodzi im duża wilgotność wzg
34 Badania geograficzne nad Polską północno-zachodnią. stwy są wydobywane na powierzchnię.1 Chodząc
Prezentowane wyniki są oparte na historycznych danych dotyczących wyceny Funduszu i nie stanowią gwa

więcej podobnych podstron