Met grup obiekt p


Przykład 3.1

Punktem wyjścia grupowania województw, w grupy województw o podobnym poziomie życia, za pomocą metod diagramowych było ich uporządkowanie uzyskane za pomocą metody Czekanowskiego (Przykład 2.1).

Za powiązania bliskie uznano powiązania odpowiadające odległościom między województwami mniejszymi od 2,4 (puste kwadraty). Dla każdej możliwego do uzyskania grupowania województw obliczono wskaźnik poprawności podziału (3.4). Na kolejnych rysunkach przedstawiono cztery najlepsze (począwszy od optymalnego), ze względu na przyjętą funkcję kryterium dobroci grupowania, grupowania województw, przedstawiając je na uporządkowanym diagramie Czekanowskiego, podając jednocześnie wartości funkcji dobroci grupowania. W diagramach zaznaczono kwadraty odpowiadające wyodrębnionym grupom województw.

Tab. 3.1. Optymalne grupy województw.

O8

O15

O4

O10

O14

O1

O2

O16

O6

O11

O7

O13

O5

O3

O9

O12

O8

+

+

+

+

+

+

+

+

X

X

X

O15

+

+

+

+

+

+

X

X

+

O4

+

+

+

+

X

+

+

X

X

X

O10

+

+

+

+

X

O14

+

+

+

+

+

+

X

O1

+

+

+

+

O2

+

+

+

+

+

O16

+

+

+

+

+

+

+

O6

+

+

+

+

+

O11

+

+

+

+

+

+

X

O7

+

X

+

+

+

+

+

X

X

+

O13

+

+

+

+

+

+

+

+

X

O5

+

+

+

+

+

+

+

+

+

+

+

X

O3

X

X

X

+

+

+

+

+

X

+

+

+

O9

X

X

X

+

+

+

+

+

X

+

X

+

X

O12

X

+

X

X

X

+

+

+

+

X

+

X

+

X

Q1=0,931034

Tab. 3.2. Grupy województw.

O8

O15

O4

O10

O14

O1

O2

O16

O6

O11

O7

O13

O5

O3

O9

O12

O8

+

+

+

+

+

+

+

+

X

X

X

O15

+

+

+

+

+

+

X

X

+

O4

+

+

+

+

X

+

+

X

X

X

O10

+

+

+

+

X

O14

+

+

+

+

+

+

X

O1

+

+

+

+

O2

+

+

+

+

+

O16

+

+

+

+

+

+

+

O6

+

+

+

+

+

O11

+

+

+

+

+

+

X

O7

+

X

+

+

+

+

+

X

X

+

O13

+

+

+

+

+

+

+

+

X

O5

+

+

+

+

+

+

+

+

+

+

+

X

O3

X

X

X

+

+

+

+

+

X

+

+

+

O9

X

X

X

+

+

+

+

+

X

+

X

+

X

O12

X

+

X

X

X

+

+

+

+

X

+

X

+

X

Q1=0,915254

Tab. 3.3. Grupy województw.

O8

O15

O4

O10

O14

O1

O2

O16

O6

O11

O7

O13

O5

O3

O9

O12

O8

+

+

+

+

+

+

+

+

X

X

X

O15

+

+

+

+

+

+

X

X

+

O4

+

+

+

+

X

+

+

X

X

X

O10

+

+

+

+

X

O14

+

+

+

+

+

+

X

O1

+

+

+

+

O2

+

+

+

+

+

O16

+

+

+

+

+

+

+

O6

+

+

+

+

+

O11

+

+

+

+

+

+

X

O7

+

X

+

+

+

+

+

X

X

+

O13

+

+

+

+

+

+

+

+

X

O5

+

+

+

+

+

+

+

+

+

+

+

X

O3

X

X

X

+

+

+

+

+

X

+

+

+

O9

X

X

X

+

+

+

+

+

X

+

X

+

X

O12

X

+

X

X

X

+

+

+

+

X

+

X

+

X

Q1=0,915254

Tab. 3.4. Grupy województw.

O8

O15

O4

O10

O14

O1

O2

O16

O6

O11

O7

O13

O5

O3

O9

O12

O8

+

+

+

+

+

+

+

+

X

X

X

O15

+

+

+

+

+

+

X

X

+

O4

+

+

+

+

X

+

+

X

X

X

O10

+

+

+

+

X

O14

+

+

+

+

+

+

X

O1

+

+

+

+

O2

+

+

+

+

+

O16

+

+

+

+

+

+

+

O6

+

+

+

+

+

O11

+

+

+

+

+

+

X

O7

+

X

+

+

+

+

+

X

X

+

O13

+

+

+

+

+

+

+

+

X

O5

+

+

+

+

+

+

+

+

+

+

+

X

O3

X

X

X

+

+

+

+

+

X

+

+

+

O9

X

X

X

+

+

+

+

+

X

+

X

+

X

O12

X

+

X

X

X

+

+

+

+

X

+

X

+

X

Q1=0,907563

Przykład 3.2

W grupowaniu województw, ze względu na podobieństwo poziomu życia w 2005 r. za pomocą metody Spätha-Szczotki, wykorzystano macierz odległości między województwami (tab. 2.1) oraz uporządkowanie liniowe województw uzyskane za pomocą metody Szczotki (Przykład 2.23). W punkcie wyjścia każde z województw stanowi oddzielną grupę. W kolejnych krokach łączymy dwie sąsiadujące ze sobą grupy województw, dla których funkcja dobroci grupowania (3.5) przyjmuje najmniejszą wartość. Etapy tworzenia grup województw wraz z odpowiadającymi im minimalnymi wartościami funkcji dobroci grupowania zawiera tablica 3.5.

Wyznaczenie ostatecznej konfiguracji grup województw wymaga wskazania iteracji, w której następuje przerwanie tworzenia kolejnych, coraz mniej licznych i jednocześnie coraz mniej jednorodnych grup województw.

W tym celu obliczamy ilorazy wartości funkcji dobroci grupowania w kolejnych iteracjach (3.7):

i1=2,107; i2=1,690; i3=1,421; i4=1,316; i5=1,247; i6=1,202; i7=1,204; i8=1,189; i9=1,163; i10=1,172; i11=1,162; i12=1,185; i13=1,172; i14=1,150.

W kolejnym kroku sprawdzamy dla każdej pary sąsiednich ilorazów czy zachodzi relacja (3.8). Relacja ta spełniona jest po raz pierwszy dla pary sąsiednich ilorazów dla:

i7> i6.

Oznacza to, że grupowanie województw należy zakończyć w iteracji t=6. Tym samym za ostateczne uznajemy następujące grupowanie województw:

G1={O1,O5}

G2={O7,O13,O15}

G3={O9,O12,O14}

G4={O3,O6}

G5={O2}

G6={O4}

G7={O8}

G8={O10}

G9={O11}

G10={O16}

Tab. 3.5. Przebieg grupowania województw metodą Spätha-Szczotki.

Kroki

Łączne grupy

Wartości funkcji dobroci grupow.

1

{O1},{O5}

1,514

2

{O12},{O14}

3,191

3

{O13},{O15}

5,393

4

{O3},{O6}

7,666

5

{O7},{O13, O15}

10,085

6

{O9},{O12, O14}

12,573

7

{O8},{O10}

15,111

8

{O2},{O8, O10}

18,187

9

{O11},{O16}

21,617

10

{O1, O5},{O9, O12,O14}

25,140

11

{O4},{O3, O6}

29,468

12

{O2, O8, O10},{O7, O13,O15}

34,231

13

{O3, O4, O6},{O11,O16}

40,556

14

{O2, O7, O8, O10,O13, O15},{O3, O4, O6, O11,O16}

47,541

15

{O2, O3, O4, O6,O7, O8, O10, O11, O13 O15 O16},{O1, O5, O9, O12,O14}

54,691

Przykład 3.3

Dla grupowania województw, ze względu na podobieństwo poziomu życia w 2005 r., za pomocą metody maksymalnego gradientu wykorzystano wartości miary syntetycznej (si) uzyskanej w wyniku zastosowania miary rozwoju (przykład 2.4). Na wstępie założyliśmy podział województw na z=4 grupy. Dla uporządkowanego ciągu województw, ze względu na rosnące wartości zmiennej syntetycznej, obliczono różnice pomiędzy tymi wartościami dla kolejnych par województw (tab. 3.6).

Aby uzyskać grupy województw nasz uporządkowany ciąg województw powinniśmy przerwać w z-1=3 miejscach, ze względu na największe wartości różnic pomiędzy zmiennymi syntetycznymi dla sąsiednich województw (si+1-si). W kroku 1 uzyskano największą różnicę między województwami O8 i O15 równą 0,059. Tym samym dokonujemy podziału województw na 2 grupy:

0x01 graphic

Następnie usunięto z ciągu różnic wartość maksymalną i ponownie wyznaczono wartość maksymalną różnic zmiennych syntetycznych (krok 2). Była to wartość 0,047 między województwami O9 i O3.

W efekcie grupa województw G2 rozpadła się na podgrupy:

0x01 graphic

Po usunięciu z ciągu różnic pomiędzy wartościami zmiennej syntetycznej wartości maksymalnej, w kroku 3 wyznaczono kolejną wartość maksymalną. Wartość ta znajdowała się między województwami O14 i O13 i wynosiła 0,045. Powoduje to podział grupy województw G2 na dwie nowe podgrupy i uzyskanie następujących, ostatecznych grup województw o podobnym poziomie życia w 2005 r.:

0x01 graphic

Tab. 3.6. Przebieg grupowania województw, ze względu na osiągnięty poziom życia w 2005 r., według metody maksymalnego gradientu.

Nr

Województwo

Wartości zmiennej syntetycznej

Bezwzględne wartości różnic

krok 1

krok 2

krok 3

7

8

15

6

1

10

11

16

4

2

5

14

13

12

9

3

Mazowieckie

Opolskie

Wielkopolskie

Małopolskie

Dolnośląskie

Podlaskie

Pomorskie

Zachodniopomorskie

Lubuskie

Kujawsko-Pomorskie

Łódzkie

Warmińsko-Mazurskie

Świętokrzyskie

Śląskie

Podkarpackie

Lubelskie

0,617

0,614

0,555

0,528

0,496

0,459

0,452

0,431

0,392

0,381

0,348

0,304

0,259

0,242

0,219

0,172

-

0,003

0,059

0,026

0,032

0,037

0,007

0,021

0,034

0,017

0,033

0,044

0,045

0,018

0,023

0,047

-

0,003

-

0,026

0,032

0,037

0,007

0,021

0,034

0,017

0,033

0,044

0,045

0,018

0,023

0,047

-

0,003

-

0,026

0,032

0,037

0,007

0,021

0,034

0,017

0,033

0,044

0,045

0,018

0,023

-

Przykład 3.4

Na podstawie wartości miary syntetycznej dla województw (si), uzyskanej w wyniku zastosowania miary rozwoju (Przykład 2.4), dokonano grupowania województw ze względu na osiągnięty poziom życia za pomocą metody odchyleń standardowych. Wartości średniej arytmetycznej oraz odchylenia standardowego zmiennej syntetycznej wyniosły:

0x01 graphic

Uzyskano następujące podziały zmienności zmiennej syntetycznej dla grup województw w oparciu o powyższe wartości:

0x01 graphic

Ostatecznie otrzymano cztery grupy województw o podobnym poziomie życia w 2005 r., od poziomu najwyższego do poziomu najniższego:

0x08 graphic

Przykład 3.5

W oparciu o dendryt uzyskany w wyniku porządkowania województw za pomocą metod dendrytowych (rys. 2.5) przeprowadzono grupowanie województw Polski ze względu na podobieństwo poziomu życia osiągniętego z 2005 r. Założono podział województw na 4 grupy. Następnie usunięto z dendrytu 3 najdłuższe wiązadła uzyskując w efekcie następujące grupy województw (rys. 3.1) o podobnym poziomie życia:

G1={O12},

G2={O9},

G3={O5},

G4={O1, O2, O3, O4, O6,O7, O8, O10, O11,O13,O14 O15, O16}.

Rys. 3.1. Podział dendrytu na cztery składowe.

0x01 graphic

Przykład 3.6

Dendryt będący ilustracją porządkowania województw Polski za pomocą metod dendrytowych (rys. 2.5) stanowił punkt wyjścia do grupowania województw ze względu na podobieństwo poziomu życia w 2005 r., bez zakładania z góry liczby grup.

W pierwszej z metod grupowania, dającej w efekcie tzw. naturalny podział dendrytu, porządkujemy nierosnąco wiązadła dendrytu:

d5,12=3,43; d6,9=3,19; d1,5=2,87; d2,13=2,86; d2,10=2,71; d8,10=2,54; d6,7=2,35; d4,16=2,34; d6,15=2,28; d3,13=2,27; d6,10=2,26; d6,11=2,20; d4,14=2,01; d2,14=1,68; d1,16=1,51.

Następnie tworzymy ilorazy sąsiednich wiązadeł:

0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

W kolejnym kroku dla każdej pary sąsiednich ilorazów wiązadeł sprawdzamy czy zachodzi relacja (3.14). Relacja ta jest spełniona dla następujących par sąsiednich wiązadeł:

i1<i2; i3<i4; i4<i5; i5<i6; i7<i8; i9<i10; i10<i11; i11<i12; i12<i13.

Tym samym dla ustalenia jaką liczbę najdłuższych wiązadeł należy usunąć z dendrytu bierzemy pod uwagę następujące ilorazy wiązadeł:

i1; i3; i4; i5; i6; i7; i9; i10; i11; i12.

Spośród powyższych ilorazów wiązadeł wybieramy, stosując kryterium dodatkowe (3.15), najmniejszy iloraz, tzn. i3. Oznacza to, że z dendrytu należy usunąć k-1=2 najdłuższych wiązadeł (rys. 3.2).

Rys. 3.2. Podział naturalny na 4 składowe.

0x01 graphic

Ostatecznie uzyskujemy następujące grupy województw, o podobnym poziomie życia:

G1={O12},

G2={O9},

G3={O1, O2, O3, O4, O5, O6, O7, O8, O10, O11,O13, O14, O15, O16}.

W tzw. podziale mocnym dendrytu punktem wyjścia jest, tak jak w poprzedniej metodzie podziału dendrytu, uporządkowany nierosnąco ciąg wiązadeł. W pierwszym kroku zostały obliczone wartości różnic między sąsiednimi wiązadłami na podstawie wzoru rekurencyjnego (3.16):

u1=36,5; u2=33,07; u3=29,88; u4=27,01; u5=24,15; u6=21,44; u7=18,9; u8=16,55; u9=14,21; u10=11,93; u11=9,66; u12=7,4; u13=5,2; u14=3,19; u15=1,68.

Następnie zostały obliczone wskaźniki mocy podziału w oparciu o formułę (3.17):

m1=1,083; m2=1,107; m3=1,106; m4=1,118; m5=1,126; m6=1,134; m7=1,142; m8=1,165; m9=1,191; m10=1,235; m11=1,305; m12=1,423; m13=1,630; m14=1,899.

Relacja (3.18) jest spełniona dla wskaźnika mocy podziału m2. Oznacza to, że z dendrytu należy usunąć k=2 najdłuższe wiązadła (rys. 3.2). W efekcie uzyskujemy identyczny podział województw na grupy jak przy naturalnym podziale dendrytu.

W kolejnym wariancie metody podziału dendrytu zastosowano metodę zaproponowaną przez Z. Hellwiga. Uzyskano następującą krytyczną wartość długości wiązadła:

d*=2,433+2⋅0,519=3,741.

W rozpatrywanym dendrycie wszystkie wiązadła mają mniejszą długość od wartości krytycznej. Tym samym wszystkie analizowane województwa tworzą jedną grupę.

Przykład 3.7

W oparciu o dendrogram (rys. 2.18) oraz opis i wykres przebiegu grupowania (aglomeracji) województw (rys. 2.17) przeprowadzimy podział województw na grupy o podobnym poziomie życia w 2005 r. Krytyczna wartość odległości, przy której przecinamy gałęzie drzewka została ustalona wariantowo według formuł (3.20), (3.21) oraz (3.22).

Według formuły różnicowej (3.20) wartość krytyczna odległości wynosi (tab. 3.7):

d*>4,512.

Przecięcie gałęzi drzewka przy powyższym warunku prowadzi do utworzenia trzech, następujących grup województw:

0x01 graphic

Obliczona według formuły ilorazowej (3.21) wartość krytyczna odległości spełnia nierówność (tab. 3.7):

d*>1,677.

Przyjęcie wartości krytycznej odległości spełniającej powyższą nierówność powoduje utworzenie następujących grup województw:

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

Tabela 3.7. Wyznaczanie krytycznej wartości odległości.

Kroki aglomeracji

0x01 graphic

0x01 graphic

0x01 graphic

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

1,514

1,677

2,202

2,273

2,383

2,435

2,538

3,048

3,337

3,430

3,971

4,067

4,512

5,194

5,573

-

0,163

0,525

0,071

0,110

0,052

0,103

0,510

0,289

0,093

0,541

0,096

0,445

0,682

0,379

-

1,108

1,317

1,032

1,048

1,022

1,042

1,201

1,095

1,028

1,158

1,024

1,109

1,151

1,073

Wreszcie wartość krytyczna odległości oszacowana w oparciu o regułę Mojeny (3.22), przyjmując wartość parametru k=1,25, spełnia warunek:

d*>3,210+1,25⋅1,239=4,759.

Prowadzi to ostatecznie do utworzenia identycznego grupowania województw jak przy szacunku wartości krytycznej odległości za pomocą formuły różnicowej.

Przykład 3.10

W oparciu o wystymulowane i wystandaryzowane wartości zmiennych diagnostycznych dokonano podziału województw Polski, ze względu na podobieństwo osiągniętego poziomu życia w 2005 r., metodą Forgy-Jancey'a. Na wstępie założono, że województwa zostaną podzielone na 4 grupy. Przyjęto jednocześnie następującą wstępną klasyfikację województw do tych grup:

0x01 graphic

Założono także, że optymalne grupowanie uzyskamy po co najwyżej 20 iteracjach. Szukając optymalnego grupowania województw przyjęto w formule (3.28) wartość parametru α=1. W rozwiązaniu tym za jądra nowych grup uważane są środki ciężkości dotychczasowych grup. Dla każdej z grup województw obliczono jej środek ciężkości, traktowany we wstępnym etapie procedury jako jądra grup, otrzymując:

0x01 graphic

Następnie każde z województw zostało przyporządkowane do tej grupy, dla której odległość między tym województwem, a jądrem grupy jest najmniejsza. W efekcie uzyskano poniższą klasyfikację grup:

0x01 graphic

Dla każdej grupy obliczono nowe jądra:

0x01 graphic

W kolejnym etapie przeprowadzono nowe przyporządkowanie województw do grup, stosując regułę minimalizacji ich odległości od jąder grup, otrzymując:

0x01 graphic

Współrzędne jąder tych nowych grup przyjęły następujące wartości:

0x01 graphic

Przyporządkowanie województw do grup, uwzględniając ich nowe jądra, nie zmieniło się w stosunku do przyporządkowania uzyskanego w poprzedniej iteracji. Tym samym uzyskaną w wyniku drugiej iteracji klasyfikację województw uważamy za ostateczną.

Przykład 3.9

Grupowanie województw odbywa się ze względu na poziom życia osiągnięty w 2005 r., opisywany zmiennymi diagnostycznymi, których wystandaryzowane wartości przedstawiono na rysunku 3.4.

Rys. 3.4. Tablica z danymi do przykładu 3.9.

0x01 graphic

Grupowanie województw za pomocą metody k-średnich zilustrujemy wykorzystując pakiet STATISTICA. W tym celu wybieramy z menu Statystyka opcję Wielowymiarowe techniki eksploracyjne/Analiza skupień (rys. 3.5).

Rys. 3.5. Opcje modułu Wielowymiarowe techniki eksploracyjne.

0x01 graphic

Na ekranie otrzymujemy okno Metody grupowania (rys. 3.6).

Rys. 3.6. Okno Metoda grupowania.

0x01 graphic

W oknie Metody grupowania wybieramy opcję Grupowanie metodą k-średnich. Na ekranie otwiera się okno Analiza skupień: Grupowanie metody k-średnich (rys. 3.7).

Rys. 3.7. Okno ustalania założeń grupowania metodą k-średnich.

0x01 graphic

W ramach powyższego okna wybieramy kartkę Więcej klikając odpowiedni klawisz. Otrzymana karta umożliwia określenie założeń grupowania. Na wstępie klikamy klawisz Zmienne co powoduje otwarcie okna Wybierz zmienne do analizy (rys. 3.8).

Rys. 3.8. Okno Wybierz zmienne do analizy.

0x01 graphic

Naszymi zmiennymi są wystandaryzowane zmienne diagnostyczne charakteryzujące poziom życia województw w 2005 r. Klikamy klawisz Wszystkie i akceptujemy wybór klawiszem OK. Następnie rozwijamy listę Grupuj wybierając opcję Przypadki (wiersze). Tym samym przedmiotem grupowania są województwa w przestrzeni zamiennych. W kolejnym kroku określamy liczbę grup, na które dzielimy zbiór województw. W tym celu w polu Liczba skupień, korzystając z suwaka wybieramy liczbę 4, decydując się na utworzenie czterech grup województw. W kolejnym polu Liczba iteracji ustalamy liczbę iteracji, w ramach których województwa są przesuwane między grupami. Pozostawiamy domyślne ustawienie 10 iteracji. Gdyby okazało się, że ta liczba iteracji jest zbyt mała możemy po wykonaniu analizy wykonać ją ponownie zwiększając liczbę iteracji.

W dolnej części ekranu znajduje się grupa opcji Wstępne centra skupień, pozwalająca na określenie sposobu wyznaczania wstępnych centrów grup wojewódzkich. Wyniki grupowania województw mogą zależeć od wstępnej konfiguracji grup województw, a tym samym sposobu wyznaczania wstępnych centrów tych grup. Mamy do wyboru jedną z trzech opcji:

W naszym przykładzie wybieramy drugą z powyższych opcji. Wybrane założenia grupowania (rys. 3.9) akceptujemy klawiszem OK.

Rys. 3.9. Okno z ustalonymi założeniami grupowania metodą k-średnich.

0x01 graphic

Powoduje to otwarcie okna Wyniki grupowania metodą k-średnich (rys. 3.10).

Rys. 3.10. Okno Wyniki grupowania metodą k-średnich.

0x01 graphic

W górnej części okna znajduje się ogólne podsumowanie wstępnych wyników analizy. Należy zwrócić uwagę, że optymalne grupowanie zostało znalezione już po 3 iteracjach. W dolnej części okna znajdują się klawisze otwierające arkusze wynikowe grupowania. Klikając klawisz Elementy każdego skupienia i odległości otwiera się kaskada arkuszy zawierających składy kolejnych grup województw oraz odległości poszczególnych województw od środków grup, do których należą (rys. 3.11).

Rys. 3.11. Tablice z elementami każdej grupy województw oraz odległościami od środka ciężkości.

0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

Uzyskane, w wyniku zastosowania metody k-średnich, grupy województw są następujące:

G1={O1, O2, O4, O14, O16},

G2={O6, O7, O8, O10, O11, O15},

G3={O3, O9, O13},

G4={O5, O12}.

Używając klawisza Statystyki opisowe każdego skupienia otwieramy okno zawierające arkusze wartości średnich arytmetycznych, odchyleń standardowych i wariancji zmiennych diagnostycznych dla każdej z grup województw (rys. 3.12).

Rys. 3.12. Tablice ze statystykami opisowymi wystandaryzowanych wartości zmiennych diagnostycznych dla grup województw.

0x01 graphic
0x01 graphic
0x01 graphic
0x01 graphic

Klikając klawisz Podsum. średnie skupień i odleg. euklid. Otrzymujemy okno zawierające dwa arkusze wynikowe. W pierwszym z arkuszy znajdują się wartości średnich arytmetycznych zmiennych dla utworzonych grup województw (rys. 3.13).

Rys. 3.13. Tablice ze średnimi arytmetycznymi wystandaryzowanych zmiennych diagnostycznych dla grup województw.

0x01 graphic

Drugi z arkuszy zawiera odległości euklidesowe między centrami grup województw (rys. 3.14).

Rys. 3.14. Tablica odległości euklidesowych między centrami grup województw.

0x01 graphic

Klikając klawisz Analiza wariancji uzyskujemy okno zawierające wyniki analizy wariancji (rys. 3.15).

Rys. 3.15. Okno Analiza wariancji.

0x01 graphic

W otrzymanym arkuszu znajdują się miary zróżnicowania międzygrupowego i zróżnicowania wewnątrzgrupowego kolejnych zmiennych diagnostycznych wraz z odpowiadającymi im stopniami swobody. Uzyskane, jako stosunek zróżnicowania międzygrupowego do zróżnicowania wewnątrzgrupowego, wartości statystyki F pozwalają na ustalenie hierarchii zmiennych ze względu na ich moc dyskryminacyjną. Podstawowe znaczenie dla ostatecznych wyników grupowania miała zmienna X83.

Używając klawisza Wykres średnich otrzymujemy wykres średnich wartości zmiennych dla każdej z grup województw cechami charakterystycznymi pierwszej z grup województw (rys. 3.16) jest relatywnie najniższa przeciętna wartość.

Rys. 3.16. Wykres średnich wartości zmiennych dla grup województw.

0x01 graphic

Przykład 3.13

Stosując metodę katowicką, należącą do grupy metod hiperkostek, przeprowadzono grupowanie województw Polski ze względu na osiągnięty poziom życia w 2005 r. Na wstępie zakres zmienności każdej ze zmiennych podzielono na 4 przedziały klasowe o równej długości przyporządkowując kolejnym przedziałom, kolejne numery porządkowe, (tab. 3.11). Tym samym dokonujemy podziału siedmiowymiarowej przestrzeni klasyfikacji na 47=16 384 hiperkostek.

Następnie każdemu województwu przyporządkowano numer identyfikacyjny składający się z 7 elementowego ciągu liczb, którego kolejne elementy odpowiadają numerom przedziałom klasowym kolejnych zmiennych (tab. 3.12). Numery te wskazują jednocześnie, do której hiperkostki należy dane województwo.

Grupy województw, o podobnym poziomie życia, są tworzone z województw których numery identyfikacyjne są identyczne lub różnią się co najwyżej jednym elementem. Warunek ten prowadzi do utworzenia następujących grup województw:

G1={O1},

G2={O2, O14},

G3={O3, O11, O13},

G4={O4, O 8},

G5={O5},

G6={O6, O15},

G7={O7},

G8={O9, O10},

G9={O12},

G10={O16}.

Tabl. 3.11. Numery identyfikacyjne województw ze względu na numery klas zmiennych.

Województwa

Numery identyfikacyjne województw

X11

X15

X35

X51

X64

X71

X83

Dolnośląskie

1

3

3

4

2

4

4

Kujawsko-pomorskie

1

2

1

1

1

4

4

Lubelskie

1

1

1

1

1

1

4

Lubuskie

4

4

1

4

1

4

4

Łódzkie

4

1

1

4

1

4

1

Małopolskie

4

4

4

1

4

1

1

Mazowieckie

4

1

4

4

4

4

1

Opolskie

4

4

4

4

1

4

4

Podkarpackie

1

4

4

1

1

1

4

Podlaskie

4

4

4

1

1

1

4

Pomorskie

4

1

1

1

4

1

4

Śląskie

1

1

4

1

4

4

1

Świętokrzyskie

4

1

1

1

1

1

4

Warmińsko-mazurskie

1

4

1

1

1

4

4

Wielkopolskie

4

4

4

1

4

4

1

Zachodniopomorskie

1

4

1

4

4

4

4

Tabl. 3.12. Granice przedziałów klasowych zmiennych.

Zmienne

Granice przedziałów klasowych zmiennych

1

2

3

4

X11

-1,55 - -0,66

-0,66 - 0,23

0,23 - 1,12

1,12 - 2,00

X15

-2,15 - -1,27

-1,27 - -0,40

-0,40 - 0,47

0,47 - 1,35

X35

-1,70 - -0,94

-0,94 - -0,18

-0,18 - 0,58

0,58 - 1,34

X51

-1,65 - -0,81

-0,81 - 0,02

0,02 - 0,86

0,86 - 1,70

X64

-1,13 - -0,23

-0,23 - 0,66

0,66 - 1,55

1,55 - 2,44

X71

-2,66 - -1,72

-1,72 - -0,79

-0,79 - 0,15

0,15 - 1,08

X83

-2,81 - -1,91

-1,91 - -1,00

-1,00 - -0,09

-0,09 - 0,82

Przykład 3.14

Metoda taksonomii struktur została wykorzystana do podziału województw Polski na grupy województw o podobnej strukturze ludności według wieku w 2005 r. Na podstawie danych z Rocznika Statystycznego Województw (GUS, 2006) ustalono strukturę ludności według wieku w tych województwach (tab. 3.13).

Tab. 3.13. Wartości zmiennych opisujących strukturę ludności w województwach Polski według wieku w 2005 r.

Województwo

Udział ludności w danym wieku w ludności ogółem w procentach

0-2

(X1)

3-6

(X2)

7-12

(X3)

13-15

(X4)

16-18

(X5)

19-24

(X6)

25-34

(X7)

35-44

(X8)

45-54

(X9)

55-64

(X10)

Pow. 65 (X11)

Dolnośląskie

2,56

3,50

6,29

3,81

4,21

10,45

15,65

12,19

17,07

10,79

13,47

Kujawsko-Pomorskie

2,90

4,00

7,16

4,31

4,55

10,51

15,28

12,74

15,74

10,49

12,32

Lubelskie

2,86

3,96

7,19

4,47

4,74

10,56

14,42

12,47

14,92

10,14

14,27

Lubuskie

2,87

3,89

7,02

4,24

4,66

10,84

15,54

12,40

16,61

10,27

11,67

Łódzkie

2,57

3,50

6,30

3,83

4,06

9,58

14,91

12,42

16,37

11,58

14,88

Małopolskie

2,95

4,21

7,29

4,37

4,58

10,50

15,62

13,09

14,31

9,71

13,36

Mazowieckie

2,82

3,81

6,53

3,85

4,09

9,69

15,90

12,50

15,76

10,50

14,55

Opolskie

2,37

3,54

6,53

4,13

4,60

10,26

15,08

14,17

15,59

10,06

13,65

Podkarpackie

2,91

4,27

7,72

4,82

5,09

10,60

15,14

13,10

14,24

9,21

12,91

Podlaskie

2,68

3,88

7,31

4,55

4,90

10,50

14,35

13,35

14,60

9,41

14,46

Pomorskie

3,12

4,20

7,14

4,30

4,58

10,40

15,81

12,77

15,54

10,22

11,92

Śląskie

2,55

3,48

6,18

3,84

4,31

10,06

15,28

13,35

16,51

11,17

13,25

Świętokrzyskie

2,63

3,72

6,93

4,28

4,54

10,05

14,41

12,33

15,77

10,48

14,86

Warmińsko-Mazurskie

3,03

4,16

7,48

4,61

4,94

11,11

14,83

13,04

15,86

9,38

11,56

Wielkopolskie

3,02

4,09

7,12

4,33

4,64

10,61

16,01

12,69

15,28

10,33

11,89

Zachodnio

pomorskie

2,79

3,82

6,85

4,10

4,42

10,53

15,37

12,41

17,01

10,61

12,09

Następnie stosując miarę odległości struktur (1.76) zbudowano macierz odległości między województwami (tab. 3.14).

Tab. 3.14. Macierz odległości struktur między województwami.

O1

0.000

0.031

0.040

0.029

0.025

0.040

0.025

0.031

0.055

0.051

0.037

0.017

0.032

0.053

0.038

0.019

O2

0.031

0.000

0.024

0.016

0.043

0.022

0.029

0.028

0.029

0.035

0.010

0.030

0.026

0.023

0.011

0.015

O3

0.040

0.024

0.000

0.032

0.040

0.023

0.030

0.030

0.030

0.014

0.029

0.044

0.018

0.035

0.027

0.035

O4

0.029

0.016

0.032

0.000

0.045

0.033

0.036

0.038

0.041

0.046

0.016

0.034

0.034

0.025

0.016

0.012

O5

0.025

0.043

0.040

0.045

0.000

0.054

0.020

0.037

0.065

0.049

0.052

0.022

0.023

0.061

0.053

0.038

O6

0.040

0.022

0.023

0.033

0.054

0.000

0.037

0.030

0.016

0.022

0.021

0.039

0.037

0.030

0.022

0.036

O7

0.025

0.029

0.030

0.036

0.020

0.037

0.000

0.030

0.052

0.040

0.032

0.029

0.020

0.052

0.033

0.031

D =

O8

0.031

0.028

0.030

0.038

0.037

0.030

0.030

0.000

0.040

0.032

0.032

0.024

0.028

0.042

0.036

0.035

O9

0.055

0.029

0.030

0.041

0.065

0.016

0.052

0.040

0.000

0.024

0.032

0.050

0.048

0.024

0.032

0.044

O10

0.051

0.035

0.014

0.046

0.049

0.022

0.040

0.032

0.024

0.000

0.040

0.046

0.027

0.032

0.039

0.048

O11

0.037

0.010

0.029

0.016

0.052

0.021

0.032

0.032

0.032

0.040

0.000

0.038

0.034

0.023

0.006

0.022

O12

0.017

0.030

0.044

0.034

0.022

0.039

0.029

0.024

0.050

0.046

0.038

0.000

0.033

0.049

0.041

0.027

O13

0.032

0.026

0.018

0.034

0.023

0.037

0.020

0.028

0.048

0.027

0.034

0.033

0.000

0.044

0.036

0.032

O14

0.053

0.023

0.035

0.025

0.061

0.030

0.052

0.042

0.024

0.032

0.023

0.049

0.044

0.000

0.025

0.034

O15

0.038

0.011

0.027

0.016

0.053

0.022

0.033

0.036

0.032

0.039

0.006

0.041

0.036

0.025

0.000

0.022

O16

0.019

0.015

0.035

0.012

0.038

0.036

0.031

0.035

0.044

0.048

0.022

0.027

0.032

0.034

0.022

0.000

W kolejnym kroku wyznaczono wartość progową odległości między województwami w oparciu o formułę: 0x01 graphic
; i,i'=1,2,...,n.

Wartość krytyczna odległości wyniosła d*=0,0416.

Macierz odległości (3.14) przekształcono w macierz binarną podobieństwa województw P (tabl. 3.15), stosując formułę transformacji o postaci (3.33).

Tab. 3.15. Binarna macierz odległości między województwami.

O1

0

0

0

0

0

0

0

0

1

1

0

0

0

1

0

0

O2

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

O3

0

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

O4

0

0

0

0

1

0

0

0

0

1

0

0

0

0

0

0

O5

0

1

0

1

0

1

0

0

1

1

1

0

0

1

1

0

O6

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

O7

0

0

0

0

0

0

0

0

1

0

0

0

0

1

0

0

P =

O8

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O9

1

0

0

0

1

0

1

0

0

0

0

1

1

0

0

1

O10

1

0

0

1

1

0

0

0

0

0

0

1

0

0

0

1

O11

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

O12

0

0

1

0

0

0

0

0

1

1

0

0

0

1

0

0

O13

0

0

0

0

0

0

0

0

1

0

0

0

0

1

0

0

O14

1

0

0

0

1

0

1

0

0

0

0

1

1

0

0

0

O15

0

0

0

0

1

0

0

0

0

0

0

0

0

0

0

0

O16

0

0

0

0

0

0

0

0

1

1

0

0

0

0

0

0

Otrzymana macierz binarna stanowi punkt wyjścia do grupowania województw. Na podstawie tej macierzy konstruujemy wektor eliminacji, którego elementami są sumy wartości kolejnych wierszy macierzy binarnej:

0x01 graphic
[0, 1, 1, 2, 8, 1, 2, 0, 6, 5, 1, 4, 2, 5, 1, 2].

W pierwszym kroku procedury w macierzy P eliminujemy wiersz i kolumnę nr 5, które wskazuje maksymalny element w wektorze eliminacji p0, uzyskując macierz zredukowaną P:

Tab. 3.16. Zredukowana macierz binarna odległości między województwami.

O1

0

0

0

0

0

0

0

1

1

0

0

0

1

0

0

O2

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O3

0

0

0

0

0

0

0

0

0

0

1

0

0

0

0

O4

0

0

0

0

0

0

0

0

1

0

0

0

0

0

0

O6

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O7

0

0

0

0

0

0

0

1

0

0

0

0

1

0

0

P1 =

O8

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O9

1

0

0

0

0

1

0

0

0

0

1

1

0

0

1

O10

1

0

0

1

0

0

0

0

0

0

1

0

0

0

1

O11

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O12

0

0

1

0

0

0

0

1

1

0

0

0

1

0

0

O13

0

0

0

0

0

0

0

1

0

0

0

0

1

0

0

O14

1

0

0

0

0

1

0

0

0

0

1

1

0

0

0

O15

0

0

0

0

0

0

0

0

0

0

0

0

0

0

0

O16

0

0

0

0

0

0

0

1

1

0

0

0

0

0

0

Następnie w oparciu o macierz P1 konstruujemy wektor eliminacji p1:

0x01 graphic
[3, 0, 1, 1, 0, 2, 0, 5, 4, 0, 4, 2, 4, 0, 2].

Sprawdzamy, czy wszystkie elementy składowe wektora eliminacji są zerami. Ponieważ warunek ten nie jest spełniony, wyznaczamy maksymalny element wektora eliminacji i przystępujemy do kolejnego kroku procedury. Powtarzamy powyższą procedurę, aż do momentu gdy wszystkie składowe wektora eliminacji są zerami. Uzyskiwane w kolejnych krokach wektory eliminacji mają następującą postać:

Krok 2:

0x01 graphic
[2, 0, 1, 1, 0, 1, 0, 4, 0, 3, 1, 4, 0, 1]

W wektorze eliminacji występują dwie wartości maksymalne, ostatecznie eliminujemy z macierzy P2 wiersz i kolumnę odpowiadającą województwu O9. Województwu temu odpowiada większa maksymalna wartość w macierzy odległości (3.14) niż województwu O14.

Krok 3:

0x01 graphic
[1, 0, 1, 0, 0, 1, 0, 0, 2, 1, 4, 0, 0]

Krok 4:

0x01 graphic
[0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0]

W kroku tym otrzymaliśmy wektor eliminacji, w którym występują dwie wartości maksymalne. Ostatecznie eliminujemy z macierzy P4 wiersz i kolumnę odpowiadające województwu O12. Województwu temu odpowiada większa maksymalna wartość w macierzy odległości (3.14) niż w przypadku odpowiadającym jemu wierszu województwa O3.

Krok 5:

0x01 graphic
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

Wszystkie składowe wektora p5 są zerami województwa, które nie zostały wyeliminowane tworzą pierwszą grupę województw:

G1 = {O1, O2, O3, O4, O6, O7, O8, O11, O13, O15, O16}

W oparciu o postać wyjściową macierzy binarnej P, w szóstym kroku procedury, budujemy macierz P6, eliminując w macierzy wyjściowej wiersze i kolumny odpowiadające województwom należącym do pierwszej grupy obiektów (tab. 3.16).

Tab. 3.16. Binarna macierz odległości między województwami nie należącymi do grupy G1.

0x01 graphic

Następnie (w kroku 6) konstruujemy wektor eliminacji:

0x01 graphic
[3, 2, 2, 3, 2]

W wektorze eliminacji występują dwie maksymalne wartości. Z macierzy P6 eliminujemy wiersz i kolumnę odpowiadające województwu O5. Województwu temu odpowiada większa maksymalna wartość w odpowiadającym jemu zredukowanej macierzy odległości (wyjściowej macierzy odległości po eliminacji wektorów i wierszy opowiadających województwom należącym do grupy G1).

Powtarzamy powyższą procedurę do momentu gdy wszystkie składowe wektora eliminacji są zerami. W kolejnych krokach otrzymujemy następujące wektory eliminacji:

Krok 7:

0x01 graphic
[1, 1, 3, 1]

Krok 8:

0x01 graphic
[0, 0, 0]

Wszystkie składowe wektora p8 są zerami. Województwa, które nie zostały wyeliminowane tworzą drugą grupę województw:

G1 = {O9, O12, O14}

Na podstawie wyjściowej macierzy liniowej P w dziewiątym kroku procedury budujemy macierz P9, eliminując z macierzy wyjściowej wiersze i kolumny odpowiadające województwom należącym do grup G1 i G2 (tab. 3.17).

Tab. 3.17. Binarna macierz odległości między województwami nie należącymi do grup G1 i G2.

0x01 graphic

Następnie konstruujemy wektor eliminacji:

0x01 graphic

Bez względu na to, który wiersz i kolumnę wyeliminujemy z macierzy P9 otrzymamy dwie jednoelementowe grupy województw:

G3 = {O5},

G4 = {O10},

co kończy procedurę grupowania województw.

0x01 graphic



Wyszukiwarka

Podobne podstrony:
Wyb reprezentantow grup obiektow p, Wielowymiarowa analiza statystyczna, Panek, wap
metodyka met ind przyp, pr grup
metodyka met ind przyp, pr grup
Obiekty martyrologii polskiej
R 6 1 Obiektowy model zapytan
Wykład 6 2009 Użytkowanie obiektu
05 Odwzorowanie podstawowych obiektów rysunkowych
Automatyzacja w KiC (w 2) Obiekty reg
na niebie są widoczne różne obiekty astronomiczne
obiektywne metody oceny postawy ciała (win 1997 2003)
30 Obciążenia obiektów budowlanych, mostów drogowych i kolejowych
ST14 20010 Met ppt
Zasady zasilania energią obiektu szpitalnego
Obiekty Graficzne w PowerPoint
Metodyka Obiektowa pojęcia podstawowe
Organizacja działu handlu zagranicznego w zależności od grup

więcej podobnych podstron