Rk IV, Wielowymiarowa analiza statystyczna, Panek, wap


Rozdział IV

WYBÓR REPREZENTANTÓW GRUP OBIEKTÓW PRZE-STRZENNYCH

Wybór reprezentantów grup obiektów przestrzennych dokonywany jest na podstawie wcześniejszego grupowania porównywanych obiektów. Z każdej grupy obiektów wybierany jest jeden reprezentant, który powinien charakteryzować się dwoma podstawowymi własnościami (Nowak, 1990, s. 184):

Przykładowymi metodami, posiadającymi powyższe własności, są metoda środka ciężkości oraz metoda potencjałów (Pluta, 1977).

4.1. Metoda środka ciężkości

Sposób wyboru reprezentantów w metodzie środka ciężkości zależy od liczebności grup obiektów, przy czym wyróżnia się grupy jednoelementowe, grupy dwuelementowe oraz grupy wieloelementowe o liczbie elementów większej od dwóch.

Obiekty stanowiące grupy jednoelementowe stają się automatycznie reprezentantami, gdyż charakteryzują się własnościami (wartościami opisujących je zmiennych) znacznie różniącymi się od pozostałych obiektów.

W kolejnym etapie procedury wybieramy reprezentanty grup wieloelementowych. Na wstępie obliczamy sumę odległości każdego obiektu od pozostałych obiektów w danej, r-tej grupie wieloelementowej.

0x01 graphic
, i,i'=1,2,...,nr>2, ii'. (4.1)

Reprezentantem r-tej grupy obiektów zostaje obiekt o najmniejszej sumie odległości od innych obiektów tej grupy:

0x01 graphic
, i=1,2,...,nr. (4.2)

Wybrany obiekt reprezentant jest najbardziej podobny do pozostałych obiektów należących do danej grupy obiektów.

W ostatnim etapie procedury wybierane są reprezentanty grup dwuelementowych. W tym celu obliczamy sumy odległości każdego obiektu z danej r-tej grupy dwuelementowej od wybranych we wcześniejszych etapach obiektów reprezentantów:

0x01 graphic
, i'=1,...,nr'=2. (4.3)

Reprezentantem danej grupy dwuelementowej zostaje obiekt, dla którego suma odległości (4.3) jest większa:

0x01 graphic
, i'=1,...,nr'=2. (4.4)

Wybrany w ten sposób obiekt reprezentant jest najmniej podobnym obiektem, w danej grupie obiektów, do obiektów reprezentantów grup jednoelementowych i grup wieloelementowych.

Zaprezentowana procedura nie pozwala na wybór obiektów reprezentantów z dwuelementowych grup obiektów, gdy mamy do czynienia z większą ich liczbą. W sytuacji gdy występuje więcej niż jedna grupa dwuelementowa proponujemy zastosować zmodyfikowaną formułę (4.3), a mianowicie uwzględnić w niej obok sumy odległości danego obiektu od obiektów reprezentantów także sum jego odległości od środków ciężkości pozostałych grup dwuelementowych. Formuła (4.3) przyjmuje wtedy postać:

0x01 graphic
, i'=1,...,nr'=2; i”=1,...,nr”=2; ii'. (4.5)

gdzie:

i”c - środek ciężkości danej dwuelementowej grupy obiektów, obliczany według formuły (2.46).

Przykład 4.1

Wybór reprezentantów grup województw został przeprowadzony metodą środka ciężkości, dla grup województw otrzymanych w wyniku zastosowania metody k-średnich. W efekcie zastosowania tej metody otrzymaliśmy następujące 4 grupy województw (por. Przykład 3.9):

0x01 graphic

W analizowanym przykładzie nie otrzymano grup jednoelementowych, a tym samym możemy przystąpić do wyboru reprezentantów z grup wieloelementowych. W tym celu obliczamy, niezależnie dla każdej grupy, sumę odległości każdego z województw od pozostałych województw otrzymując:

Grupa G1:

d1=1,707,

d2=1,650,

d3=1,677,

d14=1,658,

d16=1,571,

Grupa G2:

d6=2,161,

d7=2,798,

d8=2,977,

d10=2,668,

d11=2,847

d15=2,696,

Grupa G3:

d3=1,064,

d9=1,369,

d13=1,120.

Następnie w każdej z grup województw jako reprezentanta wybieramy województwo o najmniejszej sumie odległości od innych województw. Reprezentantami kolejnych grup województw zostają tym samym:

G1→O16,

G2→O6,

G3→O3.

W przypadku wyboru reprezentantów z dwuelementowej grupy województw G4 szacujemy dla każdego z województw z tej grupy sumę jego odległości od wcześniej wybranych województw reprezentantów otrzymując:

d5=11,376,

d10=10,149.

Reprezentantem grupy G4 zostaje województwo, dla którego suma powyższych odległości jest większa, tzn.:

G4→ O5.

4.2. Metoda potencjałów

Punktem wyjścia metody potencjałów jest konstrukcja skupień I-go rzędu. Tym samym każdemu obiektowi Oi przyporządkowujemy obiekt najbardziej do niego podobny 0x01 graphic
, tzn. obiekt, dla którego spełniona jest relacja:

0x01 graphic
i,i'=1,2,...,nr, ii' . (4.6)

W efekcie otrzymujemy pary obiektów. Pierwszy z wierzchołków (odpowiadający i-temu obiektowi) stanowi początek wiązadła (odcinka łączącego wierzchołki), a drugi z wierzchołków (odpowiadających 0x01 graphic
-temu obiektowi) jest końcem tego wiązadła. Kierunek wiązadeł (połączeń między obiektami) przedstawia się w postaci skierowanych strzałek. Otrzymujemy w ten sposób graf zorientowany (rys. 4.1, Przykład 4.2).

Następnie określamy potencjał wierzchołków (obiektów) tożsamy z liczbą skierowanych do nich strzałek. Reprezentantem danego skupienia (grupy obiektów) zostaje obiekt o największym potencjale. Jeżeli w danym skupieniu występuje więcej niż jeden obiekt o maksymalnym potencjale to jako reprezentanta skupienia wybieramy ten obiekt, którego średnia odległość od pozostałych obiektów jest najmniejsza.

0x01 graphic
, i=1,2,...,nr, (4.7)

przy czym:

0x01 graphic
, i,i'=1,2,...,nr. (4.8)

Uzyskujemy w ten sposób podstawowy zbiór obiektów reprezentantów. Zbiór ten wykorzystujemy do wyeliminowania tzw. elementów (obiektów) zbędnych i nieistotnych. W tym celu obszar zmienności odległości województw od województwa reprezentanta w tym skupieniu jest dzielony na trzy podobszary:

0x01 graphic
, (4.9)

0x01 graphic
, (4.10)

0x01 graphic
, (4.11)

gdzie:

0x01 graphic
, (4.12)

0x01 graphic
. (4.13)

Wszystkie obiekty, których odległości od obiektu podstawowego w danym skupieniu należą do pierwszego z przedziałów, nazywane są zbędnymi gdyż leżą relatywnie blisko obiektów podstawowych. Natomiast obiekty, których odległości od obiektu podstawowego, w danym skupieniu, należą do trzeciego z przedziałów nazywane są nieistotnymi, gdyż leżą relatywnie daleko od obiektów podstawowych. Pozostałe obiekty, wraz z obiektami podstawowymi, stają się reprezentantami.

Przykład 4.2

Do wyboru województw reprezentantów wykorzystano metodę potencjałów. Punktem wyjścia metody są skupienia 1-szego rzędu otrzymane podczas budowy dendrytu za pomocą metody taksonomii wrocławskiej (por. rozdz. 2.3.1). Kierunek połączeń między parami województw przedstawiamy w postaci skierowanych strzałek, otrzymując skupienia zorientowane (rys. 4.1).

Rys. 4.1. Zorientowane skupienia 1-szego rzędu.

0x01 graphic

Następnie określamy potencjał poszczególnych województw. W skupieniu dwuelementowym oba województwa mają ten sam potencjał równy 1. Jako reprezentanta tej grupy wybieramy województwo, którego średnia odległość od pozostałych województw jest najmniejsza. Odległości te były w naszym przykładzie następujące:

0x01 graphic
.

Ostatecznie podstawowy zbiór województw ma następującą postać:

GP={O1, O3, O6, O14}.

Na podstawie odległości województw od województw należących do zbioru podstawowego eliminujemy, w każdym ze skupień, województwa zbędne spełniające nierówność:

diir<2,2655-0,551<1,7145.

Do zbioru województw zbędnych należą województwa:

GZ={O2, O14}.

Natomiast dla województw nieistotnych spełniona jest nierówność:

diir.>2,2655+0,551>2,8165.

Do zbioru województw nieistotnych wchodzą województwa:

GN={O5, O8, O9, O12}.

Województwami, dla których spełniona jest nierówność:

3,232≤diir≤4,060

są województwa O4, O7, O10, O11, O13, O15, które wraz z województwami podstawowymi tworzą ostateczny zbiór województw reprezentantów o postaci:

GR={ O1, O3, O4, O5, O6, O7, O10, O11, O13, O14, O15}.

181



Wyszukiwarka

Podobne podstrony:
Podstawowe pojecia przyklady, Wielowymiarowa analiza statystyczna, Panek, wap
Metody porzadkowani liniowego, Wielowymiarowa analiza statystyczna, Panek, wap
Transformacja, Wielowymiarowa analiza statystyczna, Panek, wap
Klasyczna an czynn, Wielowymiarowa analiza statystyczna, Panek, wap
harmonogram wap, Wielowymiarowa analiza statystyczna, Panek, wap
Metody porzadkowania liniowego p, Wielowymiarowa analiza statystyczna, Panek, wap
Analiza korespondencji, Wielowymiarowa analiza statystyczna, Panek, wap
Wybor repr gr obiektow, Wielowymiarowa analiza statystyczna, Panek, wap
Podstawowe pojecia, Wielowymiarowa analiza statystyczna, Panek, wap
Metody grupowania obiektow, Wielowymiarowa analiza statystyczna, Panek, wap
An gl sklad, Wielowymiarowa analiza statystyczna, Panek, wap
analiza kanoniczna p, Wielowymiarowa analiza statystyczna, Panek, wap
Wyb reprezentantow grup obiektow p, Wielowymiarowa analiza statystyczna, Panek, wap
Met porz nieliniowego, Wielowymiarowa analiza statystyczna, Panek, wap
Analiza kanoniczna, Wielowymiarowa analiza statystyczna, Panek, wap
WAS egzamin, Wielowymiarowa analiza statystyczna
wielowymiarowa analiza statystyczna DWJNX64TI3NMLMCMGQW3YQWWUOQSMOA4OWT6I6Q
podstawowe pojecia, WIELOWYMIAROWA ANALIZA PORÓWNAWCZA (WAP)

więcej podobnych podstron