Rozdział IV
WYBÓR REPREZENTANTÓW GRUP OBIEKTÓW PRZE-STRZENNYCH
Wybór reprezentantów grup obiektów przestrzennych dokonywany jest na podstawie wcześniejszego grupowania porównywanych obiektów. Z każdej grupy obiektów wybierany jest jeden reprezentant, który powinien charakteryzować się dwoma podstawowymi własnościami (Nowak, 1990, s. 184):
jak największym podobieństwem, ze względu na opisujące go wartości zmiennych, do pozostałych obiektów w danej grupie,
jak najmniejszym podobieństwem do obiektów reprezentantów innych grup.
Przykładowymi metodami, posiadającymi powyższe własności, są metoda środka ciężkości oraz metoda potencjałów (Pluta, 1977).
4.1. Metoda środka ciężkości
Sposób wyboru reprezentantów w metodzie środka ciężkości zależy od liczebności grup obiektów, przy czym wyróżnia się grupy jednoelementowe, grupy dwuelementowe oraz grupy wieloelementowe o liczbie elementów większej od dwóch.
Obiekty stanowiące grupy jednoelementowe stają się automatycznie reprezentantami, gdyż charakteryzują się własnościami (wartościami opisujących je zmiennych) znacznie różniącymi się od pozostałych obiektów.
W kolejnym etapie procedury wybieramy reprezentanty grup wieloelementowych. Na wstępie obliczamy sumę odległości każdego obiektu od pozostałych obiektów w danej, r-tej grupie wieloelementowej.
, i,i'=1,2,...,nr>2, i≠i'. (4.1)
Reprezentantem r-tej grupy obiektów zostaje obiekt o najmniejszej sumie odległości od innych obiektów tej grupy:
, i=1,2,...,nr. (4.2)
Wybrany obiekt reprezentant jest najbardziej podobny do pozostałych obiektów należących do danej grupy obiektów.
W ostatnim etapie procedury wybierane są reprezentanty grup dwuelementowych. W tym celu obliczamy sumy odległości każdego obiektu z danej r-tej grupy dwuelementowej od wybranych we wcześniejszych etapach obiektów reprezentantów:
, i'=1,...,nr'=2. (4.3)
Reprezentantem danej grupy dwuelementowej zostaje obiekt, dla którego suma odległości (4.3) jest większa:
, i'=1,...,nr'=2. (4.4)
Wybrany w ten sposób obiekt reprezentant jest najmniej podobnym obiektem, w danej grupie obiektów, do obiektów reprezentantów grup jednoelementowych i grup wieloelementowych.
Zaprezentowana procedura nie pozwala na wybór obiektów reprezentantów z dwuelementowych grup obiektów, gdy mamy do czynienia z większą ich liczbą. W sytuacji gdy występuje więcej niż jedna grupa dwuelementowa proponujemy zastosować zmodyfikowaną formułę (4.3), a mianowicie uwzględnić w niej obok sumy odległości danego obiektu od obiektów reprezentantów także sum jego odległości od środków ciężkości pozostałych grup dwuelementowych. Formuła (4.3) przyjmuje wtedy postać:
, i'=1,...,nr'=2; i”=1,...,nr”=2; i≠i'. (4.5)
gdzie:
i”c - środek ciężkości danej dwuelementowej grupy obiektów, obliczany według formuły (2.46).
Przykład 4.1
Wybór reprezentantów grup województw został przeprowadzony metodą środka ciężkości, dla grup województw otrzymanych w wyniku zastosowania metody k-średnich. W efekcie zastosowania tej metody otrzymaliśmy następujące 4 grupy województw (por. Przykład 3.9):
W analizowanym przykładzie nie otrzymano grup jednoelementowych, a tym samym możemy przystąpić do wyboru reprezentantów z grup wieloelementowych. W tym celu obliczamy, niezależnie dla każdej grupy, sumę odległości każdego z województw od pozostałych województw otrzymując:
Grupa G1:
d1=1,707,
d2=1,650,
d3=1,677,
d14=1,658,
d16=1,571,
Grupa G2:
d6=2,161,
d7=2,798,
d8=2,977,
d10=2,668,
d11=2,847
d15=2,696,
Grupa G3:
d3=1,064,
d9=1,369,
d13=1,120.
Następnie w każdej z grup województw jako reprezentanta wybieramy województwo o najmniejszej sumie odległości od innych województw. Reprezentantami kolejnych grup województw zostają tym samym:
G1→O16,
G2→O6,
G3→O3.
W przypadku wyboru reprezentantów z dwuelementowej grupy województw G4 szacujemy dla każdego z województw z tej grupy sumę jego odległości od wcześniej wybranych województw reprezentantów otrzymując:
d5=11,376,
d10=10,149.
Reprezentantem grupy G4 zostaje województwo, dla którego suma powyższych odległości jest większa, tzn.:
G4→ O5.
4.2. Metoda potencjałów
Punktem wyjścia metody potencjałów jest konstrukcja skupień I-go rzędu. Tym samym każdemu obiektowi Oi przyporządkowujemy obiekt najbardziej do niego podobny
, tzn. obiekt, dla którego spełniona jest relacja:
i,i'=1,2,...,nr, i≠i' . (4.6)
W efekcie otrzymujemy pary obiektów. Pierwszy z wierzchołków (odpowiadający i-temu obiektowi) stanowi początek wiązadła (odcinka łączącego wierzchołki), a drugi z wierzchołków (odpowiadających
-temu obiektowi) jest końcem tego wiązadła. Kierunek wiązadeł (połączeń między obiektami) przedstawia się w postaci skierowanych strzałek. Otrzymujemy w ten sposób graf zorientowany (rys. 4.1, Przykład 4.2).
Następnie określamy potencjał wierzchołków (obiektów) tożsamy z liczbą skierowanych do nich strzałek. Reprezentantem danego skupienia (grupy obiektów) zostaje obiekt o największym potencjale. Jeżeli w danym skupieniu występuje więcej niż jeden obiekt o maksymalnym potencjale to jako reprezentanta skupienia wybieramy ten obiekt, którego średnia odległość od pozostałych obiektów jest najmniejsza.
, i=1,2,...,nr, (4.7)
przy czym:
, i,i'=1,2,...,nr. (4.8)
Uzyskujemy w ten sposób podstawowy zbiór obiektów reprezentantów. Zbiór ten wykorzystujemy do wyeliminowania tzw. elementów (obiektów) zbędnych i nieistotnych. W tym celu obszar zmienności odległości województw od województwa reprezentanta w tym skupieniu jest dzielony na trzy podobszary:
, (4.9)
, (4.10)
, (4.11)
gdzie:
, (4.12)
. (4.13)
Wszystkie obiekty, których odległości od obiektu podstawowego w danym skupieniu należą do pierwszego z przedziałów, nazywane są zbędnymi gdyż leżą relatywnie blisko obiektów podstawowych. Natomiast obiekty, których odległości od obiektu podstawowego, w danym skupieniu, należą do trzeciego z przedziałów nazywane są nieistotnymi, gdyż leżą relatywnie daleko od obiektów podstawowych. Pozostałe obiekty, wraz z obiektami podstawowymi, stają się reprezentantami.
Przykład 4.2
Do wyboru województw reprezentantów wykorzystano metodę potencjałów. Punktem wyjścia metody są skupienia 1-szego rzędu otrzymane podczas budowy dendrytu za pomocą metody taksonomii wrocławskiej (por. rozdz. 2.3.1). Kierunek połączeń między parami województw przedstawiamy w postaci skierowanych strzałek, otrzymując skupienia zorientowane (rys. 4.1).
Rys. 4.1. Zorientowane skupienia 1-szego rzędu.
Następnie określamy potencjał poszczególnych województw. W skupieniu dwuelementowym oba województwa mają ten sam potencjał równy 1. Jako reprezentanta tej grupy wybieramy województwo, którego średnia odległość od pozostałych województw jest najmniejsza. Odległości te były w naszym przykładzie następujące:
.
Ostatecznie podstawowy zbiór województw ma następującą postać:
GP={O1, O3, O6, O14}.
Na podstawie odległości województw od województw należących do zbioru podstawowego eliminujemy, w każdym ze skupień, województwa zbędne spełniające nierówność:
diir<2,2655-0,551<1,7145.
Do zbioru województw zbędnych należą województwa:
GZ={O2, O14}.
Natomiast dla województw nieistotnych spełniona jest nierówność:
diir.>2,2655+0,551>2,8165.
Do zbioru województw nieistotnych wchodzą województwa:
GN={O5, O8, O9, O12}.
Województwami, dla których spełniona jest nierówność:
3,232≤diir≤4,060
są województwa O4, O7, O10, O11, O13, O15, które wraz z województwami podstawowymi tworzą ostateczny zbiór województw reprezentantów o postaci:
GR={ O1, O3, O4, O5, O6, O7, O10, O11, O13, O14, O15}.
181