1. Wstęp
Celem pracy jest analiza kształtowania się wielkości ścieków nieoczyszczonych, przemysłowych i komunalnych odprowadzanych do wód powierzchniowych lub do ziemi a także analiza czynników wpływających na ich wielkość.
Analizę przeprowadzono na przykładzie województw Polski. Wybrano sześć czynników, które potencjalnie mogłyby determinować wielkość nieoczyszczonych ścieków :
liczba ludności poszczególnych województw
liczba ludności obsługiwana przez oczyszczalnie ścieków w miastach województw
ludność zamieszkująca w miastach województw
liczba miast w województwach
wielkość produkcji sprzedanej przemysłu w województwach
wielkość poboru wody przez przemysł w województwach
Zadano pytanie w jaki sposób powyższe czynniki wpływają na wielkość
nieoczyszczonych ścieków w województwach Polski i czy w ogóle determinują ich wielkość. W tym celu zebrano dane statystyczne dotyczące powyższych wielkości aby zbudować odpowiedni model ekonometryczny opisujący zależności między wybranymi czynnikami. Źródłem danych jest Rocznik statystyczny 2001 roku.
Główną przesłanką wyboru tematu była próba znalezienia determinant ilości ścieków nieoczyszczonych w polskich województwach.
W skali niemal całego kraju odczuwany jest deficyt wód czystych. Wynika to z katastroficznego stanu czystości rzek, jezior, a często także wód podziemnych. Najbardziej zanieczyszczone rzeki i jeziora znajdują się na obszarach uznanych za szczególnie dotknięte odprowadzaniem nieoczyszczonych ścieków przez zakłady przemysłowe.
Wzrost wielkości produkcji sprzedanej przemysłu, koncentracji zwłaszcza przemysłu ciężkiego ; węglowego, chemicznego, hutnictwa, energetyki, przemysłu maszynowego prowadzi do zwiększenia ilości ścieków wypuszczonych do wód powierzchniowych lub do ziemi. Zwiększającej się liczbie ludności zamieszkującej dany teren towarzyszy równoczesny wzrost `produkowanych' i odprowadzanych, często nieoczyszczanych ścieków. W 2001 roku przemysł i gospodarka komunalna odprowadziły ( do wód i ziemi ) około 10 km3 ścieków. Część z nich stanowiły wody chłodnicze - uznawane umownie za czyste. Pozostałe stanowiły ścieki toksyczne, wymagające oczyszczenia. Oczyszczono jednak tylko 72% tych ścieków - głównie mechanicznie - mimo, że większość wymagała oczyszczenia chemicznego i biologicznego. Poważny wpływ na ilość nieoczyszczonych ścieków wywiera również niewystarczająca liczba oczyszczalni ścieków. Zwiększenie liczby budowanych oczyszczalni mogłoby neutralizować skutecznie ścieki nieoczyszczone. Tereny silnie zurbanizowane cechują się większą ilością `produkowanych' ścieków. Wzrost odsetka ludności miejskiej w województwach, stopień urbanizacji województw oznacza większe zanieczyszczenie terenu oraz większą ilość ścieków. O ilości odprowadzanych nieoczyszczonych ścieków może decydować także większa ilość pobieranej wody przez przemysł.
Założeniem pracy było zbudowanie modelu, który pomógłby w szacowaniu zmian ilości nieoczyszczonych ścieków w zależności od zwiększania się lub zmniejszania wybranych czynników. Taki model mógłby przedstawić możliwości zmniejszania ilości nieoczyszczonych ścieków, co byłoby pomocne w przeciwdziałaniu zanieczyszczeń wód powierzchniowych oraz gleb, a także w zmniejszaniu skali zaniedbań w gospodarce wodno-ściekowej.
2. Rozkład empiryczny cech i jego opis
Do analizy wybrano 16 województw Polski. Wykorzystano następujące dane :
|
Województwo\ zmienna |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
Y |
1 |
Dolnośląskie |
2972,7 |
90,3 |
71,5 |
90 |
36304,1 |
19,3 |
8 |
2 |
Kujawsko-Pomorskie |
2099,7 |
55,6 |
62,2 |
52 |
24828,7 |
32,7 |
36,4 |
3 |
Lubelskie |
2232,1 |
91,7 |
46,9 |
41 |
14468,7 |
34,1 |
2,5 |
4 |
Lubuskie |
1024 |
85,8 |
64,7 |
42 |
11092,2 |
16,6 |
4,6 |
5 |
Łódzkie |
2643,4 |
85,9 |
64,8 |
42 |
30492,2 |
27,2 |
11,3 |
6 |
Małopolskie |
3233,8 |
85,3 |
50,4 |
55 |
35787,6 |
66,2 |
21,9 |
7 |
Mazowieckie |
5072,3 |
59,9 |
64,2 |
84 |
102269,6 |
82,2 |
98 |
8 |
Opolskie |
1084,7 |
88,8 |
52,3 |
34 |
12892,5 |
32,4 |
3 |
9 |
Podkarpackie |
2128,6 |
80,2 |
41 |
45 |
19274,3 |
57,6 |
8,4 |
10 |
Podlaskie |
1221,1 |
88 |
58,5 |
36 |
8661,1 |
16,8 |
0,6 |
11 |
Śląskie |
4847,6 |
74,9 |
79,3 |
69 |
83990,1 |
26,2 |
11,7 |
12 |
Świętokrzyskie |
1322,9 |
82,6 |
45,8 |
29 |
11347,2 |
91,3 |
51,8 |
13 |
Warmińsko-Mazurskie |
1468,3 |
94,8 |
60,2 |
49 |
12561,6 |
30,5 |
3 |
14 |
Pomorskie |
2198,3 |
97,6 |
68,3 |
36 |
29953,6 |
41,7 |
2,5 |
15 |
Wielkopolskie |
3360,9 |
82,9 |
57,7 |
108 |
50742,7 |
83,7 |
8,6 |
16 |
Zachodniopomorskie |
1733,8 |
68,1 |
69,6 |
61 |
17956,1 |
91,5 |
29,1 |
Źródło : Rocznik statystyczny, 2001
X1- |
ludność województw (w tys.)
|
|
|
|
|
|
|
|
|
|
X2 - ludność obsługiwana przez oczyszczalnie ścieków w miastach (w procentach)
|
|
|
|
|
|
|
|
|
|
|
X3 - ludność miast (w procentach)
|
|
|
|
|
|
|
|
|
|
|
X4 - liczba miast
|
|
|
|
|
|
|
|
|
|
|
X5 - produkcja sprzedana przemysłu w mln zł (ceny realne)
|
|
|
|
|
|
|
|
|
|
|
X6 - pobór wody przez przemysł (w procentach ogólnego poboru)
|
|
|
|
|
|
|
|
|
|
|
Y - ścieki nieoczyszczone przemysłowe i komunalne odprowadzone do wód powierzchniowych lub do ziemi (w hm3)
|
|
|
|
|
|
|
|
|
|
|
Podstawowe obliczenia
Xmin |
1024 |
55,6 |
41 |
29 |
8661,1 |
16,6 |
0,6 |
Xmax |
5072,3 |
97,6 |
79,3 |
108 |
102269,6 |
91,5 |
98 |
Xmin / Xmax |
0,202 |
0,570 |
0,517 |
0,269 |
0,085 |
0,181 |
0,006 |
Xmax / Xmin |
4,953 |
1,755 |
1,934 |
3,724 |
11,808 |
5,512 |
163,333 |
Średnia |
2415,263 |
82,025 |
59,838 |
54,563 |
31413,894 |
46,875 |
18,838 |
Odchylenie standardowe |
1195,092 |
11,528 |
10,082 |
21,826 |
26095,003 |
26,601 |
24,731 |
Współczynnik zmienności |
49,481 |
14,054 |
16,848 |
40,002 |
83,068 |
56,749 |
131,287 |
Xmax - Xmin |
4048,3 |
42 |
38,3 |
79 |
93608,5 |
74,9 |
97,4 |
Średnia arytmetyczna
Jest to miara przeciętna, suma wartości zmiennej wszystkich jednostek badanej zbiorowości podzielona przez liczbę tych jednostek.
Interpr.; średnia liczba ludności w województwach wynosi 2415,263
Odchylenie standardowe
Jest to miara zmienności, określająca, o ile wszystkie jednostki danej zbiorowości różnią się średnio od średniej arytmetycznej badanej zmiennej.
Interpr.; liczba ludności województw różni się średnio od średniej arytmetycznej o 1195,092
Współczynnik zmienności
Jest to miara zmienności, iloraz bezwzględnej miary dyspersji i odpowiednich średnich. Wyrażony w procentach. Informuje o sile dyspersji. Duże jego wartości liczbowe świadczą o niejednorodności zbiorowości.
Empiryczny obszar zmienności
Jest miarą zmienności, różnicą między największą i najmniejszą wartością zmiennej w badanej zbiorowości.
Najmniejszą ilość ścieków nieoczyszczonych odprowadza województwo Podlaskie, zaś największą województwo Mazowieckie. Województwa są najsilniej zróżnicowane pod względem liczby ludności, produkcji sprzedanej przemysłu, poboru wody przez przemysł oraz ilości ścieków nieoczyszczonych odprowadzonych do wód powierzchniowych i do ziemi.
3. Współczynnik korelacji liniowej Pearsona
Parametrem wykorzystywanym do oceny siły zależności między zmiennymi jest współczynnik korealcji Pearsona.
Współczynnik ten jest miernikiem siły związku prostoliniowego miedzy dwiema cechami mierzalnymi. Związkiem prostoliniowym nazywamy taka zależność, w której jednostkowym przyrostom jednej zmiennej towarzyszy, średnio biorąc, stały przyrost drugiej zmiennej.
Określa się go wzorem:
gdzie:
cov(x,y) - jest kowariancją w dwuwymiarowym rozkładzie empirycznym
s(x) i s(y) - są odchyleniami standardowymi w empirycznych rozkładach brzegowych, odpowiednio zmiennej x oraz y.
W analizowanym przykładzie :
|
Y |
X1 |
0,45820832 |
X2 |
-0,71734576 |
X3 |
0,01331239 |
X4 |
0,24621801 |
X5 |
0,56283467 |
X6 |
0,60764558 |
|
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X1 |
|
|
|
|
|
|
X2 |
-0,399392 |
|
|
|
|
|
X3 |
0,390114 |
-0,190224 |
|
|
|
|
X4 |
0,708608 |
-0,315374 |
0,389942 |
|
|
|
X5 |
0,959031 |
-0,471161 |
0,460151 |
0,663258 |
|
|
X6 |
0,222306 |
-0,385089 |
-0,287679 |
0,287391 |
0,240134 |
|
Współczynnik korelacji liniowej Pearsona jest miarą unormowaną, przyjmuje wartości z przedziału : -1≤ rxy≤+1.. Dodatni znak współczynnika wskazuje na istnienie współzależności pozytywnej, ujemny zaś oznacza współzależność negatywną. Im moduł współczynnika korelacji jest bliższy jedności, tym zależność korelacyjna między badanymi zmiennymi jest silniejsza.
Przyjmuje się, że korelacja między dwiema cechami jest niewyraźna, jeśli
, średnia, gdy
, i wyraźna, jeśli
. Interpretacja ta odnosi się również do ujemnych wartości współczynnika korelacji.
W przykładzie najsilniejszy związek korelacyjny z ilością nieoczyszczonych ścieków tworzy liczba ludności obsługiwana przez oczyszczalnie ścieków,
dla tej zmiennej r2y= -0,71734576. Najsłabszy związek korelacyjny z Y tworzy ludność miast wyrażona w procentach, dla tej zmiennej r3y= 0,01331239.
4. Ocena istotności współczynnika korelacji liniowej Pearsona
Stawiamy hipotezę, że badane cechy są nieskorelowane w populacji generalnej, czyli
H0: ρ12 = 0
wobec hipotezy alternatywnej:
H1: ρ12
0
Sprawdzianem jest
o n-2 stopniach swobody. Wartości krytyczne rozkładu t-Studenta wynoszą dla poziomu istotności α=0,1 i 14 stopni swobody:
-1,761 oraz 1,761.
Wartości sprawdzianów dla obliczonych wyżej współczynników korelacji wynoszą:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
t17 |
t27 |
t37 |
t47 |
t57 |
t67 |
|
|
|
|
1,92886147 |
-3,85244 |
0,049815 |
0,950526 |
2,547801 |
2,862727 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Wartości statystyki t37 oraz t47 nie wpadają do obszaru krytycznego, a zatem nie ma podstaw do odrzucenia hipotezy H0 |
|
|
|
|
|
|
|
|
|
Pozostałe wartości statystyki wpadają do obszaru krytycznego, zatem hipotezę H0 odrzucamy na korzyść H1. Ryzyko, że popełnimy błąd wynosi 0,1.
W analizowanym przykładzie, nie wpływają istotnie na ilość ścieków nieoczyszczonych odprowadzonych do wód powierzchniowych i do ziemi : odsetek ludności zamieszkująca miasta w województwach oraz liczba miast danego województwa. Zmienne X3 i X4 są zbędne i należy je usunąć z modelu.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7. Ocena parametrów z zastosowaniem rangowania
W metodzie tej wykorzystuje się terminy stymulanty, destymulanty i nominanty. Stymulanta - to zmienna, której wysokie wartości świadczą na korzyść, a niskie na niekorzyść ocenianego obiektu. Natomiast destymulanta to taka zmienna, której wysokie wartości świadczą na niekorzyść, a niskie na korzyść obiektu. Nominanta zaś to cecha diagnostyczna, której wartości tylko z pewnego wybranego przedziału są korzystne. W badanym modelu zmienne X1, X3, X4, X5, X6 to stymulanty, natomiast X2 to destymulanta.
Metoda rang
Metoda ta przypisuje rangi: R1, R2, R3, R4, R5, R6 poszczególnym zmiennym. Zmienną syntetyzującą te uporządkowania jest średnia arytmetyczna rang, przy jednoczesnym założeniu, że wszystkie mają jednakowe znaczenie.
Województwo |
R1 |
R2 |
R3 |
R4 |
R5 |
R6 |
Ry |
Suma R |
Kolejność miejsc |
Dolnośląskie |
5 |
13 |
2 |
2 |
4 |
14 |
10 |
50 |
7 |
Kujawsko-Pomorskie |
10 |
1 |
8 |
7 |
8 |
9 |
3 |
46 |
5,5 |
Lubelskie |
7 |
14 |
14 |
12 |
11 |
8 |
14,5 |
80,5 |
12,5 |
Lubuskie |
16 |
9 |
6 |
10,5 |
15 |
16 |
11 |
83,5 |
14 |
Łódzkie |
6 |
10 |
5 |
10,5 |
6 |
12 |
7 |
56,5 |
8 |
Małopolskie |
4 |
8 |
13 |
6 |
5 |
5 |
5 |
46 |
5,5 |
Mazowieckie |
1 |
2 |
7 |
3 |
1 |
4 |
1 |
19 |
1 |
Opolskie |
15 |
12 |
12 |
15 |
12 |
10 |
12,5 |
88,5 |
15 |
Podkarpackie |
9 |
5 |
16 |
9 |
9 |
6 |
9 |
63 |
9 |
Podlaskie |
14 |
11 |
10 |
13,5 |
16 |
15 |
16 |
95,5 |
16 |
Śląskie |
2 |
4 |
1 |
4 |
2 |
13 |
6 |
32 |
2 |
Świętokrzyskie |
13 |
6 |
15 |
16 |
14 |
2 |
2 |
68 |
10 |
Warmińsko-Mazurskie |
12 |
15 |
9 |
8 |
13 |
11 |
12,5 |
80,5 |
12,5 |
Pomorskie |
8 |
16 |
4 |
13,5 |
7 |
7 |
14,5 |
70 |
11 |
Wielkopolskie |
3 |
7 |
11 |
1 |
3 |
3 |
8 |
36 |
3 |
Zachodniopomorskie |
11 |
3 |
3 |
5 |
10 |
1 |
4 |
37 |
4 |
W metodzie tej pierwsze miejsce zajmuje województwo Mazowieckie, jest to obszar o najbardziej niekorzystnych warunkach. Województwo to jest najsilniej narażone na skażenie wód powierzchniowych i gleb. Ostatnie miejsce w metodzie rang zajmuje województwo Podlaskie. Posiada najkorzystniejsze warunki, a zatem jest najmniej narażone na skażenie.
Metoda zmiennych zunitaryzowanych
Unitaryzacja zmiennych polega na takim przekształceniu zmiennych wyjściowych by przetworzona zmienna przyjmowała wartości z przedziału < 0,1>. Metoda zmiennych zunitaryzowanych pozwala na sprowadzenie do porównywalności cech różniących się nie tylko ze względu na miano, ale i skalę.
Dla stymulanty zmienna zunitaryzowana ma postać:
Dla destymulanty zmienna zunitaryzowana przybiera formę:
Wyniki uzyskane tą metodą różnią się nieznacznie w pewnych punktach od wielkości otrzymanych metodą rang. Również według metody zmiennych zunitaryzowanych pierwsze miejsce uzyskało województwo Mazowieckie, podobnie na ostatnim miejscu znalazło się województwo Podlaskie. Różnice miejsc tych dwóch metod są niewielkie.
|
Województwo\ zmienna |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
Y |
Z1 |
Z2 |
Z3 |
Z4 |
Z5 |
Z6 |
Zy |
Suma Z |
Kolejność miejsc |
1 |
Dolnośląskie |
2972,7 |
90,3 |
71,5 |
90 |
36304,1 |
19,3 |
8 |
0,481 |
0,174 |
0,796 |
0,772 |
0,295 |
0,036 |
0,076 |
2,631 |
6 |
2 |
Kujawsko-Pomorskie |
2099,7 |
55,6 |
62,2 |
52 |
24828,7 |
32,7 |
36,4 |
0,266 |
1,000 |
0,554 |
0,291 |
0,173 |
0,215 |
0,368 |
2,866 |
5 |
3 |
Lubelskie |
2232,1 |
91,7 |
46,9 |
41 |
14468,7 |
34,1 |
2,5 |
0,298 |
0,140 |
0,154 |
0,152 |
0,062 |
0,234 |
0,020 |
1,060 |
14 |
4 |
Lubuskie |
1024 |
85,8 |
64,7 |
42 |
11092,2 |
16,6 |
4,6 |
0,000 |
0,281 |
0,619 |
0,165 |
0,026 |
0,000 |
0,041 |
1,131 |
13 |
5 |
Łódzkie |
2643,4 |
85,9 |
64,8 |
42 |
30492,2 |
27,2 |
11,3 |
0,400 |
0,279 |
0,621 |
0,165 |
0,233 |
0,142 |
0,110 |
1,949 |
9 |
6 |
Małopolskie |
3233,8 |
85,3 |
50,4 |
55 |
35787,6 |
66,2 |
21,9 |
0,546 |
0,293 |
0,245 |
0,329 |
0,290 |
0,662 |
0,219 |
2,584 |
7 |
7 |
Mazowieckie |
5072,3 |
59,9 |
64,2 |
84 |
102269,6 |
82,2 |
98 |
1,000 |
0,898 |
0,606 |
0,696 |
1,000 |
0,876 |
1,000 |
6,075 |
1 |
8 |
Opolskie |
1084,7 |
88,8 |
52,3 |
34 |
12892,5 |
32,4 |
3 |
0,015 |
0,210 |
0,295 |
0,063 |
0,045 |
0,211 |
0,025 |
0,864 |
15 |
9 |
Podkarpackie |
2128,6 |
80,2 |
41 |
45 |
19274,3 |
57,6 |
8,4 |
0,273 |
0,414 |
0,000 |
0,203 |
0,113 |
0,547 |
0,080 |
1,631 |
11 |
10 |
Podlaskie |
1221,1 |
88 |
58,5 |
36 |
8661,1 |
16,8 |
0,6 |
0,049 |
0,229 |
0,457 |
0,089 |
0,000 |
0,003 |
0,000 |
0,825 |
16 |
11 |
Śląskie |
4847,6 |
74,9 |
79,3 |
69 |
83990,1 |
26,2 |
11,7 |
0,944 |
0,540 |
1,000 |
0,506 |
0,805 |
0,128 |
0,114 |
4,038 |
2 |
12 |
Świętokrzyskie |
1322,9 |
82,6 |
45,8 |
29 |
11347,2 |
91,3 |
51,8 |
0,074 |
0,357 |
0,125 |
0,000 |
0,029 |
0,997 |
0,526 |
2,108 |
8 |
13 |
Warmińsko-Mazurskie |
1468,3 |
94,8 |
60,2 |
49 |
12561,6 |
30,5 |
3 |
0,110 |
0,067 |
0,501 |
0,253 |
0,042 |
0,186 |
0,025 |
1,183 |
12 |
14 |
Pomorskie |
2198,3 |
97,6 |
68,3 |
36 |
29953,6 |
41,7 |
2,5 |
0,290 |
0,000 |
0,713 |
0,089 |
0,227 |
0,335 |
0,020 |
1,674 |
10 |
15 |
Wielkopolskie |
3360,9 |
82,9 |
57,7 |
108 |
50742,7 |
83,7 |
8,6 |
0,577 |
0,350 |
0,436 |
1,000 |
0,450 |
0,896 |
0,082 |
3,791 |
3 |
16 |
Zachodniopomorskie |
1733,8 |
68,1 |
69,6 |
61 |
17956,1 |
91,5 |
29,1 |
0,175 |
0,702 |
0,747 |
0,405 |
0,099 |
1,000 |
0,293 |
3,421 |
4 |
Ocena podobieństwa uporządkowania
Miarą zgodności uporządkowań wynikających z dwóch powyższych metod można zmierzyć za pomocą współczynnika korelacji (kolejnościowej)rang Spearmana. Można przedstawić go w postaci:
Porównując metody rangowania należy dokonać obliczeń:
|
Województwo |
( Vx-Vy)^2 |
|
Vx - kolejność miejsc w metodzie rang |
|
|
|
|
|
|
1 |
Dolnośląskie |
1 |
|
Vy - kolejność miejsc w metodzie zmiennych zunitaryzowanych |
|
|
|
|
|
|
2 |
Kujawsko-Pomorskie |
0,25 |
|
|
|
|
|
|
|
|
3 |
Lubelskie |
2,25 |
|
|
|
|
|
|
|
|
4 |
Lubuskie |
1 |
|
|
|
|
|
|
|
|
5 |
Łódzkie |
1 |
|
|
Rs = |
0,975 |
|
|
|
|
6 |
Małopolskie |
2,25 |
|
|
|
|
|
|
|
|
7 |
Mazowieckie |
0 |
|
|
|
|
|
|
|
|
8 |
Opolskie |
0 |
|
|
|
|
|
|
|
|
9 |
Podkarpackie |
4 |
|
|
|
|
|
|
|
|
10 |
Podlaskie |
0 |
|
|
|
|
|
|
|
|
11 |
Śląskie |
0 |
|
|
|
|
|
|
|
|
12 |
Świętokrzyskie |
4 |
|
|
|
|
|
|
|
|
13 |
Warmińsko-Mazurskie |
0,25 |
|
|
|
|
|
|
|
|
14 |
Pomorskie |
1 |
|
|
|
|
|
|
|
|
15 |
Wielkopolskie |
0 |
|
|
|
|
|
|
|
|
16 |
Zachodniopomorskie |
0 |
|
|
|
|
|
|
|
|
|
Suma : |
17 |
|
|
|
|
|
|
|
|
Z przeprowadzonych obliczeń wynika, że współczynnik korelacji rang Spearmana wynosi 0,975. Zatem występuje dokładna zależność między uporządkowaniami tymi dwiema metodami. Można stosować zamiennie jedną z metod.
8. Metoda unitaryzacji zmiennej zerowanej - metoda postępowania wzorca rozwoju Hellwiga
Schemat postępowania w metodzie wzorca rozwoju Hellwiga jest nastepujące:
Wyznacza się abstrakcyjne obserwacje (wektory liczbowe), tzw. wzorzec rozwoju Z0 oraz antywzorzec Z-0. Wzorzec rozwoju to wektor składający się z najlepszych wartości zmiennej dla każdej zmiennej:
W przypadku, gdy j - ta zmienna jest stymulantą:
Z0j = max zij
a gdy jest destymulantą:
Z0j = min zij
Antywzorzec to wektor składający się z najmniej korzystnych wartości zmiennej zunitaryzowanej dla każdej cechy:
Badane jest podobieństwo obserwacji do abstrakcyjnej „najlepszej” obserwacji. Odległość każdej zunitaryzowanej (lub zestandaryzowanej) obserwacji zij od wzorca rozwoju:
gdzie:
z0j - j-ta zmienna wzorca rozwoju
zij - j-ta zmienna zunitaryzowana
Uważa się, że im bardziej podobna jest m-wymiarowa obserwacja do wzorca rozwoju, tym wyższy jest poziom rozwoju badanego zjawiska złożonego i tym mniejsza odległość dzieli
i-tą obserwację od obserwacji abstrakcyjnej z0i
Dla każdej obserwacji wyznacza się tzw. miarę rozwoju według wzoru:
gdzie:
d0 - odległość między wzorcem rozwoju i antywzorcem
Miernik rozwoju przyjmuje wartości z przedziału <0,1>. Im wyższy jest poziom zjawiska, tym bliższa jedności jest ta wielkość i tym mniej oddalony jest dany obiekt od obiektu wzorcowego.
W prezentowanym przykładzie:
Wzorzec rozwoju Zo = [ 1, 0, 1, 1, 1, 1, 1]
Antywzorzec Z-o = [0, 1, 0, 0, 0, 0, 0]
d0 = 2,646
di0 - odległość każdej zunitaryzowanej obserwacji od wzorca rozwoju
mi - miernik rozwoju
|
Województwo |
d io |
mi |
1 |
Dolnośląskie |
1,635 |
0,382 |
2 |
Kujawsko-Pomorskie |
1,985 |
0,250 |
3 |
Lubelskie |
2,092 |
0,209 |
4 |
Lubuskie |
2,189 |
0,173 |
5 |
Łódzkie |
1,843 |
0,303 |
6 |
Małopolskie |
1,594 |
0,398 |
7 |
Mazowieckie |
1,034 |
0,609 |
8 |
Opolskie |
2,208 |
0,166 |
9 |
Podkarpackie |
2,043 |
0,228 |
10 |
Podlaskie |
2,253 |
0,148 |
11 |
Śląskie |
1,457 |
0,449 |
12 |
Świętokrzyskie |
1,980 |
0,252 |
13 |
Warmińsko-Mazurskie |
2,034 |
0,231 |
14 |
Pomorskie |
1,849 |
0,301 |
15 |
Wielkopolskie |
1,333 |
0,496 |
16 |
Zachodniopomorskie |
1,704 |
0,356 |
Powyższa metoda ma na celu uszeregowanie zmiennych. W danym przykładzie mi waha się w przedziale od 0,148 do 0,609. Wynika stąd, że najbardziej oddalonym od obiektu wzorcowego jest województwo Podlaskie a najmniej województwo Mazowieckie. Poszczególne obiekty nie są bardzo oddalone od obiektu wzorcowego.
LITERATURA:
M.Sobczyk: „Statystyka”, Wydawnictwo Naukowe PWN, Warszawa 1996
W.Skrzypczak: „Geografia ekonomiczna”, EFEKT, Warszawa 1998
A.S.Barczak, J.Biolik: „Podstawy ekonometrii”, Wydawnictwo Uczelniane Akademii Ekonomicznej w Katowicach, Katowice 1998
A.Goryl, Z.Jędrzejczyk, K.Kukuła, J.Osiewalski, A.Walkosz: „Wprowadzenie do ekonometrii w przykładach i zadaniach”, Wydawnictwo Naukowe PWN Warszawa 1999
J.Jóźwiak, J.Podgórski: „Statystyka od podstaw”, PWE, Warszawa 1998
M.Sobczyk: „Statystyka. Podstawy teoretyczne przykłady” - zadania, Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej, Lublin 1998
A.Welfe: „Ekonometria. Metody i ich zastosowanie”, PWE, Warszawa 1998
K.Zając: „Zarys metod statystycznych”, PWE, Warszawa 1998
M.Sobczyk: „Elementy statystyki i demografii”, PWE, Warszawa 1997