mgr Grzegorz Stolarczyk
1
Ekonometria 1
BLOK 1
Opis kategorii ekonomicznych zmiennymi ilo
ś
ciowymi – zmienne diagnostyczne i zmienna
ilo
ś
ciowa
Zmienne diagnostyczne wykorzystywane s
ą
do opisu zło
ż
onych kategorii ekonomicznych, których
nie mo
ż
na opisa
ć
za pomoc
ą
jednej cechy. Odpowiednio dobrany zbiór zmiennych diagnostycznych
stanowi podstaw
ę
do konstruowania zmiennej syntetycznej, która mo
ż
e by
ć
traktowana jako miernik
zło
ż
onych kategorii ekonomicznych.
Przykład 1.
Prosz
ę
dobra
ć
odpowiedni zbiór zmiennych diagnostycznych i skonstruowa
ć
zmienn
ą
syntetyczn
ą
opisuj
ą
c
ą
poziom
ż
ycia ludno
ś
ci miast wojewódzkich w Polsce w roku 2001. Porówna
ć
miasta ze
wzgl
ę
du na poziom
ż
ycia ludno
ś
ci.
Rozwi
ą
zanie:
Poziom
ż
ycia jest to poj
ę
cie, które cho
ć
funkcjonuje w
ż
yciu codziennym, jest trudno
i jednoznacznie definiowalne. Najcz
ęś
ciej okre
ś
la si
ę
je jako „stopie
ń
zaspokojenia potrzeb ludno
ś
ci
wynikaj
ą
cy z konsumpcji wytworzonych przez człowieka dóbr materialnych i usług oraz wykorzystania
walorów
ś
rodowiska naturalnego i społecznego”
1
.
Wieloaspektowo
ść
badanego zjawiska bardzo utrudnia jego pomiary. W empirycznych badaniach
przyjmuje si
ę
zwykle zało
ż
enie o istnieniu mo
ż
liwo
ś
ci statystycznego pomiaru rzeczywistego stopnia
zaspokojenia okre
ś
lonych potrzeb człowieka zwi
ą
zanych z ró
ż
nymi elementami jego
ż
ycia.
W naszym przykładzie bierzemy pod uwag
ę
nast
ę
puj
ą
ce elementy
ż
ycia człowieka: ochrona
ś
rodowiska, zdrowie, edukacja, mieszkalnictwo, rynek pracy, bezpiecze
ń
stwo i opieka społeczna,
kultura i rozrywka. Dla ka
ż
dego z tych elementów wybieramy zestaw mierników – reprezentantów,
bior
ą
c pod uwag
ę
przede wszystkim kryterium merytoryczne uwzgl
ę
dniaj
ą
ce istotno
ść
danego
miernika z punktu widzenia celu i przedmiotu badania, jednoznaczno
ść
interpretacyjn
ą
dla ka
ż
dego
badanego obiektu, wyczerpanie przez dany miernik zakresu badanego zjawiska oraz proporcjonalna
reprezentacja poszczególnych elementów badanego zjawiska.
Nie istniej
ą
ż
adne obiektywne procedury doboru mierników, a jednym z wi
ę
kszych ogranicze
ń
przy
ich doborze jest dost
ę
pno
ść
danych statystycznych.
Na podstawie rocznika statystycznego województw z 2001r. wybieramy nast
ę
puj
ą
ce mierniki
poziomu
ż
ycia:
X1 – stopa bezrobocia
X2 – przeci
ę
tne miesi
ę
czne wynagrodzenie w sektorze przedsi
ę
biorstw brutto w zł
X3 - Kwota
ś
wiadcze
ń
pomocy społecznej w przeliczeniu na 1 mieszka
ń
ca w zł
X4 - Mieszkania oddane do u
ż
ytku na 1000 zawartych mał
ż
e
ń
stw
1
Cz. Bywalec, S. Wydymus, Poziom
ż
ycia ludno
ś
ci Polski w porównaniu z krajami Europejskiej Wspólnoty
Gospodarczej, Ekonomista 1992, nr 5-6
mgr Grzegorz Stolarczyk
2
Ekonometria 1
X5 - Przeci
ę
tna powierzchnia u
ż
ytkowa mieszkania w m2
X6 - Uczniowie szkół policealnych na 10 tys ludno
ś
ci
X7 - Wska
ź
nik wykrywalno
ś
ci sprawców przest
ę
pstw w %
X8 - Urodzenia
ż
ywe na 1000 ludno
ś
ci
X9 - Zgony ogółem na 1000 ludno
ś
ci
X10 - Łó
ż
ka w szpitalach na 10 tys ludno
ś
ci
X11 - Ludno
ść
korzystaj
ą
ca z oczyszczalni
ś
cieków w % ludno
ś
ci ogółem
X12 - Zanieczyszczenia powietrza pyłowe zatrzymane w urz
ą
dzeniach do redukcji zanieczyszcze
ń
X13 - Nakłady inwestycyjne na ochron
ę
ś
rodowiska w mln zł na 10 tys. mieszka
ń
ców
X14 - Widzowie w kinach na 1 seans
X15 - Wypo
ż
yczenia ksi
ę
gozbioru z bibliotek publicznych na 1 czytelnika w woluminach
X16 - Absolwenci szkół wy
ż
szych na 10 tys ludno
ś
ci
mgr Grzegorz Stolarczyk
3
Ekonometria 1
Tabela 1.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
X
14
X
15
X
16
Warszawa
5,1
3186,77
61
2149,2
72,3
80,2
28,6
7,2
10,8
68
43,7
99,3
1,6766266
35
19,1
282,8461
Białystok
13,3
1961,28
51
1399,5
59
146
54,1
8,4
7,6
96,6
98,8
99,4
1,1628516
45
17,1
249,15754
Bydgoszcz
11,7
1960,74
55
836,7
60,7
110,5
48,1
8,4
9
73,7
87,6
97,2
1,4378427
79
15,8
186,44983
Gda
ń
sk
10,1
2487,81
50
471,4
69,7
91,1
47,1
8,8
9,1
75,7
100
98,5
2,5600267
32
20,9
247,94495
Gorzów Wlkp.
15,4
1874,3
103
1225,6
61
112
66,7
8,4
7,6
73,9
96,6
95,8
0,435347
57
15,4
144,85182
Katowice
7
2581,78
63
362,3
87,1
124,2
39,3
7
10,4
108,1
61,3
98,4
1,4377975
61
19,7
406,81386
Kielce
15
1990,71
63
667,3
88,7
80,6
57,4
8,3
7,6
70,1
85,7
88,7
0,5041233
68
20,7
564,76083
Kraków
8,1
2154,39
56
1531,2
60,1
134,8
30,2
8,2
9,7
79,3
93,1
98,4
1,0570553
41
18,7
290,73747
Lublin
12,7
1992,54
89
1454,5
63,9
166,3
52,1
9
8,8
109,1
100
98,5
1,0507703
65
20,6
352,51648
Łód
ź
17,8
1918,58
70
469,5
99,3
85,1
44,5
7,1
13,8
74,8
95,4
99,3
1,3349845
37
19,5
187,54625
Olsztyn
12,5
2034,25
66
1592,1
56,4
140,1
53,7
8,8
7,3
79,7
100
97,8
0,4365809
76
12,5
401,99908
Opole
9,6
2062,53
52
593
84,5
205,2
39,5
7,6
7,7
93,9
99
99,5
3,3439354
73
22,8
516,52137
Pozna
ń
5,6
2373,13
59
1216,9
71,9
132
41,3
8,4
10,3
96,1
100
99,1
1,1206588
44
21
349,27489
Rzeszów
9,5
1933
60
570,3
79,5
170,7
52,6
8,5
7,1
113,7
98,7
98,4
0,5241963
55
21,2
563,23349
Szczecin
11
2278,65
61
1213,2
69,8
100,5
40
7,8
9,5
84,9
14,3
97,6
1,7975051
68
14,4
287,43238
Toru
ń
13,7
1919,67
55
1287,2
62,7
162,4
48,8
9,4
8,3
59,5
82,8
94,6
1,8695502
56
19,4
298,34905
Wrocław
9,7
2233
44
1954,7
57,1
163,2
45,1
7,4
9,4
85,7
84,7
98,4
1,8563293
40
23,5
301,69688
Zielona
Góra
12,3
1975
66
1315,5
66,6
194,6
52,5
8
8
62,4
97,4
77,5
1,0910434
50
16,3
427,26937
mgr Grzegorz Stolarczyk
4
Ekonometria 1
Wybrane cechy opisuj
ą
ce poziom
ż
ycia nale
ż
y podda
ć
jako
ś
ciowej ocenie, która powinna dotyczy
ć
zmienno
ś
ci cech oraz ich niezale
ż
no
ś
ci.
Zmienno
ść
cechy mo
ż
na oceni
ć
na podstawie współczynnika zmienno
ś
ci, a niezale
ż
no
ść
wykorzystuj
ą
c współczynniki korelacji.
Badanie zmienno
ś
ci:
Współczynnik zmienno
ś
ci:
%
100
⋅
=
j
j
j
X
S
V
(j=1,2,...,m)
gdzie:
V
j
– współczynnik zmienno
ś
ci
X
j
–
ś
rednia arytmetyczna:
∑
=
=
n
i
i
j
X
n
X
1
1
S
j
– odchylenie standardowe:
(
)
5
,
0
1
2
1
−
=
∑
=
n
i
j
i
j
X
X
n
S
Liczymy
ś
redni
ą
arytmetyczn
ą
, odchylenie standardowe oraz współczynnik zmienno
ś
ci dla ka
ż
dej
cechy. Obliczenia w tabeli 2.
Ka
ż
da z cech powinna charakteryzowa
ć
si
ę
odpowiednio wysok
ą
zmienno
ś
ci
ą
. Przyjmuje si
ę
warto
ść
krytyczn
ą
współczynnika zmienno
ś
ci V*, przewa
ż
nie na poziomie V*=10%. Cechy, dla których
spełniona jest nierówno
ść
V
≤
V* uznaje si
ę
za quasi-stałe i eliminuje si
ę
z całego zbioru cech. Cechy
te nie wnosz
ą
istotnych informacji o badanym zjawisku.
Z naszego zbioru cech eliminujemy x
8
oraz x
12
. Współczynnik zmienno
ś
ci dla tych zmiennych jest
mniejszy ni
ż
10%.
W tabeli 3 znajduje si
ę
zredukowany zbiór danych.
mgr Grzegorz Stolarczyk
5
Ekonometria 1
Tabela 2.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
X
11
X
12
X
13
X
14
X
15
X
16
Ś
rednia
11,1
2162,1
62,4
1128,3
70,6
133,3
46,8
8,2
9,0
83,6
85,5
96,5
1,4
54,6
18,8
336,6
Odchylenie
3,3
320,5
13,6
511,8
12,1
37,4
9,2
0,7
1,6
15,7
22,6
5,2
0,7
14,4
2,9
120,4
V
j
30%
15%
22%
45%
17%
28%
20%
8%
18%
19%
26%
5%
53%
26%
15%
36%
Tabela 3.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
9
X
10
X
11
X
13
X
14
X
15
X
16
Warszawa
5,1
3186,77
61
2149,2
72,3
80,2
28,6
10,8
68
43,7
1,6766266
35
19,1
282,8461
Białystok
13,3
1961,28
51
1399,5
59
146
54,1
7,6
96,6
98,8
1,1628516
45
17,1
249,15754
Bydgoszcz
11,7
1960,74
55
836,7
60,7
110,5
48,1
9
73,7
87,6
1,4378427
79
15,8
186,44983
Gdańsk
10,1
2487,81
50
471,4
69,7
91,1
47,1
9,1
75,7
100
2,5600267
32
20,9
247,94495
Gorzów Wlkp
15,4
1874,3
103
1225,6
61
112
66,7
7,6
73,9
96,6
0,435347
57
15,4
144,85182
Katowice
7
2581,78
63
362,3
87,1
124,2
39,3
10,4
108,1
61,3
1,4377975
61
19,7
406,81386
Kielce
15
1990,71
63
667,3
88,7
80,6
57,4
7,6
70,1
85,7
0,5041233
68
20,7
564,76083
Kraków
8,1
2154,39
56
1531,2
60,1
134,8
30,2
9,7
79,3
93,1
1,0570553
41
18,7
290,73747
Lublin
12,7
1992,54
89
1454,5
63,9
166,3
52,1
8,8
109,1
100
1,0507703
65
20,6
352,51648
Łódź
17,8
1918,58
70
469,5
99,3
85,1
44,5
13,8
74,8
95,4
1,3349845
37
19,5
187,54625
Olsztyn
12,5
2034,25
66
1592,1
56,4
140,1
53,7
7,3
79,7
100
0,4365809
76
12,5
401,99908
Opole
9,6
2062,53
52
593
84,5
205,2
39,5
7,7
93,9
99
3,3439354
73
22,8
516,52137
Poznań
5,6
2373,13
59
1216,9
71,9
132
41,3
10,3
96,1
100
1,1206588
44
21
349,27489
Rzeszów
9,5
1933
60
570,3
79,5
170,7
52,6
7,1
113,7
98,7
0,5241963
55
21,2
563,23349
Szczecin
11
2278,65
61
1213,2
69,8
100,5
40
9,5
84,9
14,3
1,7975051
68
14,4
287,43238
Toruń
13,7
1919,67
55
1287,2
62,7
162,4
48,8
8,3
59,5
82,8
1,8695502
56
19,4
298,34905
Wrocław
9,7
2233
44
1954,7
57,1
163,2
45,1
9,4
85,7
84,7
1,8563293
40
23,5
301,69688
Zielona Góra
12,3
1975
66
1315,5
66,6
194,6
52,5
8
62,4
97,4
1,0910434
50
16,3
427,26937
mgr Grzegorz Stolarczyk
6
Podstawy ekonometrii
Badanie niezale
ż
no
ś
ci:
Współczynnik korelacji:
(
)(
)
(
) (
)
5
,
0
1
1
2
2
1
−
−
−
−
=
∑
∑
∑
=
=
=
n
i
n
i
j
i
j
i
n
i
j
i
j
i
xy
Y
Y
X
X
Y
Y
X
X
R
gdzie:
∑
=
=
n
i
i
j
X
n
X
1
1
∑
=
=
n
i
i
j
Y
n
Y
1
1
Liczymy macierz współczynników korelacji uwzgl
ę
dniaj
ą
c wszystkie cechy bez zmiennych x
8
i x
12
.
Korzystamy z funkcji „Korelacja” dost
ę
pnej w Excelu w zakładce „Narz
ę
dzia” – „Analiza danych”.
Tabela 4. Macierz współczynników korelacji.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
9
X
10
X
11
X
13
X
14
X
15
X
16
X
1
1
X
2
-0,75
1
X
3
0,41
-0,25
1
X
4
-0,23
0,27
0,02
1
X
5
0,09
0,10
0,01
-0,69
1
X
6
-0,09
-0,40
-0,12
0,11
-0,26
1
X
7
0,70
-0,69
0,50
-0,18
-0,17
0,11
1
X
9
-0,10
0,40
-0,04
-0,06
0,45
-0,49
-0,57
1
X
10
-0,33
-0,01
0,03
-0,24
0,16
0,32
-0,04
-0,09
1
X
11
0,29
-0,56
0,10
-0,19
-0,10
0,41
0,47
-0,29
0,10
1
X
13
-0,28
0,31
-0,52
-0,16
0,14
0,18
-0,50
0,18
-0,05
-0,18
1
X
14
0,22
-0,41
0,20
-0,22
-0,04
0,21
0,32
-0,49
0,14
-0,07
-0,11
1
X
15
-0,30
0,18
-0,34
-0,21
0,40
0,21
-0,27
0,18
0,32
0,23
0,43
-0,37
1
X
16
-0,21
-0,07
-0,19
-0,25
0,37
0,43
0,03
-0,44
0,35
0,11
-0,06
0,34
0,34
1
Stworzenie zbioru niezale
ż
nych cech diagnostycznych przeprowadzamy na przykład metod
ą
grafow
ą
. U podstaw tej metody jest zało
ż
enie,
ż
e zmienne diagnostyczne powinny by
ć
nieskorelowane mi
ę
dzy sob
ą
. Poniewa
ż
w praktyce nie ma mo
ż
liwo
ś
ci uzyskania takich zmiennych,
dla których warto
ść
współczynnika korelacji wynosi 0, zast
ę
puje si
ę
ten warunek mniej
rygorystycznym, a mianowicie przyjmuje si
ę
,
ż
e korelacja mi
ę
dzy zmiennymi jest dostatecznie niska,
mgr Grzegorz Stolarczyk
7
Podstawy ekonometrii
gdy charakteryzuj
ą
cy j
ą
współczynnik korelacji mi
ę
dzy zmiennymi przyjmuje warto
ść
nieistotnie ró
ż
n
ą
od zera.
Przyjmuje si
ę
,
ż
e korelacja mi
ę
dzy cechami jest wyra
ź
na, je
ż
eli warto
ść
bezwzgl
ę
dna
współczynnika korelacji jest wi
ę
ksza od 0,5. Zakładamy w naszym przykładzie warto
ść
krytyczn
ą
współczynnika korelacji równie
ż
na poziomie 0,5, co oznacza,
ż
e te cechy, dla których warto
ść
bezwzgl
ę
dna obliczonego współczynnika korelacji jest równa lub wi
ę
ksza od 0,5 s
ą
cechami
zale
ż
nymi.
Macierz współczynników korelacji pomi
ę
dzy cechami zamieniamy na tzw. macierz zerojedynkow
ą
(tabela 5), w której wszystkie współczynniki korelacji nieistotnie ró
ż
ne od zera zast
ę
puje si
ę
zerami,
a pozostałe jedynkami. Wykorzystujemy w Excelu funkcj
ę
logiczn
ą
„Je
ż
eli”.
Tabela 5.
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
9
X
10
X
11
X
13
X
14
X
15
X
16
X
1
1
X
2
1
1
X
3
0
0
1
X
4
0
0
0
1
X
5
0
0
0
1
1
X
6
0
0
0
0
0
1
X
7
1
1
0
0
0
0
1
X
9
0
0
0
0
0
0
1
1
X
10
0
0
0
0
0
0
0
0
1
X
11
0
1
0
0
0
0
0
0
0
1
X
13
0
0
1
0
0
0
0
0
0
0
1
X
14
0
0
0
0
0
0
0
0
0
0
0
1
X
15
0
0
0
0
0
0
0
0
0
0
0
0
1
X
16
0
0
0
0
0
0
0
0
0
0
0
0
1
1
Na podstawie macierzy zerojedynkowej budujemy graf, w którym wierzchołkami s
ą
potencjalne
cechy diagnostyczne, a wi
ą
zadłami „jedynkowe” elementy macierzy. Mo
ż
emy otrzyma
ć
jeden graf
spójny lub kilka podgrafów, a tak
ż
e cechy odosobnione.
Tworzenie grafu rozpoczynamy od sprawdzenia czy cecha X1 jest powi
ą
zana z jak
ą
kolwiek inn
ą
cech
ą
. Je
ż
eli jest, to ł
ą
czymy te cechy tworz
ą
c graf.
W naszym przykładzie cecha X1 poł
ą
czona jest (zwi
ą
zana) z cechami: X2 i X7.
mgr Grzegorz Stolarczyk
8
Podstawy ekonometrii
Analogicznie sprawdzamy kolejne cechy rysuj
ą
c graf.
Po sprawdzeniu wszystkich cech otrzymali
ś
my nast
ę
puj
ą
ce poł
ą
czenia:
Powstały 3 podgrafy oraz cechy odosobnione.
Jako niezale
ż
ne cechy diagnostyczne wybieramy cechy odosobnione (nie s
ą
skorelowane z
ż
adn
ą
inna cech
ą
) oraz cechy-reprezentanki ka
ż
dego podgrafu, które maj
ą
najwi
ę
ksz
ą
liczb
ę
poł
ą
cze
ń
(wi
ą
zadeł) z pozostałymi cechami. Je
ż
eli w podgrafie jest kilka cech o takie samej liczbie powi
ą
za
ń
,
to wybieramy spo
ś
ród nich jako zmienn
ą
diagnostyczn
ą
cech
ę
najsłabiej skorelowan
ą
ze zmiennymi
wybranymi ju
ż
do zbioru cech diagnostycznych.
W naszym przykładzie niezale
ż
nymi zmiennymi diagnostycznymi zostały cechy odosobnione,
tj. X6, X10, X14, X15, X16. Z ka
ż
dego podgrafu musimy wybra
ć
jedn
ą
reprezentantk
ę
. Zaczynamy
od podgrafu I.
X1
X10
X9
X2
X6
X14
X7
X1
X3
X13
X4
X5
X15
X16
mgr Grzegorz Stolarczyk
9
Podstawy ekonometrii
Najwi
ę
cej poł
ą
cze
ń
(po 3 poł
ą
czenia) maj
ą
zmienne: X2 i X7. Musimy wybra
ć
z nich t
ą
, która jest
najsłabiej powi
ą
zana ze zmiennymi odosobnionymi b
ę
d
ą
cymi ju
ż
w zbiorze cech diagnostycznych.
Najpro
ś
ciej powi
ą
zanie sprawdzi
ć
na podstawie współczynników korelacji pomi
ę
dzy rozpatrywanymi
zmiennymi.
Współczynniki korelacji:
X6
X10
X14
X15
X16
X2
-0,4
-0,01
-0,41
0,18
-0,07
X7
0,11
-0,04
0,32
-0,27
0,03
Mo
ż
na przyj
ąć
,
ż
e słabiej skorelowana z pozostałymi zmiennymi jest X7. Najwy
ż
sza warto
ść
współczynnika korelacji wynosi 0,32, a w przypadku X2 jest to –0,41.
Rozpatrujemy II podgraf. Do zmiennych diagnostycznych dochodzi zmienna X7.
Współczynniki korelacji:
X6
X10
X14
X15
X16
X7
X3
-0,12
0,03
0,20
-0,34
-0,19
0,5
X13
0,18
-0,05
-0,11
0,43
-0,06
-0,5
Wybieramy zmienn
ą
X3, chocia
ż
ma współczynnik korelacji ze zmienn
ą
X7 równy 0,5, to taki sam
współczynnik ma równie
ż
zmienna X13 i dodatkowo ze zmienn
ą
X15 warto
ść
współczynnika korelacji
wynosi 0,43.
Rozpatrujemy III podgraf. Do zmiennych diagnostycznych dochodzi zmienna X3.
Współczynniki korelacji:
X6
X10
X14
X15
X16
X7
X3
X4
0,11
-0,24
-0,22
-0,21
-0,25
-0,18
0,02
X5
-0,26
0,16
-0,04
0,40
0,37
-0,17
0,01
Wybieramy zmienn
ą
X4 jako mniej skorelowan
ą
z pozostałymi zmiennymi diagnostycznymi.
Zbiór cech diagnostycznych zawiera zmienne:
X3 - Kwota
ś
wiadcze
ń
pomocy społecznej w przeliczeniu na 1 mieszka
ń
ca w zł
X4 - Mieszkania oddane do u
ż
ytku na 1000 zawartych mał
ż
e
ń
stw
X6 - Uczniowie szkół policealnych na 10 tys. ludno
ś
ci
X7 - Wska
ź
nik wykrywalno
ś
ci sprawców przest
ę
pstw w %
X10 - Łó
ż
ka w szpitalach na 10 tys. ludno
ś
ci
X14 - Widzowie w kinach na 1 seans
X15 - Wypo
ż
yczenia ksi
ę
gozbioru z bibliotek publicznych na 1 czytelnika w woluminach
X16 - Absolwenci szkół wy
ż
szych na 10 tys. ludno
ś
ci.
Maj
ą
c zbiór zmiennych (cech) diagnostycznych mo
ż
emy przej
ść
do tworzenia zmiennej
syntetycznej. Zmienna syntetyczna jest tak konstruowana,
ż
e zast
ę
puje zbiór zmiennych
mgr Grzegorz Stolarczyk
10
Podstawy ekonometrii
diagnostycznych i zawiera informacje niesione przez te zmienne. Taka zmienna mo
ż
e by
ć
traktowana
jako miernik zło
ż
onej kategorii ekonomicznej.
Przy wyznaczaniu zmiennej syntetycznej rozpoczynamy od doprowadzenia wszystkich cech
diagnostycznych (niejednorodnych) do porównywalno
ś
ci. Przeprowadzamy klasyczn
ą
procedur
ę
standaryzacji za pomoc
ą
wzoru:
j
j
ij
ij
S
X
X
Z
−
=
gdzie:
j
X
–
ś
rednia arytmetyczna
j
S
– odchylenie standardowe.
Tworzymy macierz Z cech standaryzowanych.
Tabela 5.
X
3
X
4
X
6
X
7
X
10
X
14
X
15
X
16
Warszawa
-0,11
1,99
-1,42
-1,98
-1,00
-1,36
0,10
-0,45
Białystok
-0,84
0,53
0,34
0,80
0,83
-0,66
-0,59
-0,73
Bydgoszcz
-0,55
-0,57
-0,61
0,15
-0,63
1,70
-1,04
-1,25
Gdańsk
-0,91
-1,28
-1,13
0,04
-0,51
-1,57
0,72
-0,74
Gorzów Wlkp
2,98
0,19
-0,57
2,18
-0,62
0,17
-1,18
-1,59
Katowice
0,04
-1,50
-0,24
-0,81
1,56
0,45
0,31
0,58
Kielce
0,04
-0,90
-1,41
1,16
-0,86
0,93
0,65
1,90
Kraków
-0,47
0,79
0,04
-1,81
-0,28
-0,94
-0,04
-0,38
Lublin
1,95
0,64
0,88
0,58
1,63
0,72
0,62
0,13
Łódź
0,55
-1,29
-1,29
-0,25
-0,56
-1,22
0,24
-1,24
Olsztyn
0,26
0,91
0,18
0,76
-0,25
1,49
-2,18
0,54
Opole
-0,77
-1,05
1,92
-0,79
0,66
1,28
1,38
1,49
Poznań
-0,25
0,17
-0,03
-0,60
0,80
-0,73
0,76
0,11
Rzeszów
-0,18
-1,09
1,00
0,64
1,92
0,03
0,83
1,88
Szczecin
-0,11
0,17
-0,88
-0,74
0,08
0,93
-1,53
-0,41
Toruń
-0,55
0,31
0,78
0,22
-1,54
0,10
0,20
-0,32
Wrocław
-1,35
1,61
0,80
-0,18
0,13
-1,01
1,62
-0,29
Zielona Góra
0,26
0,37
1,64
0,63
-1,36
-0,32
-0,87
0,75
Zmienna syntetyczn
ą
konstruujemy za pomoc
ą
wzorcowej metody agregacji zmiennych,
tj. taksonomicznej miary rozwoju Hellwiga.
mgr Grzegorz Stolarczyk
11
Podstawy ekonometrii
Na pocz
ą
tku dzielimy cechy diagnostyczne na stymulanty i destymulanty. Stymulantami nazywane
s
ą
zmienne, których wzrost warto
ś
ci
ś
wiadczy o wzro
ś
cie badanego zjawiska zło
ż
onego.
Destymulant
ą
jest zmienna, której spadek
ś
wiadczy o wzro
ś
cie badanego zjawiska zło
ż
onego.
W naszym przykładzie dotycz
ą
cym poziomu
ż
ycia ludno
ś
ci stymulantami s
ą
zmienne:
X4 - Mieszkania oddane do u
ż
ytku na 1000 zawartych mał
ż
e
ń
stw
X6 - Uczniowie szkół policealnych na 10 tys. ludno
ś
ci
X7 - Wska
ź
nik wykrywalno
ś
ci sprawców przest
ę
pstw w %
X10 - Łó
ż
ka w szpitalach na 10 tys. ludno
ś
ci
X14 - Widzowie w kinach na 1 seans
X15 - Wypo
ż
yczenia ksi
ę
gozbioru z bibliotek publicznych na 1 czytelnika w woluminach
X16 - Absolwenci szkół wy
ż
szych na 10 tys. ludno
ś
ci.
Destymulant
ą
jest jedynie zmienna X3, tj. kwota
ś
wiadcze
ń
pomocy społecznej w przeliczeniu
na 1 mieszka
ń
ca w zł.
Kolejnym krokiem jest wyznaczenie tzw. wzorca rozwoju, który tworz
ą
optymalne warto
ś
ci
poszczególnych cech. Wyra
ż
a si
ę
wzorem:
=
tą
destymulan
jest
cecha
ta
-
j
jeśli
stymulantą
jest
cecha
ta
-
j
jeśli
,
,
min
max
ij
ij
j
Z
Z
p
Wzorce rozwoju w naszym przykładzie:
X
3
X
4
X
6
X
7
X
10
X
14
X
15
X
16
pj
-1,35
1,99
1,92
2,18
1,92
1,70
1,62
1,90
Nast
ę
pnie dla ka
ż
dego obiektu ustala si
ę
miar
ę
odległo
ś
ci od wzorca:
(
)
5
,
0
1
2
−
=
∑
=
m
j
j
ij
i
p
Z
C
(i = 1,2,...,n)
mgr Grzegorz Stolarczyk
12
Podstawy ekonometrii
Miasto
i
C
Warszawa
7,46
Białystok
5,03
Bydgoszcz
6,42
Gdańsk
7,01
Gorzów Wlkp
7,55
Katowice
5,74
Kielce
5,63
Kraków
6,43
Lublin
4,64
Łódź
7,55
Olsztyn
5,47
Opole
4,52
Poznań
5,21
Rzeszów
4,19
Szczecin
6,36
Toruń
5,48
Wrocław
4,72
Zielona Góra
5,48
Ostatnim etapem jest wyznaczenie miary rozwoju – zmiennej syntetycznej, której wzrost
odpowiada korzystniejszemu kształtowaniu si
ę
badanego zjawiska (poziomu
ż
ycia), co ułatwia
równie
ż
wszelkie analizy porównawcze. Zmienn
ą
syntetyczn
ą
tworzymy ze wzoru:
c
j
i
i
S
C
C
q
2
1
+
−
=
gdzie:
j
C
-
ś
rednia arytmetyczna:
∑
=
=
n
i
i
j
C
n
C
1
1
c
S
- odchylenie standardowe:
mgr Grzegorz Stolarczyk
13
Podstawy ekonometrii
(
)
5
,
0
2
1
−
=
∑
j
i
c
C
C
n
S
W naszym przykładzie otrzymali
ś
my nast
ę
puj
ą
ce zmienne syntetyczne – miary rozwoju:
Miasto
i
q
Warszawa
0,056
Białystok
0,363
Bydgoszcz
0,188
Gda
ń
sk
0,114
Gorzów Wlkp
0,045
Katowice
0,275
Kielce
0,288
Kraków
0,187
Lublin
0,413
Łód
ź
0,045
Olsztyn
0,309
Opole
0,429
Pozna
ń
0,341
Rzeszów
0,471
Szczecin
0,196
Toru
ń
0,307
Wrocław
0,403
Zielona Góra
0,307
Szeregujemy miasta ze wzgl
ę
du na poziom
ż
ycia ich mieszka
ń
ców:
Miasto
i
q
Rzeszów
0,471
Opole
0,429
Lublin
0,413
Wrocław
0,403
Białystok
0,363
Poznań
0,341
Olsztyn
0,309
Zielona Góra
0,307
Toruń
0,307
Kielce
0,288
mgr Grzegorz Stolarczyk
14
Podstawy ekonometrii
Katowice
0,275
Szczecin
0,196
Bydgoszcz
0,188
Kraków
0,187
Gdańsk
0,114
Warszawa
0,056
Łódź
0,045
Gorzów Wlkp
0,045
Interpretacja wyników:
Miasta dzielimy na 3 grupy charakteryzuj
ą
ce poziom badanego zjawiska. Podziału tego
dokonujemy według wzoru:
n
i
q
q
r
i
i
i
i
...,
2
,
1
3
min
max
=
−
=
gdzie: q
i
– syntetyczna miara rozwoju badanych zjawisk.
W pierwszej grupie miast o najwy
ż
szym poziomie
ż
ycia znalazły si
ę
w kolejno
ś
ci: Rzeszów, Opole,
Lublin, Wrocław, Białystok i Pozna
ń
. Miasta te wyró
ż
niaj
ą
jedne z najwy
ż
szych warto
ś
ci
poszczególnych mierników poziomu
ż
ycia, m.in. liczba uczniów szkół policealnych czy liczba łó
ż
ek
w szpitalach. We Wrocławiu s
ą
najmniejsze kwoty
ś
wiadcze
ń
socjalnych na 1 mieszka
ń
ca
oraz najwi
ę
ksza liczba wypo
ż
ycze
ń
ksi
ę
gozbioru z bibliotek. W drugiej grupie miast o
ś
rednim
poziomie
ż
ycia mieszka
ń
ców znalazły si
ę
: Olsztyn, Zielona Góra, Toru
ń
, Kielce, Katowice, Szczecin,
Bydgoszcz i Kraków. Warto
ś
ci poszczególnych mierników w tych miastach oscyluj
ą
wokół
ś
redniej
miary syntetycznej. W tej grupie jedynie Kielce i Bydgoszcz maj
ą
najwy
ż
sze mierniki ze wszystkich
miast dotycz
ą
ce liczby absolwentów szkół wy
ż
szych na 10 tys. ludno
ś
ci oraz liczby widzów w kinach
na 1 seans. Bardzo interesuj
ą
cy jest fakt,
ż
e jedne z najwi
ę
kszych miast Polski, tj. Gda
ń
sk, Warszawa
i Łód
ź
charakteryzuj
ą
si
ę
najni
ż
szym poziomem
ż
ycia ich mieszka
ń
ców i razem z Gorzowem
Wielkopolskim znajduj
ą
w ostatniej grupie. Warszawa ma najgorsze wska
ź
niki dotycz
ą
ce liczby
uczniów szkół policealnych oraz wykrywalno
ś
ci przest
ę
pstw. Gda
ń
sk charakteryzuje si
ę
najmniejsz
ą
liczb
ą
widzów w kinach, a Gorzów Wlkp. ma najmniejsz
ą
liczb
ę
absolwentów szkół wy
ż
szych
oraz najwi
ę
ksze kwoty
ś
wiadcze
ń
socjalnych przypadaj
ą
cych na 1 mieszka
ń
ca. O zakwalifikowaniu
Warszawy i Gda
ń
ska do ostatniej grupy miast o najgorszym poziomie
ż
ycia ich mieszka
ń
ców mo
ż
e
decydowa
ć
równie
ż
fakt,
ż
e ze zbioru zmiennych diagnostycznych odpadły mierniki zwi
ą
zane
z rynkiem pracy. W tych miastach warto
ś
ci mierników dotycz
ą
cych bezrobocia i przeci
ę
tnego
wynagrodzenia s
ą
jednymi z najwy
ż
szych w Polsce.
Badanie poziomu
ż
ycia w miastach mo
ż
na spróbowa
ć
przeprowadzi
ć
ponownie zmieniaj
ą
c
warto
ść
krytyczn
ą
współczynnika korelacji i dokona
ć
analizy przy u
ż
yciu wi
ę
kszej ilo
ś
ci zmiennych
diagnostycznych. Ze wzgl
ę
du na specyfik
ę
badanego zjawiska zasadne wydaje si
ę
dokona
ć
jego
analizy uwzgl
ę
dniaj
ą
c warunki pracy mieszka
ń
ców miast.
mgr Grzegorz Stolarczyk
15
Podstawy ekonometrii
Zadanie:
Prosz
ę
na podstawie rocznika statystycznego województw z 2004r. znale
źć
warto
ś
ci
nast
ę
puj
ą
cych cech opisuj
ą
cych konkurencyjno
ść
regionów:
•
Stopa bezrobocia rejestrowanego w %.
•
Absolwenci telefonii przewodowej na 1000 ludno
ś
ci.
•
Zu
ż
ycie nawozów sztucznych NPK 1 ha u
ż
ytków rolnych w kg.
•
Ś
cieki przemysłowe i komunalne odprowadzane do wód powierzchniowych nie oczyszczone
w dam3 na km2.
•
Budynki oddane do u
ż
ytku w gospodarce narodowej ogółem na 1000 ludno
ś
ci
•
Studenci (ogółem) na 1000 ludno
ś
ci.
•
Nakłady inwestycyjne (ceny bie
żą
ce) ogółem w mld zł. na 1000 ludno
ś
ci.
•
Warto
ść
brutto
ś
rodków trwałych w przedsi
ę
biorstwach mld zł. (bie
żą
ce ceny ewidencyjne)
ogółem na 1000 ludno
ś
ci w cenach bie
żą
cych.
•
Produkcja sprzedana przemysłu ogółem w mld zł. na 1000 ludno
ś
ci w cenach bie
żą
cych.
•
Przeci
ę
tne wynagrodzenia miesi
ę
czne według działów Gospodarki Narodowej w cenach
bie
żą
cych.
•
Powierzchnia u
ż
ytków rolnych na 1 ci
ą
gnik w ha.
Skonstruowa
ć
zmienn
ą
syntetyczn
ą
opisuj
ą
c
ą
konkurencyjno
ść
województw i porówna
ć
województwa ze wzgl
ę
du na badane zjawisko.