Model ekonometryczny
Y = f (X1, X2, X3, ε)
Y - zmienna endogeniczna oznaczająca ilość ludzi aktywnych ekonomicznie ogółem, w tys.
X1, X2, X3 - zmienne egzogeniczne gdzie:
X1 - oznacza aktywność ekonomiczną kobiet (w wieku od 15 lat) w tys.
X2 - oznacza aktywne zawodowo kobiety w tys.
X3 - oznacza ludność w wieku produkcyjnym - ogółem w tys.
Określenie celu badania.
Celem modelu będzie przedstawienie powiązań ekonometrycznych pomiędzy zależnością między zjawiskami reprezentowanymi przez zmienne egzogeniczne: X1, X2, X3 oraz zmienną endogeniczną Y.
2. Specyfikacja zmiennych modelu:
dobór zmiennych objaśniających
i |
Yi |
X1 |
X2 |
X3 |
1 2 3 4 5 |
28,391 28,380 28,903 29,106 29,486 |
14,856 14,915 15,173 15,280 15,462 |
8,048 7,998 7,917 7,804 7,825 |
21,211 21,772 21,962 22,647 22,820 |
Σ |
144,266 |
75,686 |
39,592 |
110,112 |
i - kolejne okresy,
wybór zmiennych objaśniających do modelu:
Jako metodę doboru zmiennych objaśniających do modelu wybrałam metodę Hellwiga (metodę pojemności integralnych informacji).
Macierz korelacji R - macierz współczynników korelacji pomiędzy zmiennymi objaśniającymi:
gdzie: r21 = r12 Ro - macierz pomiędzy korelacją zmiennych:
r31 = r13 objaśnianej a zmienną objaśnianą
r23 = r32
i |
X1⋅X2 |
X1⋅X3 |
X2⋅X3 |
X1⋅Y |
X2⋅Y |
X3⋅Y |
1 2 3 4 5 |
119,561 119,290 120,125 119,245 120,990 |
315,111 324,729 333,229 346,046 352,843 |
170,706 174,132 173,873 176,737 176,567 |
421,777 423,288 438,545 444,740 455,913 |
288,491 226,983 228,825 227,143 230,728 |
602,202 617,889 634,768 659,164 672,871 |
Σ |
599,211 |
1671,958 |
874,015 |
2184,263 |
1142,170 |
3186,894 |
i |
|
|
|
|
1 2 3 4 5 |
0,213440 0,223729 0,002500 0,064009 0,406890 |
0,078961 0,049284 0,001296 0,020449 0,008649 |
0,0169 0,0064 0,000001 0,012996 0,008649 |
0,758641 0,0961 0,0144 0,319225 0,544644 |
Σ |
0,904367 |
0,2557 |
0,944946 |
1,7329 |
Interpretacja:
Średnia aktywnych kobiet od lat 15 w danym okresie wynosi 15,137 tys. kobiet.
Średnia aktywność zawodowa kobiet w danym okresie wynosi 7,918 kobiet.
Średnia populacja ludności w wieku produkcyjnym wynosi 28,853 tys.
Średnia ilość ludzi aktywnych ekonomicznie w badanym okresie wynosi
22,082 tys.
Metoda Hellwiga:
L = ilość kombinacji
k - liczba zmiennych objaśniających
L=2k-1=23-1=7 a więc liczba kombinacji =7
kombinacje 1-elementowe:
C1= (X1) C2= (X2) C3= (X3)
H1= h11= (1)2= 1
H2= h22= (-0,59769)2 = 0,3572
H3= h33= (0,9859)2 = 0,972
kombinacje 2-elementowe:
C4= (X1,X2) C5= (X1,X3) C6= (X2,X3)
H4= h41 + h42 = 0,8556
H5= h51 + h52 = 0,9742
H6= h62 + h63 = 0,7564
kombinacje 3-elementowe
C7= (X1,X2,X3)
H7= 0,8848
max Hm= H5 = 0,9742
H5 jest kombinacją zmiennych egzogenicznych X1 i X3
Efekt katalizy:
det P5 = 1+1,0099 + 1,0099 - 0,972 - 1,0493 = 0,9985
det R = 1 - 1,0493 = -0,0493
Um=R2m - Hm Um - wskaźnik natężenia efektu katalizy
Um= 1,0494 - 0,9742 = 0,0752
Interpretacja:
Tak niski wskaźnik natężenia katalizy świadczy o braku wystarczającego efektu katalizy.
Szacowanie parametrów modelu.
Metoda najmniejszych kwadratów.
X - macierz obserwacji ze zmiennymi X1 i X3
y - macierz obserwacji dla zmiennej endogenicznej
det XT ⋅ X - wyznacznik ilorazu macierzy XT i X
A - macierz dopełnień algebraicznych macierzy XT i X
T - macierz transponowana
Funkcja ma postać:
Interpretacja:
Wzrostowi ilości kobiet aktywnych ekonomicznie o tys. towarzyszy wzrost ilości ludzi aktywnych ogółem o 2,344 tys.
Wzrostowi ilości ludności w wieku produkcyjnym o tys. towarzyszy spadek ilości ludzi aktywnych ogółem o 0,206 tys.
Weryfikacja modelu
a) badanie dokładności szacunku modelu
wyznaczamy
gdzie: ei - odchylenie losowe
T |
|
ei |
ei2 |
1 2 3 4 5 |
28,809 28,825 29,362 29,47 29,829 |
-0,417838 -0,445078 -0,45931 -0,344238 0,343128 |
0,1745885 0,1980944 0,2109656 0,1326693 0,1177368 |
Σ |
|
|
0,8340546 |
Se2 - wariancja odchyleń losowych
n - liczba obserwacji
k - liczba zmiennych objaśniających
n = 5 k = 2 n - k - 1 = 2
wyznaczamy macierz kowariancji i wariancji oceny parametrów strukturalnych
α0 α1 α3
Przy dokonywaniu szacunku parametrów modelu mylimy się średnio:
dla α0 o ± 30,136017
dla α1 o ± 3,9545251
dla α3 o ± 1,5187521
badanie stopnia dopasowania modelu do danych empirycznych.
- współczynnik zmienności:
%
odchylenia resztowe stanowią 2,238 % średniej ilości ludzi aktywnych zawodowo.
Vs < 10 % - co oznacza, że model jest dostatecznie dopasowany do danych
empirycznych
- współczynnik h zbieżności indeterminalnej.
w 92,225% (zmienne objaśniające X1 i X3 ) ilość aktywnych ekonomicznie kobiet i ludności w wieku produkcyjnym nie tłumaczy ilości ludzi aktywnych ekonomicznie ogółem.
- współczynnik determinacji (zgodności)
R2 = ϕ2 - 1 = 0,0777477
R2 ⋅ 100% = 7,77477%
W 7,78% ilość aktywnych ekonomicznie kobiet i ludzi w wieku produkcyjnym tłumaczą ilość ludzi aktywnych zawodowo.
- weryfikacja hipotezy o istotności współczynnika korelacji wielorakiej.
Ho : R = 0 - współczynnik korelacji wielorakiej nieistotnie różni się od 0
H1 : R ≠ 0 - współczynnik korelacji wielorakiej istotnie różni się od 0
α = 0,05
Fα k = 2 Fα = 19
n - k -1
F < Fα - brak podstaw do odrzucenia H0 tzn. ,że współczynnik nieistotnie różni się od 0, stopień dopasowania korelacji wielorakiej do danych empirycznych jest niski (złe dopasowanie).
badanie statystycznej istotności parametrów strukturalnych:
- test t-studenta
H0 :
= 0 - rozkład jest losowy
H1 :
≠ 0 - rozkład nie jest losowy
t0 = 0,0003318
t1 = 0,564224
t3 = 0,1356376
0,05
tα n - k - 1 =2 tα = 4,303
t0 < tα t1 < tα t3 < tα
oznacza to, że α0, α1 i α3 nie są istotne i brakuje podstaw do odrzucenia H0.
weryfikacja hipotez dotyczących składnika losowego:
- badanie losowości
H0 : ei = 0 - rozkład reszt jest losowy
H1 : ei ≠ 0 - rozkład reszt nie jest losowy
test serii
T |
ei |
1 2 3 4 5 |
-0,417838 -0,445078 -0,45931 -0,344238 0,343128 |
ei > 0 = a ei < b
k = 1 , kA = 0 kB = 5
OK :
Obszar krytyczny - kA i kB nie są możliwe do odczytania
k < 2 tzn. że znajduje się poza obszarem krytycznym.
Musimy odrzucić H0 , rozkład reszt nie jest losowy.
- badanie autokorelacji test Durbina - Watsona
t |
(ei - ei-1) |
2 3 4 5 |
- 0,744624 0,8179176 0,6782313 0,8003666 |
Σ |
2,7411402 |
H0 : ρ = 0 - brak autokorelacji
H1 : ρ ≠ 0 - autokorelacja występuje
Przyjmujemy iż, α = 0,05
dL,du n = 5 (n przyjmujemy dla 15 prób)
dL = 0,95 k = 2
du = 1,54
d > du tzn., że występuje brak autokorelacji, przyjmujemy H0
1
1
2
k(α/2,kA,kB)
k(1-α/2, kA,kB)
n