Estymacja i weryfikacja modelu
Na etapie estymacji i weryfikacji modelu należy oszacować parametry modelu ekonometrycznego, a także musimy zbadać jego jakość, zbadać czy model jest statystycznie istotny, koincydentny, czy nie występuje w nim efekt katalizy itp.
Szacowanie parametrów modelu przed standaryzacją
Nasz model przed standaryzacją przyjmuje postać:
Y = α0Z0 + α1Z1 + α2Z2 + α3Z3 + ξ , gdzie
Z0 = 1 dla wszystkich okresów.
Macierz Z ma obecnie postać:
Z =
Parametry strukturalne α0, α1, α2, α3 modelu szacujemy metodą najmniejszych kwadratów.
Jeżeli przez ai oszacowanie parametru αi, i = 0,1,...,k natomiast A = [ai](k+1)×1 jest wektorem oszacowań parametrów modelu uzyskanym metodą najmniejszych kwadratów, to chcąc wyznaczyć wektor A należy rozwiązać układ równań
ZTZA = ZTy
Układ ten posiada dokładnie jedno rozwiązanie
A = ( ZTZ )-1ZTy
Układ ten można rozwiązać przy pomocy wzorów Cramera, obliczając macierz odwrotną do macierzy ZTZ, lub też wykorzystując macierz brzegową postaci
ZTZ ZTy
A =
-I k+1 0 (k+1)×
My wykorzystamy ten trzeci sposób.
Mając daną macierz brzegową
A =
dokonujemy przekształceń elementarnych w wyniku których macierz ZTZ przejdzie w macierz górną trójkątną z jednostkową główną przekątną, natomiast macierz (-I k+1) w macierz zerową, wówczas w miejscu wektora 0 (k+1)×1 mamy wektor A, który wynosi
A =
Szacowanie parametrów modelu po standaryzacji
Nasz model po standaryzacji przyjmuje postać:
Y = β2Z2 + β3Z3 + β5Z5 + ξ
Wektor B = [bi] k×1, będący wektorem oszacowań parametrów modelu po standaryzacji, możemy obliczyć rozwiązując następujące równanie
B = R-1R0,
gdzie ( R, R0 ) jest parą korelacyjną charakteryzującą model
Y = β2Z2 + β3Z3 + β5Z5 + ξ
Znak oszacowania parametru stojącego przy i-tej zmiennej objaśniającej modelu przed standaryzacją musi być taki sam jak znak oszacowania parametru przy zmiennej w modelu określonym przez parę ( R, R0 ).
Podobnie jak w poprzednim przypadku do obliczeń wykorzystamy odpowiednią macierz brzegową o postaci
R R0
B =
-Ik 0 k×1
Nasza macierz brzegowa wygląda następująco:
B =
Po dokonaniu odpowiednich przekształceń elementarnych uzyskałyśmy wektor
B =
Wyznaczanie średnich błędów oceny oszacowań parametrów strukturalnych modelu przed standaryzacją
Aby wyznaczyć średnie błędy oceny oszacowań ai parametrów αi, i = 0,1,...,k, które będziemy oznaczać symbolem S(ai) posłużymy się wzorem:
S(ai) =
, gdzie
d i+1,i+1 , i = 0,1,...,k oznacza (i +1)-szy element diagonalny macierzy wariancji kowariancji D2(A), przy czym
D2(A) = S
(ZTZ)-1
natomiast S
oznacza oszacowanie wariancji składnika losowego ξ modelu i jest równe:
S
=
,
gdzie :
n-(k+1) - liczba stopni swobody
n - liczba obserwacji
k - liczba zmiennych objaśniających w modelu
U - to wektor reszt modelu, których suma składowych powinna być
równa 0
U = y - y* ,
gdzie
y* to wektor wartości teoretycznych zmiennej objaśnianej Y, przy czym suma składowych wektora y* musi być równa sumie składowych wektora y. Wektor y* możemy obliczyć z formuły
y* = Z ⋅ A ,
gdzie
A to wektor oszacowań parametrów modelu przed standaryzacją, który dla naszego modelu wynosi
A =
y* =
⋅
=
Stąd ustalamy wektor reszt U
U = y - y* =
Przy liczbie obserwacji n = 10 oraz liczbie zmiennych objaśniających k = 8, ustalamy liczbę stopni swobody n - ( k + 1 ) = 6.
Obliczając macierz UTU
UTU =
możemy wyznaczyć oszacowanie wariancji
składnika losowego modelu S2ξ
S2ξ =
Do wyznaczenia macierzy wariancji kowariancji D2(A) potrzebna jest nam jasna macierz ( ZTZ )-1, którą możemy uzyskać korzystając z macierzy blokowej o postaci
ZTZ I
- I 0
Dokonując elementarnych przekształceń otrzymujemy macierz:
( ZTZ )-1 =
Macierz wariancji kowariancji D2(A) wygląda następująco:
D2(A) = S2ξ ⋅ ( ZTZ )-1 =
Uzyskałyśmy następujące wyniki:
S(a0) =
= 231,358
S(a1) =
= 0,615
S(a2) =
= 0,118
S(a3) =
= 0,176
Średni błąd oszacowania parametru :
α0 wynosi S(a0) = 231,358
α1 wynosi S(a1) = 0,615
α2 wynosi S(a2) = 0,118
α3 wynosi S(a3) = 0,176
Wyznaczanie przedziałów ufności dla parametrów strukturalnych
Znając oszacowania parametrów strukturalnych modelu oraz standardowe błędy oceny tych parametrów przy założeniu, że składnik losowy ξ ma rozkład normalny możemy wyznaczyć przedziały ufności dla tych parametrów, czyli przedziały, które z przyjętym prawdopodobieństwem 1 - α zawierają wartości parametrów modelu ekonometrycznego. Dla parametru αi przedział ten ma postać:
αi ∈ < ai - t(n-(k+1)) S(ai) ; ai + t(n-(k+1)) S(ai) > ,
gdzie t(n-(k+1)) jest odczytaną z tablicy rozkładu T-Studenta wartością krytyczną dla przyjętego poziomu istotności α oraz liczby stopni swobody n - ( k+1 ).
Przyjęłyśmy poziom istotności α = 0,2 ; przy n - ( k+1 ) = 6 stopniach swobody t(S) = 1,44. Stąd możemy wyznaczyć przedziały ufności dla poszczególnych parametrów.
Dla parametru α0 mamy:
-228,356 - 1,44 ⋅ 231,358 ≤ α0 ≤ -228,356 + 1,44 ⋅ 231,358
-561,511 ≤ α0 ≤ 104,799
Dla parametru α1 mamy:
2,539 - 1,44 ⋅ 0,615 ≤ α1 ≤ 2,539 + 1,44 ⋅ 0,615
1,653 ≤ α1 ≤ 3,425
Dla parametru α2 mamy:
-0,303 - 1,44 ⋅ 0,118 ≤ α2 ≤ -0,303 + 1,44 ⋅ 0,118
-0,473 ≤ α2 ≤ -0,133
Dla parametru α3 mamy:
0,165 - 1,44 ⋅ 0,176 ≤ α3 ≤ 0,165 + 1,44 ⋅ 0,176
-0,088 ≤ α3 ≤ 0,418
Wyznaczone przedziały zawierają rzeczywiste wartości parametrów strukturalnych z prawdopodobieństwem 1 - α = 0,8.
Badanie statystycznej istotności zmiennych objaśniających modelu
W trakcie badania statystycznej istotności, weryfikujemy hipotezę zerową H0i : αi = 0 wobec hipotezy alternatywnej H1i : αi ≠ 0 i = 1,2,...,k.
Zakładając, że składnik losowy ξ ma rozkład normalny, statystyka
ti =
ma rozkład t-Studenta o n - ( k+1 ) stopniach swobody. Jeśli t(n-(k+1)) to wartość krytyczna odczytana z tablic rozkładu t-Studenta przy poziomie istotności α to jeśli spełniona jest nierówność
ti ≤ t(n-(k+1)),
wówczas nie ma podstaw do odrzucenia hipotezy zerowej i zmienną Zi uznajemy za statystycznie nieistotną, natomiast jeśli jest spełniona nierówność
ti > t(n-(k+1))
odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej i zmienną Zi nazywamy statystycznie istotną.
Model nazywamy statystycznie istotny jeśli wszystkie zmienne występujące w nim są statystycznie istotne. Zazwyczaj zmienne statystycznie nieistotne usuwamy z modelu i w związku z tym model staje się statystycznie istotny.
Dla naszego modelu mamy dane:
n - ( k + 1 ) = 6
α = 0,2
t (n-(k+1)) = 1,44
Zatem możemy sprawdzić statystyczną istotność zmiennych objaśniających.
Dla zmiennej Z1 mamy:
t1 =
4,128 > 1,44
Zmienna Z1 jest statystycznie istotna.
Dla zmiennej Z2 mamy:
t2 =
2,57 > 1,44
Zmienna Z2 jest statystycznie istotna.
Dla zmiennej Z3 mamy:
t3 =
0,94 ≤ 1,44
Zmienna Z3 jest statystycznie nieistotna.
W naszym modelu występuje jedna zmienna statystycznie nieistotna, więc model nie jest statystycznie istotny.
6. Wyznaczanie modelu uciętego i wewnętrznego.
Modelem pierwotnym jest model określony przez parę korelacyjną postaci (R(k);R0(k)). W modelu tym zmienną objaśnianą jest zmienna Y, a zmiennymi objaśniającymi wszystkie zmienne pochodzące ze zbioru A(k)={Z1, Z2, ..., Zk}.
Dla naszego modelu, modelem pierwotnym jest model o równaniu
Y=β1Z1 + β2Z2 + ξ, którego wartości zmiennych przedstawiają się następująco:
164,847 1396 2192,5 137,5
193,482 1402 2201,3 121,8
161,243 1458 2212,1 100,4
159,876 1493 2243,2 96,1
Q = 156,835 1554 2289,8 81,7
154,857 1580 2304,4 69,3
159,348 1621 2342,7 66,2
162,945 1698 2368,3 64,9
162,671 1703 2394,2 61,6
161,342 1742 2427,6 58,3
i odpowiada mu para korelacyjna
1,000 -0,168 -0,146 0,447
R = -0,168 1,000 0,992 R0 = -0,939
-0,146 0,992 1,000 -0,918
Modelem uciętym dla modelu pierwotnego nazywamy model określony przez parę korelacyjną (Rii, R0i), gdzie macierz Rii powstaje z macierzy R(k) przez usunięcie i-tego wiersza i i-tej kolumny, natomiast wektor R0i powstaje z wektora R0(k) przez usunięcie i-tej składowej. Model ten powstaje z modelu pierwotnego przez odrzucenie zmiennej objaśnianej Zi w modelu pierwotnym. Model ucięty ma postać:
Y=βi1Z1 +...+ βii-1Zi-1 + βii+1Zi+1 +...+βikZk + ξi.
Możemy wyznaczyć trzy modele ucięte.
Model ucięty ze względu na zmienną Z1.
1396 2192,5 137,5
1402 2201,3 121,8
1458 2212,1 100,4
1493 2243,2 96,1
Q1 = 1554 2289,8 81,7
1580 2304,4 69,3
1621 2342,7 66,2
1698 2368,3 64,9
1703 2394,2 61,6
1742 2427,6 58,3
jest określony przez parę korelacyjną
1,000 0,992 -0,939
R11= R01=
0,992 1,000 -0,918
Model ucięty ze względu na zmienną Z2
164,847 2192,5 137,5
163,482 2201,3 121,8
161,243 2212,1 100,4
159,876 2243,2 96,1
Q2 = 156,835 2298,8 81,7
154,857 2304,4 69,3
159,348 2342,7 66,2
162,945 2368,3 64,9
162,671 2394,2 61,6
161,342 2427,6 58,3
jest określony przez parę korelacyjną
1,000 -0,146 0,447
R22 = R02 =
-0,146 1,000 -0,918
Model ucięty ze względu na zmienną Z3
164,847 1396 137,5
163,482 1402 121,8
161,243 1458 100,4
159,876 1493 96,1
Q3 = 156,835 1554 81,7
154,857 1580 69,3
159,348 1621 66,2
162,945 1698 64,9
162,671 1703 61,6
161,342 1742 58,3
jest określony przez parę korelacyjną
1,000 -0,168 0,447
R33 = R03 =
-0,168 1,000 -0,939
Modelem wewnętrznym dla modelu pierwotnego nazywamy model określony przez parę korelacyjną (Rii, ρi), gdzie ρi oznacza i-tą kolumnę macierzy R(k) bez i-tego elementu. W modelu tym zmienną objaśnianą jest zmienna Zi odrzucona z modelu pierwotnego, zaś zmiennymi objaśniającymi są te same zmienne, które występują w modelu uciętym. Model wewnętrzny dany jest wzorem:
Zi=γi1Z1 + ... + γii-1Zi-1 + γii+1Zi+1 + ... + γikZk + ηi.
Możemy wyznaczyć trzy modele wewnętrzne.
Model wewnętrzny ze względu na zmienną Z1.
1396 2192,5 164,847
1402 2201,3 163,482
1458 2212,1 161,243
1493 2243,2 159,876
Q1 = 1554 2289,8 156,835
1580 2304,4 154,857
1621 2342,7 159,348
1698 2368,3 162,945
1703 2394,2 162,671
1742 2427,6 161,342
jest określony przez parę korelacyjną
1,000 0,992 -0,168
R11 = ρ1 =
0,992 1,000 -0,146
Model wewnętrzny ze względu na zmienną Z2.
164,847 2192,5 1396
163,482 2201,3 1402
161,243 2212,1 1458
159,876 2243,2 1493
Q2 = 156,835 2289,8 1554
154,857 2304,4 1580
159,348 2342,7 1621
162,945 2368,3 1698
162,671 2394,2 1703
161,342 2427,6 1742
jest określony przez parę korelacyjną
1,000 -0,146 -0,168
R22 = ρ2 =
-0,146 1,000 0,992
Model wewnętrzny ze względu na zmienną Z3.
164,847 1396 2192,5
163,482 1402 2201,3
161,243 1458 2212,1
159,876 1493 2243,2
Q3 = 15683,5 1554 2289,8
154,857 1580 2304,4
159,348 1621 2342,7
162,945 1698 2368,3
162,671 1703 2394,2
161,342 1742 2427,6
jest określony przez parę korelacyjną
1,000 -0,168 -0,146
R33 = ρ3 =
-0,168 1,000 0,992
7. Wyznaczanie współczynnika korelacji cząstkowej.
Współczynnik korelacji cząstkowej zmiennej Y ze zmienną Zi, oznaczany symbolem ri*, jest współczynnikiem korelacji zwykłej pomiędzy resztami modelu uciętego oraz modelu wewnętrznego i można go wyznaczyć z następującego wzoru:
Dla wyznaczenia wartości współczynnika ri* można skorzystać z podwójnej macierzy brzegowej postaci:
Rii ρi R0i
ΛI = ρiT 1 ri
RoiT ri 1
Przedstawiamy jak wyglądają współczynniki korelacji cząstkowej dla naszego modelu.
ri* dla zmiennej Z1.
1,000 0,992 -0,168 -0,939
0,992 1,000 -0,146 -0,918
Λ1 =
-0,168 -0,146 1,000 0,447
-0,939 -0,918 0,447 1,000
ri* dla zmiennej Z2.
1,000 -0,146 -0,168 0,447
-0,146 1,000 0,992 -0,918
Λ2 =
-0,168 0,992 1,000 -0,939
0,447 -0,918 -0939 1,000
ri* dla zmiennej Z3.
1,000 -0,168 -0,146 0,447
-0,168 1,000 0,992 -0,918
Λ3 =
-0,146 0,992 1,000 -0,939
0,447 -0,918 -0,939 1,000
Współczynnik korelacji cząstkowej ri* jest wykorzystywany dla sprawdzenia statystycznej istotności modelu. Jeżeli spełniona jest nierówność
gdzie Fγ to wartość krytyczna odczytana z tablic rozkładu F-Snedecora przy ustalonym poziomie istotności γ i odpowiedniej liczbie stopni swobody, to zmienna Zi jest statystycznie istotna, przy założeniu, że rozkład składnika losowego modelu jest normalny.
Dla naszego modelu przyjmujemy, że poziom istotności wynosi γ = 0,05 i przy n-(k+1) = 6 stopniach swobody wartość krytyczna wynosi Fγ = 5,99, więc
Sprawdzamy statystyczną istotność zmiennej Z1.
r1* = 0,855
(r1*)2 = 0,731
0,731 > 0,499,
więc zmienna Z1 jest statystycznie istotna.
Sprawdzamy statystyczną istotność zmiennej Z2.
r2* = -0,724
(r2*)2 = 0,524
0,524 > 0,499,
więc zmienna Z2 jest statystycznie istotna.
Sprawdzamy statystyczną istotność zmiennej Z3.
r3*= 0,318
(r3*)2 = 0,101
0,101 < 0,499,
więc zmienna Z3 nie jest statystycznie istotna.
Na podstawie otrzymanych wyników stwierdzamy, że model nie jest statystycznie istotny, gdyż jedna zmienna Z3 nie spełnia warunku statystycznej istotności.
Badanie jakości modelu
Miarami służącymi do dokonania oceny jakości modelu są współczynnik determinacji, współczynnik zbieżności oraz współczynnik natężenia efektu katalizy.
Współczynnik determinacji lub inaczej kwadrat współczynnika korelacji wielowymiarowej, oznaczamy symbolem r2 , który określa jaka część zmiennej objaśnianej Y jest opisana przez model. r2 przyjmuje wartości z przedziału < 0,1 >, przy czym im ta wartość większa tym model jakościowo lepszy.
Dla modelu przed standaryzacją obliczamy r2 ze wzoru:
r2 = 1 - ϕ2
natomiast dla modelu po standaryzacji:
r2 = R0TR-1R0
Współczynnik zbieżności oznaczony symbolem ϕ2, mówi nam jaka część objaśnianej Y pozostaje poza modelem. ϕ2 przyjmuje wartości z przedziału < 0,1 >, przy czym wartość bliska 0 świadczy o wysokiej jakości modelu.
Dla modelu przed standaryzacją obliczamy go ze wzoru:
ϕ2 =
,
gdzie:
U - wektor reszt,
P - wektor odchyleń zmiennej Y od średniej.
P =
Między współczynnikiem determinacji i współczynnikiem zbieżności zachodzi następująca zależność:
r2 + ϕ2 = 1
Współczynnik natężenia efektu katalizy, oznaczamy symbolem η, jest szkodliwy dla jakości modelu. Często powoduje sztuczne zawyżenie współczynnika determinacji na skutek silnego skorelowania pomiędzy zmiennymi objaśniającymi.
Jeśli:
rij < 0
rij > min (
)
to tę zmienną z pary zmiennych ( Zi, Zj ), która mniejszy współczynnik korelacji ze zmienną objaśnianą Y, nazywamy zmienną katalityczną.
W punkcie 1) mamy do czynienia ze słabym katalizatorem, w punkcie 2) mówimy o mocnym katalizatorze.
Współczynnik η przyjmuje wartości z przedziału < 0,1 >, a im jest on niższy tym lepsza jakość modelu. Obliczamy go według wzoru:
η = r2 - H
Istotne jest by, współczynniki przed i po standaryzacji przyjmowały wartości zbliżone do siebie.
Badanie jakości modelu przed standaryzacją
ϕ2 =
Korzystając z wcześniejszych obliczeń wiemy, że UTU = 184,959.
Pozostaje nam wyznaczyć P ze wzoru:
P =
=
, stąd
P =
Zatem PTP = 6740,056
ϕ2 =
= 0,027
r2 = 1 - ϕ2 r2 = 0,973
η = r2 - H
Dla naszego modelu H = 0,956 więc
η = 0,973 - 0,956 = 0,017
Badanie jakości modelu po standaryzacji
r2 = R0TR-1R0
r2 możemy wyznaczyć dokonując elementarnych przekształceń macierzy blokowej postaci
R R0
r2 =
-R0T 0
r2 = 0,971
ϕ2 = 1 - R0TR-1R0
Dla wyznaczenia ϕ2 skorzystamy z macierzy blokowej postaci
R R0
ϕ2 =
R0T 1
ϕ2 = 0,029
Sprawdzamy czy została zachowana równość
r2 + ϕ2 = 1
0,971 + 0,029 = 1
η = r2 - H
η = 0,971 - 0,956 = 0,015
Uzyskałyśmy wyniki świadczące o wysokiej jakości modelu.
9.Badanie koincydencji modelu.
Mówimy, że zmienna objaśniająca Zi modelu jest zmienną koincydentną jeśli spełniona jest nierówność
sign ai=sign ri,
czyli znak oszacowania parametru strukturalnego stojącego przy tej zmiennej jest identyczny ze znakiem jej współczynnika korelacji ze zmienną objaśnianą Y. Brak koincydentności uniemożliwia sensowną interpretację ekonomiczną uzyskanych oszacowań parametrów strukturalnych modelu.
Zmienna Zi jest zmienną koincydentną,gdy znak oszacowania parametru αi jest identyczny ze znakiem liczby di
di = ri - ρiTRii-1R01,
gdzie
ri - i-ta składowa wektora korelacji,
ρi - i-ta kolumna macierzy korelacji z pominięciem i-tego elementu
w kolumnie,
Rii - macierz powstała z macierzy korelacji po wykreśleniu i-tego wiersza i i-tej kolumny,
Roi - wektor powstały z wektora korelacji po skreśleniu i-tej składowej wektora korelacji.
Wartość liczby di możemy obliczyć wykonując elementarne przekształcenia pojedynczej macierzy brzegowej postaci
Rii Roi
Bi=
ρiT ri
Dany model jest koincydentny, gdy wszystkie jego zmienne są koincydentne.
Koincydencja naszego modelu przedstawia się następująco.
Koincydencja zmiennej Z1.
r1=0,447
Przekształcamy macierz brzegową postaci
1,000 0,992 -0,939
0,992 1,000 -0,918
-0,168 -0,146 0,447
i otrzymujemy d1=0,272. Oznacza to, że zmienna Z1 jest koincydentna.
Koincydencja zmiennej Z2.
r2= -0,939
Przekształcamy macierz brzegową postaci
1,000 -0,146 0,447
-0,146 1,000 -0,918
-0,168 0,992 -0,939
i otrzymujemy d2 = -0,021. Oznacza to, że zmienna Z2 jest koincydentna.
Koincydencja zmiennej Z3.
r3= -0,918
Przekształcamy macierz brzegową postaci
1,000 -0,168 0,447
-0,168 1,000 -0,939
-0,146 0,992 -0,918
i otrzymujemy d3 = 0,007. Oznacza to, że zmienna Z3 nie jest koincydentna.
Wyznaczanie macierzy uniwersalnej i macierzy neutralnej.
Macierzą uniwersalną jest macierz
U = [uij]kxk, gdzie
Uij =
ri, rj - i-ta, j-ta składowa wektora korelacji.
Jeżeli macierz korelacji jest macierzą uniwersalną to model taki nie zawiera mocnych ani słabych katalizatorów, a także jest modelem koincydentnym.
Dla wektora korelacji R0 naszego modelu macierz uniwersalna wygląda następująco:
0,447 1,000 -0,420 -0,410
R0 = -0,939 U = -0,420 1,000 0,862
-0,918 -0,410 0,862 1,000
Macierzą neutralną jest macierz
N = [nij]kxk, gdzie
Nij =
Gdy macierz korelacji jest macierzą neutralną to model:
Nie zawiera mocnych ani słabych katalizatorów.
Nie jest modelem koincydentnym - w modelu tym koincydentna jest tylko ta zmienna objaśniająca, która ma najwyższy współczynnik korelacji ze zmienną objaśnianą.
Współczynnik determinacji r2 jest równy kwadratowi największej składowej wektora korelacji.
Dla naszego wektora korelacji macierz neutralna wygląda następująco:
0,447 1,000 -0,476 -0,487
R0 = -0,939 N = -0,476 1,000 0,978
-0,918 -0,487 0,978 1,000
Na podstawie wcześniejszych obliczeń i testów jakości stwierdziłyśmy, że zmienna Z3 zarówno nie jest statystycznie istotna, jak i nie jest koincydentna, więc decydujemy się na jej usunięcie z modelu. Dzięki temu nasz model zyskuje na jakości, jest zarówno koincydentny, jak i statystycznie istotny. Obecnie nasz model przyjmuje postać:
Y=β1Z1 + β2Z2 +ξ , gdzie
Z1 - zatrudnienie ogółem w tys. osób
Z2 - rodzice samotnie wychowujący dzieci w tys. osób,
para korelacyjna natomiast wygląda następująco:
1,000 -0,168 0,447
R = R0 =
-0,168 1,000 -0,939
Praca pochodzi z serwisu www.e-sciagi.pl