Weryfikacja modelu, cz. I
• Dobroć dopasowania do danych empirycznych
• Istotność parametrów strukturalnych
• Normalność, homoskedastyczność, brak autokorelacji składników losowych
• Dobór zmiennych objaśniających
• Postać funkcyjna
2
Dopasowanie do danych empirycznych
Niech
Y = β + β X + … + β X + ξ
t
0
1
t1
K
tK
t
Załóżmy, że b jest estymatorem β (i = 1,2, …,K ) uzyskanym MNK.
i
i
Wówczas
Y = b + b X + … + b X + u t
0
1
t1
K
tK
t ,
u – reszta
t
Dekompozycja łącznej sumy kwadratów odchyleń zm. objaśnianej od jej średniej
T
T
T
T
T
2
2
2
2
ˆ
ˆ
∑ (Y −Y) =∑ (Y +u −Y) =∑ (Y −Y) +∑ u +2∑ (Y −Y)u t
t
t
t
t
t
t
t =1
t =1
t =1
t =1
t =1
Własności numeryczne estymatora MNK
T
∑
T
u = 0
∑ X u = 0
(j =1,2, …,K)
t
,
t =1
tj
t
t =1
3
T
T
T
2
2
2
ˆ
∑ (Y −Y) =∑ (Y −Y) +∑ u t
t
t
t =1
t =1
t =1
TSS = ESS + RSS
(łączna, wyjaśniona oraz resztowa suma kwa-
dratów)
Dzieląc obustronnie przez TSS uzyskuje się
ESS
RSS
1 =
+
TSS
TSS
Wspołczynnik determinacji
ESS
2
R =
TSS
Im większy 2
R , tym lepsze dopasowanie
2
R ∈ [0,1] pod warunkiem, że w modelu występuje wyraz wolny 4
Obliczenia dla makroekonomicznej funkcji konsumpcji dla Wlk.
Brytanii
TSS=7228800000000
ESS=7210000000000
RSS=18800000
7210000000000
2
R =
= 0,9973993
(interpretacja?)
7228800000000
(prawie doskonałe dopasowanie)
Dochód i konsumpcja w Wlk. Brytanii,
1948-1985 (mln Ł)
90000
80000
aj
70000
cp
60000
m
50000
us
40000
n
30000
ok
20000
10000
0
0
20000
40000
60000
80000
100000
dochód
5
Istotność parametrów strukturalnych
b −β
j
j
b −β
σ(b )
N 0,1
j
j
j
( )
t(b )=
=
=
~t[T −(K+1)] (j=0,1,2, …,K) j
2
2
S(b )
j
S (b )
χ [T−(K+1)]
j
2
σ (b )
T −(K+1)
j
rozkład t-Studenta z T-(K+1) stopniami swobody
(1 − α) × 100 % przedział ufności dla β
j
b
− β
Pr t
(b )
j
j
≤ t
≤
= Pr
≤ t = 1− α
j
α 2
α 2
S(b )
j
b − t
× S(b ) ≤ β ≤ b + t × S(b )
j
α 2
j
j
j
α 2
j
Interpretacja przedziału ufności?
b i S(b ) są zmiennymi losowymi zanim próba zostanie wylosowana, zatem j
j
b ± t
× S(b ) – granice (losowe) przedziału ufności
6
j
α 2
j
Obliczenia dla makroekonomicznej funkcji konsumpcji dla Wlk. Brytanii b = 6969,3
S(b ) = 420,64
0
0
b = 0,79251
S(b ) = 0,00675
1
1
T − (K + 1) = 38 − 2 = 36
α = 0,05
t
(36) = 2,03
0,025
6969,3 − 2,03 × 420,64 ≤ β ≤ 6969,3 + 2,03 × 420,64
0
6115, 4 ≤ β ≤ 7823,2
(interpretacja?)
0
0,79251 − 2,03 × 0,00675 ≤ β ≤ 0,79251+ 2,03 × 0,00675
1
0,77882 ≤ β ≤ 0,80621
(interpretacja?)
1
Załóżmy, że przypuszczasz, iż β = 6800 i β = 0,82 . Czy Twoje przypuszcze-0
1
nie jest prawidłowe w świetle wyznaczonych przedziałów ufności dla parametrów strukturalnych?
7
bj
H : β = 0 ⇒ t(b ) =
~ t[T − (K + 1)]
0
j
j
S(b )
j
Reguła decyzyjna:
t(b ) ≤ t [T − (K + 1)] ⇒ H : β = 0, j
α 2
0
j
t(b ) > t [T − (K + 1)] ⇒ H : β ≠ 0
j
α 2
A
j
Naszkicuj obszar krytyczny i niekrytyczny; jaka jest różnica pomiędzy obszarem krytycznym/niekrytycznym a obszarem przyjęcia/odrzucenia H0?
Wskazówka: niech H : β = βɶ jest prawdziwa, zwróć uwagę na 0
j
j
βɶ − t × S(b ) ≤ b ≤ βɶ + t × S(b ) j
α 2
j
j
j
α 2
j
Obliczenia, c.d.
6993,2
t(b ) =
= 16,568 > 2,03 ⇒ H
0
A
420,64
0,79251
8
t(b ) =
= 117,491> 2,03 ⇒ H
1
A
0,00675
Niech
Y = β + β X + … + β X + ξ
t
0
1
t1
K
tK
t
Jesteś zainteresowany weryfikacją H : β = β = … = β wobec 0
1
2
K
H : przynajmniej jeden β ≠ 0
A
j
Zwróć uwagę na
T
T
T
2
2
2
ˆ
∑ u =∑ (Y − Y) − ∑ (Y − Y) t
t
t
oraz
t =1
t =1
t =1
T
T
2
2
∑ u =∑ (Y − Y)
t
t
pod warunkiem, że H jest prawdziwa
t =1
t =1
0
T
T
T
2
2
2
ˆ
∑ (Y −Y)
∑ (Y −Y) −∑ u
t
t
t
t =1
t =1
t =1
2
T −(K+1) R
K
K
F=
=
=
~ F[K,T −(K+1)]
T
T
2
2
2
K
1 R
∑ u
∑ u
−
t
t
t =1
t =1
T −(K+1)
T −(K+1)
Iloraz wariancji jest niski (wysoki) w wypadku, gdy H jest prawdziwa (fał-
0
szywa)
9
α
(narszkicuj)
Reguła decyzyjna
F ≥ F [K,T − (K + 1)] ⇒ H
α
A
F < F [K,T − (K + 1)] ⇒ H
α
0
Alternatywne statystyki testowe:
Test LM (mnożnka Lagrange’a) dla dodawanych zmiennych
Y = β + β X + … + β X + ξ
(R)
t
0
1
t1
K
tK
t
Y = β + β X + … + β X + β
X
+ … + β
X
+ ξ
(U)
t
0
1
t1
K
tK
K +1
tK +1
K +m
tK +m
t
H : β
= … = β
= 0 , H : przynajmniej jeden β
≠ 0 (l = 1,2, …,m)
0
K+1
+
K+m
A
K l
+
2
2
TR ~ χ (K) (w dużych próbach)
Obliczenia dla makroekonomicznej funkcji konsumpcji
38 − 2 0,9973993
F =
= 13806,426 > 4,11 = F (1,36) ⇒ H
0,05
A
1
1−
0,9973993
2
2
TR = 38 × 0,9973993 = 37,901 > 3,84 = χ
(1) ⇒ H
0,05
A
10
Y = β + β X + … + β X
+ ξ
(R)
t
0
1
t1
m
tm
t
Y = β + β X + … + β X
+ β X
+ … + β X + ξ
(U)
t
0
1
t1
m
tm
m+1
tm+1
K
tK
t
H : β
= … = β = 0 , H : przynajmniej jeden z β
≠ 0 (l = 1,2, …,m)
0
m+1
K
A
m+l
2
2
(RSS
R
− SS ) /(df d
− f ) (RSS R
− SS ) /(K m
− )
(R
R
− ) /(K m
− )
R
U
R
U
R
U
U
R
F =
=
=
~ F[K m
− ,T (
− K 1
+ )]
2
RSS / df
RSS /[T (
− K 1
+ )]
(1 R
− ) /(T (
− K 1
+ )]
U
U
U
U
11
Wydruk z Microfita – wyniki estymacji i weryfikacji modelu Ordinary Least Squares Estimation
*******************************************************************************
Dependent variable is C38 observations used for estimation from 1948 to 1985
*******************************************************************************
Regressor Coefficient Standard Error T-Ratio[Prob]ST 6969.3 420.4459 16.5760[.000]
Y .79251 .0067438 117.5173[.000]
*******************************************************************************
R-Squared .99740 R-Bar-Squared .99733S.E. of Regression 722.3114 F-stat. F( 1, 36) 13810.3[.000]
Mean of Dependent Variable 54421.4 S.D. of Dependent Variable 13973.0
Residual Sum of Squares 1.88E+07 Equation Log-likelihood -303.0257
Akaike Info. Criterion -305.0257 Schwarz Bayesian Criterion -306.6633
DW-statistic .71210
*******************************************************************************
12Proszę wykonać odpowiednie obliczenia dla modelu cen domów jednorodzinnych w mia-steczku uniwersyteckim San Diego oraz modelu wydatków na ochronę zdrowia w USA!
13