Weryfikacja modelu ekonometrycznego
Dr Krystyna Melich-
Iwanek
Katedra Ekonometrii
melich@ue.katowice.
pl
Weryfikacja modelu
1.
Błędy średnie szacunku
parametrów
2.
Miary zgodności modelu z
danymi empirycznymi
3.
Weryfikacja statystyczna
parametrów
4.
Weryfikacja rozkładu
reszt modelu
NIEOBCIĄŻONĄ OCENĄ WARIANCJI
SKŁADNIKÓW LOSOWYCH JEST
WARIANCJA RESZTOWA
*
t
y
t
y
t
u
,
n
1
t
2
t
u
k
n
1
2
s
Xa
T
y
y
T
y
k
n
1
2
s
s – odchylenie resztowe, odchylenie
standardowe reszt
2
s
s
MIARY ZGODNOŚCI MODELU Z DANYMI
EMPIRYCZNYMI
1. s – odchylenie standardowe reszt,
2
1
1
n
t
*
t
y
t
y
k
n
s
s - informuje o ile średnio rzecz biorąc
(i n plus i in minus) zaobserwowane
wartości zmiennej endogenicznej odchylają
się od wartości wyznaczonych na podstawie
oszacowanego modelu,
2.w
-
współczynnik
zmienności
przypadkowej,
%
y
s
w
100
w -
informuje jaki procent wartości zmiennej
objaśnianej modelu stanowi odchylenie
resztowe
BŁĘDY ŚREDNIE SZACUNKU
1. Błąd szacunku i-tego parametru
a
i
-
i
2. Średni błąd estymatora i-tego
parametru,
ii
c
s
)
i
a
(
d
d(a
i
) - informuje o ile średnio rzecz
biorąc (in plus i in minus) pomylilibyśmy
się szacując wielokrotnie parametr
i
każdorazowo wykorzystując n- elementowe
próby wylosowane z tej samej populacji
Analiza wariancji –
dekompozycja ogólnej sumy kwadratów
2
2
2
t
u
t
u
t
*
y
*
t
y
t
y
t
y
całkowita
zmienność
zmienność
zmienność Y
t
objaśniona
resztowa Y
t
(zmiennej Y
t
)
Dla modelu liniowego oszacowanego MNK mamy
t
u
t
u
0
0
y
*
y
t
y
t
y
:
/
t t
u
t
y
*
t
y
t
y
t
y
2
2
2
2
t
y
t
y
t
t
u
t
y
t
y
t
y
*
t
y
2
2
2
2
1
a stąd:
3. Współczynnik zbieżności
2
2
2
2
2
y
s
n
s
k
n
t
y
t
y
t
t
u
2
[ 0 ; 1 ] - wskazuje jaką część
całkowitej zmienności zmiennej endogenicznej
stanowi zmienność nie wyjaśniona przez
model,
czyli zmienność przypadkowa,
4. Współczynnik determinacji
2
1
2
2
2
t
y
t
y
t
y
*
t
y
R
R
2
[ 0 ; 1 ] - wskazuje jaką część
całkowitej zmienności zmiennej Y
t
stanowi
zmienność wyjaśniona przez model,
zdeterminowana przez zmienne objaśniające
5. Skorygowany współczynnik determinacji
)
(
ˆ
2
1
1
1
2
R
k
n
n
R
wyeliminowany został wpływ
ilości zmiennych objaśniających
TEST „F”
H
o
:
k
=0,
( z wyjątkiem wyrazu
wolnego),
H
1
: przynajmniej jeden z parametrów
i
≠
0
Jeżeli Y ma rozkład normalny, to sprawdzian
hipotezy
jest dany wzorem:
2
1
2
1
1
1
2
1
1
2
1
1
k
n
)
(
k
)
R
(
k
n
R
k
F
F ma rozkład FISHERA-SNEDECORA o k-1 i n-k stopniach
swobody
.
Jeżeli dla
złożonego
F > F
to H
o
odrzucamy
BADANIE ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH
H
o
:
i
0, hipoteza sprawdzana
H
1
:
i
≠ 0, hipoteza alternatywna
)
(
)
(
i
i
a
d
i
a
a
d
i
i
a
i
t
t
i
– ma rozkład Studenta o (n-k) stopniach
swobody,
t
- wartość zmiennej t dla poziomu
istotności
i
n-k
stopni swobody
Gdy:
|
t
i
| > t
to H
0
odrzucamy
,
a gdy
|
t
i
| t
to nie ma podstaw do jej
odrzucenia
ESTYMACJA PRZEDZIAŁOWA
Szacowanie nieznanych wartości parametrów
poprzez podanie przedziałów liczbowych, o
których zakłada się, że będą zawierać
prawdziwe wartości poszukiwanych
parametrów z ustalonym z góry
prawdopodobieństwem
-
współczynnik ufności,
Przedział ufności dla parametru
i
P{ a
i
- t
d(a
i
)
i
< a
i
+ t
d(a
i
) } =
t
wartość krytyczna dla zmiennej losowej
o rozkładzie
t – Studenta dla n-k stopni swobody, przy
ustalonym poziomie istotności .
Analiza wybranych własności rozkładu
reszt
Reszty modelu powinny spełniać
następujące warunki:
•
Losowość
•
Symetria
•
Brak autokorelacji
•
Stałość wariancji
•
Normalność
TEST SERII
H
O
: RESZTY MODELU SĄ LOSOWE
(trafnie dobrano postać analityczną
modelu)
H
1
: RESZTY MODELU NIE SĄ LOSOWE
Oznaczenia:
A gdy u
t
> 0,
B gdy u
t
< 0,
u
t
= 0, pomijamy.
SERIA – KAŻDY PODCIĄG RESZT,
UPORZĄDKO-WANYCH W CZASIE LUB
WEDŁUG WARTOŚCI OKREŚLONEJ
ZMIENNEJ OBJAŚNIAJĄCEJ, ZŁOŻONY
WYŁĄCZNIE Z ELEMENTÓW JEDNEGO
RODZAJU (DODATNICH LUB UJEMNYCH).
C – empiryczna liczba serii,
n
1
= liczba reszt dodatnich
n
2
= liczba reszt ujemnych,
Dla poziomów istotności
(
i
odczytujemy odpowiednio
C
1
i
C
2
Jeśli C
1
< C < C
2
to H
0
Jeśli CC
1
lub CC
2
to
H
0
odrzucamy
Uproszczona analiza reszt
LOSOWOŚĆ
Rozkład reszt
-15
-10
-5
0
5
10
15
1 3 5 7 9 11 13 15 17 19 21 23 25 27
t
S
k
ła
d
n
ik
i
re
s
z
to
w
e
Jeżeli ciąg reszt jest losowy to liczba serii
jest w przybliżeniu równa połowie liczby
obserwacji.
Rozkład reszt
-15
-10
-5
0
5
10
15
1
7
13
19
25
t
n = 27 , c =
14
TEST SYMETRII (dla małej próby)
H
O
:
m/n = 1/2
RESZTY MODELU MAJĄ ROZKŁAD
SYMETRYCZNY
H
1
:
m/n ½
RESZTY MODELU NIE MAJĄ ROZKŁADU
SYMETRYCZNEGO
(m liczba reszt dodatnich, n liczba reszt )
n
)
n
m
(
n
m
n
m
t
Sprawdzian
hipotezy
t ma rozkład
Studenta o n-1
stopniach
swobody
jeżeli
t t
nie ma podstaw do
odrzucenia H
o
gdy
t
>t
odrzucamy H
o
na
korzyść H
1,
rozkład
nie jest symetryczny
Uproszczona analiza reszt
SYMETRIA
Symetria oznacza równe
prawdopodobieństwa występowania reszt
dodatnich i ujemnych.
Jeśli liczba reszt dodatnich jest w
przybliżeniu równa liczbie reszt ujemnych
to można przyjąć, że reszty spełniają
warunek symetrii.
n
1
= 15 (liczba reszt dodatnich)
n
2
= 12 (liczba reszt ujemnych)
TEST DURBINA WATSONA
H
O
:
=
0
H
1
:
0
n
t
t
u
n
t
)
t
u
t
u
(
d
1
2
2
2
1
d [ 0 ; 4 ]
Jeżeli:
r
1
=0 to
d=2,
r
1
=1 to
d=0,
r
1
=-1 to
d=4.
Dla ustalonego
, k`=k-1
i
n
na ogół
n
>15
,
z tablic odczytujemy
d
L
i d
U
.
Gdy:
d> d
U
,
to
.
H
O
przyjmujemy,
d< d
L
, to
.
H
O
odrzucamy,
d
L
d d
U
,
test nie daje odpowiedzi,
gdy
r
1
< 0,
obliczamy
d*=4-d.
Gdy H
O
jest prawdziwa to E(d)=2.
Jeśli d 2 to prawdopodobnie
0
TEST JEDNORODNOŚCI WARIANCJI
GOLDFELDA QUANDTA
CZYNNOŚCI:
•PODZIAŁ PRÓBY NA DWIE
RÓWNOLICZNE CZĘŚCI,
OPUSZCZAMY PRZECIĘTNIE OKOŁO
4-8 ŚRODKOWYCH ELEMENTÓW,
•SZACUJEMY PARAMETRY MODELI,
y
1
=X
1
i
y
2
=X
2
(W OBU PODPRÓBACH),
•OBLICZAMY WARIANCJE RESZTOWE
DLA OBU MODELI, czyli
s
1
2
i
s
2
2
OZNACZENIA:
n – liczba obserwacji,
c – liczba opuszczonych środkowych
elementów,
n
1
= n
2
. – liczebność w badanych podpróbach,
n=n1+n2+c
TEST
H
O
:
H
1
:
JEŻELI H
O
JEST PRAWDZIWA TO STATYSTYKA
2
1
S
2
2
S
F
MA ROZKŁAD F FISCHERA SNEDECORA
O
m
1
=(n
2
-k) i m
2
= (n
1
-k)
STOPNIACH
SWOBODY.
JEŻELI, PRZY POZIOMIE ISTOTNOŚCI
F>F
TO HIPOTEZĘ
O JEDNORODNOŚCI WARIANCJI NALEŻY
ODRZUCIĆ
Test istotności współczynnika korelacji
modułu reszt z czasem
H
O
: r=0
H
: r ≠ 0
,
2
1
2
n
r
r
t
Sprawdzian testu
t ma rozklad Studenta,
o n-2 stopniach
swobody
Uproszczona analiza reszt
Jednorodność wariancji
Wykres reszt według następstwa czasowego
pozwala
ocenić czy wariancja jest stała
Rozkład reszt
-20,00
-15,00
-10,00
-5,00
-
5,00
10,00
15,00
0
10
20
30
t
S
k
ła
d
n
ik
i
re
s
z
to
w
e
Z rysunku wyraźnie widać, że odchylenie
standardowe reszt wzrasta co świadczy o
wzroście wariancji w czasie, nie jest spełnione
założenie o niejednorodności wariancji.
TEST NORMALNOŚCI ROZKŁADU
SKŁADNIKA
LOSOWEGO – JARQUE - BERA
H
O
: składnik losowy modelu ma rozkład
normalny
H
1
: składnik losowy modelu nie ma
rozkładu normalnego
Statystyka
testu
]
)
B
(
B
[
n
JB
2
3
2
24
1
1
6
1
n
t
t
u
n
S
1
2
1
2
1 3
3
1
1
n
t S
t
u
n
B
n
t S
t
u
n
B
1 4
4
1
2
DOWODZI SIĘ, ŻE STATYSTYKA JB MA ROZKŁAD
2
(chi-kwadrat) Z DWOMA STOPNIAMI SWOBODY.
DLA
0 05 WARTOŚĆ KRYTYCZNA TESTU WYNOSI
5,991
, CZYLI GDY:
JB>5,991
H
O
O NORMALNOŚCI ROZKŁADU NALEŻY ODRZUCIĆ
Uproszczona analiza reszt
Normalność rozkładu
Rozkład prawdopodobieństwa normalnego
0
50
100
150
200
0
50
100
150
Percentyl próbki
Y