1
EKONOMETRIA 1
wykład 11
dr Beata Madras-Kobus
Weryfikacja merytoryczna oszacowanego modelu
obejmuje
interpretację
oszacowań
parametrów
modelu i ich analizę, polegającą na badaniu zgodności
znaków ocen parametrów z wiedzą ekonomiczną o
modelowanym zjawisku.
Oszacowany
model
ekonometryczny
przyjmuje
postać:
Ocena a parametru strukturalnego
α, występującego
przy zmiennej X w modelu ekonometrycznym
oznacza, o ile przeciętnie wzrośnie (gdy a>0) lub
zmaleje (gdy a<0) wartość zmiennej objaśnianej Y,
gdy wartość zmiennej X wzrośnie o jedną jednostkę.
3
Dopasowanie modelu do danych
empirycznych
Po
oszacowaniu
parametrów
modelu
ekonometrycznego należy zbadać stopień
zgodności modelu z danymi empirycznymi.
Analiza dopasowania modelu do danych
empirycznych polega na porównaniu wartości
empirycznych zmiennej objaśnianej y
i
, z
wartościami teoretycznymi wyznaczonymi z
modelu
, i = 1,2, …, n.
Model
tym
lepiej
pasuje
do
danych
empirycznych im reszty
co do wartości bezwzględnej są mniejsze.
Miary określające stopień zgodności modelu z
danymi
empirycznymi
obliczane
są
na
podstawie wartości reszt.
O dopasowaniu modelu ekonometrycznego do danych
empirycznych informuje wariancja składnika losowego
. Informuje ona o zmienności składnika losowego.
Nieobciążonym i zgodnym estymatorem wariancji
składnika losowego jest:
gdzie:
e – wektor reszt, czyli wektor odchyleń rzeczywistych wartości
zmiennej objaśnianej od jej wartości teoretycznych,
n – liczba obserwacji
Dopasowanie modelu do danych empirycznych
Odchylenie standardowe reszt
2
Odchylenie standardowe reszt modelu (in.
standardowy błąd estymacji) wyznacza się ze
wzoru:
Odchylenie standardowe reszt wskazuje, o ile
przeciętnie zaobserwowane wartości zmiennej
objaśnianej
różnią
się
od
wartości
teoretycznych tej zmiennej wyznaczonych z
modelu.
Dopasowanie modelu do danych empirycznych
Odchylenie standardowe reszt
Suma kwadratów reszt jako miara dopasowania
modelu do danych empirycznych ma tę wadę, że
przeskalowanie
zmiennej
objaśnianej
powoduje
zmianę jej wartości. Z tego powodu w praktyce
częściej wykorzystuje się miary wyprowadzone dzięki
dekompozycji
wariancji
zmiennej
objaśnianej.
Całkowitą zmienność zmiennej objaśnianej określaną
jako:
Analiza wariancji zmiennej objaśnianej
można rozbić na dwie części:
czyli:
Odejmując średnią y od obu stron otrzymujemy:
Następnie tożsamość (*) podnosimy obustronnie do
kwadratu:
(*)
Po zsumowaniu uzyskujemy:
można zapisać jako:
Wyrażenie:
Wiadomo, że:
Zatem:
i stąd:
gdzie:
ogólna suma kwadratów odchyleń
wartości
empirycznych zmiennej objaśnianej od wartości
średniej, całkowita zmienność zmiennej
suma
kwadratów
odchyleń
wartości
teoretycznych zmiennej objaśnianej od wartości
średniej,
zmienność
zmiennej
objaśnianej
wyjaśniona przez model
suma kwadratów reszt, zmienność zmiennej
objaśnianej niewyjaśniona przez model
Całkowita zmienność zmiennej objaśnianej, SST, jest zatem sumą
zmienności zmiennej objaśnianej wyjaśnianej przez model (SSR)
oraz zmienności zmiennej objaśnianej niewyjaśnianej przez
model (SSE):
ANALIZA
WARIANCJI
df
SS
MS
F
Istotność F
Regresja
k
SSR
SSR/k
Wartość
statystyki F
poziom
istotności
Resztkowy
n-k-1
SSE
SSE/(n-k-1)
Razem
n-1
SST
12
Dopasowanie modelu do danych empirycznych
Analiza wariancji zmiennej objaśnianej
w programie Excel
ANALIZA
WARIANCJI
df
SS
MS
F
Istotność F
Regresja
2
0,594
0,297
346,5
1E-07
Resztkowy
7
0,006
0,000857143
Razem
9
0,6
3
Wartość współczynnika determinacji jest liczbą z przedziału [0, 1].
Gdyby dopasowanie modelu do danych było idealne to R
2
= 1,
ponieważ wszystkie reszty e
t
byłyby równe 0.
Współczynnik determinacji R
2
informuje, w jakim stopniu
zmienność zmiennej objaśnianej wyjaśniona została przez model.
Dzieląc obustronnie powyższy wzór przez SST
otrzymujemy:
Wyrażenie SSR/SST nazywane jest współczynnikiem
determinacji i oznaczane R
2:
Współczynnik determinacji
Współczynnik
korelacji
wielorakiej
R
jest
pierwiastkiem
kwadratowym
ze
współczynnika
determinacji R
2
Współczynnik korelacji wielorakiej można traktować
jako współczynnik korelacji pomiędzy wartościami
empirycznymi zmiennej objaśnianej i wartościami
teoretycznymi zmiennej objaśnianej wyznaczonymi na
podstawie liniowego modelu ekonometrycznego.
Interpretacja:
Współczynnik korelacji wielorakiej informuje, w
jakim stopniu są skorelowane ze sobą empiryczne i
teoretyczne wartości zmiennej objaśnianej.
Inne miary dopasowania modelu do danych
Badając jego istotność stawiamy hipotezy:
Sprawdzianem tej hipotezy jest statystyka:
Ma ona rozkład Fishera-Snedecora o m
1
= 1 oraz m
2
=
n-2 stopniach swobody.
15
Z tablic testu F dla zadanego poziomu istotności
oraz
dla m
1
i m
2
stopni swobody odczytuje się wartość
krytyczną F*.
Interpretacja:
Jeśli
, to nie ma podstaw do odrzucenia hipotezy
H
0
. Oznacza to, że współczynnik korelacji wielorakiej
jest nieistotnie różny od zera, a dopasowanie modelu
do danych jest zbyt słabe.
Jeśli
, to hipotezę H
0
należy odrzucić na rzecz
hipotezy H
A
. Współczynnik korelacji wielorakiej jest
istotny, a stopień dopasowania modelu do danych jest
dostatecznie wysoki.
16
Interpretacja: φ
2
informuje, jaka część całkowitej
zmienności
zmiennej objaśnianej nie została
wyjaśniona przez model.
Wyrażenie
SSE/SST
nazywane
jest
współczynnikiem zbieżności i oznaczane φ
2
:
Współczynnik zbieżności
W przypadku gdy w modelu nie występuje wyraz
wolny, do mierzenia jakości dopasowania modelu do
danych
należy
wykorzystać
niescentrowany
współczynnik determinacji:
Niescentrowany
współczynnik
determinacji
przyjmuje wartości z przedziału [0, 1].
Niescentrowany współczynnik determinacji.
4
19
Dopasowanie modelu do danych empirycznych
Statystyki regresji w programie Excel
Statystyki regresji
Wielokrotność R
współczynnik korelacji wielorakiej
R kwadrat
współczynnik determinacji
Dopasowany R kwadrat
skorygowany współczynnik determinacji
Błąd standardowy
odchylenie standardowe reszt modelu
Obserwacje
n
Statystyki regresji
Wielokrotność R
0,99499
R kwadrat
0,99
Dopasowany R kwadrat
0,98714
Błąd standardowy
0,02928
Obserwacje
10
Przykład 1
Korzystając z KMNK oszacować zależność wydatków
konsumpcyjnych (y
t
) od dochodów (x
t
).
t
wydatki dochód
1
150
200
2
250
300
3
300
400
4
350
400
5
400
500
6
380
500
7
450
600
8
400
700
Rozwiązanie
szacujemy model:
t
1
200
150
30000
40000
2
300
250
75000
90000
3
400
300
120000
160000
4
400
350
140000
160000
5
500
400
200000
250000
6
500
380
190000
250000
7
600
450
270000
360000
8
700
400
280000
490000
Σ
3600 2680 1305000 1800000
stąd
czyli model ma postać:
Standardowe
błędy
S(a)
i
S(b)
szacunku
parametrów strukturalnych
α i β wyznacza się ze
wzorów:
Standardowe błędy szacunku informują, o ile przeciętnie
wartość zmiennej objaśniającej X odchyla się od wartości
średniej.
Wnioskowanie o parametrach liniowego modelu
ekonometrycznego
Analiza wielkości błędów standardowych ocen
parametrów
Wyznaczenie
standardowych
błędów
szacunku
parametrów a i b ma na celu sprawdzenie, czy stopień
dokładności szacunku wszystkich parametrów jest
wystarczająco wysoki.
Do
interpretacji
wygodnie
jest
posługiwać
się
względnym średnim błędem szacunku:
Zbyt
wielki
względny
średni
błąd
szacunku
(przekraczający 50% wartości szacowanego parametru)
przekreśla
wartość
poznawczą
liczbowej
oceny
parametru.
24
5
Wnioskowanie o parametrach liniowego modelu ekonometrycznego
Przedziały ufności dla parametrów strukturalnych
Estymator a
j
ma rozkład normalny o średniej
α
j
i odchyleniu
standardowym
σ
j
, co można zapisać jako a
j
: N(
α
j
,
σ
j
).
Zatem:
W praktyce zamiast nieznanego
σ
j
stosuje się S(a
j
), czyli:
Aby zbudować przedział ufności dla parametru
α
j
, j = 1, 2, …, k,
przy współczynniku ufności (1-
γ), należy dobrać z tablic rozkładu
t-Studenta taką wartość t
γ, n-(k+1)
, aby spełniona była relacja:
Wnioskowanie o parametrach liniowego modelu ekonometrycznego
Przedziały ufności dla parametrów strukturalnych
Oznacza to, że:
Przedział ufności dla parametru
α
j
ma postać:
Długość przedziału ufności zależy od poziomu istotności
γ, liczby stopni
swobody oraz wielkości standardowych błędów szacunku parametrów.
Przedział ufności jest tym węższy, im wyższa jest wartość poziomu istotności,
większa liczba stopni swobody (a więc bardziej liczna próba) oraz niższa
wartość standardowego błędu szacunku parametru.
Testowanie hipotez dotyczących wartości parametrów
strukturalnych
Badanie istotności zmiennych objaśniających
Test t-Studenta
Badając istotność wpływu zmian wartości j-tej zmiennej
egzogenicznej na zmiany wartości zmiennej endogenicznej można
stosować statystyczny test istotności.
Testujemy hipotezy:
H
0
:
α
j
= 0
H
A
:
α
j
0
Statystyka:
ma rozkład t-Studenta z n - 2 stopniami swobody.
Z tablic rozkładu t-Studenta należy odczytać wartość t* = t
γ,n-2
Badanie istotności zmiennych objaśniających
Test t-Studenta
Interpretacja:
Jeżeli t>t* to hipotezę zerową odrzucamy na korzyść hipotezy
alternatywnej. Oznacza to, że zmienna X
j
ma statystycznie
istotny wpływ na zmienną objaśnianą Y. Prawdopodobieństwo
popełnienia błędu, polegającego na podjęciu błędnej decyzji
weryfikacyjnej wynosi
.
Jeżeli t<t* to nie mamy podstaw do odrzucenia hipotezy zerowej
na korzyść hipotezy alternatywnej. Oznacza to, że zmienna X
j
ma statystycznie nieistotny wpływ na zmienną objaśnianą Y.
Parametr
strukturalny
Ocena
parametru
Standardowy
błąd
szacunku
Wartość
statystyki
t-Studenta
Wartość-p
Dolny kraniec 95%
przedziału ufności
Górny kraniec 95%
przedziału ufności
α
0
a
0
S(a
0
)
t
1
poziom
α
1
a
1
S(a
1
)
t
2
istotności
α
2
a
2
S(a
2
)
t
3
Precyzja oszacowań parametrów strukturalnych
modelu ekonometrycznego w programie Excel
Współczynniki
Błąd
standardowy
t Stat
Wartość-p
Dolne 95%
Górne 95%
Przecięcie
-0,78
0,458444575 -1,701405234 0,132657615
-1,86404916 0,30404916
x
1
0,6
0,226778684 2,645751311
0,0331455
0,063753625 1,13624638
x
2
0,9
0,196396101 4,582575695 0,002535996
0,435597016 1,36440298