Materiały do ekonometrii część I
(ekonometryczny model liniowy)
Opracowanie: dr inż. Mirosława Szewczyk
Literatura
W trosce o własne dobro sugeruję NIE KUPOWAĆ, natomiast nie wątpię, iż Student, który będzie chciał poszerzyć swoją wiedzę z ekonometrii, pobiegnie z chęcią do biblioteki lub czytelni karta opisu przedmiotu
Podstawowe pojęcia:
Ekonometria - w szerszym znaczeniu: metody matematyczne i statystyczne stosowane do badania zjawisk ekonomicznych; klasycznie: nauka zajmująca się ustalaniem za pomocą metod ilościowych prawidłowości zachodzących w życiu gospodarczym
Zmienna objaśniana - zjawisko wyjaśniane przez model (zwykle oznaczana Y)
Zmienne objaśniające - zjawiska ekonomiczne, które oddziałują na zmienną objaśnianą (zwykle oznaczane X1, X2, ...)
Cele badań ekonometrycznych:
cel poznawczy - wyjaśnienie mechanizmu kształtowania się zjawisk ekonomicznych, tj. sformułowanie konkretnych zależności wynikających z analiz empirycznych, zmierzających do potwierdzenia lub odrzucenia teoretycznie opisywanych praw i hipotez ekonomicznych
cel predyktywny - przewidywanie dalszego (czasowo) przebiegu zjawisk ekonomicznych (budowa prognoz gospodarczych)
cel decyzyjny - sterowanie przebiegiem zjawisk ekonomicznych (oddziaływanie na wybrane zjawiska w kierunku pożądanym przez decydenta)
cel predyktywno-decyzyjny - projektowanie możliwych scenariuszy rozwoju badanego zjawiska, poprzez symulację zachowań zmiennych i modelu.
Etapy modelowania:
Określenie celu badań
Dobór zmiennych objaśniających do modelu
Wybór postaci analitycznej modelu
Szacowanie parametrów strukturalnych modelu
Weryfikacja modelu
Wykorzystanie modelu do analizy lub/i prognozy
Opisowy model ekonometryczny - równanie lub układ równań, który w sposób przybliżony przedstawia powiązania ilościowe występujące między rozpatrywanymi zjawiskami ekonomicznymi. Opisowy model ekonometryczny przedstawiający zależność zmiennej Y od zmiennych X1, X2, ...Xk można zapisać w ogólnej postaci następująco: Y=f(X1, X2, ... Xk, ε), gdzie ε - tzw. składnik losowy.
Jeżeli zależność zmiennej objaśnianej Y od zmiennych objaśniających X1, X2, ...Xk ma charakter liniowy, to mamy do czynienia z modelem postaci:
Y=α0+ α 1X1+ α 2X2+...+ α kXk+ ε
gdzie α 0, α 1, α 2,..., α k - parametry strukturalne.
Po oszacowaniu parametrów strukturalnych otrzymujemy równanie
gdzie - wartość teoretyczna zmiennej objaśnianej,
a0, a1, ..., ak - oceny parametrów strukturalnych.
Określenie celu badań
Dobór zmiennych objaśniających do modelu
Z formalnego punktu widzenia zmienne objaśniające w liniowym modelu ekonometrycznym powinny się odznaczać następującymi własnościami:
mieć odpowiednio wysoką zmienność
być silnie skorelowane ze zmienną objaśnianą
być słabo skorelowane między sobą
być silnie skorelowane z innymi zmiennymi nie pełniącymi roli zmiennych objaśniających (zmienne objaśniające powinny być dobrymi reprezentantkami zmiennych, które nie weszły do modelu).
Schemat postępowania:
Na podstawie wiedzy merytorycznej sporządza się zestaw tzw. potencjalnych zmiennych objaśniających X1, X2, ...Xk.
Następnie zbiera się dane statystyczne będące realizacjami zmiennej objaśnianej i potencjalnych zmiennych objaśniających. Otrzymuje się w ten sposób wektor y obserwacji zmiennej Y oraz macierz X obserwacji zmiennych X1, X2, ...Xk postaci:
Eliminuje się potencjalne zmienne objaśniające odznaczające się zbyt niskim poziomem zmienności
vi - współczynnik zmienności wyznaczony dla zmiennej objaśniającej Xi, si - odchylenie standardowe wyznaczone dla zmiennej objaśniającej Xi,
- średnia arytmetyczna wyznaczona dla zmiennej objaśniającej zmiennej objaśniającej Xi.
v* - wartość krytyczna współczynnika zmienności (najczęściej przyjmuje się v*=0,05 lub v*=0,1 lub v*=0,15)
Jeżeli vi ≤ v*, to zmienna objaśniająca Xi jest quasi-stała (charakteryzuje się zbyt niską zmiennością) i powinna zostać wyeliminowana z modelu. Jeżeli vi > v*, to zmienna objaśniająca Xi charakteryzuje się odpowiednio wysoką zmiennością i może pozostać w modelu.
Przykład
Dokonaj wyboru spośród kandydatek X1, X2, X3 zmiennych objaśniających charakteryzujących się odpowiednio wysoką zmiennością, jeśli v*=0,15.
Y |
X1 |
X2 |
X3 |
10 |
5 |
6 |
118 |
12 |
6 |
6 |
120 |
8 |
4 |
6 |
116 |
Oblicza się współczynniki korelacji między wszystkimi rozpatrywanymi zmiennymi (R0 - wektor współczynników korelacji, R - macierz współczynników korelacji).
Własności macierzy współczynników korelacji:
1. rii=1
2. rij= rji
Przeprowadza się redukcję zbioru potencjalnych zmiennych objaśniających za pomocą wybranej procedury statystycznej (metoda grafowa, metoda optymalnego doboru predykant).
Metoda grafowa
Idea: spośród kandydatek na zmienne objaśniające należy wybrać takie zmienne, które byłyby silnie skorelowane ze zmienną objaśnianą i słabo skorelowane z innymi zmiennymi objaśniającymi.
Podstawą wyboru są macierz i wektor współczynników korelacji. Na bazie współczynników korelacji zawartych w macierzy współczynników korelacji wyznaczamy wartość krytyczną r* (r*=min max |rij|). Następnie wyznaczamy tzw. macierz przyległości grafu, w której współczynniki korelacji rij spełniające nierówność |rij| ≤ r* zastępowane są liczbą 0, natomiast współczynniki rij spełniające |rij| > r* zastępowane są liczbą 1. Na podstawie macierzy przyległości grafu budowany jest graf, w którym węzłami są kandydatki na zmienne objaśniające, a wiązadłami łączy się węzły wskazane przez współczynniki korelacji równe 1.
Jako zmienne objaśniające do modelu wejdą:
wszystkie zmienne odosobnione,
z każdego podgrafu spójnego dokładnie jedna reprezentantka. Będzie nią kandydatka o największej liczbie wiązadeł, a jeśli jest kilka kandydatek o takiej samej liczbie wiązadeł, to do modelu wejdzie ta z nich (czyli tych o największej liczbie wiązadeł), która jest najsilniej skorelowana ze zmienna objaśnianą.
Przykład
Dokonaj wyboru zmiennych objaśniających do modelu spośród kandydatek X1, X2, X3, X4, X5, jeśli dane są macierz i wektor współczynników korelacji:
Metoda optymalnego doboru predykant
Idea: spośród kandydatek na zmienne objaśniające należy wybrać takie zmienne, które byłyby silnie skorelowane ze zmienną objaśnianą i słabo skorelowane z innymi zmiennymi objaśniającymi.
Podstawą wyboru są macierz i wektor współczynników korelacji. Rozpatruje się wszystkie kombinacje potencjalnych zmiennych objaśniających, których ogólna liczba wynosi K=2m-1.
Dla każdej kombinacji potencjalnych zmiennych objaśniających oblicza się wskaźniki indywidualne i integralne pojemności informacyjnej.
Indywidualne wskaźniki pojemności informacyjnej zmiennych w ramach rozpatrywanej kombinacji są zdefiniowane następująco:
gdzie k - numer kombinacji, j - numer zmiennej w kombinacji.
Integralne wskaźniki pojemności informacyjnej zmiennych w ramach rozpatrywanej kombinacji są zdefiniowane następująco:
Jako zmienne objaśniające wybiera się kandydatki z kombinacji o największej pojemności integralnej.
Przykład
Biuro podróży „Latawica” przeprowadziło badania ankietowe dotyczące współzależności pomiędzy rocznymi wydatkami rodzin na agroturystykę (Y) a przeciętnym dochodem (X1), przeciętną ceną dziennego pobytu w gospodarstwie agroturystycznym (X2) oraz liczbą dzieci w rodzinie (X3).
----------------------------------------------------------------------------------------------------------------
Wybór postaci analitycznej modelu
Metoda oceny wzrokowej rozrzutu punktów polega na przedstawieniu na wykresie korelacyjnym rozrzutu punktów empirycznych i przypisaniu badanej zależności funkcji, której przebieg zmienności jest najbardziej zbliżony do uzyskanej smugi punktów. Warunkiem stosowania tej metody jest występowanie tylko jednej zmiennej objaśniającej.
Metoda aprioryczna polega na doborze postaci analitycznej modelu na podstawie informacji pozastatystycznych, dotyczących związku łączącego zmienną objaśnianą ze zmiennymi objaśniającymi. Źródłami informacji mogą być: teoria ekonomii i ekonomik branżowych, opinie ekspertów, tradycje i doświadczenia badawcze.
Metoda heurystyczna polega na zastosowaniu modeli o różnych postaciach analitycznych i wyborze jednego z nich na podstawie wyróżnionego kryterium dobroci dopasowania modelu do rzeczywistości.
--------------------------------------------------------------------------------------------------------------
Szacowanie parametrów strukturalnych modelu
Najpowszechniej stosowaną w praktyce metodą estymacji parametrów jest klasyczna metoda najmniejszych kwadratów (KMNK). KMNK służy do estymacji parametrów strukturalnych modeli liniowych i sprowadzalnych do liniowych.
Idea KMNK: należy ustalić takie wartości ocen parametrów strukturalnych a0, a1, ..., ak dla których suma kwadratów odchyleń wartości empirycznych zmiennej objaśnianej od wartości teoretycznych jest najmniejsza
Rys. Idea szacowania parametrów prostej regresji.
Źródło: opracowanie własne.
Ogólna postać modelu liniowego: Y=α0+α1X1+α2X2+...+αkXk+ɛ
Model po oszacowaniu:
Reszta modelu:
Założenia KMNK:
Model jest niezmienniczy ze względu na obserwacje. Zakłada się stabilność relacji wystepujących między badanymi zmiennymi.
Model jest liniowy.
Zmienne objaśniające są nielosowe.
Zmienne objaśniające są liniowo niezależne. Żadna ze zmiennych nie może stanowić kombinacji liniowych pozostałych.
Liczba obserwacji n musi być większa od liczby szacowanych parametrów strukturalnych.
Składnik losowy ma rozkład normalny o wartości oczekiwanej zero i stałej skończonej wariancji.
Nie występuje autokorelacja składników losowych, czyli składniki losowe pochodzące z różnych okresów nie są wzajemnie zależne.
Składnik losowy nie jest skorelowany z żadną ze zmiennych objaśniających.
Szacowany model: Y=α0+α1X1+α2X2+...+αkXk+ɛ
a=(XTX)-1XTY wektor ocen parametrów strukturalnych
wariancja odchyleń losowych
(n - liczba obserwacji, m - liczba szacowanych parametrów)
Se odchylenie standardowe reszt; informuje o ile średnio rzecz biorąc zaobserwowane wartości zmiennej objaśnianej odchylają się od wartości wyznaczonych na podstawie oszacowanego modelu
macierz wariancji i kowariancji ocen parametrów strukturalnych
standardowy błąd szacunku parametru strukturalnego αi; informuje o ile średnio rzecz biorąc pomylilibyśmy się szacując wielokrotnie parametr αi na podstawie różnych n-elementowych prób wylosowanych z tej samej populacji
Przykład
|
|
Y |
X1 |
X2 |
|
|
||
|
|
10 |
2 |
1 |
|
|
||
|
|
12 |
1 |
1 |
|
|
||
|
|
13 |
2 |
2 |
|
|
||
|
|
15 |
1 |
3 |
|
|
||
|
|
20 |
4 |
3 |
|
|
||
Model, którego parametry szacujemy ma postać: |
|
|||||||
Y=0+1X1+2X2+ɛ |
|
|
|
|
||||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
10 |
|
|
1 |
2 |
1 |
||
|
12 |
|
|
1 |
1 |
1 |
||
y= |
13 |
|
X= |
1 |
2 |
2 |
||
|
15 |
|
|
1 |
1 |
3 |
||
|
20 |
|
|
1 |
4 |
3 |
||
|
|
|
|
|
|
|
||
|
1 |
1 |
1 |
1 |
1 |
|
||
XT= |
2 |
1 |
2 |
1 |
4 |
|
||
|
1 |
1 |
2 |
3 |
3 |
|
||
|
|
|
|
|
|
|
||
|
5 |
10 |
10 |
|
|
|
||
XTX= |
10 |
26 |
22 |
|
|
|
||
|
10 |
22 |
24 |
|
|
|
||
|
|
|
|
|
|
|
||
|
1,4 |
-0,2 |
-0,4 |
|
|
|
||
(XTX)-1= |
-0,2 |
0,2 |
-0,1 |
|
|
|
||
|
-0,4 |
-0,1 |
0,3 |
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
0,60 |
0,80 |
0,20 |
0,00 |
-0,60 |
|
||
(XTX)-1XT= |
0,10 |
-0,10 |
0,00 |
-0,30 |
0,30 |
|
||
|
-0,30 |
-0,20 |
0,00 |
0,40 |
0,10 |
|
||
|
|
|
|
|
|
|
||
|
|
6,2 |
a0 |
|
|
|
||
|
a=(XTX)-1XTy= |
1,3 |
a1 |
|
|
|
||
|
|
2,6 |
a2 |
|
|
|
||
|
|
|
|
|
|
|
||
Model po oszacowaniu parametrów strukturalnych: |
|
|||||||
|
|
|
|
|
Wektor teoretycznych wartości zmiennej objaśnianej: |
|
|||||
|
|
|
|
|
|
|
|
11,4 |
|
|
|
|
|
|
10,1 |
|
|
|
|
|
y^=Xa= |
14,0 |
|
|
|
|
|
|
15,3 |
|
|
|
|
|
|
19,2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Wektor reszt: |
|
|
|
|
|
|
|
|
|
|
|
|
|
-1,40 |
|
|
|
|
|
|
1,90 |
|
|
|
|
|
e= |
-1,00 |
|
|
|
|
|
|
-0,30 |
|
|
|
|
|
|
0,80 |
|
|
|
|
|
|
|
|
|
|
|
|
eT= |
-1,4 |
1,9 |
-1,0 |
-0,3 |
0,8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
X1 |
X2 |
Y^ |
e |
e2 |
|
10 |
2 |
1 |
11,4 |
-1,40 |
1,96 |
|
12 |
1 |
1 |
10,1 |
1,90 |
3,61 |
|
13 |
2 |
2 |
14 |
-1,00 |
1,00 |
|
15 |
1 |
3 |
15,3 |
-0,30 |
0,09 |
|
20 |
4 |
3 |
19,2 |
0,80 |
0,64 |
|
|
|
|
|
S= |
7,30 |
|
|
|
|
|
|
|
|
|
|
|
|
lub |
eTe= |
7,3 |
Se2= |
3,65 |
|
|
|
|
|
|
|
|
|
|
|
|
Se= |
1,91 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5,11 |
-0,73 |
-1,46 |
|
|
D2(a)= |
Se2(XTX)-1= |
-0,73 |
0,73 |
-0,37 |
|
|
|
|
-1,46 |
-0,365 |
1,095 |
|
|
|
|
|
|
|
|
|
Standardowe błędy szacunku parametrów strukturalnych wynoszą: |
||||||
S(a0)= |
2,26 |
S(a1)= |
0,85 |
S(a2)= |
1,05 |
|
|
|
|
|
|
|
|
Wyniki szacowania modelu można zapisać następująco: |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||
(2,26) (0,85) (1,05) |
|
|
|
|
Interpretacja oceny ai parametru strukturalnego αi (i=1, 2, ..., k) występującego przy zmiennej Xi jest następująca:
ocena parametru strukturalnego ai wskazuje, o ile przeciętnie zmieni się wartość zmiennej objaśnianej Y, jeżeli przy niezmienionych wartościach innych zmiennych objaśniających (ceteris paribus) wartość zmiennej Xi zmieni się o jednostkę,
zasada ceteris paribus znajduje zastosowanie w interpretacji ocen parametrów strukturalnych modeli ekonometrycznych, ponieważ ocena parametru informuje o bezpośrednim efekcie jednostkowej zmiany zmiennej objaśniającej, pod warunkiem że pozostałe zmienne objaśniające są constans.
-------------------------------------------------------------------------------------------------------------
Weryfikacja modelu
Badanie dopasowania modelu do danych empirycznych
Badanie jakości ocen parametrów strukturalnych
Badanie wybranych własności wektora reszt
5a) Badanie dopasowania modelu do danych empirycznych
współczynnik zmienności losowej W
współczynnik determinacji R2
współczynnik zbieżności φ2
Współczynnik zmienności losowej W informuje jaką część (jaki procent) średniej wartości zmiennej objaśnianej modelu stanowi odchylenie standardowe reszt
Współczynnik determinacji R2 informuje jaka część zmienności zmiennej objaśnianej została wyjaśniona przez zmienne objaśniające modelu
Współczynnik zbieżności φ2 informuje jaka część zmienności zmiennej objaśnianej nie została wyjaśniona przez zmienne objaśniające modelu
-----------------------------------
5b) Badanie jakości ocen parametrów strukturalnych
badanie koincydencji
badanie istotności parametrów strukturalnych
badanie dopuszczalności
Ogólna postać modelu liniowego: Y=α0+α1X1+α2X2+...+αkXk+ɛ
Model po oszacowaniu:
Badanie koincydencji
Znak oceny ai powinien informować o kierunku oddziaływania zmiennej objaśniającej Xi na zmienną objaśnianą Y. Jeżeli wraz ze wzrostem wartości zmiennej objaśniającej Xi rosną wartości zmiennej objaśnianej Y, to ocena ai powinna mieć znak „+”.Jeżeli wraz ze wzrostem wartości zmiennej objaśniającej Xi maleją wartości zmiennej objaśnianej Y, to ocena ai powinna mieć znak „-”.
Oznacza to, że powinien być spełniony warunek
sgn ai = sgn r0i dla i=1, 2, ..., k
nazywany własnością koinydencji. Jeśli tak jest to ocena ai jest sensowna ze względu na jej znak (model ma własność koincydencji).
Jeśli natomiast dla pewnego i
sgn ai ≠ sgn r0i
to ocena ai nie jest sensowna ze względu na znak, a model nie posiada własności koincydencji. W takim przypadku zmienną Xi należy wyeliminować z modelu, a następnie oszacować parametry modelu ...
Badanie istotności parametrów strukturalnych
Badanie istotności parametrów strukturalnych α0, α1, α2,..., αk liniowego modelu ekonometrycznego ma na celu sprawdzenie czy zmienne objaśniające istotnie oddziałują na zmienną objaśnianą, czy też nie.
Dla każdego i=1, 2, ..., k weryfikuje się hipotezę zerową H0: αi=0 wobec hipotezy alternatywnej HA: αi≠0. Sprawdzianem tej hipotezy jest statystyka:
gdzie ai - ocena parametru strukturalnego; S(ai) - standardowy błąd szacunku tego parametru.
Z tablic testu t-Studenta dla przyjętego poziomu istotności α (przyjąć α=0,05) oraz dla n-m stopni swobody (n - liczba obserwacji, m - liczba szacowanych parametrów strukturalnych) odczytuje się wartość krytyczną t*(α, n-m).
Jeżeli ti < t*(α, n-m) to nie ma podstaw do odrzucenia hipotezy H0. Parametr strukturalny αi nie różni się istotnie od zera, a zmienna objaśniająca Xi nie wpływa w istotny sposób na zmienną objaśnianą Y. Zmienną Xi należy wyeliminować z modelu.
Natomiast jeżeli ti ≥t*(α, n-m) to hipotezę H0 należy odrzucić na rzecz hipotezy alternatywnej (parametr strukturalny αi różni się w sposób istotny od zera, a zmienna objaśniająca Xi wpływa w istotny sposób na zmienną objaśnianą Y).
Badanie dopuszczalności
Badanie dopuszczalności polega na merytorycznym sprawdzeniu sensowności ocen parametrów strukturalnych modelu.
----------------------------------------------------------
5c) Badanie wybranych własności wektora reszt (symetria, losowość, autokorelacja, normalność, stacjonarność)
Przykład. Wyznaczyć wartości teoretyczne oraz reszty modelu
=6,2 + 1,3X1 + 2,6X2
Y |
X1 |
X2 |
|
ei |
10 |
2 |
1 |
11,4 |
-1,40 |
12 |
1 |
1 |
10,1 |
1,90 |
13 |
2 |
2 |
14,0 |
-1.00 |
15 |
1 |
3 |
15,3 |
-0.30 |
20 |
4 |
3 |
19,2 |
0.80 |
Symetria
Rozkład normalny jest symetryczny, a więc w wektorze reszt prawdopodobieństwo występowania reszt dodatnich i ujemnych jest jednakowe. Weryfikujemy hipotezę zerową:
H0: P(et>0)=P(et<0)
wobec hipotezy alternatywnej
Ha: P(et>0)≠P(et<0).
Statystyką testową jest:
gdzie n - liczba obserwacji, k - liczba reszt dodatnich.
Z tablic testu t-Studenta odczytujemy wartość krytyczną t*(α, n-1), gdzie α - poziom istotności (przyjąć α=0,05), n-1 - liczba stopni swobody.
Jeżeli t< t*(α, n-1), to brak jest podstaw do odrzucenia hipotezy H0, mówiącej o symetrii reszt modelu.
Jeżeli t≥ t*(α, n-1), to hipotezę H0 odrzucamy na rzecz Ha. Reszty modelu nie są symetryczne.
Losowość
Rozważamy ciąg reszt. Rozróżniamy w nim dwa rodzaje elementów: reszty dodatnie i reszty ujemne. Reszty równe zero pomijamy. Jeżeli dane statystyczne stanowią szeregi czasowe, to reszty porządkujemy według numerów okresów obserwacji. Obliczamy liczbę serii k. Serią nazywamy każdy podciąg złożony z elementów o jednakowych znakach. Testujemy hipotezę:
H0: reszty są losowe
wobec hipotezy alternatywnej
Ha: reszty nie są losowe.
Z tablic serii dla na (liczby reszt dodatnich) i nb (liczby reszt ujemnych) oraz dla zadanego poziomu istotności α odczytujemy wartości krytyczne k1*, k2*.
Jeżeli k≤k1* lub k≥k2*, to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. Reszty modelu nie są losowe.
Jeżeli natomiast k1*<k< k2*, to nie ma podstaw do odrzucenia hipotezy o losowości reszt modelu.
Badanie autokorelacji składnika losowego
Autokorelacja oznacza liniową zależność między składnikiem losowym z różnych okresów. Między składnikiem losowym z okresu t oraz z okresu t-τ występuje autokorelacja, gdy istnieją między nimi współczynniki korelacji istotnie różniące się od zera.
H0:
Ha:
Autokorelacja między ρt i ρt-1:
H0:
Ha:
Test Durbina-Watsona (α-poziom istotności, n-liczba obserwacji, k-liczba zmiennych objaśniających modelu)
Z tablic odczytujemy wartości dl, dn
Statystyka testowa:
Gdy d<2 podejrzewamy występowanie autokorelacji dodatniej i Ha:
Gdy d>2 podejrzewamy występowanie autokorelacji ujemnej, d'=4-d i Ha:
Autokorelacja dodatnia |
d≥dn
d≤dl dl<d<dn |
Brak podstaw do odrzucenia H0, między ɛt i ɛt-1 nie występuje autokorelacja H0 odrzucamy na rzecz Ha, między ɛt i ɛt-1 występuje autokorelacja dodatnia Nie można podjąć żadnej decyzji |
Autokorelacja ujemna |
d'≥dn
d'≤dl dl<d'<dn |
Brak podstaw do odrzucenia H0, między ɛt i ɛt-1 nie występuje autokorelacja H0 odrzucamy na rzecz Ha, między ɛt i ɛt-1 występuje autokorelacja ujemna Nie można podjąć żadnej decyzji |
Badanie normalności
Przyjmujemy, że reszty modelu ekonometrycznego są empiryczną realizacją składnika losowego. Testujemy hipotezę
H0: składnik losowy modelu ma rozkład normalny
przy hipotezie alternatywnej
H1: składnik losowy modelu nie ma rozkładu normalnego
Test Hellwiga
Standaryzacja reszt według wzoru:
Zestandaryzowane reszty porzadkuje się wg wartości niemalejących u(1)< u(2)<...< u(n).
Z tablic dystrybuanty rozkładu normalnego odczytuje się wartość dystrybuanty Φ(u(t))=P(u< u(t)).
Wyznacza się tzw. cele, którymi są przedziały liczbowe o rozpiętości 1/n powstałe po podzieleniu odcinka [0, 1] na n równych części.
Wartości dystrybuanty Φ(u(t)) przyporządkowuje się odpowiednim celom i określa się liczbę pustych cel (K).
Z tablic testu zgodności Hellwiga dla danej liczby obserwacji n oraz dla przyjętego poziomu istotności odczytuje się wartość krytyczną K*.
Jeśli K<K*, to nie ma podstaw do odrzucenia H0.
Jeśli K≥K*, to hipotezę o normalności rozkładu składnika losowego odrzucamy na rzecz Ha.
Badanie stacjonarności
Ma na celu sprawdzenie, czy reszty są nieskorelowane z czasem. Jeśli składnik losowy jest nieskorelowany z czasem to jest stacjonarny, czyli wariancja składnika losowego jest stała. Jeśli składnik losowy jest skorelowany z czasem to jest nie stacjonarny, czyli wariancja składnika losowego nie jest stała.
H0:
Ha:
Sprawdzianem jest statystyka
współczynnik korelacji między resztami a czasem
Statystyka ma rozkład t-Studenta o n-2 swobody. Z tablic odczytujemy wartość krytyczną t*(α,n-2), gdzie α-poziom istotności.
< t*(α,n-2) nie ma podstaw do odrzucenia H0, mówiącej o tym, że składnik losowy jest stacjonarny
≥ t*(α,n-2) H0 odrzucamy na korzyść Ha. Składnik losowy nie jest stacjonarny
Przykład - na cały semestr
Za górami, za lasami żył sobie Szewczyk Dratewka. Po powstaniu sieci supermarketów (sprzedających m. in. tanie obuwie) oraz po zabiciu ostatniego złego smoka-ludożercy Szewczyk Dratewka stracił pracę w zawodach wyuczonych (szewstwo, morderstwa na zlecenie). Został tym samym zmuszony do ponownego przekwalifikowania się. Ponieważ żona Szewczyka była właścicielką sklepu mięsnego „Udko” na nowym osiedlu Smok-4, Szewczyk również zajął się sprzedażą mięsa. Państwo Szewczyk żyli szczęśliwie, gdyż jeszcze przed ślubem ustalili, że o wszystkich mało istotnych sprawach decyduje pani Szewczyk, a w kwestiach ważnych - pan Szewczyk. Dotychczas spraw istotnych nie było Ale teraz pojawił się problem. Pani Szewczyk zapragnęła odwiedzić mamusię i tatusia (żyjących za siedmioma lasami i siedmioma górami). Oznacza to wyjazd pani Szewczyk na 3 miesiące. Pan Szewczyk zostaje w domu (nie cierpi teściów). Żona zostawiła mu wytyczne odnośnie wielkości zamówień na wołowinę w maju i czerwcu, ale w lipcu Szewczyk musi sobie poradzić sam. Powinien w związku z tym dokonać analizy dotychczasowej sprzedaży mięsa wołowego w sklepie „Udko”, zbudować ekonometryczny model liniowy (Y - sprzedaż wołowiny w tonach), a następnie wyznaczyć prognozę w oparciu o istniejące dane. Pani Szewczyk powiesiła na drzwiach lodówki kartkę z następującymi punktami:
a) Przy założonej wartości krytycznej współczynnika zmienności v*=0,05 sprawdź, czy potencjalne zmienne objaśniające X1, X2, X3, X4, X5 odznaczają się odpowiednio wysoką zmiennością. Wyeliminuj zmienne quasi-stałe.
b) Wyznacz wektor współczynników korelacji oraz macierz współczynników korelacji .
Stosując metodę grafową dokonaj wyboru zmiennych objaśniających do modelu liniowego.
Oszacuj parametry strukturalne modelu (do budowy modelu wykorzystaj tylko zmienne objaśniające dobrane w punkcie c). Zapisz model po oszacowaniu parametrów strukturalnych z uwzględnieniem standardowych błędów ocen.
Uwagi do weryfikacji modelu: podczas weryfikacji ustosunkujemy się do badanej własności i bez względu na wyniki przejdziemy do badania kolejnej własności naszego modelu (czyli cały czas weryfikujemy model z punktu d)
Podaj interpretacje ocen parametrów strukturalnych. Czy spełniony jest warunek dopuszczalności?
Wyznacz wartości następujących współczynników: zmienności losowej, determinacji, zbieżności; podaj ich interpretacje. Przy założonych wartościach krytycznych W*=0,1 oraz R2*=0,7 oceń dopasowanie modelu do danych empirycznych.
Oceń istotność parametrów strukturalnych,
Czy model ma własność koincydencji?
Wyznacz wektor reszt.
Przeprowadź badanie własności wektora reszt (symetria, losowość, autokorelacja, normalność, stacjonarność).
Jakiej miesięcznej sprzedaży wołowiny należy się spodziewać w lipcu przy cenie wołowiny 22 zieleńce oraz cenie wieprzowiny 12 zieleńców?
Y - sprzedaż wołowiny w sklepie "Udko" w tonach |
|
|
|
||||
X1 - cena 1 kg wołowiny w zieleńcach |
|
|
|
|
|||
X2 - cena 1 kg wieprzowiny w zieleńcach |
|
|
|
|
|||
X3 - cena 1 kg kurczaka w zieleńcach |
|
|
|
|
|||
X4 - cena 1 kg gęsiny w zieleńcach |
|
|
|
|
|
||
X5 - cena 1 kg pstrąga w zieleńcach |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
Lp. |
Miesiące |
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
1 |
cze-11 |
31,2 |
23,4 |
12,0 |
5,9 |
17,2 |
20,1 |
2 |
lip-11 |
30,2 |
23,0 |
12,6 |
5,8 |
17,3 |
20,0 |
3 |
sie-11 |
30,0 |
22,9 |
13,0 |
5,7 |
17,5 |
21,5 |
4 |
wrz-11 |
30,1 |
21,3 |
12,5 |
5,3 |
17,4 |
20,5 |
5 |
paź-11 |
33,0 |
21,6 |
12,0 |
5,4 |
17,3 |
20,5 |
6 |
lis-11 |
32,0 |
21,3 |
11,0 |
5,3 |
17,2 |
20,0 |
7 |
gru-11 |
35,5 |
20,0 |
10,0 |
5,0 |
17,1 |
19,0 |
8 |
sty-12 |
36,1 |
19,9 |
10,0 |
5,0 |
17,0 |
19,0 |
9 |
lut-12 |
33,8 |
20,3 |
10,5 |
5,1 |
17,1 |
19,0 |
10 |
mar-12 |
28,0 |
21,5 |
11,0 |
5,4 |
17,2 |
19,5 |
11 |
kwi-12 |
29,6 |
21,7 |
12,0 |
5,4 |
17,2 |
19,5 |
12 |
maj-12 |
30,3 |
22,0 |
12,5 |
5,5 |
17,3 |
20,5 |
13 |
cze-12 |
31,2 |
22,5 |
12,5 |
5,6 |
17,3 |
21,0 |
14 |
lip-12 |
30,0 |
22,8 |
13,0 |
5,7 |
17,3 |
22,0 |
15 |
sie-12 |
29,0 |
23,4 |
13,5 |
5,9 |
17,3 |
22,0 |
16 |
wrz-12 |
30,1 |
22,5 |
13,0 |
5,6 |
17,3 |
21,5 |
17 |
paź-12 |
33,5 |
22,0 |
13,5 |
5,5 |
17,4 |
21,0 |
18 |
lis-12 |
36,2 |
19,5 |
12,0 |
5,0 |
17,0 |
20,0 |
19 |
gru-12 |
36,8 |
19,0 |
11,0 |
4,8 |
17,0 |
20,0 |
20 |
sty-13 |
37,0 |
19,0 |
11,0 |
5,0 |
16,9 |
20,0 |
21 |
lut-13 |
33,8 |
20,3 |
11,5 |
5,3 |
16,8 |
20,0 |
Zieleniec - jednostka pieniężna w kraju „za górami, za lasami”, w którym żyje Szewczyk Dratewka.
1
Y
X
ŷ= ayx+ by
xi
yi
ŷi