2

WYKŁAD 2 22.03.2011

Zastosowanie KMNK wymaga spełnienia następujących założeń (założenia klasyczne):

Składnik losowy -> ξ - > E(ξ) = 0

D2 (ξ) = σ2

Nie występie autokorelacja składnika losowego:

E(ξ i, ξ j) = 0 dla i j

Jest to miara pamięci czynnika losowego, która w czasie zanika.

Jeśli autokorelacja występuje, oznacza to, że realizacje są zależne od siebie; model musi zostać poprawiony.

Kowariancja składnika losowego nie zależy od zmiennych objaśniających – składnik losowy nie jest skorelowany ze zmiennymi objaśniającymi.

Przykład. Jedna zmienna objaśniająca. Regresja jednej zmiennej.

Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu produkcji:

Yt = α1X1t + α0 + ξt

t – produkcja [tys. szt.]

X1t – zatrudnienie [osoby]

Z wykresu można zobaczyć znak zależności dodatnią oraz siłę, która jest tym większa, im bardziej punkty są skupione. Nachylenie wykresu mniej więcej 45 stopni. Jeśli dorysowałoby się linię regresji, powinna ona przebiegać jak najbliżej każdego z tych punktów.

Następnie można rozpisać wykres produkcji w czasie; świat teoretyczny modelu, który generujemy, ma być jak najbardziej podobny do modelu świata rzeczywistego, widocznego na wykresie.

Kolumnowy wektor realizacji zmiennej endogenicznej oraz macierz X realizacji zmiennych objaśniających dane są jako:

35,2 28 1

33,8 24 1

Y = : X = : :

46, 8 32 1

Stosując formułę na wektor ocen parametrów strukturalnych czyli:

a = (X’ X)-1 X’ Y

18 537 597 0,0014 - 0,0417

X’X = (X’ X)-1 =

597 20 - 0,0417 1,2935

Główna przekątna dodatnia – na niej wariancje estymatorów.

26772,3 1,3203

X’ Y = a = Yt = 1,3203 X1t + 3,8483 + u­t

865,2 3,8483

parametr wolny

Trzeba się upewnić czy możemy interpretować model.

Parametr musi mieć taki sam znak, jak współczynnik korelacji Pearsona.

Zagadnienie koincydencji.

Dany jest model:

Yt = 1,3203 X1t + 3,8483 + u­t

oraz współczynnik korelacji liniowej Pearsona miedzy produkcją a zatrudnieniem.

r = 0,9349

Więc zmienna jest koincydentalna.

Jeśli parametr ma inny znak niż współczynnik korelacji Pearsona, oznacza to, że zbieżność jest pozorna.

Zasady koincydencji głosi, że

sgn (rx,y) ≡ sgn (ai)

stąd wynika, że:

sgn (rX1t,Yt) ≡ sgn (a1)

Wzrost zatrudnienia o jeden etat spowoduje przeciętny wzrost wielkości produkcji o 1,32 tys. szt.

a0 = 3,8483 tys. szt. Taką przeciętną wartość przyjmie wielkość produkcji w przypadku gdy zatrudnienie będzie równe zero. Nawet przy braku sensownej interpretacji, podaje się ją i tak.

Weryfikacja modelu.

Wartości teoretyczne modelu dane są następująca formułą:

Yt* = 1,3203 X1t + 3,8483

wartości teoretyczne modelu

Zatem mamy:

Y1* = 1,3203 * 28 + 3,8483 = 40,8174

Y2* = 1,3203 * 24 + 3,8483 = 35,5361

: : : : :

Y20* = 1,3203 * 32 + 3,8483 = 46,0979

Sprawdzamy czy na wykresie wartości teoretyczne i empiryczne są podobne; szczególnie w ostatnim okresie ważne jest, żeby wartości te były możliwie bliskie, a nie rozbieżne (gdy są rozbieżne, w przyszłości model może dawać niedopuszczalną prognozę – niezgodną z rzeczywistością). Należy też przyjrzeć się elastyczności modelu – kiedy model zareagował na zmianę.

Efekt postarzania informacji – kiedy najstarsza informacja ma wpływ na wynik. W niektórych modelach można eliminować ten wpływ (np. przypisując wagi do obserwacji, mniejsze wagi obserwacjom starszym, a większe obserwacjom młodszym). Przeciwdziałamy temu, ponieważ wolimy prognozować na podstawie jak najmłodszych danych.

Reszty modelu.

Reszta modelu dana jest następującą formułą:

ut = yt – yt*

Składniki resztowe powinny być symetryczne ze względu na znak (podobna ilość reszt dodatnich i ujemnych).

stąd

u1 = 35,2 – 40,8174 = - 5,6174

u2 = 33,8 – 35,5361 = - 1,7361

: : : :

u20 = 46,8 – 46,0987 = 0,7013

Jeśli suma jest < 0 można powiedzieć, że w danym punkcie model jest przeszacowany (świat teoretyczny większy od rzeczywistego), jeśli jest > 0 możemy mówić, że w danym punkcie model jest niedoszacowany (świat teoretyczny mniejszy od rzeczywistego). Sytuacja idealna – gdy reszty wynoszą 0.

Miarą, która pokazuje syntetycznie przeciętny poziom błędu i jakie jest je zróżnicowanie jest wariancja resztowa.


$$\sum_{t = 1}^{20}{u_{t} = 0,000}$$

Wykres przebiegu reszt w czasie – widzimy, że reszty są symetryczne w czasie względem osi OX.

Przy podzieleniu wykresu na dwie części wariancje z I i II części wykresu powinny być równe (nie powinny być zmienne w czasie).

Jeżeli wariancje są różne w czasie i różnica między nimi jest statystycznie istotna, mamy do czynienia z heteroskedastycznością składnika losowego. Jest to odejście od założeń KMNK, model trzeba poprawić, nie można stosować KMNK. Niestety, czasem po usunięciu heteroskedastyczności model przestaje być interpretowalny.

Jeśli różnicy nie ma, mamy do czynienia z homoskedastycznym składnikiem losowym.

Własność heteroskedastyczności wykorzystywana jest w analizie ryzyk, analizie finansowych szeregów czasowych.

Drugi odstępstwem od założeń KMNK jest autokorelacja. Gdy realizacje reszt są na przemian, spodziewamy się autokorelacji ujemnej, gdy nie są – autokorelacji dodatniej.

Wariancja (błąd) może być wysoki, byle był stały.

Miary struktury stochastycznej.

Wariancja resztowa i odchylenie standardowe reszt:

n = 20; k = 20

stąd

su2 = 9,9930 [tys. szt.]2

su = 3,1612 [tys. szt.]

Interpretacja ekonometryczna Su: rzeczywiste realizacje zmiennej endogenicznej y­t odchylają się średnio rzecz biorąc in plus bądź in minus o 3,1612 tys. szt. od wartości teoretycznych, wyznaczonych przez model.

Macierz wariancji i kowariancji oraz średnie błędy szacunku:

0,0139 - 0,4163

D2(u) = = su2 * (X’ X)-1

- 0,4163 12,9258 (wyskalowana macierz (X’ X)-1 )

Średnie błędy szacunku:


$$D\left( a_{1} \right) = \sqrt{0,0139} = 0,1181$$


$$D\left( a_{0} \right) = \sqrt{12,9258} = 3,5952$$

Yt = 1,3203 Xt + 3,8483 + ut

(0,1181) (3,5952)

Jest to badanie precyzji oszacowania parametrów modelu.

Jeśli chodzi o parametr zmiennej X1t błąd jest niski; parametr będzie istotnie różny od zera w modelu (i tym samym statystycznie istotny).

Parametr wolny ma błąd istotny, prawdopodobnie będzie statystycznie nieistotny.

Jeśli parametr przy zmiennej X1t jest wysoki i parametr tym samym będzie nieistotny, usuwa się ten regresor (parametr) z modelu (bo nie wpływa istotnie na Y).

Parametr wolny często jest nieistotny.

Badanie istotności parametrów wpływa na interpretację modelu.

Miary dopasowania modelu do danych empirycznych

(badanie jakości modelu)

Współczynniki zbieżności

_

Y = 46,32 [tys. szt.]


$$\sum_{t = 1}^{20}{\left( y_{t} - \overline{Y} \right)^{2} = 1429,008}$$


$$\sum_{t = 1}^{20}{u_{t}^{2} = 179,8743}$$

Suma kwadratów reszt wg KMNK musi być minimalna.

stąd:

φ2 = 12,59 [%]

mówi o poziomie wariancji zmiennej Y (zróżnicowania Y), jaki nie został wyjaśniony przez model

W tym przypadku dość duża część zmian nie została wyjaśniona przez model, ponieważ:

Zatem współczynnik determinacji wynosi:

R2 = 87,4 [%]

87,4 % przeciętnego poziomu zmiennej endogenicznej Y zostało wyjaśnione przez model ekonometryczny.

W modelach klasycznych nie jest to dobry wynik; dobry wynik to 95% i więcej.

Przy zbyt niskim R2 model nie może być wykorzystywany do prognozowania.

Miarę tą charakteryzuje również pewien błąd (wzrasta wraz z liczbą zmiennych objaśniających skorelowanych z y). By tego uniknąć, należy liczyć skorygowany wskaźnik R2.

Współczynnik zmienności losowej wynosi:

V = 7,3 [%]

Vs to poziom wahań przypadkowych zmiennej endogenicznej Y.

Jest to miara uzupełniająca do R2, nie funkcjonuje samodzielnie. Jeśli jest niskie R2, prawdopodobnie Vs będzie wysokie.

Random walk – jeśli mamy proces, który jest błądzeniem przypadkowym, nie jesteśmy w stanie zbudować modelu, nie da się przebiegu tych procesów prognozować.

Regresja wielu zmiennych – dwuczynnikowa funkcja produkcji.

Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu produkcji:

Yt = α1X1t + α2X2t + α0 + ξ

t – produkcja [tys. szt.]

X1t – zatrudnienie [osoby]

X2t – majątek [tys. zł.]

Spodziewamy się, zgodnie z koincydencją, przy obu współczynnikach regresji dodatnich, parametrów dodatnich.

35,2 28 34 1

33,8 24 41 1

Y = : X = : : :

46, 8 32 55 1

x1 x2 ­parametr wolny

Stosując formułę na wektor ocen parametrów strukturalnych, czyli:

a = (X’ X)-1 X’ Y

18 537 36 194 597 0,0100 - 0,0024 - 0,1653

X’X = 74 359 1 125 (X’ X)-1 = 0,0006 0,0339

20 3,0769

26772,3000 1,1085

X’ Y = 52207,3000 a = 0,0581

865,200 6,9042

Stąd model po oszacowaniu przyjmie następującą postać:

Yt = 1,1085 X1t + 0,0581 X2t + 6,9042 + u­t

Wzrost zatrudnienia X1t o 1 osobę spowoduje przeciętny wzrost produkcji Yt o 1,1085 tys. szt. pod warunkiem, że majątek X2t nie ulegnie zmianie.

Wzrost majątku X2t o 1 tys. zł. spowoduje przeciętny wzrost produkcji o Yt o 0,0581 tys. szt. pod warunkiem, że zatrudnienie X1t nie ulegnie zmianie.

a0 = 6,9042 taką średnią wartość przyjmie wielkość produkcji Yt w przypadku gdy zatrudnienie X1t i majątek X2t będą równie 0.

Zagadnienie koincydencji - podwójne, związane z X1t i z X2t. Obie zmienne są koincydentne. Zmienną koincydentną trzeba usunąć z modelu i jeszcze raz oszacować model.

Weryfikacja modelu

Wartości teoretyczne modelu dane są następującą formułą:

Yt* = 1,1085 X1t + 0,0581 X2t + 6,9042

Y1* = 1,1085 * 28 + 0,0581 * 34 + 6,9042 = 39,9165

: : : : :

Y20* = 1,1085 * 32 + 0,0581 * 55 + 6,9042 =


Wyszukiwarka

Podobne podstrony:
2
2
2
2
03 wykaz prac niebezp , których nie należy pow dzieciom do ~2
2
2
uzasadnienie do ustawy budzetowej na 2005r, Pomoce naukowe, studia, Ekonomia2, IV rok Finanse Public
2
2
8524
ros zad dom 2 03 13
Marketing personalny, wyklad 2 03 2012 r
Wykład 2 03 2014
2
(2)
2
2
2
2

więcej podobnych podstron