EKONOMETRIA
Pojęcia: model ekonometryczny, dane statystyczne
Model ekonometryczny stanowi równanie lub system równań, które opisują relacje między ekonomicznymi i nieekonomicznymi zmiennymi losowymi. Składa się z równań stochastycznych oraz niestochastycznych, zwanych tożsamościami. Przynajmniej jedno równanie musi mieć charakter stochastyczny.
Model ekon. rozumiany jako równanie przedstawiony jest na ogół w postaci znormalizowanej tzn. po lewej stronie równania występuje zmienna objaśniana (Y) natomiast po prawej stronie występuje funkcja zawierająca zmienne objaśniające (Xk) oraz parametry.
Model ek. w postaci ogólnej przedstawiający zależność między zmienną Y a zmiennymi (Xk) ma postać:
Y=f(X1,X2,…,Xk,ε)
gdzie Y-zm. objaśniana (endogeniczna)
X-zm. objaśniające (egzogeniczne
(k=1,2,…,K); K- liczba zmiennych objaśniających
ε- składnik losowy
Dane statystyczne są materiałem statystycznym zebranym specjalnie do celu badania lub zebranym pierwotnie do innych celów, ale wykorzystywanym w badaniu. Rodzaje danych statystycznych będących podstawą budowy modelu można pogrupować na: dane przekrojowe, szeregi czasowe oraz dane przekrojowo-czasowe.
Etapy budowy modelu ekonometrycznego.
I. Specyfikacja modelu, na którą składają się:
a) określenie celu budowy modelu – ustalenie zmiennej/ zmiennych objaśnianych,
b) dobór zmiennych objaśniających – metoda a priori i a posteriori,
c) dobór postaci analitycznej modelu
Efektem specyfikacji jest hipoteza modelowa, która w dalszych etapach będzie podlegała weryfikacji.
II. Zebranie danych statystycznych do modelu:
a) dane przekrojowe,
b) szeregi czasowe,
c) dane przekrojowo-czasowe
III. Estymacja parametrów modelu
polega na szacowaniu parametrów w oparciu o próbę statystyczną z wykorzystaniem odpowiednich metod. Wyróżnia się:
- MNK
-metodę największej wiarygodności
-metodę momentów.
W wyniku estymacji uzyskujemy model empiryczny.
IV. Weryfikacja oszacowanego modelu
przebiegająca w dwóch płaszczyznach:
-ekonomicznej (polega na badaniu wielkości i znaków αk stojących przy zmiennych Xk)
-statystycznej (polega na obliczaniu odpowiednich wskaźników statystycznych oraz weryfikacji hipotez dotyczących wybranych własności modelu).
V. Praktyczne wykorzystanie modelu – analiza przeszłości, prognozowanie przyszłości, symulacja.
VI. Raport zawierający interpretację modelu oraz wskazówki wynikające z praktycznego wykorzystania modelu dla celów podejmowania decyzji gospodarczych.
Klasyfikacja modeli ekonometrycznych
Rodzaje modeli ze względu na wartości poznania
Modele przyczynowo-skutkowe – pomiędzy zmienną objaśnianą, a zmiennymi objaśniającymi zachodzi związek przyczyna – skutek. Zmienne objaśniające określają poziom kształtowania się zmiennej objaśnianej, która spełnia rolę skutku.
Modele symptomatyczne – zmienne objaśniające są silnie skorelowane ze zmienną objaśnianą, ale na nią bezpośrednio nie oddziaływają np. Y – płace; X- export
Modele autoregresyjne – role zmiennej objaśniającej pełni opóźniona w czasie zmienna objaśniana np. model w postaci liniowej z dwiema zmiennymi objaśniającymi (zmienna objaśniana opóźniona jest odpowiednia o 1 i 2 okresy – Yt-1 ; Yt-2) Y=α0+α1Yt−1+α2Yt−2+εt
Modele tendencji rozwojowej – opisują rozwój zjawiska w czasie, zmienna objaśniającą jest zmienna czasowa t={1,2,3… n}
- modele trendu liniowego
Y=Yt=α0+α1t+ε
- model trendu wykładniczego
Y=α0α1teε
b) Rodzaje ze względu na postać analityczną funkcji
Y = α0+ α1X1+α2X2 + ε
B. Modele nieliniowe
- względem zmiennych objaśniających, ale liniowe względem parametru strukturalnego np.
Y = α0+ α1X1+α2X 12+ ε
- nieliniowe zarówno względem zmiennych objaśniających jak i względem parametrów np.
$$\mathbf{Y}\mathbf{=}\frac{\mathbf{\alpha}_{\mathbf{0}}\mathbf{(}\mathbf{X}\mathbf{-}\mathbf{\alpha}_{\mathbf{2}}\mathbf{)}}{\mathbf{X}\mathbf{+}\mathbf{\alpha}_{\mathbf{2}}}\mathbf{+}\mathbf{\varepsilon}$$
- sprowadzenie do postaci liniowej np. modeli potęgowych z dwiema zmiennymi objaśniającymi
(X1,X2):y=α0X1α1X2α2eε
c) Klasyfikacja modeli ze względu na rodzaje danych statystycznych
A. modele statyczne – modele dla zmiennych losowych ; obserwacje zmiennych dotyczą zbioru obiektów ekonomicznych w ustalonej jednostce czasu (są oparte na danych przekrojowych) np. y1, y2….yn gdzie n jest liczbą obiektów.
B. modele dynamiczne – modele procesów stochastycznych ; obserwacje oparte są w szeregach czasowych (mogą dotyczyć zarówno jednego jak i wielu obiektów ekonomicznych, wówczas są to dane przekrojowo-czasowe) np. y1, y2…yt gdzie t stanowi liczbę okresów.
d) Rodzaje modeli ze względu na linię równań
A. modele jednorównaniowe np. liniowy model jednorównaniowy
Y = α0+ α1X1+α2X2 + ε
B. modele wielorównaniowe np. wielorównaniowy model prosty o dwóch równaniach
Y1=α10 +α11X1+α12X2+ε1
Y2=α20+α23X3+ε2
Założenia KMNK i wyprowadzić wzór na estymator:
Model ma postać liniową (lub sprowadzalny do liniowej)
Zmienne objaśniające są nielosowe i tym samym nie są skorelowane ze składnikiem losowym. Zmienne ekonomiczne są zmiennymi losowymi, zatem konieczne jest przyjęcie założenia, że są one nieskorelowane ze składnikiem losowym czyli E(Xk ε) = 0 (E – wartość oczekiwana, kowariancja)
Pomiędzy żadną z podgrup zbioru zmiennych objaśnianych nie występuje dokładna zależność liniowa czyli r(X)= k+1 (rząd macierzy X jet równy liczbie parametrów strukturalnych modelu)
Wielkość próby jest większa od liczby szacowanych parametrów n> k+1
Wartość oczekiwana składnika losowego jest równa zero tj. E(ε) = 0
Wariancja składnika losowego jest skończona i stała (σε2 < nieskończoność) (wariancja jest jednorodna) natomiast kowariancje są równe zero (nie występuje autokorelacja składnika losowego). Stąd macierz wariancji – kowariancji składnika losowego (tzw. Czystość składnika losowego) ma postać:
$D^{2}\left( \varepsilon \right) = \ E\left( \varepsilon,\varepsilon^{T} \right) = \ \sigma^{2}I = \begin{bmatrix} \sigma_{11}^{2} & 0 & \ldots & 0 \\ 0 & \sigma_{22}^{2} & \ldots & 0 \\ \ldots & \ldots & \ldots & \ldots \\ 0 & 0 & \ldots & \sigma_{\text{NN}}^{2} \\ \end{bmatrix}$ przy czym: dla każdego i $\bigwedge_{}^{}i\sigma_{\text{ii}}^{2}$= σ2
Wzór na estymator
$$\psi = \sum_{i = 1}^{N}e_{i}^{2} = \ \sum_{i = 1}^{N}{\left( y_{i} - y_{i} \right)^{2}\ \Rightarrow}\ \min$$
Wykorzystując zależność$\ \sum_{i = 1}^{X}e_{i}^{2} = e^{T}e\ \rightarrow \min$ funkcja kryterium z zapisem macierzowym ma postać:
ψ = eTe = (y − Xa)T(y − Xa)
Gdzie
e=y-$\hat{y}$
$\hat{y}$=Xa
e=y-Xa
co da się przedstawić jako
ψ(a) = (y − Xa)T(y − Xa)
ψ(a) = yTy − yTXa − aTXTy + aTXTXa
Po dokonaniu odpowiednich przekształceń otrzymuje się ostateczną postać funkcji kryterium φ
ψ(a) = yTy − 2aTXTy + aTXTXa
Znajdowanie minimum powyższego kryterium
Funkcja posiada minimum w punkcie jeśli spełnione są dwa warunki :
Warunek I
Pochodna cząstkowa funkcji φ względem wektora ocen parametrów a równa jest zero:
$\frac{\partial\psi(a)}{\partial a} =$0
Warunek II
Druga pochodna cząstkowa funkcji φ (macierz Hessa) względem wektora parametrów a jest macierzą dodatnio określoną, czyli:
$$\frac{\partial^{2}\psi(a)}{\partial a^{2}} > 0$$
Rozwinięcie warunku I
Pochodna cząstkowa funkcji φ względem wektora ocen parametrów a dana jest wzorem:
$$\frac{\partial\varphi\psi(a)}{\partial a} = - 2X^{T}y + 2X^{T}\text{Xa}$$
Przyrównując wartość pochodnej funkcji φ do zera otrzymuje się:
$$\frac{\partial\psi(a)}{\partial a} = 0$$
XTXa − XTy = 0
(XTX)−1/XTXa = XTy
a = (XTX)−1XTy
Otrzymany wektor a jest wektorem ocen parametrów strukturalnych postaci:
$$a = \begin{bmatrix}
a_{0} \\
\begin{matrix}
a_{1} \\
\begin{matrix}
\vdots \\
a_{K} \\
\end{matrix} \\
\end{matrix} \\
\end{bmatrix}$$
(K+1)
Gdzie:
a0,a1,…,aK – oceny nieznanych parametrów strukturalnych będące rozwiązaniem KMNK
Rozwinięcie warunku II
Druga pochodna cząstkowa funkcji φ względem wektora a dana jest wzorem:
$\frac{\partial^{2}\psi(a)}{\partial a^{2}} = 2X^{T}X$ (dodatnio określona)
Przyrównując wartość drugiej pochodnej funkcji φ zgodnie z warunkiem na istnienie minimum funkcji, otrzymuje się:
2XTX > 0
$$\frac{\partial^{2}\psi(a)}{\partial a^{2}} > 0$$
Rozwiązania funkcji kryterium φ są elementami wektora ocen parametrów strukturalnych a, danego wzorem:
a = (XTX)-1Xy, przy założeniu, że det(XTX)-1 0
Autokorelacja - TEST DW
Autokorelacja jest to zależność wartości bieżących obserwowanych w czasie t od wartości wcześniejszych obserwowanych w czasie t-1 (autokorelacja I rzędu)
Występowanie autokorelacji nie bada się w przypadku danych przekrojowych
Jeżeli składnik losowy ηt (eta) zawiera autokorelację I rzędu to zależność taką zapisujemy w postaci:
ηt= ρt ηt-1+ εt
gdzie:
ηt – (eta) składnik losowy zawierający autokorelacje
εt – składnik losowy nie zawierający autokorelacji
ρt - (ro) współczynnik autokorelacji I rzędu
Hipotezę zerowa i alternatywną badania autokorelacji zapisuje się odpowiednio w postaci:
H0: ρ1 =0 (brak autokorelacji I rzędu dla składnika losowego – dobrze dla modelu)
H1 : ρ1≠0 (występuje autokorelacja I rzędu składnika losowego)
(ρt > 0 autokorelacja I rzędu dodatnia; ρt < 0 autokorelacja I rzędu ujemna)
Weryfikację powyższych hipotez przeprowadza się w oparciu o statystykę Durbina Watsona daną wzorem:
$$\mathbf{\text{DW}}\mathbf{=}\frac{\sum_{\mathbf{t}\mathbf{= 2}}^{\mathbf{t}}{\mathbf{(}\mathbf{e}_{\mathbf{t}}\mathbf{-}\mathbf{\ }\mathbf{e}_{\mathbf{t}\mathbf{-}\mathbf{1}}\mathbf{)}}^{\mathbf{2}}}{\sum_{\mathbf{t}\mathbf{= 1}}^{\mathbf{t}}\mathbf{e}_{\mathbf{t}}^{\mathbf{2}}}\mathbf{\ }$$
Gdzie:
et = reszty z modelu z okresu t; et-1 = reszty z modelu z okresu t-1
Wartość statystyki DW zawiera się w zbiorze [0;4].
Jeżeli DW ε [0;2) to zakłada się występowanie autokorelacji dodatniej i hipoteza alternatywna ma postać H1: ρt > 0
DW ε [0;2) – autokorelacja dodatnia ρt > 0
DW = 2 – brak autokorelacji
DW ε (2;4] – autokorelacja ujemna ρt < 0
Jeżeli DW ∈ (2;4], to zakłada się występowanie autokorelacji ujemnej i hipoteza alternatywna ma postać:
H1 : ρt < 0
Jeżeli DW=2, to stwierdza się brak autokorelacji I rzędu składnika losowego.
Jeżeli DW, DW* ≥ DU , wówczas nie mamy podstaw do odrzucenia hipotezy zerowej, stwierdza się brak autokorelacji I rzędu składnika losowego.
Jeżeli DL<DW, DW*<DU stwierdza się obszar niekonkluzywności, test nie daje odpowiedzi i trzeba zastosować testy alternatywne do rozstrzygnięcia hipotez.
Jeżeli DW, DW*≤DL, wówczas odrzuca się hipotezę zerową na rzecz hipotezy alternatywnej mówiącej o występowaniu autokorelacji I rzędu składnika losowego.
Występowanie autokorelacji jest błędem specyfikacji modelu i jest zjawiskiem niepożądanym.
Przyczyna występowania autokorelacji dodatniej:
-uwzględnienie zbyt małej liczby zmiennych objaśniających modelu
Przyczyna występowania autokorelacji ujemnej:
-uwzględnienie zbyt dużej liczby zmiennych objaśniających modelu
Autokorelację może też powodować błędna postać analityczna modelu lub niewłaściwa transformacja zmiennych objaśniających.
W modelu w którym występuje autokorelacja I rzędu składnika losowego nie są spełnione wszystkie założenia KMNK, dlatego też nie można zastosować tej metody do szacowania parametrów.
6. Czemu w równaniach łącznie współzależnych nie można stosować KMNK
W modelu o równaniach łącznie współzależnych żadne z równań nie spełnia warunku o nieskorelowaniu zmiennych objaśniających ze składnikiem losowym dlatego poszczególnych równań nie można oszacować klasyczna MNK. Model o równaniach łącznie współzależnych można oszacować pod warunkiem, że wszystkie równania modelu są identyfikowalne.
nie da się stosować KMNK dlatego stosujemy PMNK (pośrednią MNK) lub 2MNK (podwójną MNK)
Metoda a priori i a posteriori
Metoda a priori polega na tym, że do modelu wchodzą zm. objaśniające XK będące bezpośrednimi przyczynami zmiennej objaśnianej Y lub wobec braku możliwości określenia przyczyn, zmienne XK najsilniej skorelowane ze zmienną Y. Jednocześnie zmienne XK powinny być skorelowane ze sobą w jak najmniejszym stopniu. Metoda a priori - dobór zmiennych objaśniających XK przed estymacją modelu.
Metoda a posteriori – zmienne objaśniające, które w nieistotny sposób wpływają na zmienną objaśnianą należy usunąć z modelu. Metoda eliminacji zmiennych nieistotnych po oszacowaniu modelu nazywa się metodą eliminacji a posteriori. Metoda a posteriori – dobór zmiennych objaśniających XK po estymacji modelu.
8. Jak rozwiązać zadania sprowadzając model potęgowy do postaci liniowej?
1. obustronne logarytmowanie równania:
Y = α0X1α1X2α2…XKαK eε / ln
Otrzymujemy: lnY = ln (α0X1α1X2α2…XKαK eε)
2. korzystamy z własności logarytmów
ln(ab) = lna + lnb
ln ab = b lna
lnY = ln α0 + lnX1α1 + lnX2α2…lnXKαK + lneε
3. z własności:
ln ab = b lna;
lne = 1
lnY = ln α0 + α1 lnX1 + α2 lnX2+…+αK lnXK + ε postać liniowa modelu potęgowego
4. dla przejrzystości zapisu:
lnY = Y*, lnX1=X1*,…, lnXK=XK*, ln α0 = α0* Y* = α0* + α1X1*+ α2X2*+…+ αKXK + ε
Model logarytmiczny: Y = α0 + α1 lnX1+…+ αK lnXK + ε
Sprowadzenie do postaci liniowej podstawienie w miejsce logarytmów zmiennych postaci: X1* = lnX1,…, XK* = lnXK
Mamy więc: Y = α0 + α1X1*+…+αKXK* + ε
Cobb-Douglas: wzór funkcji produkcji (w postaci potęgowej): Y = α0 Lα1Kα2eε
logarytmowanie do postaci liniowej: Y* = α0* + α1L*+ α2K* + ε ostateczny model: y*= x•Lα1K α2•eε
interpretacje dla α1 i α2: Jeśli zatrudnienie [nakłady] wzrośnie średnio o 1% to wielkość produkcji wzrośnie/spadnie o α1 [α2] przy pozostałych czynnikach niezmienionych.
korzyści/niekorzyści skali: α1 + α2 > 1 korzyści skali; α1 + α2 < 1 niekorzyści skali; α1 + α2 = 1 brak efektów skali
interpretacja: Jeśli zatrudnienie i nakłady wrosną o 1% to produkcja wzrośnie/spadnie średnio o (sumę α1 i
9. interpretacja (I-B) i (I-B)^-1
(*) Macierz (I-B) nazywana jest macierzą struktury techniczno finansowej (lub macierzą Leontieffa w ujęciu finansowym). Jej elementy interpretujemy następująco: o ile wzrośnie produkcja finalna w dziale „i” jeżeli produkcja globalna w dziale „j” wzrośnie o 1 zł.
(**) Macierz (I-B)-1 nazywana jest macierzą współczynników materiałochłonności (lub dodatkowego zapotrzebowania) w ujęciu finansowym. Jej elementy interpretujemy następująco: o ile zł należy zwiększyć produkcję globalną w dziale „i” aby produkcja finalna (końcowa) w dziale „j” wzrosła o 1 zł.
10. wypisać założenia predykcji
Założenia predykcji dokonywanej na modelu ekonometrycznym
Dysponujemy modelem ekonometrycznym (oszacowane parametry stochastyczne, określone dopasowanie modelu)
Struktura opisywanych przez model zjawisk jest stabilna w czasie:
Nie zmienia się postać analityczna modelu w okresie próby
Nie zmieniają się parametry strukturalne modelu
Znane są wartości zmiennych objaśniających w okresie prognozowanym (Xt)
- w okresie próby
$$Y_{t} = \sum_{k = 1}^{K}{a_{k}X_{\text{kt}} + \varepsilon_{t}}$$
- w okresie prognozowanym:
$$Y_{T} = \sum_{k = 1}^{K}{a_{k}X_{\text{kT}} + \varepsilon_{T}}$$
Planuje się, że zmienne objaśniane osiągną dany poziom (prognozowane Xt na podstawie modelu trendu /sezonowości/)
Rozkład składnika losowego jest stabilny w czasie
Jeżeli rozkład składnika losowego nie spełnia tego założenia, a zmiany są regularne i niewielkie wówczas można jest opisać, natomiast gdy są nieregularne i duże, nie można ich opisać E(ε) = 0 E(ε,ε′) = δ2I
Dopuszczalna jest ekstrapolacja modelu poza obserwowany w próbie obszar zmienności zmiennych objaśniających. Nie są planowane żadne zmiany prawne organizacyjne itp. W przewidzianym horyzoncie czasu.
12. Przykład modelu 2-równaniowego zmiennych łącznie współzależnych.
Y1t= α10+β12Y2t+ α11X1t+ ε1t
Y2t= α20+β21Y1t+α22X2t+ε2t
13. napisać wzór na wariancje predykcji i wytłumaczyć oznaczenia
wariancji predykcji:
V2T = (1+XT(XTX)-1XTT) * S(e)2
XT,XTT - wektor zmiennych objaśniających w okresie prognozowanym
14. do czego się stosuje zmienne zero-jedynkowe
wykorzystujemy ją w celu opisania cech binarnych, np.
upadłość podmiotu gospodarczego (upadek/dalsza działalność),
miejsce zamieszkania (miasto/wieś),
finansowanie działalności (kapitał własny/obcy),
decyzja zgromadzenia akcjonariuszy o wypłaceniu dywidendy (tak/nie)
Model logitowy (1-spełania warunek,0- nie spełnia warunku), model sezonowości i trendu
Model logitowy – transformacja logitowa polega na zamianie prawdopodobieństwa z przedziału <0,1> na przedział (-∞;+∞)
15. Badanie istotności parametrów (testy)
Istotność parametrów strukturalnych
Dany jest model z K zmiennymi objaśniającymi
Yt= a0 + a1x1t + a2x2t + … + akxkt + et
S(a0) S(a1) S(a2) S(ak)
Badanie istotności parametrów strukturalnych za pomocą testu t-Studenta.
Statystyka t posiada przy założeniu prawdziwości H0, rozkład t-Studenta
H0 : a1 = 0
H1: a2 ≠ 0
$t_{k} = \ \frac{a_{k}}{{S(a}_{k})}$ Jeżeli wartość t znajduje się w obszarze krytycznym (przekracza 2) => odrzucamy Ho na rzecz H1
ak- ocena parametru ak
S(ak) - średni błąd parametru ak
Wartość krytyczną testu ta N − (K + 1) odczytuje się z tablic rozkładu przy ustalonym poziomie istotności α oraz N-(k+1) liczbie stopni swobody.
Odczytuje wartości prawdopodobieństwa empirycznego.
Wartość statystyki z próby tak wyznacza się na podstawie wzoru
Jeżeli |tak|>2 -> odrzucamy H0 na rzecz H1
Porównanie poziomu istotności α z wartością p
Wartość p to prawdopodobieństwo empiryczne przy którym odrzucilibyśmy hipotezę zerową:
Poziom istotności α = 0, 05; 0, 01; 0, 1
Poziom α 0,05 ≥ wartość p 0,0004 ->odrzucamy H0 na rzecz H1
Poziom α 0,05 , wartość p 0,22 -> nie ma podstaw do odrzucenia hipotezy zerowej
Badanie istotności parametrów strukturalnych za pomocą testu F
Badanie istotności parametrów strukturalnych testem F
Badanie istotności parametrów strukturalnych testem F polega na badaniu istotności wszystkich parametrów strukturalnych łącznie. W badaniu pomija się wyraz wolny
H0: a1=…=ak=0 (parametry strukturalne nieistotne różnią się od zera tj. wszystkie zmienne objaśniające X nieistotnie wpływają na zmienną objaśnianą Y)
H1: a1=0 v … v ak =0 (co najmniej jeden parametr strukturalny istotnie różni się od zera tj. co najmniej jedna zmienna objaśniająca X istotnie wpływa na zmienną objaśnianą Y)
Weryfikacja powyższych hipotez przebiega w oparciu o statystykę F Fishera Snedecora. Wartość krytyczna testu Fa1,r1,r2 odczytywana z tablic rozkładu przy ustalonym poziomie istotności α oraz r1= K ; r2 = N – K – 1 stopniach swobody.
Wartości statystyki F. z próby wyznacza się ze wzoru
$$F = \frac{R^{2}}{1 - R}\ \frac{N - K - 1}{K}$$
Gdzie:
N - liczebność próby
K – liczba zmiennych objaśniających Xk
R2 –współczynnik determinacji
|r|-> max p -> max
[ pojedynczo; badamy model, badanie istotności ponownie]
(( patrzeć czy p<0,05 – usunąć wszystkie które są większe))
16. omówić model logitowy
Funkcja logitowa / logit - funkcja stosowana w statystyce (metoda regresji logistycznej) do przekształcania prawdopodobieństwa na logarytm ilorazu szans:
17. interpretacja, ocena modelu, R^2 i DW
Mierniki jakości modelu
Współczynnik determinacji R2 oraz współczynnik zbieżności φ2 oblicza się z tzw. równości wariancyjnej.
Równość wariancyjna wyraża całkowitą zmienność zmiennej objaśnianej, podzieloną na: zmienność wynikającą z oszacowania modelu ekonometrycznego S2(ŷ) oraz zmienność resztową S2(et)
Równość wariancyjną zapisać można wzorem:
S2(yi) = S2(ŷi) +S2(et)
$$1 = \frac{S^{2}(\hat{y_{i}})}{S^{2}(y_{i})} + \frac{S^{2}(e_{t})}{S^{2}(y_{t})}$$
Stąd:
1 = R2+ φ2
$$R^{2} = \frac{S^{2}(\hat{y_{i}})}{S^{2}(y_{i})}$$
$$\varphi 2 = \frac{S^{2}(e_{t})}{S^{2}(y_{t})}$$
φ2= 1- R
R2; φ2 Є [0,1]
R2 powinno dążyć do 1
φ2 powinno dążyć do 0
Y = α0 + α1X1i + α2X2i + … + +αKXKi + ε
| | |
yi $\hat{y_{i}}\ $ ei
Współczynnik determinacji R2 wyraża udział zmienności części teoretycznej modelu ($\hat{y_{t}} - \overset{\overline{}}{y})$ w całkowitej zmienności objaśnianej.
Współczynnik R2 jest miarą jakości dopasowania modelu do danych empirycznych. Im bliższa jedności wartość współczynnika R2 (R2 → 1) , tym w większym stopniu model jest dopasowany do danych α z próby i tym większe jest wyjaśnienie zmiennych Y przez zmienne objaśniające Xk.
$$R^{2} = \frac{\sum_{i = 1}^{N}{\hat{{(y}_{i}} - \overset{\overline{}}{y})^{2}}}{\sum_{i = 1}^{N}{{(y}_{i} - \overset{\overline{}}{y})^{2}}}$$
18. Błąd predykcji ex ante – wzór i interpretacja.
Średni błąd predykcji:
$V_{T} = \ \sqrt{V_{T}^{2}}$
(informuje o ile średnio w długim ciągu prognoz rzeczywiste realizacje zmiennej prognozowanej będą różnić się od wartości wyliczonych prognoz)
19. Postać modelu programowania liniowego i wyjaśnić oznaczenia.
Standardowe zadanie programowania liniowego
Rozważmy proces, w którym zmiennymi są x1,x2,…,xn
Proces poddany jest m ograniczeniom, zapisanym w postaci:
a11x1 + a12x2 + … + a1nxn = b1
a21x1 + a22x2 + … + a2nxn = b2
…
am1x1 + am2x2 + … + amnxn = bn
aij ; bi – różne współczynniki m<n
bi – ograniczenia
Dopuszczamy jedynie nieujemne wartości xj czyli
Xj ≥ 0 j= 1,2,…,n
Zakładamy również, że
bi ≥ 0 i=1,2,…, m
Z procesem związana jest funkcja Z
Z= c1x1+c2x2+…+cnxn
cj – j=1,2,3…,n – znane współczynniki
cj – współczynniki jednostkowego zysku/kosztu
Zagadnienie polega na maksymalizacji (minimalizacji) funkcji Z spełniających ograniczenia (1),(2), (3)
Zapis:
(funkcja celu) $\text{FC}\ :Z = \sum_{j = 1}^{n}{c_{j}x_{j}}\text{\ \ \ \ } \rightarrow \max$
(ograniczenia) $O:\ \left\{ \begin{matrix} \sum_{j = 1}^{m}{a_{\text{ij}}x_{j} = b_{i}} \\ x_{j} \geq 0 \\ b_{i} \geq 0 \\ \end{matrix} \right.\ \ j\left( i \right) = 1,2,\ldots.,\ n(m)$
Zapis w postaci macierzowej
FC: Z=cTx -> max
O:$\ \left\{ \begin{matrix} \text{Ax} = b \\ x \geq 0 \\ b \geq 0 \\ \end{matrix} \right.\ $
c – wektor współczynników funkcji celu
x- wektor zmiennych decyzyjnych
A – macierz technologicznych współczynników
B – wektor ograniczeń
$$A:\ \begin{bmatrix}
a_{11} & a_{12} & \ldots & a_{1n} \\
a_{21} & a_{22} & \ldots & a_{2n} \\
\ldots & \ldots & \ldots & \ldots \\
a_{m1} & a_{m2} & \ldots & a_{\text{mn}} \\
\end{bmatrix}\text{\ \ \ \ \ }c = \begin{bmatrix}
c_{1} \\
c_{2} \\
\ldots \\
c_{n} \\
\end{bmatrix}\text{\ \ \ \ \ }x = \begin{bmatrix}
x_{1} \\
x_{2} \\
\ldots \\
x_{n} \\
\end{bmatrix}\text{\ \ \ \ \ }b = \begin{bmatrix}
b_{1} \\
b_{2} \\
\ldots \\
b_{n} \\
\end{bmatrix}$$
Bardzo powszechna w zagadnieniach praktycznych odmianą ograniczeń są ograniczenia w postaci nierówności. To też są zagadnieniem programowania liniowego ale nie w postaci standardowej.
20. Na czym polega badanie jednorodności wariancji składnika losowego w modelu ekonometrycznym ? Przedstawić odpowiedni test. Jakie są konsekwencje niejednorodności wariancji?
Jednorodność wariancji składnika losowego
$$E(\varepsilon,\varepsilon^{T}) = \begin{bmatrix}
\delta_{11}^{2} & \begin{matrix}
0 & \ldots \\
\end{matrix} & 0 \\
\begin{matrix}
\begin{matrix}
0 \\
\vdots \\
\end{matrix} \\
0 \\
\end{matrix} & \begin{matrix}
\begin{matrix}
\begin{matrix}
\delta_{22}^{2} & \ldots \\
\end{matrix} \\
\begin{matrix}
\vdots & \ddots \\
\end{matrix} \\
\end{matrix} \\
\begin{matrix}
0 & \ldots \\
\end{matrix} \\
\end{matrix} & \begin{matrix}
\begin{matrix}
0 \\
\vdots \\
\end{matrix} \\
\delta_{\text{NN}}^{2} \\
\end{matrix} \\
\end{bmatrix}$$
Ta wariancja jest jednorodna δ112 = δ222 = δii2 = δ2
Małe firmy
Duże firmy
$\begin{bmatrix} \begin{matrix} 0,3 \\ \begin{matrix} 0,41 \\ 0,5 \\ \end{matrix} \\ \begin{matrix} \begin{matrix} 3,8 \\ 2,9 \\ \end{matrix} \\ 11,4 \\ \end{matrix} \\ \end{matrix} & \begin{matrix} \begin{matrix} e_{1} \\ e_{2} \\ e_{3} \\ \end{matrix} \\ e_{4} \\ \begin{matrix} e_{5} \\ e_{6} \\ \end{matrix} \\ \end{matrix} \\ \end{bmatrix}$ y-$\hat{y_{i}}$=ei
Jednorodność wariancji, podobnie jak założenie o braku autokorelacji, wynika z budowy macierzy wariancji – kowariancji, składnika losowego (wymaganej w KMNK) postaci
$$E\left( \varepsilon,\varepsilon^{T} \right) = \begin{bmatrix}
\delta_{11}^{2} & \begin{matrix}
0 & \ldots \\
\end{matrix} & 0 \\
\begin{matrix}
\begin{matrix}
0 \\
\vdots \\
\end{matrix} \\
0 \\
\end{matrix} & \begin{matrix}
\begin{matrix}
\begin{matrix}
\delta_{22}^{2} & \ldots \\
\end{matrix} \\
\begin{matrix}
\vdots & \ddots \\
\end{matrix} \\
\end{matrix} \\
\begin{matrix}
0 & \ldots \\
\end{matrix} \\
\end{matrix} & \begin{matrix}
\begin{matrix}
0 \\
\vdots \\
\end{matrix} \\
\delta_{\text{NN}}^{2} \\
\end{matrix} \\
\end{bmatrix}$$
Przy czym $\bigwedge_{i}^{}\delta_{\text{ii}}^{2} = \delta^{2}$
Elementy na głównej przekątnej stanowią wariancję składnika losowego δii2 (i=1,2,…,N)
Z założenia KMNK wynika, że wariancja składnika losowego jest stała, tzn.: elementy na głównej przekątnej są sobie równe δ112 = δ222 = …=δNN2. Jeżeli założenie to nie jest spełnione, estymator KMNK nie posiada własności efektywności (tzn.: wariancja nie jest najmniejsza z możliwych i np.: w teście t –Studenta wychodzi, że zmienna jest nieistotna, a tak naprawdę jest istotna).
yi = α0 + α1X1 + ei
S(α0)
$$t = \frac{\alpha_{1}}{S(\alpha_{1})\ }$$
Weryfikacja jednorodności wariancji składnika losowego przebiega w oparciu o hipotezy postaci:
Hipoteza jednorodności H0:
H0 : δ12 = δ22
H1 : δ12 ≠ δ22
Gdzie:
δ12, δ22 - wariancje składnika losowego odpowiednio z pierwszej i drugiej podpróby (standardowo dzieli się próbę na dwie równe części)
Statystyka F z próby (do licznika wpisujemy większą)
$$F = \frac{S_{e_{1}}^{2}}{S_{e_{2}}^{2}}$$
Gdzie:
Se12, Se22 − estymatory wariancji resztowych odpowiednie dla pierwszej i drugiej podproby
Statystyka F wymaga, aby w liczniku znalazła się większa wartość estymatora wariancji resztowej.
Statystykę F porównuje się z wartością krytyczną testu Fα, r1, r2 pochodzącą z tablic rozkładu testu F – Shedecora przy danym poziomie istotności α oraz przy r1, r2 stopniach swobody gdzie
r1 = n1 − (K + 1), n1 - liczebność pierwszej podpróby
r2 = n2 − (K + 1), n2 - liczebność drugiej podpróby
W przypadku niejednorodności wariancji składnika losowego (heteroskedostyczności składnika losowego [homoskedostyczność składnika losowego – jednorodność składnika losowego]) nie można zastosować klasycznej metody najmniejszych kwadratów do oszacowania parametrów modelu. Należy posłużyć się uogólnioną metodą najmniejszych kwadratów.
21.Opisz miary dokładności prognozy ex post.
Mierniki błędu ex post
Błąd prognozy stanowi różnice między realizacją zmiennej prognozowanej a prognozą, co zapisuje się w postaci zależności:
δT = yT - yTP
Średni błąd prognozy:
Wariancja błędu:
$$\delta_{T}^{2} = \frac{1}{n}\sum_{T = N + 1}^{N + h}{(y_{T} - y_{\text{TP}})}$$
Gdzie h – horyzont prognozy
Średni błąd w całym okresie prognozowanym
$$\delta_{T} = \sqrt{\delta_{T}^{2}}$$
Względny błąd prognozy
$$\delta_{T}^{*} = \frac{\delta_{T}}{y_{T}}*100\%$$
Jeżeli T* ≤ G* to prognoza jest trafna. Natomiast jeśli δT* > G* wówczas prognoza nie jest trafna.
Granicę błędu G* przyjmuje się zazwyczaj 5% lub 10%
Weryfikacja statystyczna modelu ekonometrycznego przebiegać może według następujących etapów:
1. Badanie istotności parametrów strukturalnych α1:
a) Test t-Studenta
b)Test F
2. Badanie dopasowania modelu do danych empirycznych
a) Współczynnik zbieżności i współczynnik determinacji
b) Współczynnik zbieżności losowej
3. Weryfikacja właściwości struktury stochastycznej
a) Losowości składnika losowego
b) Normalności rozkładu składnika losowego (Test Jarqe-Bera)
c) Autokorelacja składnika losowego
d) Jednorodność wariancji składnika losowego
4. Inne użyteczne testy
a) Badanie liniowości postaci funkcji
b) Badanie stabilności parametrów strukturalnych modelu
23. metoda estymacji modelu rekurencyjnego
Wyróżnia się następujące metody estymacji:
- metoda najmniejszych kwadratów
- metoda największej wiarygodności
- metoda momentów
24. wymienić i napisać wzór na współczynnik determinacji, zbieżności i zmienności losowej
Współczynnik determinacji R2 wyraża udział zmienności części teoretycznej modelu ($\hat{y_{t}} - \overset{\overline{}}{y})$ w całkowitej zmienności objaśnianej.
Współczynnik R2 jest miarą jakości dopasowania modelu do danych empirycznych. Im bliższa jedności wartość współczynnika R2 (R2 → 1) , tym w większym stopniu model jest dopasowany do danych α z próby i tym większe jest wyjaśnienie zmiennych Y przez zmienne objaśniające Xk.
$$R^{2} = \frac{\sum_{i = 1}^{N}{\hat{{(y}_{i}} - \overset{\overline{}}{y})^{2}}}{\sum_{i = 1}^{N}{{(y}_{i} - \overset{\overline{}}{y})^{2}}}$$
Współczynnik zbieżności φ2 , który wyraża udział odchyleń wartości oszacowanych od wartości obserwowanych ${(y}_{i} - \hat{y})\ $, w całkowitej zmienności zmiennej objaśnianej. Współczynnik φ2 wskazuje w jakim stopniu kształtowanie się zmiennej objaśnianej Y nie zostało wyjaśnione przez model. Dlatego też pożądane są wartości φ2 bliskie zera (φ2->0).
Współczynnik zmienności losowej
$$\text{Ve} = \frac{\text{Se}}{\overset{\overline{}}{y}}*100$$
*powinien być < 20% (koszty w przedsiębiorstwie, inflacja, oszczędności)
*180% gdy ryzyko jest duże (w finansach)
Macierz wariancji – kowariancji D²(a) po wyliczeniu:
$$D^{2}\left( a \right) = \begin{bmatrix}
\begin{matrix}
\text{var}(a_{0}) & \text{cov}(a_{1},a_{0}) & \begin{matrix}
\cdots & \text{cov}(a_{K},a_{0}) \\
\end{matrix} \\
\text{cov}(a_{0},a_{1}) & \text{var}(a_{1}) & \begin{matrix}
\ldots & cov(a_{K},a_{1}) \\
\end{matrix} \\
\begin{matrix}
\vdots \\
\text{cov}(a_{0},a_{K}) \\
\end{matrix} & \begin{matrix}
\vdots \\
\text{cov}(a_{1},a_{K}) \\
\end{matrix} & \begin{matrix}
\begin{matrix}
\ddots & \text{\ \ \ \ \ \ \ \ \ } \vdots \\
\end{matrix} \\
\begin{matrix}
\cdots & \text{var}(a_{K}) \\
\end{matrix} \\
\end{matrix} \\
\end{matrix} \\
\end{bmatrix}$$
(K+1)(K+1)
Gdzie:
Cov(ak, at) – kowariancje ocen parametrów strukturalnych dla k≠s.
Pierwiastki z elementów na głównej przekątnej macierzy D2(a) stanowią średnie błędy ocen parametrów strukturalnych.
$$\sqrt{\text{Var}(a_{0})} = S(a_{0})$$
$$\sqrt{\text{Var}(a_{1})} = S(a_{1})$$
…………………
$$\sqrt{\text{Va}r(a_{K})} = S(a_{K})$$
Średnie błędy ocen parametrów przy oszacowanej postaci modelu zapisuje się jako:
$$y_{i} = \ \begin{matrix}
a_{0} \\
S(a_{0}) \\
\end{matrix} + \begin{matrix}
a_{1}X_{1i} \\
S(a_{1}) \\
\end{matrix} + \ldots + \begin{matrix}
a_{K}X_{\text{Ki}} \\
S(a_{K}) \\
\end{matrix}$$
Gdzie:
$\hat{y_{i}}$ - wartości teoretyczne (oszacowane) zmiennej objaśnianej Y
XKi - obserwacje na zmiennej objaśniającej Xk
a0 - ocena wyrazu wolnego
aK- ocena parametrów strukturalnych modelu
S(aK) – średnie błędy ocen parametrów strukturalnych
Interpretacja średnich błędów ocen parametru
Szacując parametry strukturalne modelu na podstawie N-elementarnej próby mylimy się średnio o S(ak) w stosunku do oceny parametru ak
Miary dopasowania w modelach zmiennych jakościowych
Podstawowe miary dopasowania opierają się na różnorodnych odpowiednikach współczynnika determinacji R2. Wśród nich wyróżniamy miary oparte:
-na wartości funkcji wiarygodności,
-na własnościach predykcyjnych modelu.
-Poza miarami, które wykorzystują wartość funkcji wiarygodności, pozostałe można wykorzystać również do oceny LMP.
26. Współczynnik determinacji R2 McFaddena:
Zaliczany jest do miar wykorzystujących wartość funkcji wiarygodności. Określany jest mianem współczynnika pseudo R2. Wyraża się wzorem:
gdzie: oznaczenia są analogiczne jak we wzorze (15).
Współczynnik determinacji R2 McFaddena
Dla modeli z 0-1 zmienną objaśnianą współczynnik determinacji przyjmuje zazwyczaj niskie wartości. Jest to charakterystyczna sytuacja dla modeli szacowanych w oparciu o duże zbiory mikrodanych.
Niska wartość współczynnika nie oznacza jego nieistotności. Istotność badana jest testem F. Dla przykładu dla modelu z dwiema zmiennymi objaśniającymi oszacowanego KMNK na podstawie próby N = 1000, wartością graniczną dla R2 (przy poziomie istotności α = 0,01) jest wartość R2 = 0,2.
27. Test współczynnika korelacji:
Jednym ze sposobów na sprawdzenie, w jakim stopniu oszacowany model jest dopasowany do danych empirycznych, jest zbadanie istotności współczynnika korelacji pomiędzy szeregiem wartości empirycznych i szeregiem wartości teoretycznych modelu . Współczynnik determinacji R2 jest równy kwadratowi współczynnika korelacji Pearsona: yi pi ˆ
W hipotezie zerowej zakładamy zerową wartość współczynnika korelacji Pearsona:
Test współczynnika korelacji
Hipotezy weryfikujemy na podstawie statystyki t postaci:
Test współczynnika korelacji
Wartość statystyki (18) jest zbieżna do rozkładu t-Studenta z N-2 stopniami swobody. Jeżeli t < , to mamy brak podstaw do odrzucenia H0. W przypadku, kiedy to odrzucamy H0.
Istnieje również możliwość obliczenia współczynnika R2, jako kwadrat współczynnika korelacji pomiędzy szeregiem wartości empirycznych yi, a szeregiem wartości prognozowanych . Przyjmuje on postać:
W modelu rekurencyjnym występuje jednokierunkowe powiązanie między zmiennymi łącznie współzależnymi (Y1 -> Y2 -> Y3) a macierz B jest macierzą trójkątną
Estymacja parametrów modelu rekurencyjnego (KMNK – sekwencyjnie w określonej kolejności)
Problem w równaniu II E(Y1t ε2t) ≠ 0 a wg założeń KMNK powinny być = 0. Co oznacza że estymator jest niezgodny a na potrzeby KMNK powinien być zgodny. Wówczas stosuje się zmienne instrumentalne ZI (IV) (jako instrument wykorzystuje się wartości Y1t oszacowane z równania I.
Y2t= α20+β21$\hat{Y_{1t}}$ + α22X2t +ε2t -> KMNK
29. oszacować parametry strukturalne 2MNK
Podwójna metoda najmniejszych kwadratów (2MNK)
Istota podwójnej MNK polega na dwukrotnym zastosowaniu klasycznej MNK. W pierwszej kolejności stosuje się KNMK do oszacowania parametrów strukturalnych postaci zredukowanej modelu, analogicznie jak w przypadku pośredniej MNK
Oszacowane elementy macierzy Π wykorzystuje się do obliczenia wartości teoretycznych (wyrównanych) zmiennych łącznie współzależnych postaci zredukowanej, korzystając z poniższego układu równań
Ŷ1 = Π10 + Π11X1+…+ Π1KXK
Ŷ2 = Π20 + Π21X1+…+ Π2KXK
…………………………………………………………………
ŶG = ΠG0 + ΠG1X1+…+ ΠGKXK
Po raz drugi stosuje się klasyczna MNK do oszacowania parametrów postaci strukturalnej modelu, gdzie podstawia się wyliczane wartości teoretyczne zmiennych łącznie współzależnych postaci zredukowanej tj ŷ1t , ŷ2t , … , ŷGt
y1i =b12ŷ2i+…+b1GŷGi+a10+a11X1i+…+a1KXKi+e1
y2i =b21ŷ1i+…+b2GŷGi+a20+a21X1i+…+a2KXKi+e2
……………………………………………………………………
y1i =bGiŷ2i+…+bG(G-1)ŷ(G-1)i+aG0+aG1X1i+…+aGKXKi+eG
Estymator wariancji resztowej oraz standardowy błąd reszt i – tego równania postaci strukturalnej dane są takimi samymi wzorami co w przypadku KMNK.
30. tworzenie produkcji globalnej i warunek cząstkowy układu?
Układ równań bilansowych produkcji globalnej (Xj)
Bilans tworzenia produkcji globalnej (równania kosztów)
Wartość produkcji = koszty materiałów + płace + zyski
$$x_{j} = \sum_{j = 1}^{n}{x_{\text{ij}} + {(M}_{j} + V_{j})}\ \ \ \ \ \ \ \ (j = 1,2\ldots n)$$
$$x_{j} = \sum_{j = 1}^{n}{b_{\text{ij}}X_{j} + D_{j}}\ \ \ \ \ \ \ \ (j = 1,2\ldots n)$$
Warunek równowagi cząstkowej układu
Układ gospodarczy jest w równowadze cząstkowej, jeżeli wartość produkcji liczona według:
Bilansu podziału oraz
Bilansu powstania
Są sobie równe tj.:
Xi = Xj (i=j ; i,j =1,2…n)
$$\sum_{j = 1}^{n}{b_{\text{ij}}X_{j} + D_{j}}\ = \ \sum_{i = 1}^{n}{x_{\text{ij}} + {(M}_{j} + V_{j})}\text{\ \ \ \ \ \ \ \ \ \ \ \ \ }(i = j\ ;\ i,j\ = 1,2\ldots n)\ $$
Warunek równowagi ogólnej układu:
Układ gospodarczy jest w równowadze ogólnej jeżeli wartość dodana w układzie jest równa produkcji końcowej (finalnej) układu
$$\sum_{j = 1}^{n}{D_{j} = \sum_{i = 1}^{n}x_{i}}$$
$$\sum_{j = 1}^{n}{{(M}_{j} + V_{j}) = \sum_{i = 1}^{n}x_{i}}$$
Warunek samowystarczalności układu
Układ gospodarczy nazywamy samowystarczalnym, jeżeli dla każdego działu produkcja finalna (końcowa) jest nieujemna, tj.:
xi ≥ 0 (i=1,2…n)
x≥0 (w zapisie macierzowym)
31. badanie normalności składnika losowego. naczym polega i wzór
Normalność rozkłady składnika losowego:
Badanie polega na porównaniu rozkładu składnika losowego z próby z postulowanym teoretycznym rozkładem normalnym. Jest to test dla dużych prób (n>100)
H0 : F(ei) = FN(ei) - dystrybuanta rozkładu reszt
H1 : F(ei) ≠ FN(ei) - dystrybuanta rozkładu normalnego
Rozkład statystyki Bery Jarque’a (JB) jest zbieżny do rozkładu chi – kwadrat o 2 stopniach swobody Xα2(2)
Statystyka Bery Jarque’a ma postać:
$$JB = N(\frac{1}{6}\beta_{1} + \frac{1}{24}(\beta_{2} - 3)^{2}$$
β1 = A = 0
β2 = K = 3
Gdzie:
$\sqrt{\beta_{1}} = \frac{1}{N}\sum_{i = 1}^{N}e_{i}^{3}/S^{3}(e_{i}$)
$\beta_{2} = \frac{1}{N}\sum_{i = 1}^{N}e_{i}^{4}/S^{4}(e_{i}$) współczynnik koncentracji (kurioza)
E(ε)=0 dlatego 1/N
Jeżeli JB<χα2(2), wówczas nie ma podstaw do odrzucenia hipotezy zerowej, rozkład składnika losowego jest rozkładem normalnym.
Dla rozkładu normalnego
β1 = A = 0
β2 = K = 3
Natomiast jeżeli JB≥χα2(2), wówczas odrzuca się H0 ma rzecz H1, mówiącej o niezgodności rozkładu składnika losowego z rozkładem normalnym.
32. model sezonowości
Wahania sezonowe, sezonowość – okresowy składnik w modelu zależności badanej cechy statystycznej od czasu.Najczęściej występuje sezonowość roczna, tygodniowa oraz dzienna.
St= ∑mk=1 dkQkt gdzie: dk – parametry modelu sezonowości oznaczające o ile wartość zjawiska odchyla się od poziomu średniego, wyłącznie z tytułu wahań sezonowych; ∑mk=1 dk=0 – co oznacza, że wahania sezonowe w skali roku znoszą się wzajemnie; m-liczba podokresów w roku; Qkt – zmienna zero-jedynkowa przyjmująca wartość 1 zawsze w okresie gdy (t-k) dzieli się bez reszty przez m i 0 w pozost. okresach; Qkt = { 1 gdy (t-k) dzieli się przez m bez reszty; 0 w pozost. okresach
33. Błąd predykcji ex ante – wzór i interpretacja.
Przed zrealizowaniem wartości zmiennej prognozowanej; przed upływem okresu zrealizowanego. Informuje o ile średnio w długim ciągu prognoz rzeczywiste realizacje zmiennej prognozowanej będą różnić się od wartości wyliczonych prognoz.
Błąd predykcji (ex ante): VT=√(1+XT(XTX)-1XTT)*S2(e); INTER: Prognozowana np. liczba mieszkańców miast w grudniu 2006 wyniesie coś tam z błędem, który policzę.
Trafność prognozy przedział ufności: P{ytp – t alfa/2, T-K-1 * VT < yt < ytp + t alfa/2, T-K-1} I Inter: z prawdopodobieństwem % przedział od do pokrywa nieznaną liczbę ludności miast w danym okresie czasu.
34.Wariancja resztowa, błąd standardowy reszt, błędy ocen parametrów.
wariancja resztowa: S2(e)= ∑ni=1 et2 / N-(K+1); błąd standardowy reszt S(e)=√S2(e); błędy ocen parametru: wzór: D(a)=S2(e)*(XTX)-1 Inter: błąd s. reszt: Wartości teoretyczne wyznaczone przez model odchylają się od empirycznych wartości zmiennej Y przeciętnie o __. błędy o. parametru: jeżeli zmienna Y wzrośnie o jednostkę to inna zmienna wzrośnie/spadnie średnio o __ z błędem __.
35. Własności estymatora KMNK.
*zgodność (estymator KMNK dany wzorem a=(XTX)-1XT*y jest zgodny jeśli spełniony jest warunek: p lim n∞ (a) = α); *nieobciążoność (jeśli spełnia warunek postaci: E(a)=α); *efektywność (jeśli spełnia warunek D2(a)=V(a)=S2e=(XTX)-1 min
36. Zapisać przykładowy 2-równaniowy model rekurencyjny.
Y1=α10+α11X1t+ε1
Y2= α20+β21Y1t+α22X2t+ε2
37. metoda estymacji modelu rekurencyjnego
Do oszacowania modelu rekurencyjnego możemy wykorzystać metodę KMNK. W modelu występuje równanie, które spełnia warunek o nieskorelowaniu zmiennych objaśniających ze składnikiem losowym. W pierwszej kolejności należy oszacować to równanie. Wartości teoretyczne zmiennej objaśnianej wyliczone z tego równania podstawia się w miejsce wartości obserwowanych danej zmiennej w kolejnych równaniach. (Jedno z kolejnych równań powinno teraz spełniać warunek o nieskorelowaniu zmiennych i można ponownie użyć KMNK)
38. Wariancja predykcji
V2T=(1+XT(XTX)-1XTT)*S(e)2; gdzie: XT – wektor wierszowy wartości zmiennych objaśniających w okresie prognozowanym T, X – macierz obserwacji na zmiennych objaśniających modelu