EKONOMETRIA
Model ekonometryczny
Elementy składowe pojedynczego równania w modelu ekonometrycznym
zależność scholastyczna y = f(α,x) + ε
objaśnienia: y – zmienna objaśniana, zależna, jest jedna wielkość
x – zmienne objaśniające, niezależne – to wektor. x = {x1, x2,…, xn} – składa się ze zmiennych
[Model nie wyjaśnia jak się kształtuje dany model, tylko wyjaśniamy te zmienne.]
α – wektor parametrów strukturalnych w modelu zależy od funkcji f
ε – zmienne losowe (składnik losowy) o nieznanej treści (zjawiska o czysto losowym charakterze)
szacujemy model: model zależności: $\hat{\gamma} = f(\alpha,x)$
objaśnienia: $\hat{y}$ – oszacowanie zmiennej zależnej
α – wektor oszacowań parametrów strukturalnych modelu
Dobór zmiennych do modelu ekonometrycznego
Regresja prosta. Metoda najmniejszych kwadratów.
model zależności stochastycznej yi = βo + β1 * xi + εi
model oszacowany:$\ \hat{y}i = \ b_{0} + b_{1}*\ x_{i}$
metoda regresji - jedna zmienna niezależna, szacujemy na podstawie obserwacji zmiennej x i y
x i y – to wektory zawierające konkretne liczby
rys. – najlepsza opcja, kiedy zmienna leży najbliżej punktów
$$\sum_{i = 1}^{\alpha}e_{i}^{2}$$
$$\mathbf{SEE = \ }\sum_{i = 1}^{\alpha}\left( y_{i} - {\hat{y}}_{i} \right)^{2} = \sum_{i = 1}^{\alpha}\left( y_{i} - \ b_{o} - b_{1}*\ x_{1} \right)^{2}$$
tak dobieramy bo i b1 (oszacowanie parametrów), aby ich suma kwadratów błędów była jak najmniejsza
Metoda najmniejszych kwadratów (MNK): min bo i b1 (SSE)
Układ równań normalnych, z warunku koniecznego istnienia ekstremum funkcji.
$$\left\{ \begin{matrix}
\frac{\text{dSEE}}{db_{o}} = - 2\ \sum_{i = 1}^{n}\left( y_{1} - b_{o} - b_{1} - x_{i} = 0 \right)\ \\
\frac{\text{dSEE}}{db_{1}} = - 2\sum_{i = 1}^{n}{x_{i}\left( y_{1} - b_{o} - b_{1} - x_{i} = 0 \right)} \\
\end{matrix} \right.\ $$
po przekształceniach:
Estymatory parametrów strukturalnych.
Model regresji prostej
Założenia MNK:
- zmienne niezależne są nielosowe
- składniki losowe mają rozkłady N(0, α2)
- składniki losowe εi i εj są niezależne dla każdego i =/ j
Błędy dopasowania
- średni błąd kwadratowy (oszacowanie wariancji składnika logowego)
$$MSE = \ \frac{\text{SSE}}{n - 2} = \ \frac{1}{n - 2}\ \sum_{i = 1}^{n}\left( y_{i} - \ {\hat{y}}_{i} \right)^{2}$$
SSE – suma kwadratów błędów
- standardowy błąd szacunku (oszacowanie odchylenia standardowego składnika losowego)
$$S = \ \sqrt{\text{MSE}} = \ \sqrt{\frac{\sum_{i - 1}^{n}\left( y_{i} - \ {\hat{y}}_{i} \right)^{2}}{n - 2}}$$
Do liniowego modelu ekonometrycznego:
$\sum_{i - 1}^{n}{\left( y_{i} - \ \hat{y} \right)^{2} = \ }\sum_{i - 1}^{n}{\left( y_{i} - \ {\hat{y}}_{i} \right)^{2} + \ \sum_{i - 1}^{n}\left( \ {\hat{y}}_{i} - \ \overset{\overline{}}{y} \right)^{2}}$
Syy = SEE + SSR (suma kwadratow odchylen regresyjnych)
Syy – miara całkowitej zmienności y
SSR – część zmienności, zmiennej zależnej, która została przez model wyjaśniona
Współczynnik determinacji
$$\mathbf{r}^{\mathbf{2}}\mathbf{= \ }\frac{\mathbf{\text{SRR}}}{\mathbf{S}_{\mathbf{\text{yy}}}}\mathbf{= \ }{\mathbf{r}_{\mathbf{\text{yy}}}}^{\mathbf{2}}$$
informuje jaka część zmienności zmiennej zależnej jest wyjaśniana przez model
r2 przyjmuje wartość z przedziały (0,1)
r2 <0,9;1) - model bardzo dobry
r2 <0,8;0,9) – model dobry
r2 <0,6;0,8) - model zadowalający
r2 =1 – moder deterministyczny (Syy=SSR)
r2 = 0 – model zły
r2=ryy2 oznacza, że współczynnik deterministyczny jest kwadratem współczynnika korelacji między zmienną….
Weryfikacja statystyczna istnienia liniowej zależności:
tabela analizy wariancji
Fempiryczne – wartość służąca nam do weryfikacji statystycznej modelu zależności między x a y
F1, n-2 – wartość powinna być duża
Fempiryczne – pozwala nam zweryfikować hipotezę Ho=β0=1 y=b0 +0 X, między x a y nie ma zależności liniowej
α – poziom istotności
Femiryczne >Fkrytyczne odrzucamy Ho, współczynnik β1 =/ 0. Między x i y istnieje związek liniowy.
Istotność F >α odrzucamy Ho
Femiryczne <Fkrytyczne Brak podstaw do odrzucenia Ho, współczynnik β1 nie istotnie różny od 0. Między x i y nie ma związku liniowego.
Istotność F >α
Fkrytyczne = ROZKŁ.F.ODWR.VPS(α, st.sw licznika, st.sw.mianownika)
Istotność F – prawdopodobieństwo tego, ze liczba F1, n-2 jest większa od Fempirycznego. Fempiryczne powinno być jak największe. Istotność F powinna być jak najmniejsza.
Poziom istotności – 0,01 lub 0,05
0,01 oznacza, że w jednej na sto prób liczymy się z prawdopodobieństwem popełnienia błędu
ROZKŁAD.F(F;MS resztkowy) = ISTOTNOŚC F
Badanie istotności parametrów strukturalnych
1) Ho: β0=0 t = n-2
2) Ho: β1=0 – reszta tak samo t = n-2
Tkryt = ROZKŁAD.T.ODW.DS(α, n-2)
1. |Temp| > Tkryt - Tkryt odrzucamy Ho, współczynnik β0 istotnie różny od 0; współczynnik powinien być w modelu uwzględniony; istotność Temp < α
2. |Temp| < Tkryt - brak podstaw do odrzucenia Ho, współczynnik β0 nie istotnie różny od 0; współczynnik powinien być w modelu usunięty; istotność T0emp > α
Poprawność modelu ekonometrycznego – test serii (pozwala weryfikować hipotezę czy reszty mają charakter losowy)
1. Porządkujemy reszty według wartości zmiennej niezależnej (x)
2. Seria reszt – to ciąg reszt tego samego znaku (zera pomijamy)
3. Formułujemy H0: postać fikcyjna modelu jest poprawna
4. Weryfikujemy H0 na postawie statystyki testowej – liczba serii reszt kemp. Ta statystyka ma rozkład serii z parametrem k: kn1,n2. n1 – liczba reszt dodatnich; n2 – liczba reszt ujemnych; lub odwrotnie
5. Odczytujemy z tablicy wartości krytyczne k1 i k2
6. Obszar krytyczny: (-nieskończoność, k1>u <k2, + nieskończoność), gdzie
k1 = kα/2, n1,n2; k2= k1-α/2;n1;n2
W2
Przy pomocy testu serii, sprawdzić czy na poziomie istotności 0.05 model liniowy jest odpowiedni
Reszty ei mają następujące znaki kolejno:
++-+---++-+-
Kemp = 8
+n1 = 6
-n2 =6
K1 a/2= 3 – z testu serii
K2(1- a/2)(1-0,025=0,975)= 10 – z testu serii
Obszar akceptacji hipotezy o losowym wyborze reszt jest to obszar od k1 do k2. Kemp należy do obszaru akceptacji
poniżej k1 i powyżej k2 obszar krytyczny
Nie ma podstaw do odrzucenia hipotezy
Model regresji wielorakiej
Model zależności stochastycznej:
yi = β0 +β1⋅x1i +β2⋅x2i +… +βk⋅xki +εi
Model oszacowany:
Nie można zastosować METODY MOMENTÓW! – do oszacowania
Regresja wieloraka:
Dane do analizy regresji
„1” – potrzeba do wyrazu wolnego
$\hat{y} = 1*b0 + x1*b1\ldots.$
Metoda najmniejszych kwadratów (MNK)
Suma kwadratów różnic (błędów)
MNK minb0, b1…bk(SEE)
Założenia – jak w regresji prostej (reszty nają rozkład normalny, „x” są nielosowe)
Formuła macierzowa dla współczynników
Jeśli n=k+1 to b=X-1*y
Jeśli n>k+1 to b=X+*y=(XT*X)-1*XT*y
y= x*b
XTy = (XT X)*b
(XT X) to kwadrat
(XT*X)-1Xt*y = (XT*X)-1 *(XT*X)*b
(XT*X)-1 *(XT*X) -> to I jednostka
b= (xT*x)-1 *xT*y
(xT*x)-1 *xT -> ten wzór to X+
Błędy dopasowania:
średni błąd kwadratowy
standardowy błąd szacunku s – jest oszacowaniem składnika losowego
Wartość błędów nie stanowi miary jakości modelu. Najlepszy błąd daje najmniejsze standardowe błędy szacunku.
Błędy dopasowania
dla liniowego modelu ekonomicznego:
= +
SYY = SSE + SSR
całkowita zmienność część zmienności część zmiennej zależnej y
zmiennej zależnej y nie wyjaśniona wyjaśniona przez model
przez model
Miara jakości modelu = współczynnik determinacji wielorakiej – nie ujmuje stopnia złożoności modelu. Określa jaka część zmienności zmiennej zależnej jest wyjaśniona przez model.
Dodawanie kolejnych zmiennych do modelu zawsze poprawia współczynnik determinacji, a nam potrzeba te zmienne, które naprawdę wpływają, dlatego utworzone s korygowany współczynnik determinacji wielorakiej – ujmuje złożoność modelu (k). Określa jaka jest jakość modelu.
Model regresji wielorakiej musi być zweryfikowany statystycznie i merytorycznie (czy daje sensowne wyniki)
Tabela analizy wariancji: (tabela analizy wariancji i testujemy istotność poszczególnych składników)
F: (rozkład F z l. stopni swobody licznika k i mianownika n-k-1). Można ją wykorzystać do weryfikacji hipotezy.
H0: β1+β2+…+βk
H1: Ui β1 =/ 0 – istnieje takie „i”, że β1 =/ 0 (hipoteza alternatywna)
do weryfikacji hipotezy: : rozk.F, st. swobody licznika k; st. swobody mianownika n-k-1)
Jeżeli hipoteza jest prawdziwa to bardzo mało prawdopodobne są duże wartości tej statystyki.
y= β0+O*x1 + O*x2 +..0*xk+ε
α – małe prawdopodobieństwo, że statystyka przyjmuje duże wartości
Femp (obliczane z próby) jeżeli jest w obszarze krytycznym to hipotezę zerową odrzucamy, a jeżeli nie to przyjmujemy
Jeżeli α =0,05 w 5 próbach na 100 mogliśmy się mylić w naszej ocenie hipotezy „0”.
Femp >Fkryt H0 odrzucamy, przynajmniej jeden ze współczynników βi jest istotnie różny od 0. Istnieje związek liniowy między zmienną zależną, a przynajmniej jedną zmienną niezależną x (zmiany x przenoszą się na y)
Femp ≤Fkryt brak podstaw do odrzucenia H0. Wszystkie współczynniki przy zmiennych niezależnych x nieistotnie różne od 0, a wobec tego brak związku liniowego między zmienną zależną y a zmienną niezależną x. Jeżeli tak jest to nie ma sensu testować dalej hipotez.
Jeżeli istotność Femp <α odrzucamy hipotezę zerową
Jeżeli istotność Femp > α nie ma podstaw do odrzucenia hipotezy zerowej
Wartość KRYTYCZNA : Fkryt = ROZKŁAD.
Testy istotności dla współczynników:
Hipoteza o istotności parametrów strukturalnych:
H0: βi = 0; H1: βi =/ 0
$T = \frac{b_{i}}{s(b)}$ - można udowodnić, żema rozkład T z liczbą st. swobody n-k-1
T – statystyka dla weryfikacji hipotezy
Jeżeli |T emp|> Tkryt H0 : odrzucamy, czyli Bi =/0 jeśli i = 0 wyraz wolny powinien być uwzględniony w modelu istotności T emp<α. Jeśli i > 0 zmienna xi powinna być w modelu uwzględniona (związek między xi a zmienną zależna y)
Jeżeli |T emp|< Tkryt brak podstaw do odrzucenia hipotezy zerowej. βi = 0, i = 0 wyraz wolny nieistotnie różny od zera powinien być pominięty
T emp < α - odrzucamy H0
T emp > α – brak podstaw do odrzucenia H0
W3
Współczynniki | Błąd standardowy | t Stat | Wartość-p | |
---|---|---|---|---|
Przecięcie | 35,09382492 | 2,23759562 | 15,68372 | 1,04E-06 |
Zmienna X 1 | 0,578496678 | 0,12164652 | 4,755555 | 0,00207 |
Zmienna X 2 | 1,782380091 | 0,52973487 | 3,364664 | 0,012008 |
ROZKŁAD.T.ODW(0,05;9)=2,26
ŷ= 35+0,58*x1+1,78*x2
wyraz wolny –wartość zmiennej zależnej, jeśli zmienne niezależne równe zera
x1=0 , x2=0, ŷ=b0
∆x1=1, ∆x2=0 ∆ y=b1
∆x1=1, ∆x2=0 ∆ y=b2
Jak dla regresji prostej
Kolejność reszt:
Zgodnie z upływem czasu
Według wybranej zmiennej niezależnej
Wybieramy tą najważniejszą i względem niej stosujemy resztę (T-stat, największe czyli najbardziej istotne różne od 0). Jeżeli z testu serii okaże się, że postać liniowa nie jest poprawna to mamy model regresji nieliniowej.
Model zależności stochastycznej:
Yi = f(xi, β)+ εi gdzie: xTi = [x1i, x2i,…., xki ]
βT = [β1, β2,….., βm]
Model oszacowany:
Ŷi = f(xi, b) gdzie: bT = [b1, b2,…., bm] ; b – wektor oszacowań parametrów strukturalnych w modelu
yi = α + β*x1i + γ*x22i + εi
ŷi = α + b*x1i + c*x22i
yi = α + β*ln(x1i) + γ*x22i + εi
ŷi = α + b*ln(x1i) + c*x22i
Model regresji nieliniowej szacujemy na podstawie takich samych danych jak model regresji liniowej.
Suma kwadratów różnic (błędów):
MNK:
min(SSE)
b0, b1,….,bk
Modele linearyzowalne – transformacja zmiennych
ŷi = ƒ (xi, b) ⇒ ŷi = b0’ + b1’*x1i’ + ... + bk’*xki’
Modele ściśle nieliniowe – metody optymalizacji nieliniowej
yi = β0 * x1i + β1 * eβ2x2i + εi
$${\hat{y}}_{i} = b_{0}*x_{1i}\ + \ b_{1}*\ e^{b_{2}x_{2i}}$$
Linearyzacja:
jedna zmienna: , dla j=1, 2, ..., k
dwie zmienne:
przykład: ŷ = b0 + b1* x1 + b2*x2 x1 + b3* x12 *x22 + b4*x35
x2’ = x1 *x2
x3’ = x12 *x22
x4’ = x35
ŷ = b0 + b1* x1’ + b2*x2’ + b3* x3’ + b4*x4’
Model odwrotny do liniowego
$$\hat{y} = \ \frac{1}{b_{0} + b_{1}*x_{1i} + b_{2}*x_{2i} + \ldots + \ b_{k}*x_{\text{kt}}}$$
Linearyzacja:
$$y^{'} = \ \frac{1}{y}$$
np. funkcja produkcji Cobba-Douglasa:
Linearyzacja: obustronne zlogarytmowanie:
yi′ =ln yi, , dla j=1, 2, ..., k, ?
przykład: y = b0 * x1b1 * x2b2
lny′ = ln(b0*x1b1*x2b2) = lnb0 + lnx1b1 + lnx2b2 = lnb0 + b1 lnx1 + b2lnx2
y’ = lny
b’0 = ln b0
x1’= lnx1
x2’= lnx2
y’ = b0’ + b1*x1’ + b2 *x2’
b0 = exp(b0’) = eb0′
Linearyzacja: obustronne zlogarytmowanie:
y’=ln yi ; b0 = ln b0
przykład: $\hat{y} = *\exp(b_{0}*x_{1} + b_{2}x_{2})\ $
$$\ln\hat{y} = \ \ln\lbrack b_{0}*\exp{(b_{1}x_{1} + b_{2}x_{2})\rbrack = \ln b_{0} + \text{lnexp}(b_{1}x_{1} + b_{2}x_{2}) = \ln}b_{0} + \ b_{1}x_{1} + b_{2}x_{2}$$
y’ = lny
b0’ = lnb0
y’ = b0’+ b1x1 + b2x2
b0 = exp(b0’)
Linearyzacja:
Funkcja Tornquista I rodzaju - popyt na dobra podstawowe, pierwszej potrzeby (wyżywienie, odzież, stałe opłaty)
interpretacja: Popyt na dobro podstawowe wzrasta szybciej niż proporcjonalnie w początkowym zakresie dochodów. Dalszy wzrost dochodów powoduje niewielki wzrost tych wydatków – osiągany stan nasycenia (a – poziom nasycenia)
Funkcja Tornguista I rodzaju:
,gdzie a > 0, b > 0
- wydatki na dane dobro
- dochody lub wydatki ogółem gospodarstw domowych
szacowanie parametrów: 1/y = 1/a +b/a x 1/x
linearyzacja y’ = 1/y; x’=1/x, a’=1/a; b’ = b/a
Funkcja Tornquista II rodzaju - popyt na dobra wyższego rzędu (meble, sprzęt gospodarstwa)
interpretacja: Popyt na dobra wyższego rzędu pojawia się przy pewnym poziomie dochodów (c). W początkowym zakresie dochodów wzrasta szybciej niż proporcjonalnie. Dalszy wzrost dochodów powoduje niewielki wzrost tych wydatków – osiągany stan nasycenia (a – poziom nasycenia)
Funkcja Tornguista II rodzaju:
, gdzie
- wydatki na dane dobro
- dochody lub wydatki ogółem gospodarstw domowych
szacowanie parametrów: y = a-b y^/x – Ac/x
linearyzacja: z = y^/x; x’ = 1/x; b’= -b, c’=-ac
funkcja zlinearyzowana y^= a+b’ x z + c’ *x’
Funkcja Tornquista III rodzaju - popyt na dobra luksusowe(luksusowe wille, samochody)
interpretacja: Popyt na dobra luksusowe pojawia się przy pewnym poziomie dochodów (c) Potem zwiększa do proporcjonalnego wzrostu wraz ze wzrostem dochodów (asymptota ukośna)
Funkcja Tornguista III rodzaju:
, gdzie
- wydatki na dane dobro
- dochody lub wydatki ogółem gospodarstw domowych
y^ = - Ac + ax – b x y^/x
linearyzacja x’ = y^/x; a’ = -ac, b’ = a, c’ = -b
W 4 11.04.
W 7
Model ekonomiczny jest uproszczonym obrazem zjawisk zachodzących w gospodarce.
- uproszczenie jest niezbędne ze względu na złożoność procesów gospodarczych
- musi być przejrzysty
-może być opisany słowami lub formułami
np.
Model krzywej Phillipsa
Model Keynesa dla danej gospodarki
Modelem ekonometrycznym nazywamy formalny opis stochastycznej zależności wyróżnionej wielkości, zjawiska lub przebiegu procesu ekonomicznego, od czynników które je kształtują, wyrażony w formie pojedynczego równania bądź układu równań
Model ekonometryczny jest konstrukcją formalną, która za pomocą jednego równania lub wielu równań odwzorowuje zasadnicze powiązania ilościowe zachodzące pomiędzy badanymi zjawiskami ekonomicznymi.
Rodzaje danych i zmiennych:
- rodzaje zmiennych: *zmienne ilościowe (mają wartości liczbowe)
* zmienne jakościowe ( reprezentują pewne kategorie)
- rodzaje danych statystycznych:
* dane przekrojowe (dane o wielu obiektach)
* dane czasowe
* dane przekrojowo czasowe
ETAPY BUDOWY MODELU EKONOMETRYCZNEGO
• ustalenie celów tworzenia modelu
• specyfikacja modelu ekonometrycznego
- identyfikacja zmiennych wykorzystanych w badaniu i zebranie danych
- identyfikacja postaci modelu
• estymacja parametrów strukturalnych modelu
• weryfikacja modelu
• zastosowanie modelu
Model procesu decyzyjnego
Model decyzyjny jest konstrukcją formalną odwzorowującą istotne cechy rzeczywistej sytuacji decyzyjnej:
matematyczna postać modelu decyzyjnego: Z = f[(x1,x2,…xn)]
gdzie, (x1,x2,…xn) - zmienne decyzyjne, są przedmiotem sterowania przez podejmowanie decyzji, określają one alternatywne sposoby działania
Z – jest miarą oceny podjętej decyzji
f – jest funkcją odwzorowującą zależność między zmiennymi decyzyjnymi, a miarą oceny Z. Funkcja f nazywana jest funkcją celu.
Zbiór alternatywnych sposobów działania zwykle jest ograniczony – podejmowanie decyzji przebiega warunkach pewnych ograniczeń. Uwzględnienie tych warunków w modelu decyzyjnym polega na określeniu zbioru dopuszczalnych decyzyjnych (rozwiązań) dla konkretnej sytuacji decyzyjnej. Ogólnie warunki ograniczające można przedstawić następująco: gi(x) ≥ 0 [i = = 1, 2, …n)
Postać matematyczna problemu decyzyjnego: (max lub min) Z = f[(x1,x2,…xn)] przy ograniczeniach gi(x) ≥ 0 [i = = 1, 2, …n)