Wykład III
Modele trendowo-sezonowe
Model bez wyrazu wolnego z sezonowością możemy zapisać
yt= $\sum_{i = 1}^{l}d_{\text{i\ }}x_{\text{ti}}$ + ξt
di – oznacza parametr mierzący efekt sezonowy w danym cyklu, dla którego zachodzi $\sum_{i = 1}^{l}d_{\text{i\ }}$= 0,
l-oznacza liczbę podokresów w cyklu
xti- zmienna sezonowa 0-1, wyrażana następująco:
1 w i-tym podokresie cyklu
xti
0 w pozostałych
Model z wyrazem wolnym, trendem i sezonowością :
yt= β0 + β1t + $\sum_{i = 1}^{l}d_{\text{i\ }}x_{\text{ti}}$ + ξt
1 | 1 | 1 | 0 | 0 | 0 |
---|---|---|---|---|---|
1 | 2 | 0 | 1 | 0 | 0 |
1 | 3 | 0 | 0 | 1 | 0 |
1 | 4 | 0 | 0 | 0 | 1 |
1 | 5 | 1 | 0 | 0 | 0 |
1 | 6 | 0 | 1 | 0 | 0 |
1 | 7 | 0 | 0 | 1 | 0 |
1 | 8 | 0 | 0 | 0 | 1 |
. | . | . | . | . | . |
. | . | . | . | . | . |
. | . | . | . | . | . |
1 | n | 0 | 0 | 0 | 1 |
X =
w celu oszacowania modelu z wyrazem wolnym eliminujemy dowolny podokres w cyklu (zwykle ostatni) .
Po przekształceniach otrzymamy następującą postać modelu z sezonowością lub modelu z trendem i sezonowością :
yt= β0 + β1t + $\sum_{i = 1}^{l}d_{\text{i\ }}q_{\text{ti}}$ + ξt
1 w i-tym podokresie cyklu
qti = xti + xtl 0 w pozostałych podokresach z wyjątkiem l-tego
0 w pozostałych
Macierz obserwacji na zmiennych objaśniających w modelu trendowo-sezonowym (przykład kwartalny)
1 | 1 | 1 | 0 | 0 |
---|---|---|---|---|
1 | 2 | 0 | 1 | 0 |
1 | 3 | 0 | 0 | 1 |
1 | 4 | -1 | -1 | -1 |
1 | 5 | 1 | 0 | 0 |
1 | 6 | 0 | 1 | 0 |
1 | 7 | 0 | 0 | 1 |
1 | 8 | -1 | -1 | -1 |
. | . | . | . | . |
. | . | . | . | . |
. | . | . | . | . |
1 | n | -1 | -1 | -1 |
X =
Przykład
$\hat{y_{t}}$ = 121,75 + 2,41t – 13,18qt1 – 2,60 qt2 + 15,72 qt3
$\hat{d_{4}}$= 0,06
∑di= 0
d4= -( d1 + d2 + d3)
d4= -(-13,18 – 2,60 + 15,72)
Interpretacja:
2,41t- przychody z kwartału na kwartał rosną o 2,41 tys. zł
-13,18qt1 – przychody biura turystycznego w pierwszych kwartałach badanego okresu były niższe od przeciętnej wyznaczonej trendem średnio o 13,18 tys. zł
T= (17, 18, 19, 20)
y17P =121,75 + 2,41 * 17 – 13,18 * 1 – 2,60 * 0+ 15,72 * 0= 149,54
y18P =121,75 + 2,41 * 18 – 13,18 * 0– 2,60 * 1+ 15,72 * 0= 162,53
y19P =121,75 + 2,41 * 19 – 13,18 * 0 – 2,60 * 0+ 15,72 * 1= 183,26
y20P =121,75 + 2,41 * 20 – 13,18 * (-1) – 2,60 * (-1)+ 15,72 * (-1)= 170,01
Wybór stopnia wielomianu trendu (test równowartości dwóch wariancji)
Szacujemy parametry następujących wielomianowych modeli trendu
yt= $\sum_{l = 0}^{V}\beta_{i}$ti + ξt
yt= $\sum_{i = 0}^{V + 1}\alpha_{i}$ti + εt
Dla tych modeli wyznaczamy wariancję resztowe i stawiamy następujące hipotezy:
H0 : σξ2 = σε2
H0 : σξ2 > σε2
Statystyka testowa F= $\frac{\hat{\sigma_{\xi}^{2}}}{\hat{\sigma_{\varepsilon}^{2}}}$ która przy prawdziwości hipotezy zerowej ma rozkład F (V1 = n1 -1,
V2= n2- 1). Jeżeli natomiast F≤ Fv1v2 to nie ma podstaw do odrzucenia H0, jeżeli natomiast F>Fαv1v2 to mamy podstawy do odrzucenia H0, czyli występuje spadek wariancji resztowej, a właściwym modelem jest wielomian wyższego rzędu.
Ćwiczenia III
Zadanie 1
Zużycie paliwa w litrach w pewnym gospodarstwie w latach 2006-2010 było następujące:
lata | 1 kwartał | 2 kwartał | 3 kwartał | 4 kwartał |
---|---|---|---|---|
2006 | 9913 | 13704 | 15911 | 15285 |
2007 | 8157 | 14402 | 20490 | 19440 |
2008 | 8543 | 19387 | 17955 | 17135 |
2009 | 8998 | 19221 | 20028 | 14968 |
2010 | 9101 | 19620 | 22715 | 17698 |
Oszacować liniowy model trendu wraz z sezonowością i zinterpretować wyniki. Wyznaczyć prognozy punktowe na kolejne 4 kwartały
yt= β0 + β1t + d1xt1+ d2xt2 + d3xt3+ d4xt4
d1+d2+d3+d4=0
β= (XTx)-1Xty
Dodawanie zmiennych time- zmienna czasowa t
Dodawanie zmiennych periodyczne zmienne 0-1 dq1, dq2, dq3, dq4
Dodawanie zmiennych definiowanie nowej zmiennej… q1, q2, q3
Model klasyczna metoda najmniejszych kwadratów…
$\hat{y_{t}}$ = 13706,3 + 183,55t – 6415,83qt1 + 1725,03qt2+ 3694,47qt3
$\hat{d_{4}}$ = -( -6415,83+1725,03+3694,47)= 996,33
Analiza prognoza…
y21P= 13706,3+ 183,5 * 21 – 6415,8= 11145 ± V= 2291,062
y22P= 13706,3+ 183,5*22+1725,03=19469,4 ± V= 2291,062
Zadanie 2
Miesięczna sprzedaż pewnego produktu w kolejnych 12 miesiącach roku 2010 była następująca 9,6; 10,3; 10,6; 10,8; 11,1; 11,3; 11,6; 11,7; 11,8; 11,9; 12; 12,1. Oszacuje najlepszą funkcję trendu dla sprzedaży tego produktu oraz wyznacz prognozę na kolejny miesiąc i oceń jej dopuszczalność.
yt=βo+ β1 +ξt
$\hat{y_{t}}$ = 9,89 + 0,2t R2= 0,91
Vξ= $\frac{0,228}{11,23}$ * 100 = 2 % DW= 0,62- silna dodatnia autokorelacja
Zaznaczamy y i time wybieramy Dodawanie zmiennych … logarytmy dla wybranych zmiennych
Następnie Model Klasyczna metoda najmniejszych kwadratów…
I otrzymujemy….
yt= β0+ tβ1 * eξt e≈ 2,718
lnyt =lnβ0 + β1lnt + ξt
lnyt =2,26 + 0,09378 lnt R2=0,99 Vξ= $\frac{0,0054}{2,42}$ = 0,2 % DW= 1,34
Analiza prognoza…
y13P= 2,5 ln tys. zł V13= 0,005935 ln tys. zł
Lnβ0= 2,26 => $\hat{\beta_{0}}$ = e2,26= 9,5869
$\hat{y_{t}}$ = 9,586 t0,09378
y13P = 9,5869 * 13 0,09378 = 12,19 tys.
Wykład IV
x- zmienna endogeniczna
Postać liniowego statycznego modelu ekonometrycznego możemy przedstawić:
yt=βo + β1xt1 + β2xt2 + …+ βkxtk + ξt
Zapis macierzowy modelu:
y= Xβ + ξ
Szacowanie metodą najmniejszych kwadratów
$\hat{\beta}$= |XTX|-1XTy
Średnie błędy szacunku wyznaczamy z macierzy wariancji-kowariancji
Błędy ocen parametrów modelu
D2($\hat{\beta_{i}}$) = σξ2|XTX|-1
Weryfikacja modelu
-weryfikacja ilościowa (etap wnioskowania statystycznego)
oceny dobroci dopasowania modelu empirycznego do danych rzeczywistych
testowanie wartości parametru modelu, postaci analitycznej założeń stochastycznych
ocena pragmatyczne modelu
Ocena dopasowani modelu
Współczynnik determinacji R2
Współczynnik zbieżności ϕ2
R2 + ϕ2 = 1 R2, ϕ2 ie <D;1>
Odchylenie standardowe reszt modelu (błąd standardowy) $\hat{\sigma_{\xi}}$
Współczynnik zmienności losowej Vξ Vξ= $\frac{\hat{\sigma}}{y}$ * 100
Indywidualne hipotezy istotności:
H0: β1 = 0
H1: β1 ≠ 0 (i=1,2..k)
Przy prawdziwości hipotezy zerowej poniża statystyka
tβi= $\frac{\hat{\beta_{i}}\ \ \ - \ \sigma}{\hat{\sigma}\ (\hat{\beta_{i}})}$ ∼ t(n-k-1)
brak podstaw do odrzucenia H0 (p ≥ α = 0,05)
Parametr nieistotnie różni się od 0
Odrzucamy H0 na korzyść H1 (p< α =0,05)
Parametr βi istotnie różni się od 0
Testy diagnostyczne
Testy normalności rozkładu składnika losowego – test Jarque – Bera= Doornika- Hansena (gretl)
Hipotezy testowe są następujące:
H0: ξt∼ N( 0; σξ2)
H1: ξt≁ N( 0; σξ2)
A-współczynnik asymetrii, k-kurtoza
Test stałości wariancji składnika losowego -test heteroskedastyczności- test White`a
Hipotezy testowe są następujące
H0: E(ξt)2 = σξ2= constans
H1: E(ξt)2 ≠ σξ2
Przy prawdziwości H0 poniższa statystyka
z2=nR2∼ z2(K)
Testy autokorelacji 1-go rzędu – test Durbina -Watsona
Hipotezy:
H0:𝜚= 0 H0:𝜚= 0
H1:𝜚> 0 lub H1:𝜚< 0
DW(0,2) DW(2,4)
W przypadku weryfikacji hipotezy (1) wykonujemy statystykę DW w przypadku weryfikacji hipotezy (2) weryfikujemy statystyką 4DW.
Jeżeli DW; 4-DE > du to brak podstaw do odrzucenia H0 (autokorelacja reszt w modelu jest nieistotna)
Jeżeli DW; 4-DW < dl to odrzucamy H0 to odrzucamy H0 ( w modelu występuje odpowiednio dodatnia lub ujemna autokorelacja reszt)
Jeżeli d1<DW; 4DW <du to test nie rozstrzyga w występowaniu autokorelacji reszt.
Prognozowanie na podstawie jednorównaniowych modeli ekonometrycznych
Jeżeli przyjęte założenia statystyczne są prawdziwe wartość oczekiwana zmiennej prognozowanej będzie postaci:
E(yT) = E(xTβ + ξT) = E(xTβ) + E (ξT) = xTβ
xT= [ 1xT1 xT2…xTK]
Zgodnie z zasadą predykcji nieobciążonej prognozą zmiennej yT, wyznaczoną w okresie T, nazywać będziemy estymator wartości oczekiwanej zmiennej prognozowanej.
yTP = E(yT) = xT$\hat{\beta}$ lub yTP =$\hat{\beta_{0}}$ + β1xT1 +……+βkxT,k
Błędy prognoz ex ante w warunkach stabilności modelu zapiszemy
ξTP = yT - yTP= xTβ + ξT - xT $\hat{\beta}$ = -xT( $\hat{\beta}$- β) + ξT
Przy spełnieniu założeń stochastycznych oczekiwana błędu prognozy będzie równa 0.
E(ξTP) = E ( yT - yTP) = 0 co oznacza nieobciąożność prognozy
Próbkowe oceny średniego błędu prognozy ex ante zapiszemy zatem następująco:
VT= $\sqrt{\ (\xi_{T}^{P}}$) =
Gdzie 2()= (XTX)-1 jest próbkową macierzą wariancji-kowariancji błędu estymacji.
Wartość prognozy przedziałowej dla modelu ekonometrycznego otrzymujemy ze wzoru
P(yTP - tα, n-k-1VT < yT< yTP+ tα, n-k-1VT) = 1 - α
Gdzie tα, n-k-1 wartość statystyki t- studenta
Ćwiczenia IV
Przykład 1
Wartość kosztów w tys. zł ( y )oraz wartość produkcji w setkach ton ( x1) i zatrudnienia w osobach (x2 ) w pewnej firmie w latach 1997-2006 było następujące:
t | yt | xt1 | xt2 |
---|---|---|---|
1 | 34911 | 10 | 60 |
2 | 35132 | 11 | 72 |
3 | 35642 | 11 | 83 |
4 | 35015 | 9 | 85 |
5 | 36395 | 12 | 91 |
6 | 36521 | 11 | 102 |
7 | 36314 | 12 | 111 |
8 | 37692 | 13 | 123 |
9 | 37612 | 14 | 125 |
10 | 37158 | 13 | 127 |
Oszacuj i zweryfikuj liniowy model kosztów
Wyznacz prognozy punktowe kosztów na kolejne 2 lata wartości zmiennych objaśniających (x1x2) prognozuj za pomocą trendu liniowego.
Oceń dopuszczalność prognoz przyjmując VT* = 3 %
Wyznacz prognozy przedziałowe kosztów przyjmując ich wiarygodność na 95%.
Ad. 1
Model KMNK
$\hat{y_{t}}$= 30177,4 + 309,385xt1 + 25,26xt2
±115,34 ±7,41
R2= 0,935 – 93,5 % zmienności kosztów zostało wyjaśnionych modelem
ϕ2=0,065- 6,5 % zmienności kosztów nie udało się wyjaśnić
300,02- przeciętne odchylenie wartości kosztów teoretycznych od rzeczywistych
Jeśli produkcja wzrośnie o 100 ton to koszty zwiększą się średnio o 309,385 tys. zł ze średnim błędem 115,34 c. p.
Jeśli zatrudnienie wzrośnie o 1 osobę to koszty wzrosną średnio o 25,26 tys. zł ze średnim błędem 7,4 c. p.
b)Badamy statystyczną istotność parametru β1
H0: β1 = 0
H1: β1 ≠ 0
Statystyka t- studenta
t= $\frac{309,38}{115,3}$= 2,68
(7=10-2-1-> n-k-1; n-l.obserwacji; k-l.zmiennych)
t0,05,7 = 2,68 – ponieważ | tβ1> tα | to odrzucamy H0 na korzyść H1, parametr β1 istotnie różni się od zera; produkcja istotnie wpływa na koszty
c)Testy diagnostyczne (badając założenia KMNM)
∼ - posiada
Test Doornika- Hansena
H0: ξt∼ N( 0; σξ2)
H1: ξt≁ N( 0; σξ2)
Testytest normalności rozkładu reszt…
Χ2(2)= 0,406 [0,816]
d)Badanie autokorelacji składnika losowego – Test Durbina-Watsona
H0: = 0
H1: < 0
DW= 2,69, jeżeli DW> 2 to DW` = 4-DW= 1,31
Narzędzia tablice statystyczne DW
dl= 0,69
du= 1,64
dl<DW; 4-DW <du 0,69 <2,69; 1,31<1,64 – test nie rozstrzyga o istotności autokorelacji
2) a) xt1 = α0 + α1t + ξt
Dodawanie zmiennychtime-zmienna czasowa t
ModelKMNK
$\hat{x_{t1}^{P}}$ = 9,4 + 0,4t
Analiza Prognoza..
x11, 1P = 9,4 + 0,4 * 11= 13,8 x12, 1P= 9,4 + 0,4 * 12 = 14,2
xt2 = α0 + α2t + ξt xt2= 55,8+ 7,65t
x11, 2P = 140 x12, 2P= 148
Edytujemy wartości x1 i x2, dodajemy obliczone prognozy
Model KMNK Analiza Prognoza
Prognoza
yTP= xT * $\hat{\beta}$
y11P= [1 13,8 140] * $\left\lceil \begin{matrix} 30177,4 \\ 309,38 \\ 25,26 \\ \end{matrix} \right\rceil$ = 37983,3 tys. zł
lub $\hat{y}$t= 30177,4 + 309,38 *13,8+ 25,26 * 140= 38309,1 tys. zł
y12P = [a 1402 148] * $\left\lceil \begin{matrix} 30177,4 \\ 309,38 \\ 25,26 \\ \end{matrix} \right\rceil$ = 38309,1 tys. zł
3) Ocenić dopuszczalność-> policzyć błędy prognoz
Analiza macierz współczynników kowariancji
V11= $\sqrt{\left\lbrack 1\ \ 13,8\ \ 140 \right\rbrack\begin{bmatrix} 738433 & - 85919,9 & 2729,71 \\ - 85919,9 & 13303,8 & - 698,711 \\ 2729,71 & - 698,711 & 54,91 \\ \end{bmatrix}\begin{bmatrix} 1 \\ 13,8 \\ 140 \\ \end{bmatrix} + {(300,02)}^{2}}$ = 362,3
V12= $\sqrt{\left\lbrack 1\ \ 14,2\ \ 148 \right\rbrack\begin{bmatrix} 738433 & - 85919,9 & 2729,71 \\ - 85919,9 & 13303,8 & - 698,711 \\ 2729,71 & - 698,711 & 54,91 \\ \end{bmatrix}\begin{bmatrix} 1 \\ 14,2 \\ 148 \\ \end{bmatrix} + {(300,02)}^{2}}$ = 380,44
Względny błąd prognozy ex-ante
VT*=$\frac{V_{T}}{y_{T}^{P}}$ * 100= $\frac{362,3}{37983,3}$ =0,95%
V12*= 0,99%
Prognozy są dopuszczalne, gdyż są mniejsze od 3 %.
4. Prognozy przedziałowe
37983,3 – 2,365 * 362,3 ≤ 911 ≤ 37983,3 + 2,365 * 362,3
37126,46≤ 911 ≤38840,07 (odczytujemy z prognozy)
Z prawdopodobieństwem 0,95 przedział o końcach 37126,46 i 38840,07 pokrywa nieznaną wartość kosztów w 2007 r.