Modele ARIMA w
Modele ARIMA w
prognozowaniu
prognozowaniu
Indeks WIG20 w okresie od 25
marca 1999 do 21 marca 2000.
Indeks WIG20 - różnice
Indeks WIG20 - funkcja ACF dla
różnic
Dopasowanie modelu AR(1) do różnic z
WIG20.
1.
Dokonamy estymacji parametrów w
tym modelu
2.
Narysujemy reszty po dopasowaniu
tego modelu do różnic WIG20.
3.
Jeśli reszty będą białym szumem -
oznaczać to będzie dobre
dopasowanie.
Wykres funkcji ACF dla reszt w
modelu AR(1)
Reszty nie są białym szumem.
Ponieważ rysunek reszt w modelu AR(1) dla
różnic zawiera istotne wartości
(przekraczające linie przedziału ufności),
postanawiamy dopasować do różnic model
ARMA(1,1).
Jest to model mieszany, ponieważ łączy
elementy modelu AR(1) z modelem MA(1)
Jeśli dopasowanie jest poprawne, wtedy reszty
powinny być białym szumem.
Wzór modelu ARMA(1,1)
Szereg czasowy spełnia równanie
ARMA(1,1), jeśli
gdzie Φ
1
i θ
1
to parametry do wyestymowania,
c jest stał¡, natomiast ε
t
to biały szum
Dopasowanie modelu ARMA(1,1) polegać
będzie na estymacji parametrów Φ
1
i θ
1
.
Jeśli dopasowanie jest poprawne, wtedy reszty
ε
t
powinny być białym szumem
1
1
1
1
t
t
t
t
c
Y
Y
Wartości estymatorów w modelu
ARMA(1,1) wynoszą
Φ
1
= -0,1199
θ
1
= 0,925
Wykres funkcji ACF dla reszt w
modelu ARMA (1;1)
Możemy więc stwierdzić, ze do różnic
WIG20 pasuje dobrze model
ARMA(1,1) albo ze do wyjściowych
danych WIG20 pasuje model
ARIMA(1,1,1)
Ogólna definicja modelu
ARIMA (p,d,q)
Litera d.
Wyjściowe dane należy zróżnicować d razy. W
zastosowaniach rozważamy zazwyczaj dwie
możliwości d=1 oraz d=2.
Dwukrotne (d=2 ) różnicowanie oznacza, że
obliczamy najpierw różnice z wyjściowych
danych, a potem jeszcze raz różnice z różnic.
Litery p i q
Po zastosowaniu d - krotnego różnicowania
dopasowujemy do danych model ARMA (p,q)
Kryteria informacyjne jako
Kryteria informacyjne jako
metoda identyfikacji modelu
metoda identyfikacji modelu
ARMA
ARMA
W celu wyznaczenia rzędu opóźnień modelu
W celu wyznaczenia rzędu opóźnień modelu
ARMA przyjmuje się relatywnie wysokie p i q
ARMA przyjmuje się relatywnie wysokie p i q
(np. ARMA (5;5)) i szacuje modele
(np. ARMA (5;5)) i szacuje modele
zawierające wszystkie możliwe kombinacje p
zawierające wszystkie możliwe kombinacje p
≤ 5 i q ≤ 5 , następnie wylicza się kryteria:
≤ 5 i q ≤ 5 , następnie wylicza się kryteria:
gdzie: T – liczba obserwacji
gdzie: T – liczba obserwacji
k – liczba szacowanych parametrów
k – liczba szacowanych parametrów
- estymator największej wiarygodności
- estymator największej wiarygodności
wariancji reszt
wariancji reszt
k
T
AIC
2
ˆ
ln
2
2
ˆ
Wybrany zostaje model, dla którego
Wybrany zostaje model, dla którego
utrata informacji jest najmniejsza
utrata informacji jest najmniejsza
To znaczy taki model, dla którego AIC
To znaczy taki model, dla którego AIC
przyjmuje wartość najmniejszą
przyjmuje wartość najmniejszą
Własność teoretyczna ACF i
Własność teoretyczna ACF i
PACF typu ARMA
PACF typu ARMA
Proces
Proces
ACF
ACF
PACF
PACF
AR (p)
AR (p)
Nieskończona,
Nieskończona,
zanikająca
zanikająca
(zanikające
(zanikające
funkcje wykładnicze lub
funkcje wykładnicze lub
sinusoidy tłumione)
sinusoidy tłumione)
Skończona, urywa się
Skończona, urywa się
po odstępie p
po odstępie p
MA (q)
MA (q)
Skończona, urywa się
Skończona, urywa się
po odstępie q
po odstępie q
Nieskończona,
Nieskończona,
zanikająca
zanikająca
(zanikające
(zanikające
funkcje wykładnicze lub
funkcje wykładnicze lub
sinusoidy tłumione)
sinusoidy tłumione)
ARMA
ARMA
(p;q)
(p;q)
Nieskończona,
Nieskończona,
zanikająca
zanikająca
(po
(po
pierwszych q-p
pierwszych q-p
odstępach zanikające
odstępach zanikające
funkcje wykładnicze lub
funkcje wykładnicze lub
sinusoidy tłumione)
sinusoidy tłumione)
Nieskończona,
Nieskończona,
zanikająca
zanikająca
(po
(po
pierwszych q-p
pierwszych q-p
odstępach zanikające
odstępach zanikające
funkcje wykładnicze lub
funkcje wykładnicze lub
sinusoidy tłumione)
sinusoidy tłumione)
B Y
B Y
t
t
= Y
= Y
t-1
t-1
B (B Y
B (B Y
t
t
) = B
) = B
2
2
Y
Y
t
t
= Y
= Y
t-2
t-2
B
B
12
12
Y
Y
t
t
= Y
= Y
t-12
t-12
różnicowanie Y’
różnicowanie Y’
t
t
= Y
= Y
t
t
–Y
–Y
t-1
t-1
=Y
=Y
t
t
–B Y
–B Y
t
t
=(1-
=(1-
B)Y
B)Y
t
t
Y’’
Y’’
t
t
= Y’
= Y’
t
t
–Y’
–Y’
t-1
t-1
=(Y
=(Y
t
t
-Y
-Y
t-1
t-1
)-(Y
)-(Y
t-1
t-1
-Y
-Y
t-2
t-2
)=
)=
= Y
= Y
t
t
-2Y
-2Y
t-1
t-1
+Y
+Y
t-2
t-2
=(1-2B+B
=(1-2B+B
2
2
) Y
) Y
t
t
=(1-B)
=(1-B)
2
2
Y
Y
t
t
ARIMA (1;0;1)
ARIMA (1;0;1)
Y
Y
t
t
= c +
= c +
φ
φ
1
1
Y
Y
t-1
t-1
+ e
+ e
t
t
–
–
θ
θ
1
1
e
e
t-1
t-1
φ
φ
1
1
= 0,3
= 0,3
θ
θ
1
1
= -0,7 c = 7
= -0,7 c = 7
(1-
(1-
φ
φ
1
1
B) Y
B) Y
t
t
= c + (1-
= c + (1-
θ
θ
1
1
B) e
B) e
t
t
AR(1) MA(1)
AR(1) MA(1)
Y
Y
t
t
-
-
φ
φ
1
1
Y
Y
t-1
t-1
= c + e
= c + e
t
t
-
-
θ
θ
1
1
e
e
t-1
t-1
Y
Y
t
t
= 7 + 0,3 Y
= 7 + 0,3 Y
t-1
t-1
– 0,7 e
– 0,7 e
t-1
t-1
Sezonowość w modelach
ARIMA (p,d,q)
Po pierwsze: przedstawimy sposoby
identyfikacji sezonowości w modelach
ARIMA (p,d,q).
Po drugie: przedstawimy metody
estymacji parametrów modeli
sezonowych ARIMA.
Po trzecie: przedstawimy sposób
obliczania prognoz w takich modelach.
Wartości indeksu Moody’ego w
Wartości indeksu Moody’ego w
okresie od stycznia 1947 do lutego
okresie od stycznia 1947 do lutego
1992
1992
Wartości indeksu Moody'ego po
różnicowaniu
Funkcji ACF i PACF dla różnic
(R
t
=Y
t
-Y
t-1
) indeksu Moody'ego
Funkcji ACF i PACF dla różnic
(Z
t
=R
t
-R
t-5
) indeksu Moody'ego
- 1 .0 0
- .8 0
- .6 0
- .4 0
- .2 0
.0 0
.2 0
.4 0
.6 0
.8 0
1 .0 0
0
5
1 0
1 5
2 0
2 5
3 0
3 5
4 0
S a m p l e A C F
- 1 .0 0
- .8 0
- .6 0
- .4 0
- .2 0
.0 0
.2 0
.4 0
.6 0
.8 0
1 .0 0
0
5
1 0
1 5
2 0
2 5
3 0
3 5
4 0
S a m p l e P A C F
Do w/w indeksu Moody'ego
dopasujemy model (sezonowy)
ARIMA (2;1;0) (3;0;0)
5
1.
1.
Różnicowanie zmiennych R
Różnicowanie zmiennych R
t
t
= Y
= Y
t
t
– Y
– Y
t-1
t-1
2.
2.
Model AR(3) sezonowy
Model AR(3) sezonowy
Z
Z
t
t
= R
= R
t
t
–
–
Ф
Ф
1
1
R
R
t-5
t-5
–
–
Ф
Ф
2
2
R
R
t-10
t-10
–
–
Ф
Ф
3
3
R
R
t-15
t-15
3. Model AR(2)
3. Model AR(2)
Z
Z
t
t
–
–
φ
φ
1
1
Z
Z
t-1
t-1
–
–
φ
φ
2
2
Z
Z
t-2
t-2
= e
= e
t
t
Z
Z
t
t
=
=
φ
φ
1
1
Z
Z
t-1
t-1
+
+
φ
φ
2
2
Z
Z
t-2
t-2
+ e
+ e
t
t
Funkcji ACF i PACF dla reszt z
modelu ARIMA (3;1;0) (3;0;0)
5
W modelu ARIMA (2;1;0) (3;0;0)
W modelu ARIMA (2;1;0) (3;0;0)
5
5
wartości estymatorów parametrów
wartości estymatorów parametrów
wynosiły:
wynosiły:
φ
φ
1
1
= 0,49
= 0,49
φ
φ
2
2
= -0,31
= -0,31
Ф
Ф
1
1
=
=
0,17
0,17
Ф
Ф
2
2
=
=
0,13
0,13
Ф
Ф
3
3
=
=
-0,13
-0,13
ARIMA (p;d,q) (P;D;Q)
ARIMA (p;d,q) (P;D;Q)
s
s
ARIMA (1,1,1) (1,1,1)
ARIMA (1,1,1) (1,1,1)
4
4
(1-
(1-
φ
φ
1
1
В
В
)(1-
)(1-
Ф
Ф
1
1
B
B
4
4
)
)
(1-B)(1-B
(1-B)(1-B
4
4
)Y
)Y
t
t
=(1-
=(1-
θ
θ
1
1
B)(1-
B)(1-
ΘB
ΘB
4
4
)e
)e
t
t
nie
sezonowa
AR(1)
sezonow
a AR(1)
różnicowani
e nie
sezonowe Y
t
– Y
t-1
różnicowani
e sezonowe
nie
sezonowe
MA(1)
sezonow
e MA(1)
Y
Y
t
t
= (1+
= (1+
φ
φ
1
1
)
)
Y
Y
t-1
t-1
-
-
φ
φ
1
1
Y
Y
t-2
t-2
+(1+
+(1+
Ф
Ф
1
1
)
)
Y
Y
t-4
t-4
–
–
-
-
(1+
(1+
φ
φ
1
1
+Ф
+Ф
1
1
+
+
φ
φ
1
1
Ф
Ф
1
1
)
)
Y
Y
t-5
t-5
+(
+(
φ
φ
1
1
+
+
φ
φ
1
1
Ф
Ф
1
1
)Y
)Y
t-6
t-6
–
–
-
-
Ф
Ф
1
1
Y
Y
t-8
t-8
+(
+(
Ф
Ф
1
1
+
+
φ
φ
1
1
Ф
Ф
1
1
)
)
Y
Y
t-9
t-9
-
-
φ
φ
1
1
Ф
Ф
1
1
Y
Y
t-10
t-10
+
+
+ e
+ e
t
t
-
-
θ
θ
1
1
e
e
t-1
t-1
-
-
Θ
Θ
1
1
e
e
t-4
t-4
+
+
θ
θ
1
1
Θ
Θ
1
1
e
e
t-5
t-5
ARIMA (p;d,q) (P;D;Q)
ARIMA (p;d,q) (P;D;Q)
s
s
ARIMA (2,1,0) (3,0,0)
ARIMA (2,1,0) (3,0,0)
5
5
(1-
(1-
φ
φ
1
1
В
В
-
-
φ
φ
2
2
В
В
2
2
)(1-
)(1-
Ф
Ф
1
1
B
B
5
5
-
-
Ф
Ф
2
2
B
B
10
10
-
-
Ф
Ф
3
3
B
B
15
15
)
)
(1-
(1-
B)Y
B)Y
t
t
=
=
e
e
t
t
nie
sezonowa
AR(2)
sezonowa AR(3)
różnicowani
e nie
sezonowe Y
t
– Y
t-1
Ilość użytkowników Internetu
Ilość użytkowników Internetu
(minuty)
(minuty)
ARIMA (p;d,q)
ARIMA (p;d,q)
ARIMA (3,1,0)
ARIMA (3,1,0)
(1-
(1-
φ
φ
1
1
В
В
-
-
φ
φ
2
2
В
В
2
2
–
–
φ
φ
3
3
В
В
3
3
)(1-B)Y
)(1-B)Y
t
t
=
=
e
e
t
t
nie
sezonowa
AR(2)
różnicowani
e nie
sezonowe Y
t
– Y
t-1
Wielkość sprzedaży
Wielkość sprzedaży