Wyznaczanie rzędu autoregresji
Teoria Prognozy
Modele autoregresyjne
z uwzględnieniem opóźnień zmiennej zależnej
Krzysztof Glapiak
Matematyka Finansowa
25 maja 2015
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Model Autoregresji
Model AR(p) można zapisać w ogólnej postacji:
Y
t
= f (Y
t−1
, Y
t−2
, ..., Y
t−p
, ξ)
W praktyce najczęściej przyjmuje się, że funkcja f jest liniowa lub logartymiczno
- liniowa. W przypadku funkcji liniowej, model autoregresji jest postaci:
Y
t
= a
0
+
p
X
i =1
a
i
Y
t−i
+ ξ
t
gdzie:
Y
t
- prognozowana zmienna losowa
Y
t−i
- prognozowana zmienna losowa opóźniona w czasie (i= 1,2,...,p)
a
0
, a
1
, ..., a
p
- parametry modelu
p - rząd autoregresji
ξ
i
- składnik losowy
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Paramatery modelu będziemy szacować za pomocą metody
najmniejszych kwadratów, która nie jest najefektywniejsza lecz jest
prostsza w obliczeniach numerycznych.
Oznaczenia
Parametry modelu będziemy estymować w oparciu o n wartości
szeregu czasowego (y
i
)
i =1,...,n
y-wektor o rozmiarach (n - p)× 1 zaobserwowanych wartości
prognozowanej zmiennej
X - macierz o wymiarach (n-p)× (p+1), której pierwsza
kolumna składa się z jedynek,a pozostałe z zaobserwowanych
wartości zmiennej opóźnionej
a - wektor o rozmiarach (p + 1) × 1 nieznanych parametrów
ξ - wektor składników losowych o rozmiarach (n - p) × 1
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
y =
y
p+1
y
p+2
.
.
y
n
X =
1
y
p
y
p−1
...
y
1
1
y
p+1
y
p
...
y
2
.
.
.
...
.
.
.
.
...
.
1
y
n−1
y
p−2
...
y
n−p
a =
a
0
a
1
.
.
a
p
ξ =
ξ
p+1
ξ
p+2
.
.
ξ
n
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Przy takiech oznaczeniach model można zapisać w postaci:
y = X a + ξ
Stosując metodę najmniejszych kwadratów orzymujemy wektor
wartości poszukiwanych parametrów.
a = (X
0
X)
−1
X
0
y
gdzie X
0
oznacza transpozycję
macierz odwrotna (X
0
X)
−1
istnieje
W wyniku estymacji parametrów modelu otrzymujemy postać:
y = X a + e
gdzie e - macierz reszt o wymiarach (n-p) × 1
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Dane, które posłużą nam do zobrazowania modelu porzedstawiają kwartalną
produkcję wyrobów z gumy i tworzyw sztucznych w Polsce w latach 1992 - 2000
Data
Produkcja
Data
Produkcja
sty-92
298,3
lip-96
809,9
kwi-92
296,2
paź-96
752,8
lip-92
345,1
sty-97
679,6
paź-92
362,8
kwi-97
783,9
sty-93
356,9
lip-97
817,1
kwi-93
428,2
paź-97
802,9
lip-93
378,2
sty-98
801,3
paź-93
376,8
kwi-98
911,2
sty-94
373,5
lip-98
960
kwi-94
418,5
paź-98
895,8
lip-94
474,7
sty-99
779,4
paź-94
516,1
kwi-99
909,9
sty-95
552,3
lip-99
1075,2
kwi-95
634,7
paź-99
1040,5
lip-95
702,8
sty-00
877,1
paź-95
708,4
kwi-00
989
sty-96
635,7
lip-00
1041
kwi-96
754,4
paź-00
949,1
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Wyznaczanie rzędu autoregresji
Wyznaczanie rzędu autoregresji
Wartość rzędu autoregresji p można ustalić wykorzystując metody
bazujące na zachowaniu się empirycznych funkcji autokorelacji i
autokorelacji cząstkowej (ACF i PACF). Innym sposobem jest
szacowanie parametrów modelu dla różnych opóźnień.
Wybór p dokonujemy za pomocą funkcji:
SR(k) = ln S
2
e
(k) +
k
n
ln n
Gdzie k - rząd autoregresji,
k ∈ (1, 2, ..., K )
K- maksymalny rząd autoregresji
S
2
e
jest nieobciążonym estymatorem wariancji błędu losowego
S
2
e
=
e
0
e
N − K
=
e
0
e
(n − p) − (p + 1)
N - liczba obserwacji
P - liczba estymowamych parametrów
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Wyznaczanie rzędu autoregresji
Wartości funkcji SR obliczamy dla modeli autoregresji o kolejnych
rzędach opóźnień i następnie wypieramy takie p spełniające
warunek:
SR(p) = min
k
SR(k), k ∈ (1, 2, ..., K )
Dla naszych danych mamy:
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Istotność parametrów
Po wyznaczeniu rzędu autoregresji należy obliczyć miary
dopasowania by sprawdzić jak model opisuje naszą zmienną losową.
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Istotność parametrów
Macierz wariancji i kowariancji
Macierz wariancji i kowariancji parametrów modelu jest postaci:
Var (a) =
Var (a
0
)
Cov (a
1
, a
o
)
...
Cov (a
p
, a
0
)
Cov (a
0
, a
1
)
Var (a
1
)
...
Cov (a
p
, a
1
)
.
.
.
...
.
.
.
...
Cov (a
0
, a
p
)
...
...
Var (a
p
)
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Istotność parametrów
Obliczamy wartości macierzy wariancji-kowariancji:
Var (a) = Var ((X
0
X)
−1
X
0
y) = Var ((X
0
X)
−1
X
0
(Xa + e)) =
= Var (a + (X
0
X)
−1
X
0
e) = (X
0
X)
−1
X
0
Var (e)
|
{z
}
S
2
e
I
X(X
0
X)
−1
=
= S
2
e
(X
0
X)
−1
X
0
X(X
0
X)
−1
= S
2
e
(X
0
X)
−1
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Istotność parametrów
Współczynniki zbieżnośi i determinacji
Współczynnik determinacji (R
2
) oraz zbieżności (ϕ
2
) są jednymi z
podstawowych miar dopasowania modelu. Współczynnik R
2
informuje jaka
część zmienności zmiennej objaśnianej została wyjaśniona przez model,
natomiast ϕ
2
jaka część nie została wyjaśniona.
Zachodzi:
1 − R
2
= ϕ
2
ϕ
2
=
e
0
e
P
n
i =p+1
(y
i
− ¯
y )
2
gdzie ¯
y jest średnią arytmetyczną wartości szeregu od momentu p+1
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Współczynnik zmienności losowej
Współczynnik V
e
informuje jaką część średniej wartości badanego
zjawiska stanowi odchylenie standardowe reszt. Im niższa wartość
współczynnika tym model lepiej jest dopasowany do danych
empirycznych.
V
e
=
S
e
¯
y
S
e
=
q
S
2
e
jest estymatorem odchylenia standardowego
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Istotność parametrów
Do zbadania czy wyestymowane parametry a
i
∈ a są istotne
posłużymy się statystyką testową t-Studenta.
t
a
i
=
|a
i
|
p
Var (a
i
)
H
0
: a
i
= 0
H
A
: a
i
6= 0
Hipotezę H
0
odrzycamy gdy t
a
i
> t
α:df
Gdzie t
α:df
to wartość odczytana z tablic rozkładu t-Studenta na poziomie
istotności α z df stopniami swobody
df = N − P = (n − p) − (p − 1)
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Macierz wariancji i kowariancji
Współczynniki zbieżnośi i determinacji
Współczynnik zmienności losowej
Poniższe tabele przedstawiają obliczone wartości wyestymowanych parametrów
a, miary dopasowania modelu oraz testy istotności dla parametrów
Z powyzszych tabel odczytujemy, że wszystkie parametry modelu są istotnie
różne od zera. Współczynnik zmienności losowej wynosi niecałe 8% a z wartości
współczynnika R
2
odczytujemy, że model opisuje prawie 95% analizowanej
zmiennej losowej, więc nasz model jest dobrze dopasowany do danych
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Obliczanie wartości prognoz
Prognozy będziemy obliczać sekwencyjnie, czyli do obliczenia
prognozy na okres n + h korzystamy z wartości prognozy z okresu
n + h − 1
y
p
T
= ca =
h
1
y
T −1
y
T −1
...
y
T −p
i
a
0
a
1
.
.
.
a
p
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Ocenę średniego błędu predykcji ex ante na okres T wyznaczamy ze wzoru:
S
D
T
=
p
S
2
e
(1 + e(X
0
X)e
0
)
Natomiast błąd względny wynosi:
V
D
T
=
S
D
T
y
p
T
Błędy względne dla wyznaczonych prognoz wynoszą ok 6% więc
można uznać prognozy za dopuszczalne
Krzysztof Glapiak
Wyznaczanie rzędu autoregresji
Krzysztof Glapiak