TEORIA STEROWNIA
Zajęcia nr 11
Analiza Szeregów Czasowych
SZEREGI CZASOWE
Szereg czasowy - ciąg obserwacji pewnego zjawiska w kolejnych jednostkach czasu [def. statystyczna].
Jeżeli zbiór obserwacji jest ciągły szereg czasowy nazywamy ciągłym. Jeśli zbiór jest dyskretny to szereg nazywamy dyskretnym.
Time-Series Data, Time-related data - dane zmieniające się wraz z upływem czasu; dane zawierające serie (szeregi) wartości / wielkości zmieniających się w czasie.
Wielkości mierzone na skalach liczbowych, na ogól w równych odstępach czasu; Kształt wykresu niesie istotną informacje.
Dane reprezentowane w postaci szeregów czasowych są popularne w wielu zastosowaniach, np.:
Analiza danych giełdowych.
Opracowywanie danych GUS (spójrz Roczniki
Statystyczne lub Biuletyny Statystyczne).
Wspomaganie decyzji w zarządzaniu przedsiębiorstwami, w szczególności tworzenie prognozy sprzedaży a także analiza dynamiki procesów produkcyjnych, zaopatrzenia, zapasów, finansów, siły roboczej.
Analiza danych diagnostycznych i prognozy postępowania w medycynie.
Analiza wyników eksperymentów naukowych.
Analiza szeregów czasowych (ang. time series) jest powiązana z metodami prognozowania (ang. forecasting).
Należy odróżnić time-series data od sequence data.
Szereg dyskretny:
Obserwacje szeregu czasowego w chwilach
oznaczone zostaną przez:
lub
i mierzone są w odstępach h.
Chwile czasowe można zatem opisać również następująco:
Stacjonarne procesy stochastyczne:
proces stochastyczny, w którym wszystkie momenty oraz momenty łączne są stałe.
N - obserwacji
Średnią procesu stochastycznego wyrażona jest wzorem:
gdzie p jest funkcją prawdopodobieństwa, a E oznacza wartość oczekiwaną.
Równanie to można zastąpić korzystając ze wzoru na średnią:
wzorem:
Wariancja określona jest wzorem:
Autokowariancja:
Gdzie k oznacza odstęp między
Autokorelacja:
Którą można zastąpić wzorem:
ZADANIA:
Niżej podane są pomiary temperatury z w reaktorze chemicznym wykonane co minuta:
200,202,208,204,207,207,204,202,199,201,198,200,202,203,205,207,211,204,206,203,203,201,198, 200,206, 207,206,200,203,203,200,200,195,202,204.
Wykonać wykres szeregu
Wykonać wykres zależności
Wykonać wykres zależności
Pierwsze dwie autokorelacje procesu są równe niezerowe, a pozostałe równe zeru. Stwierdzić, Czy proces jest stacjonarny, czy nie?
Aby proces był stacjonarny macierz autokowariancji(symetryczna)
oraz odpowiadająca jej macierz autokorelacji
dla n obserwacji muszą być dodatnio określone.
Rozważając funkcję liniową zmiennych losowych
mamy:
Dla procesu stacjonarnego
wariancja równa jest:
co jest większe od zera, jeżeli nie wszystkie
są zerami.
Załóżmy, że mamy N obserwacji. Korzystając w rozwinięcia Laplace'a do wyznaczania wyznaczników macierzy otrzymywalibyśmy kolejno rozwinięcia względem i tego wiersza i tej kolumny:
Ponieważ rozwijalibyśmy tylko za pomocą kolumny i i wiersza i wynik byłby parzysty, -1 do potęgo parzystej dawało by 1 , więc wyznacznik nie zmieniałby znaku.
Doszlibyśmy w końcu do macierzy:
Zatem wyznacznik macierzy byłby równy:
Proces byłby stacjonarny.
Postępując analogicznie otrzymamy macierz:
Oblicz sty matę funkcji autokowariancji i funkcji autokorelacji dla dziesięciu wartości procesu chemicznego.
ESTYMACJA FUNKCJI AUTOKOWARIANCJI I AUTOKORELACJI
Mamy szereg czasowy
.
N- ilość obserwacji.
Z szeregu czasowego możemy jedynie otrzymać estymatory funkcji autokorelacji.
Z obserwacji innych badaczy wynika, że najbardziej zadawalającym estymatorem autokorelacji
jest:
gdzie
- estymator kowariancji
- średnia szeregu czasowego
-estymator autokowariancji kowariancji
Trzeba wykonać więcej niż 50 obserwacji, a estymowane autokorelacje
powinny być obliczone dla k=0,1,2,…K gdzie K jest w przybliżeniu większe niż N/4.
EX.
N=10
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
z(t) |
47,00 |
64,00 |
23,00 |
71,00 |
38,00 |
64,00 |
55,00 |
41,00 |
59,00 |
48,00 |
Na początku należy obliczyć wartość średnią:
a potem odchylenia wokół wartości średniej:
t |
|
1 |
-4,00 |
2 |
13,00 |
3 |
-28,00 |
4 |
20,00 |
5 |
-13,00 |
6 |
13,00 |
7 |
4,00 |
8 |
-10,00 |
9 |
8,00 |
10 |
-3,00 |
Następnie trzeba policzyć
:
Obliczając wszystkie
możemy przejść do obliczenia
. Otrzymujemy więc:
|
|
|
0 |
189,6 |
1,00 |
1 |
-149,7 |
-0,79 |
2 |
87,6 |
0,46 |
3 |
-57,1 |
-0,30 |
4 |
-23,4 |
-0,12 |
5 |
47,9 |
0,25 |
6 |
-43 |
-0,23 |
7 |
22,8 |
0,12 |
8 |
-7,1 |
-0,04 |
9 |
1,2 |
0,01 |
Oblicz
dla szeregu podanego w ćwiczeniu 1. Wykonać wykres
.
Z szeregu czasowego możemy jedynie otrzymać estymatory funkcji autokorelacji.
Z obserwacji innych badaczy wynika, że najbardziej zadawalającym estymatorem autokorelacji
jest:
gdzie
- estymator kowariancji
- średnia szeregu czasowego
-estymator autokowariancji kowariancji
200, 202,208,204,207,207,204,202,199,201,198,200,202,203,205,207,211,204,206,203,203,201,198, 200,206, 207,206,200,203,203,200,200,195,202,204.
Na początku należy obliczyć wartość średnią:
a potem odchylenia wokół wartości średniej dla każdego t:
t |
|
1 |
-2,89 |
2 |
-0,89 |
3 |
5,11 |
4 |
1,11 |
5 |
4,11 |
6 |
4,11 |
7 |
1,11 |
8 |
-0,89 |
9 |
-3,89 |
10 |
-1,89 |
11 |
-4,89 |
12 |
-2,89 |
13 |
-0,89 |
14 |
0,11 |
15 |
2,11 |
16 |
4,11 |
17 |
8,11 |
18 |
1,11 |
19 |
3,11 |
20 |
0,11 |
21 |
0,11 |
22 |
-1,89 |
23 |
-4,89 |
24 |
-2,89 |
25 |
3,11 |
26 |
4,11 |
27 |
3,11 |
28 |
-2,89 |
29 |
0,11 |
30 |
0,11 |
31 |
-2,89 |
32 |
-2,89 |
33 |
-7,89 |
34 |
-0,89 |
35 |
1,11 |
Następnie trzeba policzyć
:
|
10,96 |
|
5,36 |
|
2,11 |
Obliczając wszystkie
możemy przejść do obliczenia
. Otrzymujemy więc:
|
1 |
|
0,49 |
|
0,19 |
Model autoregresji (AR) rzędu p
Niech p początkowych wag przyjmuje wartości różne od zera
gdzie:
- skończony układ parametrów wagowych
Proces ten nazywamy procesem autoregresji rzędu p lub w skrócie AR(p).
Można również zapisać jako:
lub
gdzie operator:
Proces można traktować jako wyjście
filtru liniowego z funkcją przenoszenia
, w którym wejściem jest biały szum
, dlatego:
Model średniej ruchomej (MA) rzędu q
Niech p początkowych wag przyjmuje wartości różne od zera
gdzie:
- skończony układ parametrów wagowych
Proces ten nazywamy procesem średniej ruchomej rzędu q lub w skrócie MA(q).
Można również zapisać jako:
lub
gdzie operator:
Warunki odwracalności:
Mieszany model autoregresji i średniej ruchomej (ARMA) rzędu p i q
Niech p początkowych wag przyjmuje wartości różne od zera
gdzie:
- skończony układ parametrów wagowych
Proces ten nazywamy procesem średniej ruchomej rzędu q lub w skrócie ARMA(p,q).
Można również zapisać jako:
lub
gdzie operator:
Oznaczenia - symbole i definicje.
Dla liniowego równania różnicowe postaci:
przy czym
są nieznanymi wartościami parametrów obiektu, wielkości
znanymi wielkościami wyjścia,
znanymi wielkościami wejścia, natomiast
to zakłócenia.
Model ten nazywany jest modelem autoregresji i średniej ruchomej w skrócie ARMA.
Model ten da się zapisać za pomocą jednego wzoru:
gdzie przez
oznaczamy wektor regresji, a przez
wektor współczynników modelu.
W przypadku wyżej wymienionego modelu przez te oznaczenia rozumiemy:
Przyjmując, że zakłócenia
są zmiennymi losowymi o wartości oczekiwanej:
I macierz kowariancji:
Metoda najmniejszych kwadratów (Least Squares - LS)
Współczynniki równania można znaleźć za pomocą wzoru:
gdzie Y oznacza macierz o wymiarze
gdzie
postaci:
Rozszerzona metoda najmniejszych kwadratów (Extended Least Squares - ELS)
Metoda ELS jest rozszerzeniem metody LS na układy, w których zakłócenia są ze sobą skorelowane. Model ten da się zapisać za pomocą wzoru:
gdzie przez
oznaczamy wektor regresji, a przez
wektor współczynników modelu.
W przypadku wyżej wymienionego modelu przez te oznaczenia rozumiemy:
Współczynniki równania można znaleźć za pomocą wzoru:
gdzie Y oznacza macierz o wymiarze
gdzie
postaci: