Prognozowanie i symulacja
Ćwiczenie 3: „Prognozowanie analogowe na podstawie
metody analogii historycznych”.
Zadanie 1
Przedsiębiorstwo produkuje od dość dawna proszek do prania białej bielizny, prowadząc zarazem rozległą promocję. Proszek ten cieszy się na rynku dużym powodzeniem. Od pewnego momentu przedsiębiorstwo podjęło produkcję płynu do prania bielizny kolorowej, licząc że dzięki utrwaleniu znaku firmowego w świadomości klientów i reklamie płynu, a także małej zmienności otoczenia przedsiębiorstwa, sprzedaż płynu będzie kształtowała się podobnie jak proszku.
Dane odnośnie sprzedaży obu wyrobów przedstawia tabelka:
t |
Sprzedaż proszku |
Sprzedaż płynu |
t |
Sprzedaż proszku |
Sprzedaż płynu |
1 2 3 4 5 6 7 8 9 10 11 12 13 |
105 115 112 107 103 98 93 89 87 92 94 98 100 |
101 105 109 110 112 111 108 104 100 105 92 88 90 |
14 15 16 17 18 19 20 21 22 23 24 25 26 |
104 109 114 116 115 111 102 97 94 88 92 96 99 |
94 97 101 105 109 111 112 113 114 105 102 100 95 |
Polecenie:
Wyznacz prognozę zmiennej „sprzedaż płynu” na tyle jednostek czasu na ile wystarczy rzeczywistych wartości zmiennej „sprzedaż proszku”.
Budowa modelu do podanej treści:
Podane przesłanki są wystarczające by zastosować prognozowanie analogowe. Zmienną opóźnioną (sprzedaż płynu) oznaczamy symbolem (Y), natomiast potencjalną zmienną wiodącą (sprzedaż proszku) oznaczamy symbolem (X). Jako wzór analityczny modelu zmiennej prognozowanej posłużymy się wzorem modelu (1).
Rozwiązanie:
Warunkiem koniecznym stosowania prognozowania za pomocą analogii historycznych jest:
Stwierdzenie podobieństwa kształtu trendów wszystkich zmiennych,
Uwzględnienie występowania opóźnień.
Zgodnie z tym po pierwsze wyznaczamy postać graficzną obu zmiennych w celu porównania kształtu ich trendów:
Legenda:
Seria 1 - sprzedaż proszku (zmienna wiodąca)
Seria 2 - sprzedaż płynu (zmienna opóźniona)
Analiza wzrokowa wykresu graficznego wskazuje że dane dla obu zmiennych układają się w dwa wyraźne cykle wahań. A więc kształt trendów jest podobny.
Wyraźne zarysowanie faz cykli oraz występowanie tylko dwu zmiennych (wiodącej i opóźnionej) skłaniają do zastosowania modelu prognostycznego typu (1)
Kolejną czynnością jest obliczenie opóźnienia (p). Tutaj spotykamy się z sytuacją iż mamy dwie różne wartości opóźnienia. W pierwszym obserwowanym cyklu opóźnienie (
) jednostki czasu. W drugim cyklu (
) jednostek czasu. Mając dwie różne wartości opóźnienia obliczamy średnie opóźnienie (p = 4) jednostki czasu.
Szacujemy model:
metodą najmniejszych kwadratów (MNK).
Model prognostyczny typu (1) można zapisać w postaci:
Y = α0 + α1X1 + ε.
Bądź w zapisie macierzowym:
Y = Xα + ε gdzie:
Y - wektor zmiennej opóźnionej
X - macierz obserwacji zmiennych objaśniających (wiodących)
α - wektor nieznanych parametrów strukturalnych modelu
ε - wektor składnika losowego
Szacowanie powyższego modelu metodą estymacji (MNK) polega na obliczeniu nieznanych wartości parametrów strukturalnych „α”. Dokonuje się tego na podstawie obliczenia wzoru na wektor estymatorów parametrów strukturalnych:
W metodzie tej wzór na wektor estymatorów parametrów modelu jest następujący:
.
Aby obliczyć powyższy wzór należy wykonać następujące działania na macierzach:
transpozycja macierzy,
mnożenie (iloczyn) dwóch macierzy,
odwracanie macierzy.
Przykłady rachunku macierzowego
Przykład na iloczyn dwóch macierzy
x
= Cm x n,
A =
B =
Metody wyznaczania macierzy odwrotnej:
poprzez operacje elementarne wykonywane na wierszach macierzy blokowej:
Jedną z metod wyznaczania macierzy odwrotnej do danej macierzy An x n jest sposób polegający na przekształcaniu przez operacje elementarne wykonywane na wierszach macierzy blokowej
na postać
wówczas B = A-1;
poprzez operacje elementarne wykonywane na kolumnach macierzy blokowej.
Druga metoda odwracania macierzy sprowadza się do tego iż analogicznie wykonując operacje elementarne na kolumnach macierzy blokowej
próbuje się przekształcić ją do postaci
wówczas B = A-1;
Przykład 1:
Wyznaczamy macierz odwrotną do macierzy
, poprzez operacje elementarne wykonywane na wierszach macierzy blokowej
.
Rozwiązanie:
I iteracja:
T3: w2 + w1 x (-2)
II iteracja:
T2: (w3 , w2)
III iteracja:
T3: w1 + w2 x (-4)
T3: w3 + w2 x 8
IV iteracja:
T3: w1 + w3 x (5/7)
V iteracja:
T1: w3 x (-1/7)
Zatem otrzymaliśmy macierz odwrotną do macierzy „A” -
Przykład 2:
Wyznaczamy macierz odwrotną do macierzy
, poprzez operacje elementarne wykonywane na wierszach macierzy blokowej
.
Rozwiązanie:
Obliczenia przeprowadzono w tabeli:
Numer iteracji |
Numer wiersza |
Macierz „A” |
Macierz jednostkowa „I” |
Komentarz |
I |
1 2 3 |
1 2 3 1 3 5 1 5 12 |
1 0 0 0 1 0 0 0 1 |
Wiersz 1 mnożymy przez (-1) i dodajemy do wierszy 2 i 3 |
II |
1 2 3 |
1 2 3 0 1 2 0 3 9 |
1 0 0 -1 1 0 -1 0 1 |
Wiersz 2 mnożymy przez (-2) i dodajemy do wiersza 1, oraz przez (-3) i dodajemy do wiersza 3 |
III |
1 2 3 |
1 0 -1 0 1 2 0 0 3 |
3 -2 0 -1 1 0 2 -3 1 |
Wiersz 3 mnożymy przez (1/3) i dodajemy do wiersza 1. Następnie ten sam wiersz 3 mnożymy przez (-2) i dodajemy do wiersza 2 |
IV |
1 2 3 |
1 0 0 0 1 0 0 0 1 |
11/3 -3 1/3 -7/3 -3 2/3 2/3 -1 1/3 |
Otrzymaliśmy macierz odwrotną |
Przykład na oszacowanie nieznanych parametrów strukturalnych modelu:
Zakładając iż zmienna „Y” oznaczająca popyt na masło w kg/rok zależy w sposób liniowy od wartości dwóch zmiennych:
X1- oznaczającej cenę 1 kostki masła, oraz
X2 - oznaczającej przeciętny dochód miesięczny (w mln zł według starej nominacji złotego);
Polecenie:
Wyznacz oszacowania parametrów strukturalnych liniowego modelu ekonometrycznego.
Dane wyjściowe
Rok |
1994 |
1995 |
1996 |
1997 |
1998 |
1999 |
y |
13,00 |
12,00 |
15,00 |
14,00 |
16,00 |
17,00 |
X1 |
1,10 |
1,00 |
1,20 |
0,90 |
1,30 |
1,50 |
X2 |
9,00 |
8,00 |
7,00 |
5,00 |
4,00 |
4,00 |
Rozwiązanie:
Postać modelu liniowego:
Macierze obserwacji:
Oszacowany model ekonometryczny ma postać:
W efekcie obliczeń rozwiązywanego zadania otrzymujemy model postaci:
Obliczamy prognozy dla wszystkich możliwych jednostek czasu:
Prognoza dla (t=27):
Prognoza dla (t=28):
Prognoza dla (t=29):
Prognoza dla (t=30):
.
Zadanie 2
Dane są wartości zmiennej prognozowanej (Y0) wyrażającej wartość produkcji całkowitej w Gospodarce Narodowej oraz wartości trzech zmiennych (X1), (X2), (X3) uważanych za zmienne opóźnione w stosunku do zmiennej (Y0).
Wartości poszczególnych zmiennych przedstawione zostały w tabeli:
Lp. |
Produkcja całkowita w Gospodarce Narodowej (Y0) |
Wartość kontraktów na budowę nowych zakładów (X1) |
Średnia długość tygodnia pracy robotników (X2) |
Wartość zamówień nowych dóbr konsumpcyjnych (X3) |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 |
2956,23 3265,21 3987,36 4231,25 3854,71 3458,74 3222,10 2987,00 3265,87 3798,26 4065,62 4369,47 3921,54 3985,21 3569,43 3256,73 3049,12 3298,54 3647,81 3995,32 |
1356,87 959,12 887,30 1342,12 1746,89 2046,21 2569,21 1924,37 1724,32 1300,45 1299,12 999,25 1359,32 1745,29 2369,58 2403,60 2568,70 2154,12 1748,30 1569,14 |
1256,32 659,20 741,36 211,36 658,36 1125,56 1469,22 1587,65 1236,54 1295,59 987,21 655,41 344,25 444,33 931,72 1273,32 1541,36 1721,84 1382,74 1341,32 |
1897,25 1897,23 1505,87 1283,46 1551,21 2075,71 2338,29 2640,62 2264,30 2156,90 1849,01 1542,13 1341,57 1588,46 1928,29 2270,64 2541,19 2725,71 2397,37 2174,25 |
Zagadnienie prognostyczne polega na wyznaczeniu prognozy zmiennej (Y0) na tyle momentów czasu na ile pozwolą dostępne zmienne objaśniające.
Rozwiązanie:
Analiza wzrokowa powyższych danych (najlepiej dostrzec to na wykresie graficznym) wykazała, że wszystkie zmienne mają charakter cykliczny. Dodatkowo w analizowanym okresie stwierdzono dwa pełne cykle. Zaobserwowano również opóźnienia między zmienną objaśnianą (zmienna opóźniona) (Y0),a zmiennymi (X1), (X2) oraz (X3). Wielkość opóźnień między zmienną (Y0) a kolejnymi zmiennymi (X) to odpowiednio: 3, 4, 5 i 6 jednostek czasu (analizowano jednocześnie opóźnienia pomiędzy wartościami maksymalnymi jak również pomiędzy wartościami minimalnymi).
Biorąc za podstawę wielkość powyższych opóźnień oraz wykorzystując klasyczną metodę najmniejszych kwadratów (MNK), zbudowano model prognostyczny typu (3)
z trzema zmiennymi objaśniającymi z których każda posiada charakterystyczny dla siebie poziom opóźnienia.
Następnie oszacowano nieznane parametry strukturalne, co w efekcie dało następującą postać modelu:
Wykorzystując tak oszacowany model sporządzono prognozę zmiennej (Y0) na cztery następne jednostki czasu (t = 21, 22, 23 i 24). Prognozowane wartości zmiennej (Y0) wyniosły odpowiednio:
Wykres: Dane rzeczywiste i prognozy odpowiednich zmiennych
Legenda:
Seria 1 - Produkcja całkowita w Gospodarce Narodowej,
Seria 2 - Wartość kontraktów na budowę nowych zakładów,
Seria 3 - Średnia długość tygodnia pracy robotników,
Seria 4 - Wartość zamówień nowych dóbr konsumpcyjnych.
Zastosowanie metody analogii przestrzenno-czasowych”
Zadanie 1
Należy sporządzić prognozę liczby aparatów telefonicznych przyłączonych do sieci centralnej dla Polski w przeliczeniu na 1000 mieszkańców na podstawie informacji o kształtowaniu się tej samej zmiennej w Hiszpanii, Irlandii, Portugalii i na Węgrzech.
Ponieważ we wszystkich wyróżnionych krajach wskaźniki ilości telefonów na 1000 mieszkańców wykazywały w przeszłości zbliżony poziom do Polski (wartości te wyróżniono tłustym drukiem w dołączonej tabeli), postanowiono w procesie prognozowania zastosować łącznie kryterium podobieństwa poziomu i kształtu.
Przyjęto również krytyczną wartość miary podobieństwa funkcji m∗ = 0.8. Wartość zmiennej prognozowanej w Polsce w 1980 roku wynosiła 94,8 aparatów na 1000 mieszkańców. W porównywanych krajach zbliżony poziom tej zmiennej zanotowano: w Hiszpanii 94,3 - w 1966 roku, w Irlandii 94,2 - w 1968 roku, w Portugalii 97,3 - w 1972 roku, a na Węgrzech 92,8 - w 1973 roku.
Granice przedziału pierwotnego Y(0) dla Polski określono datami 1974-1980 (siedem kolejnych obserwacji). W krajach wzorcowych wyodrębniono przedziały o tej samej długości, których początki stanowiły wartości zmiennej najbardziej zbliżonej do wartości zmiennej w Polsce w ostatnim okresie.
Tabela 1: „Liczba aparatów telefonicznych przyłączonych do sieci centralnej
w wyróżnionych krajach na 1000 mieszkańców”
L.p. |
Hiszpania |
Irlandia |
Portugalia |
Węgry |
Polska |
1 |
58,7 |
56,7 |
44,7 |
24,3 |
29,5 |
2 |
62,8 |
64,1 |
48,0 |
36,0 |
31,8 |
3 |
67,0 |
65,0 |
50,7 |
47,6 |
33,8 |
4 |
72,3 |
67,6 |
53,7 |
50,0 |
35,2 |
5 |
79,1 |
72,0 |
57,3 |
53,1 |
38,1 |
6 |
86,5 |
75,5 |
59,8 |
55,7 |
41,0 |
7 |
94,3 |
79,8 |
63,9 |
58,6 |
44,4 |
8 |
103,0 |
97,3 |
67,7 |
62,1 |
47,7 |
9 |
112,0 |
94,2 |
71,6 |
66,6 |
50,9 |
10 |
122,0 |
98,3 |
76,7 |
75,4 |
53,8 |
11 |
135,0 |
104,0 |
82,9 |
79,7 |
57,3 |
12 |
150,0 |
109,0 |
90,0 |
84,2 |
60,0 |
13 |
166,0 |
113,0 |
97,3 |
88,9 |
62,9 |
14 |
182,0 |
120,0 |
106,0 |
92,8 |
66,8 |
15 |
200,0 |
128,0 |
111,0 |
96,8 |
70,9 |
16 |
220,0 |
142,0 |
113,0 |
99,4 |
75,4 |
17 |
239,0 |
152,0 |
116,0 |
101,0 |
79,7 |
18 |
262,0 |
163,0 |
121,0 |
104,0 |
83,9 |
19 |
280,0 |
171,0 |
128,0 |
107,0 |
88,3 |
20 |
315,0 |
174,0 |
132,0 |
111,0 |
91,7 |
21 |
315,0 |
191,0 |
138,0 |
118,0 |
94,8 |
Przypisując końcowym obserwacjom z poszczególnych przedziałów wartość „0”, wyrazom poprzednim kolejne całkowite liczby ujemne, a wyrazom następnym kolejne całkowite liczby dodatnie, przesunięto szeregi czasowe wszystkich krajów, tak by przedział pierwotny Y(0) i pozostałe przedziały Y(k) pokryły się ze sobą.
Wyrównane szeregi czasowe zmiennej w poszczególnych państwach przedstawiono w tabeli 2:
Tabela 2: „Wyrównane w czasie szeregi czasowe analizowanej zmiennej
w poszczególnych krajach”
t |
Hiszpania |
Irlandia |
Portugalia |
Węgry |
Polska |
-9 |
- |
- |
53,7 |
53,1 |
60,0 |
-8 |
- |
56,7 |
57,3 |
55,7 |
62,9 |
-7 |
- |
64,1 |
59,8 |
58,6 |
66,8 |
-6 |
58,7 |
65,0 |
63,9 |
62,1 |
70,9 |
-5 |
62,8 |
67,6 |
67,7 |
66,6 |
75,4 |
-4 |
67,0 |
72,0 |
71,6 |
75,4 |
79,7 |
-3 |
72,3 |
75,5 |
76,7 |
79,7 |
83,9 |
-2 |
79,1 |
79,8 |
82,9 |
84,2 |
88,3 |
-1 |
86,5 |
97,3 |
90,0 |
88,9 |
91,7 |
0 |
94,3 |
94,2 |
97,3 |
92,8 |
94,8 |
1 |
103,0 |
98,3 |
106,0 |
96,8 |
- |
2 |
112,0 |
104,0 |
111,0 |
99,4 |
- |
3 |
122,0 |
109,0 |
113,0 |
101,0 |
- |
4 |
135,0 |
113,0 |
116,0 |
104,0 |
- |
5 |
150,0 |
120,0 |
121,0 |
107,0 |
- |
6 |
166,0 |
128,0 |
128,0 |
111,0 |
- |
7 |
182,0 |
142,0 |
132,0 |
118,0 |
- |
8 |
200,0 |
152,0 |
138,0 |
- |
- |
9 |
220,0 |
163,0 |
- |
- |
- |
10 |
239,0 |
171,0 |
- |
- |
- |
Określono następnie wartość miary podobieństwa funkcji zmiennej dla Polski i pozostałych czterech państw (zgodnie z teorią). Wartości poszczególnych miar wyniosły odpowiednio:
Polska-Hiszpania - 0,9483;
Polska-Irlandia - 0,6539;
Polska-Portugalia - 0,9611;
Polska-Węgry - 0,9776.
Ponieważ miara podobieństwa Polski i Irlandii okazała się niższa od wartości granicznej m∗ = 0.8, dlatego też wyłączono ten kraj z dalszych obliczeń.
Miary podobieństwa pozostałych krajów znacznie przekroczyły poziom wartości krytycznej „ m∗ ”, wydłużono więc ich szeregi podobieństwa o kolejne obserwacje. Zrobiono to w zgodzie z teorią która mówi iż podczas badania podobieństwa obiektów ze względu na wyróżnione zmienne zdarzyć może się że miary podobieństwa poszczególnych par funkcji obliczone dla przedziału pierwotnego obiektu „w0” i przedziałów poszczególnych obiektów „wk” (k ≠ 0) są przynajmniej w kilku przypadkach wyższe od poziomu wartości krytycznej „m∗”. Dla takich par zmiennych należy wówczas dokonać próby wydłużenia przedziałów podobieństwa funkcji (jeżeli pozwala na to materiał statystyczny) o kolejne momenty licząc wstecz od końcowego momentu danego przedziału. Po wydłużeniu należy ponownie obliczyć miarę podobieństwa funkcji i porównać ją z wartością krytyczną „m∗”. postępowanie to należy prowadzić do momentu gdy miary podobieństwa poszczególnych par osiągną poziom „m∗”. Zabieg ten pozwala na wzmocnienie przesłanek prognostycznych, gdyż wskazuje na długotrwałą bliskość tendencji rozwojowych analizowanych zmiennych.
Obliczono ponownie miary podobieństwa funkcji na szeregach wydłużonych odpowiednio o 1, 2 i 3 obserwacje licząc wstecz od końca wstępnie ustalonych szeregów czasowych. Otrzymane wyniki przedstawiono w tabeli 3. (najlepsze wyniki wyróżniono tłustym drukiem):
Tabela 3: „Miary podobieństwa funkcji dla różnych długości szeregów czasowych”
Obserwacje
|
Polska-Hiszpania |
Polska-Irlandia |
Polska-Portugalia |
Polska-Węgry |
0 do -6 |
0,9483 |
0,6539 |
0,9483 |
0,9721 |
0 do -7 |
Brak danych |
Wyłączono z obliczeń |
0,9548 |
0,9725 |
0 do -8 |
Brak danych |
Wyłączono z obliczeń |
0,9510 |
0,9695 |
0 do -9 |
Brak danych |
Wyłączono z obliczeń |
0,9521 |
0,9704 |
Następnie obliczono wartość stałej przesunięcia „Δ(0,k)” oraz wartość współczynników „wi” dla trzech pozostałych państw. Dane przedstawia tabela 4. Na tej podstawie obliczono prognozy cząstkowe dla Polski na podstawie danych z Hiszpanii, Portugalii i Węgier oraz prognozę globalną. Otrzymane wyniki przedstawia tabela 5.
Tabela 4: „Parametry pomocnicze metody analogii przestrzenno-czasowych”
Wartość „Δ(0,k)” oraz „wi” dla poszczególnych par funkcji |
|||
Parametr |
Polska / Hiszpania |
Polska / Portugalia |
Polska / Węgry |
„Δ(0,k)” |
0,50 |
-2,50 |
2,00 |
„wi” |
0,3298 |
0,3320 |
0,3382 |
Tabela 5: „Prognozy cząstkowe i prognoza globalna”
L.p. |
Polska / Hiszpania |
Polska / Portugalia |
Polska / Węgry |
Polska |
1 |
103,5 |
103,5 |
98,8 |
101,91 |
2 |
112,5 |
108,5 |
101,4 |
107,42 |
3 |
122,5 |
110,5 |
103,0 |
111,92 |
4 |
135,5 |
113,5 |
106,0 |
118,22 |
5 |
150,5 |
118,5 |
109,0 |
125,84 |
6 |
166,5 |
125,5 |
113,0 |
134,79 |
7 |
182,5 |
129,5 |
120,0 |
143,77 |
12