Microsoft Word - EKONOMETRIA

EKONOMETRIA

Dr Stanisław Barczak

Klein – schematyczne uproszczenie rzeczywistości, pomijające nieistotne aspekty.

Specyfikacja  modelu  ekonometrycznego  –  sprecyzowanie  zmiennych  objaśniających,  zmiennych  objaśnianych
(endogenicznych), podjęcie decyzji co do charakteru występujących w modelu związków oraz podjęcie decyzji co
do postaci analitycznej modelu (liniowa, nieliniowa sprowadzalna do liniowej, strikte nieliniowa).
Specyfikacja  modelu  ekonometrycznego  opiera  się  na  informacjach  „a  priori”  (teorie  ekonomiczne)  oraz
informacjach z badań empirycznych.

Informacja „a priori”:

istniejące teorie ekonomiczne

ogólnie znane zależności ekonomiczne typu rozrachunkowego lub bilansowego

informacje pochodzące z poprzednio prowadzonych badań ekonometrycznych – są podstawą do nowych
rozwiązań

informacje o ustalonych instytucyjnie wartościach odnoszących się do pewnych zmiennych
ekonometrycznych (np. oprocentowanie kredytów, stopa dyskontowa, stopa podatku etc.)

Jednorównaniowy model ekonometryczny:
Y = f(X1,X2....Xk,

)

Y- zmienna endogeniczna (objaśniana) – to wyróżnione zjawiska ekonomiczne, które są opisywane (wyjaśniane)
przez poszczególne równania lub równanie modelu.
X1-Xk – zmienne objaśniające – służą do opisu, wyjaśniania zmian zmiennych endogenicznych, w modelu jest ich
pewna ilość

(ksi) – składnik losowy – część stochastyczną modelu, jest zmienną losową o wartości oczekiwanej (E(

)=0) i

rozkładzie normalnym, nie jest elementem pozytywnym.

Nigdy nie możemy powiedzieć, że znaleźliśmy wszystkie zmienne X.

- zawiera w sobie błąd jaki popełniamy, gdyby nie on to można idealnie przewidzieć np. kursy walut.,

jest

pozostałymi zmiennymi X, nieuwzględnionymi w modelu.

W modelu ekonometrycznym składnik losowy wynika z:

uwzględnienia wpływu wszystkich czynników mało istotnych, niewyspecyfikowanych w równaniu bądź
równaniach modelu

z różnic pomiędzy przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości

błąd pomiaru zmiennych

czynniki losowe wpływające na zmienną endogeniczną (np. pobór energii elektrycznej)

Jeśli dobieramy złą postać analityczną to „zwiększamy” wskaźnik losowści.

Przykład 1
Zbudujmy model ekonometryczny popytu na kompot z wiśni. Wyspecyfikujemy Y.
Yt – popyt na kompot z wiśni
X1t – cena kompotu z wiśni
X2t – cena kompotu z czereśni

- składnik losowy

Do konstrukcji modelu wykorzystujemy dane empiryczne.
Model w sensie ogólnym Yt = f(X1t,X2t,

Trzeba znaleźć postać analityczną modelu dla pełnej jego specyfikacji.

Yt = f(Yt-

;

) – cena kompotu zależy tylko od czasu – jest to postać autoregresyjna.

Rzeczą bardzo istotną – odpowiednie wyspecyfikowanie opóźnienia czasowego.

Przykład:
Model liniowy jednorównanionwy
Yt =

ξξξξ

Jest to model przyczynowo-skutkowy, z jedną zmienną objaśniającą, gdzie

1 i

0(parametr wolny) to parametry

strukturalne.
Model dzieli się na dwie części: deterministyczną i stochastyczną (pogrubiona)
Do takiej specyfikacji ekonometryk musi wybrać odpowiednie zmienne o charakterze liniowym.

6 etapów budowy modeli ekonometrycznych.

1. Określenie celu oraz zakresu badania (potrzebne: wiedza i praktyka z zakresu teorii ekonomii i statystki).

EKONOMETRIA

Dr Stanisław Barczak

2. Specyfikacja modelu ekonometrycznego (określenie zmiennych – endogenicznych i objaśniających oraz

postać  analityczna  modelu).  Dodatkowo  należy  określić  źródła  danych  oraz  ich  wiarygodność.  Od  tego
etapu  zależy  powodzenie  przedsięwzięcia  budowy  modelu  ekonometrycznego.  Daje  nam  to  analityczną
postać  modelu,  wstępną  postać  modelu  –  można  ją  określić  jako  hipotezę  badawczą  –  przypuszczenie  o
stanie procesu przed przeprowadzeniem badania, musi być jednoznacznie weryfikowalna.

3. Gromadzenie odpowiednich danych statystycznych na podstawie których zostaną oszacowane parametry

strukturalne modelu ekonometrycznego. Parametry nigdy nie będą znane (będą to tylko parametry
szacunkowe)

4. Estymacja parametrów strukturalnych modelu
Y

= a

+ a

+ U

oszacowany model ekonometryczny, parametry „a” są już konkretnie

oszacowanymi wartościami.
Nie istnieje uniwersalna metoda szacowania parametrów strukturalnych.
Dobór odpowiedniego estymatora (można „rozluźnić” warunki stosowania estymatorów).
Dokonuje się weryfikacji modelu ekonometrycznego (jeśli weryfikacja nie przejdzie pomyślnie to powrót do
etapu 1.)
5. Praktyczne wykorzystanie modelu ekonometrycznego. Dokonanie badanej analizy na podstawie

historycznych danych. Wykorzystuje się do przewidywania przyszłości – narzędzie do budowy prognoz,
oraz wykorzystuje się je do eksperymentów symulacyjnych.

6. Możemy to dokonać w odpowiednich warunkach prac nad modelem makroekonomicznym.

Często wszystkie te etapy prowadzone są równolegle.

Klasyfikacja modeli ekonometrycznych:
1. Na podstawie cech budowy modeli oraz typu modeli

analityczno opisowe – opisujące stan rzeczy w danym momencie czasu, wykorzystanie prawidłowości
rządzących systemem

prognostyczne – przewidywanie stanu w przyszłości, jeżeli analityczno-opisowy jest dobrze dopasowany to
jego też można wykorzystać do prognoz

symulacyjne i sterowania – analiza symulacyjna i sterowania

liniowe

3 zmienne objaśniające nie uwzględnia wpływu czasu – model statyczny

t-1

model dynamiczny – mamy zmienną opóźniającą, uwzględnia upływ czasu.

nieliniowe – sprowadzalne do liniowych

hiperboliczne

kwadratowy niezupełny

nieliniowe

trend logistyczny (dynamiczny do badania trendu)

−

3. Ze względu na udział czynnika:

statyczne

dynamiczne -> nie ma zależności tylko przyczynowo-skutkowej, bo nie zależy tylko od czasu.

4. Ze względu na walory poznawcze:

przyczynowo-opisowe – zmienne endogeniczne (skutek), a zmienna objaśniająca (przyczyny) i parametry
strukturalne świadczą o sile związku pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi.

symptomatyczne  –  modele,  w  których  pomiędzy  zmienną  endogeniczną,  a  zmiennymi  objaśniającymi
zachodzi silna korelacja, natomiast interpretacja przyczynowo-skutkowa jest nieuprawniona; stosuje się gdy
brak jest podstaw do oczekiwania przyczynowości badanej relacji ekonomicznej (brak akceptowanej teorii
ekonomicznej)  lub  gdy  zmienne  reprezentujące  przyczyny  bądź  skutek  (zmienne  objaśniające)  są
nieobserwowalne, takie modele stosuje się często  wobec prognozowania gospodarczego

tendencji rozwojowych – modele trendu, w nich jedyną zmienna objaśniającą jest zmienna czasowa
(pomija się w nim tak na dobrą sprawę istotne czynniki, co powoduje zwiększenie się czynnika losowości)

Miary jakości modelu:

stopień dopasowania modelu do danych empirycznych

EKONOMETRIA

Dr Stanisław Barczak

dokładność parametru modelu (dokładne oszacowanie parametrów strukturalnych modelu)

wartość informacyjna modelu

sensowność interpretacji parametrów (jeśli nie ma sensownej to model nie nadaj się do niczego)

wartość prognostyczna modelu

Wg Tinbergena – należy patrzeć (przy wyborze modelu etc.): jaka relacja tak na dobrą sprawę nas interesuje, jeśli
znamy dobrze zagadnienie ekonomiczne to „intuicja nam podpowie, którą metodę wybrać”

DOBÓR ZMIENNYCH OBJAŚNIAJĄCYCH DO MODELU LINIOWEGO-

JEDNORÓWNANIOWEGO

Musi być znana zmienna endogeniczna.

Y

= f(X

, X

...X

)

dochodzimy do wniosku, że to będzie model liniowy i wybieramy najistotniejsze zmienne

objaśniające.

Zmienne objaśniające w modelu ekonometrycznym powinny charakteryzować się następującymi cechami:

odpowiednią zmiennością

wykazywać silną korelacją ze zmienną endogeniczną (istotną korelacje)

powinny wykazywać słabe (nieistotne) korelacje między sobą

Jeśli np korelacja X

i X

= 0,85 mówi, że w taki sam sposób kształtują one Y. Wystarczy wybrać tylko jedną z tych

zmiennych, tę która jest bardziej skorelowana z Y.
Jeśli nie mamy wszystkich danych to szukamy zmiennych naśladowczych, bądź pomijamy zwiększając tym samym

Formalne etapy dobory zmiennych objaśniających do modelu ekonometrycznego:

1.  Ustalenie liczby potencjalnych zmiennych objaśniających – tylko nazywamy zmienne, nie mamy danych
2.  Gromadzimy materiał statystyczny
3.  Usuwamy  zmienne  o  niskiej  zmienności  (jeśli  zmienna  endogeniczna  ma  niską  zmienność  –  brak

konieczności budowy modelu), zmienne objaśniające muszą mieć ten sam okres zmienności co Y.

4. Ustalenie miernika jakości modelu ekonometrycznego

można rozpatrywać z trzech punktów widzenia:

jego dopasowanie do rzeczywistych danych empirycznych

istotność parametrów strukturalnych modelu

brak autokorelacji składnika losowego

5. Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi
6. Ustalenie kombinacji zmiennych, które wejdą do modelu

Zmienne muszą wykazywać zróżnicowanie (liczone współczynnikiem zmienności)

Wartość kryterium współczynnika zmienności to 0,1 poniżej go nie jest zmienną – wyrzucamy ją z modelu, lecz
należy ją dodać przy parametrze wolnym (ślepa zmienna – zawsze 1).
Quasi stała – prawie stała, jeśli bardzo zaokrąglamy i wtedy jest taka sama, też się taką odrzuca (o bardzo małej
zmienności).

Metoda doboru zmiennych Pawłowskiego:
Zgodnie z procedurą Pawłowskiego do modelu ekonometrycznego wejdzie kombinacja zmiennych objaśniających,
która spowoduje, że:

model będzie gwarantował pewną z góry ustaloną dokładność (dopasowanie do danych empirycznych)

spośród wszystkich kombinacji zmiennych objaśniających należy wybrać te kombinację, w której
uwzględnione zmienne objaśniające nie są skorelowane między sobą

Tworzymy macierz potencjalnych zmiennych i wektor kolumnowy zmiennej endogenicznej

...

EKONOMETRIA

Dr Stanisław Barczak

...

Wartość współczynnika korelacji Rw między zmienną endogeniczną, a zmiennymi objaśniającymi była nie mniejsza
niż z góra zadana liczba.

∂

> 0

to może być pewną miarą służącą badaniu dokładności modelu.

Rw – współczynnik korelacji wielorakiej.

det

−

R – współczynnik korelacji między wybranymi zmiennymi objaśniającymi

– wektor kolumnowy współczynnika korelacji pomiędzy wybranymi zmiennymi objaśniającymi, a zmienną

endogeniczną.

Przykład
Dane są 3 potencjalne zmienne objaśniające X

, X

oraz Y

1.Wyliczenie współczynnika korelacji pomiędzy zmiennymi objaśniającymi.

wzór na ilość kombinacji L = 2

– 1, gdzie P to liczba zmiennych objaśniających.

Jest 7 kombinacji K1={x1}, K2={x2}.... K7={X1,X2,X3}

Szukamy właściwej kombinacji
Korelacje wszystkich zmiennych ze zmienną endogeniczną Y:

Rozpatrujemy kombinację K={x1,x2}

Tworzymy macierz W

det |W| = 0,84
det |R| = 0,684
Rw = 0,9584
W analogiczny sposób postępujemy z pozostałymi kombinacjami i wybieramy tę z najwyższym Rw.

Metoda wskaźników pojemności informacyjnej (metoda Hellwiga):
1.Indywidualne wskaźniki pojemności informacyjnej.

∑

l – elta kombinacja zmiennych objaśniających
j – jota zmienna objaśniająca
r

– współczynnik korelacji liniowej Pearsona między jotą zmienną objaśniającą i zmienną endogeniczną Y

EKONOMETRIA

Dr Stanisław Barczak

– współczynnik korelacji liniowej Pearsona pomiędzy itą i jotą zmienną objaśniającą.

Przyjmuje on wartość z przedziału 0 <= h <= 1, jeżeli poza przedziałem to wiemy, że wzięliśmy do modelu
nieliniowego współczynniki korelacji liniowej.

Współczynnik (zmienne objaśniające) posiadają różną nośność informacyjną (np. X1 – 0,4; X2 – 0,5; etc.)

2.Wskaźniki integralne pojemności informacyjnej H.
H – suma h, przyjmuje wartości z tego samego przedziału 0<= H <= 1

Przykład
Dane są zmienne X

, X

Korzystając z procedury Hellwiga

liczymy:

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

)

(

Integralne wskaźniki H
H

= h

+ h

= h

+ h

= h

+ h

= h

+ h

Na ich podstawie dokonujemy wyboru H

max.

– z pośród w/w H

Mogą być rozbieżności pomiędzy metodą Pawłowskiego i Hellwiga.

Metoda współczynników korelacji

−

wartość krytyczna współczynnika korelacji

t – wartość krytyczna odczytana z tablic t-Studenta
n – liczba obserwacji

Przykład:
Przy poziomie istotności

= 0,05 oraz n = 28 wyznaczyć wartości krytyczne współczynników korelacji, a następnie

zaproponować zmienne objaśniające do modelu.

n – 2 = 26

= 0,05

= 2,056

r* = 0,3739 - wszystko co poniżej tej wartości jest nieistotne statystycznie.

EKONOMETRIA

Dr Stanisław Barczak













wszystkie zmienne mogą wejść do modelu, są istotne (wartości wyższe od r*)

zmienne których r są w [] mogą razem funkcjonować w modelu, nie
są ze sobą skorelowane

Klasyczna metoda najmniejszych kwadratów (KMNK). Idea metody: wyznaczenie ocen parametrów strukturalnych
a

, a

,...a

, (konkretne wartości) parametrów strukturalnych

, ...

aby suma kwadratów odchyleń

zaobserwowanych wartości zmiennej endogenicznej Y

od jej wartości teoretycznych obliczonych na podstawie

modelu była najmniejsza.

Dany jest jednorównaniowy model ekonometryczny

Y

+ ... +

k-1

(k-1)t

t = 1,2...n
Kryterium metody najmniejszych kwadratów ma postać:

∑

– a

- .... – a

k-1

(k-1)t

–a

)

min. czyli wartości teoretyczne modelu dane są jako:

= a

+ a

+ ... + a

k-1

(k-1)t

Ostateczna postać KMNK dana jest jako:

∑

(y – y

min gdzie wyrażenie (y

– y

*) = u

; gdzie t = 1,2...n

reszta modelu/równania.

ξξξξ

= a

+ a

+ u

Zastosowanie KMNK wymaga spełnienia następujących założeń:

postać modelu jest liniowa względem parametrów bądź sprowadzana do liniowej

zmienne objaśniające są wielkościami nielosowymi

zmienne objaśniające nie wykazują współliniowości

składnik losowy

ma wartość oczekiwaną równą zero E(

) = 0 oraz stałą wariancję D

(

) =

nie następuje autokorelacja składnika losowego (nie ma zależności korelacyjnych między poszczególnymi
realizacjami składnika losowego – chodzi o zależność rządu pierwszego)

Miara zależności, wariancja składnika losowego nie zależy od zmiennych objaśniających (składnik losowy nie jest
skorelowany ze zmiennymi objaśniającymi)

Układ skalarny
W celu wyznaczenie ocen parametrów strukturalnych modelu znajdujemy minimum funkcji

[ ]













]

[

]

[

]

[

taką obserwację odrzucamy
i rozpatrujemy osobno

EKONOMETRIA

Dr Stanisław Barczak

)

(

∑

−

minimum

(j = 1,2,...t)

∑

– a

-...- a

) (-X

) = 0

∑

– a

-...- a

) (-X

) = 0

∑

– a

-...- a

) (-1) = 0

Po wykonaniu odpowiednich przekształceń otrzymujemy tzw. układ równań normalnych danych jako:

a

∑

+ a

∑

+...+ a

∑

+ a

∑

+...+ a

∑

+ a

∑

+ ....+ na

∑

Układ macierzowy
Jest to kolumnowy wektor zmiennej endogenicznej













...













−

...

Macierz realizacji zmiennych objaśniających.

Kolumnowy wektor parametrów strukturalnych:













...

Kolumnowy wektor ocen parametrów strukturalnych













...

Kolumnowy wektor realizacji składnika losowego:













...

EKONOMETRIA

Dr Stanisław Barczak

Kolumnowy wektor reszt:













...

Wektor wartości teoretycznych













...

Tak więc model:
Y=

+... +

k-1

(k-1)t

W zespole macierzowym ma następującą postać:
Y = X

Wektor wartości teoretycznych zmiennej endogenicznej Y ma postać:

Y* = X

Funkcja kryterium KMNK dana jest jako:

= (y - Xa)’ (y – Xa)

min – transpozycja macierzy

Formuła:
A = (x’x)

-1

x’y

‘ – transpozycja prosta

-1

– macierz odwrotna

Przykład (jedna zmienna objaśniająca)
Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu o postaci.
Y

3 2 2 1 1

2 2 1 1 0

Wyznaczamy wykres rozrzutu

























parametr wolny (na końcu jest

)

Stosując formułę na wektor ocen parametrów strukturalnych czyli
a = (X’X)

-1

X’Y













−

)

(

ocena parametru a













EKONOMETRIA

Dr Stanisław Barczak

Model po oszacowaniu

Y*

= 0,78X

+ 0,86 + u

Intensywność wzrostu X

o 1 jednostkę spowoduje wzrost Y o 0,78.

= 0,86 – taką średnią wartość przyjmuje zmienna endogeniczna Y

w przypadku gdy zmienna objaśniająca X

będzie równe zero (= 0)

Model liniowy z 2 zmiennymi objaśniającymi.

Każdy parametr szacowany na podstawie 2,5 obserwacji (zdecydowanie za mało – tutaj tylko
dla uproszczenia).
Yt – poziom produkcji
X

– liczba pracowników

– zużycie energii elektrycznej

Yt =

(

-t)

– postać statyczna. „e“ – elementem dynamicznym.

Yt =

Weryfikacja postaci analitycznej modelu, od wykresu rozrzutu (dla obu zmiennych) zależy czy model liniowy czy
nie.













Tworzymy X’X. Później (X’X)

-1

= (1/detA) * adjA

Yt = 0,31X

+ 2,04X

– 22,51 + U

Wzrost liczby pracowników o 1 etat spowoduje wzrost poziomu produkcji Yt o 0,31 tys sztuk, pod warunkiem, że
zużycie energii elektrycznej nie ulegnie zmianie.

Wzrost zużycia energii elektrycznej o 1 MWh spowoduje wzrost poziomu produkcji o 2,04 tys sztuk pod
warunkiem, że liczba pracowników nie ulegnie zmianie

-22,51 taki średni poziom miałaby zmienna endogeniczna w przypadku gdy zmienne objaśniające są równe 0.

WŁASNOŚCI ESTYMATORÓW

Estymator nieobciążony:

1. Jeśli jego wartość oczekiwana (nadzieja matematyczna) jest równa estymowanemu parametrowi E(a)=a
2. Dla Modelu danego jako y = Xa +

wektor parametrów strukturalnych dany jest jako a = (X’X)

-1

X’Y

3. E(a) = E[(X’X)

-1

X’Y] = E[(X’X)

-1

X’ * (Xa +

)]

4. Zakłada się, że zmienne objaśniające są nielosowe E(

)=0

5. Stąd estymator parametrów strukturalnych jest nieobciążony jeżeli:













−













858

147

EKONOMETRIA

Dr Stanisław Barczak

a. Zmienne objaśniające są nielosowe – kowariancja składnika losowego nie zależy od zmiennych

objaśniających E(X

)=0

b. Składnik losowy ma wartość oczekiwaną 0

Estymator Zgodny:

1. Estymator parametru

jest zgodny jeżeli jest stohastycznie zbieżny do szacowanego parametru

. Oznacza

to, że przy wzroście liczby obserwacji do nieskończoności, jego wartość dąży stohastycznie do prawdziwej
wartości szacowanego parametru:

}

lim

−

∞

−

Jeżeli wraz ze wzrostem liczebności próby oczekiwana wartość rozkładu estymatora zmierza do wartości
szacowanego parametru, a jednocześnie wariancja estymatora zmierza do zera, to estymator taki jest zgodny

Estymator efektywny:
Przy danych kilku estymatorach zgodnych i nieobciążonych estymatorem najefektywniejszym jest ten, który posiada
najmniejszą wariancję.

Jeżeli spełnione są założenia KMNK (dotyczące składnika losowego oraz zmiennych objaśniających) to estymator a
= (X’X)

-1

X’Y jest estymatorem najefektywniejszym spośród estymatorów liniowych, gdzie jego wariancja dana jest

następującą formułą:
D^(a) =

^ * (X’X)

-1

jako macierz wariancji i kowariancji, na głównej przekątnej wariancje estymatorów, poza

nią kowariancje.

^ = S^(u)

Założenia klasycznej metody najmniejszych kwadratów do własności estymatorów:

1. Jeżeli

zmienne

objaśniające

są

współliniowe,

nie

istnieje

estymator

dany

formułą

a = (X’X)

-1

X’Y, ponieważ nie istnieje macierz odwrotna do macierzy (X’X) to wyznacznik jest równy 0,

czyli det (X’X) = 0.

2. Jeżeli wariancja składnika losowego nie jest stała to:
a = (X’X)

-1

X’Y jest nieobciążony, i zgodny, ale nie jest najefektywniejszy. Musi istnieć stałość wariancji w

czasie

. Często się rezygnuje z efektywności estymatora

3. Jeżeli składnik losowy jest zależny cov(

;

t+1

) różna od 0, a w zbiorze zmiennych objaśniających nie ma

zmiennej endogenicznej opóźnionej (

t-1

)w czasie to a = (X’X)

-1

X’Y jest nieobciążony i zgodny, ale nie

jest już najefektywniejszy

4. Jeżeli składnik losowy jest zależny [cov(

;

t+1

) różna od 0], a w zbiorze zmiennych objaśniających istnieje

zmienna endogeniczna opóźniona w czasie to:

a = (X’X)

-1

X’Y nie jest zgodny

5. Jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających to estymator a = (X’X)

-1

X’Y

nie jest zgodny.

Klasyczne założenia dotyczące składnika losowego:

Dana jest macierz wariancji i kowariancji składnika losowego:













)

(

...

)

(

)

(

...

)

(

...

)

(

)

(

)

(

...

)

(

)

(

)

(

macierz kwadratowa i symetryczna

jest kwadratowa i symetryczna

na głównej przekątnej znajdują się wariancje składnika losowego poszczególnych
okresów (w przypadku serii czasowych), natomiast poza główną przekątną znajdują się
kowariancje między składnikami losowymi poszczególnych okresów.

Można wyróżnić 4 sytuacje związane z założeniami:

1. Spełnione założenie MNK

a. Wariancja jest jednorodna D^(

) = D^(

) =... = D^(

) =

b. Brak autokorelacji czyli składnik losowy jest niezależny E(

t+1

)=0

c. Macierz wariancji i kowariancji ma postać:

EKONOMETRIA

Dr Stanisław Barczak

...

)

(













gdzie In to macierz jednostkowa

2. Nie jest spełnione założenie o jednorodności wariancji składnika losowego

a. D^(

)

≠

D^(

)

≠

...

≠

D^(

)

≠

b. Brak autokorelacji czyli składnik losowy jest niezależny E(

t+1

)=0

c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierz diagonalna i ma postać:













)

(

...

)

(

...

)

(

)

(

3. Jeżeli spełnione jest założenie o jednorodności wariancji składnika losowego, czyli (dzieli próbę na 2 części

i w obu wariancje będą równe):

a. D^(

) = D^(

) =... = D^(

) =

b. Składnik losowy jest zależny (występuje jego autokorelacja)
c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma

postać:













...

)

(

współczynniki autokorelacji między składnikiem losowym i-tego i –tgo okresy.

4. Jeżeli nie jest spełnione założenie o jednorodności wariancji składnika losowego:

a. D^(

)

≠

D^(

)

≠

...

≠

D^(

)

≠

b. Oraz nie jest jest spełnione założenie o braku korelacji, czyli występuje sytuacja, w której E(

)

≠

c. Wówczas macierz wariancji i kowariancji składnika losowego jest macierzą symetryczną i ma

postać (tak jak w sytuacji 1).

Sytuacje 3 i 4 to tzw. „egzamin” dla modelu i nie jest zależne od naszych błędów.

MODELE NIELINOWE SPROWADZALNE DO LINIOWYCH

MODEL HIPERBOLICZNY:

Oszacować model o postaci Y

(1/X

) +

Na podstawie danych statystycznych stablicowanych:

1,1

1,11

1,12

1,22

1,25

1,36

1,54

0,09

0,126

0,16

0,25

0,33

0,5

Na podstawie wykresu rozrzutu

model hiperboliczny (wykres hiperboli)

Model należy sprowadzić do postaci liniowej, by zastosować MNK.

G

= 1/X

Stąd model będzie liniowy ze względu na zmienną G.
Y

Stosujemny MNK:
A = (X’X)

-1

X’Y

EKONOMETRIA

Dr Stanisław Barczak













166

126

























' X













−

)

(













ostatecznie a = 1,17 v 0,93

Postać pierwsze Y

= 1,17G

+ 0,93 + U

Postać druga i ostateczna: Y

= 1,17 (1/X

) + 0,93 + U

Wzrost ceny o 100zł spowoduje spadek wielkości sprzedaży o 1,17szt.

Weryfikacja modelu ekonometrycznego:

Oznacza to:

zbadanie czy oszacowany model jest zgodny z rzeczywistością (kierunek wpływu zmiennych
objaśniających jest zgodny z rzeczywistością(

zbadanie czy model ekonometryczny jest wystarczająco przejrzysty

zbadanie czy zmienne objaśniające istotnie wpływają na zmianę endogeniczną

zbadanie czy spełnia założenie MNK

Miary struktury stochastycznej:

1. Wariancja resztowa i odchylenie standardowe reszt:

a. Przy spełnionych warunkach MNK nieobciążonym estymatorem wariancji resztowej jest

wariancja resztowa wyznaczona wg następującej formuły:

∑

−

)

(

)

(

gdzie n – liczba obserwacji, k – liczba szacowanych

parametrów.
Pierwiastek kwadratowy wariancji resztowej daje tzw. Odchylenie standardowe reszt czyli S(u).
Odchylenie standardowe informuje o ile średnio rzecz biorąc in plus, bądź in minus odchylają się
rzeczywiste realizacje zmiennej endogenicznej od wartości teoretycznych wyznaczonych przez model.

2. Macierz wariancji i kowariancji oraz średnie błędy szacunkowe

a. D

(a)=

(X’X)

-1

gdzie

= S

(u) czyli D

(a)= S

(u)(X’X)

-1

b. Miary struktury stochastycznej (wariancja resztowa oraz macierz wariancji i kowariancji) modelu

związane są ze zmienną

Miara precyzji estymacji parametru struktury są średnie błędy szacunku. Kwadraty błędów szacunku
znajdują się na głównej przekątnej macierzy wariancji i kowariancji. Pierwiastek wariancji estymatora
daje zatem średni błąd szacunku dla danego parametru.

3. Miary dopasowania modelu do danych empirycznych (badanie jakości modelu).

a. Współczynnik zbieżności (przyjmuje wartości od 0 do 1) – miara negatywna

∑

−

)

(

)

(

ii. współczynnik zbieżności może być stosowany tylko w przypadku modeli liniowych i

modeli do liniowych sprowadzalnych

EKONOMETRIA

Dr Stanisław Barczak

iii. współczynnik zbieżności przyjmuje wartość 0 w przypadku gdy wszystkie wartości

teoretyczne zmiennej endogenicznej są równe wartościom rzeczywistym zmiennej
endogenicznej

=0 => model idealnie dopasowany

iv. jeżeli współczynnik zbieżności przyjmuje wartość 1 oznacza to, że zmienność, zmiennej

endogenicznej została całkowicie nie wyjaśniona przez model ekonometryczny (na
wykresie rozrzutu punkty emiryczne „wszędzie”)

b. Współczynnik determinacji

i. Jest miarą alternatywną w stosunku do

u dana jest R

= 1-

nie jest jednak

najważniejszą miarą modelu

ii. Przyjmuje wartości od 0 do 1

iii. Współczynnik determinacji jest kwadratem współczynnika korelacji wielorakiej (reaguje

na ilość zmiennych)

iv. Informuje jaka cześć zmienności zmiennej endogenicznej została wyjaśniona przez model

v. Jego wartości związane z przyrostem ilości zmiennych objaśniających rośnie, można

zatem dodatkowo skorzystać ze skorygowanego współczynnika determinacji (gdy mamy
dużo zmiennych objaśniających I będą budowane prognozy).

)

(

−

gdzie n to liczba obserwacji, a m liczba zmiennych objaśniających

interpretacja analogiczna do R

(tylko dla modeli liniowych bądź do liniowych sprowadzalnych) Zawsze

skorygowany współczynnik determinacji niższy od normalnego.

c. Współczynnik zmienności losowej

i. Vs = Su/Y I zawsze podawany w procentach (%). Współczynnik zmienności losowej

informuje jaką część średniego poziomu zmiennej endogenicznej stanowią wahania
przypadkowe.

Przykład:

Y

-2

-1

Model po oszacowaniu MNK Yt = -0,31X

+ 1,17 + u

Obliczamy wartości teoretyczne modelu:

Y*1 = -0,31*2 + 1,17 = 0,542
Y*2 = 1,17
Y*3 = 1,8
Y*4 = 1,485

Wariancja resztowa:
U1 = 0,457 U2 = -1,17 U3 = 0,2 U4 = 0,514

suma powinna się równać 0.

∑

= 1,8857 n = 4 k = 2 => Su = 0,971

Rzeczywiste realizacje zmiennej endogenicznej (Yt) odchylają się średnio rzecz biorąc +/- o 0,971 (jednostki) od
wartości teoretycznych wyznaczonych przez model.

Liczymy macierz wariancji i kowariancji oraz średnie błędy szacunku:

(a) = S

(u)(X’X)

-1

= 0,9428













257

028

114













242

026

107

Średnie błędy szacunku:
D^(a1) = pierwiastek z 0,107 = 0,32
D^(a2) = pierwiastek z 0,242 = 0,49

Model zapisujemy:
Y*

= -0,31X

+ 1,17 + u

(0,32) (0,49)

EKONOMETRIA

Dr Stanisław Barczak

WERYFIKACJA ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH MODELU

NP.

Y

= 10X

+ 2X

+ 5 + u

Jeżeli stwierdzimy, że nieistotny jest wpływ, którejś ze zmiennych to ją usuwamy.
Wtedy ponownie szacujemy model bez tej zmiennej.
Nie ma konieczności testowania parametru wolnego.

Do przyczyn nieistotności parametrów strukturalnych modelu można zaliczyć:

brak zależności między zmienną objaśniającą, albo endogeniczną

mała dokładność lub nieodpowiednia jakość danych statystycznych

słaba dokładność technik estymacji oraz wnioskowania statystycznego (ważny przy małych próbach)

przyjęcie niewłaściwej postaci analitycznej modelu

okoliczności przypadkowe wynikające z losowości próby

pominięcie istotnych zmiennych objaśniających, te braki będą się kumulowały w resztach co spowoduje
wysoką wariancję resztową, co z kolei spowoduje, że średnie błędy szacunku będą wysoki, im wyższa
wartość wariancji szacunku tym większe średnie błędy.

TEST T-STUDENTA

H0:

= 0 wobec hipotezy alternatywnej takiej, że H1:

≠

Jeżeli H0 odrzucamy tzn, że parametr jest istotny.

Sprawdzeniem hipotezy H0 jest statystyka t-studenta o n-k stopniach swobody, gdzie k to liczba szacowanych
parametrów.

T = a

/D(a

) gdzie i = 1,2...k

- ocena parametru

D(a

) – średni błąd szacunku parametru a

|t| > t

gdzie t

to wartość krytyczna odczytywana z tablic.

W takim wypadku H0 odrzucamy na korzyść hipotezy alternatywnej.

Przykład:

Y

= 6X

+ 4X

– 8X

+ 10 + u

(2) (1) (4) (6)

S(u) = 0,4
R^ = 0,98
N = 20, k = 4, n-k = 16

Zakładamy poziom istotności

=0,05 => t

= 2,120

H0:

1 = 0

H1:

≠

T = 6/2 = 3 |t| > t

H0: odrzucamy na korzyść H1, czyli

≠

Zmienna objaśniająca X

istotnie wpływa na zmienną endogeniczną Yt i należy ją pozostawić.

t = 4 => pozostawiamy w modelu X

t = -2 => X

nieistotnie wpływa na Yt i należy ją z modelu wyrzucić.

4 (ślepa zmienna)

T = 1,8 => nieistotnie wpływa na model i należy ją z niego usunąć
Jeżeli chcemy utrzymać model to musimy zmienić poziom istotności np.

= 0,1 gdzie t

= 1,76

EKONOMETRIA

Dr Stanisław Barczak

Jeżeli wypada nam jakaś zmienna to szacujemy model raz jeszcze i raz jeszcze sprawdzamy istotność zmiennych.

Autokorelacja składnika losowego rzędu I. Test Durbina-Watsona
Może ona wyrażać się w postaci:

= f(

t-1

t-2

...

)

Do najczęstszych odstępstw od założeń MNK można zaliczyć fakt iż składnik losowy

t nie tworzy procesu czysto

losowego, lecz zależy od wskaźnika bieżącego „t”. Sytuacja taka ma miejsce, gdy wskaźnik t wyznacza pewne
rozmieszczenie przestrzenna lub częściej gdy realizacje

t są zależne w czasie.

Autokorelacje można mierzyć tzw. współczynnikiem autokorelacji rzędu

, który jest liczony jako współczynnik

korelacji liniowej r

)

(

)

(

)

(

)

(

)

(

−

Estymator współczynnika autokorelacji rzędu

, dany jako













−













−













−













−

∑

−

)

(

)

(

)

(

Współczynnik autokorelacji przyjmuje wartość z przedziału [-1,1]

Przyczyny autokorelacji składnika losowego:

błędy specyfikacji modelu:

pominięcie istotnej zmiennej objaśniającej

błędne określenie opóźnień czasowych zmiennej bądź kilku zmiennych objaśniającej

przyjęcie niewłaściwej postaci analitycznej modelu

test Durbina-Watsona stosowany jest tylko do testowania autokorelacji rzędu I

H0:

1 = 0

H1:

1 > 0 lub H1:

< 0

Sprawdzeniem Ho jest statystyka Durbina-Watsona (gdy dysponujemy resztami modelu danymi jako:

∑

−

)

(

, gdzie Ut to reszta równania z okresem t.

Sprawdzian hipotezy H0 możemy przedstawić jako (gdy mamy współczynniki autokorelacji I rzędu)
d = z (1 – r

) gdzie r

to współczynnik autokorelacji I rzędu

Statystyka D-W przyjmuje wartości z przedziału [0,4]

W przybliżeniu dla r = 1; d = 0, r = 0 d =2 i dla r = -1 d = 4
Pomiędzy 0 a 2 zależność dodatnia (+), pomiędzy 2, a 4 ujemna (-)

EKONOMETRIA

Dr Stanisław Barczak

Podjęcie decyzji w przypadku gdy:
- mamy doczynienia z dodatnią korelacją składnika losowego H0:

1 = 0 i H1

1 > 0

- dolna wartość krytyczna odczytana z tablic

- górna wartość krytyczna odczytana z tablic

•

jeżeli d <= d

to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK lub

zastosować metodę różniczki zupełnej)

•

jeżeli d

< d < d

to nie można podjąć decyzji odnośnie istotności bądź nieistotności autokorelacji składnika

losowego – tzw. obszar niekonkluzywności

•

jeżeli d => d

nie ma podstaw do odrzucenia H0.

- mamy doczynienia z dodatnią korelacją składnika losowego H0:

1 = 0 i H1

1 < 0

•

liczymy d’ (d’= 4 – d)

•

jeżeli d’ <= d

to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK

lub zastosować metodę różniczki zupełnej)

•

jeżeli d

< d’ < d

to nie można podjąć decyzji odnośnie istotności bądź nieistotności autokorelacji

składnika losowego – tzw. obszar niekonkluzywności

•

jeżeli d’ => d

nie ma podstaw do odrzucenia H0.

Homoskedastyczność – jednorodność wariancji składnika losowego (

0 nie jest spełniona – poprawiamy model

uogólnioną MNK, tracimy na dokładności modelu).

Homoskedastyczność jest:

jednym z założeń MNK

oznacza, iż wraz ze zmianą wartości zmiennej endogenicznej lub zmiennych objaśniających lub wraz z
upływem czasu wariancja składnika losowego ulega zmianie

odstąpienie od tego założenia powoduje obniżenie efektywności estymatorów

Test Goldfelda – Quandta
Próbę statystyczną dzieli się na 2 części, (gdy ilość jest nieparzysta to odrzucamy środkową).
Na podstawie równoliczących prób szacuje się dwa modele ekonometryczne, a następnie oblicza się ich wariancje
resztowe

S

oraz S

∑

−

)

(

W teście weryfikowane są następujące hipotezy H0:

H1:

Zakładając prawdziwość H0, sprawdzianem testu jest statystyka F o rozkładzie Fishera-Snedecora danego
następującą formułą:

o m

= (n

– k) i m

= (n

i k) stopniach swobody

Decyzja: hipotezę o homoskedastyczności odrzucamy, gdy wartość sprawdzianu F przekroczy wartość krytyczną F

odczytaną z tablic rozkładu Fishera dla określonego poziomu istotności oraz określonej liczby stopni swobody.

Na podstawie danych z tabeli oszacowano model ekonometryczny i otrzymano wyniki

Yt = 2X

+ 4 + u

= 0,5

Model 1 (z pierwszej części tabeli)
Yt = 2,25X

+ 3,5 + u

= 0,9166

Model 2 (z drugiej części tabeli)
Yt = 2,07X

+ 4,14 + u

= 0,2619

Test Fishera:

EKONOMETRIA

Dr Stanisław Barczak

= 0,05 m

= 3 m

= 3

F = 0,2619/0,9166 = 0,2857
Wartość z tablic F

= 9,28

F < F

brak podstaw do odrzucenia H0, głoszącej stałość wariancji składnika losowego.

Przykład 1.

Na podstawie 25 operacji oszacowano model ekonometryczny i otrzymano wyniki:
Y

= 2X

- 3X

+ 4X

+ 5 + u

Współczynnik autokorelacji rzędu I wynosi r

=-0,95; k=3; n=25;

=0,05

Statystyka: d =2 (1 - r

) = 2(1 + 0,95) = 3,9 liczymy d’= 4 – 3,9 = 0,1

=1,12 d

=1,66

d’<d

hipotezy zerowe odrzucamy na korzyść hipotezy alternatywnej głoszącej, że r

<0 Istotna

autokorelacja ujemna składnika losowego. Model należy poprawić.
Pierwsza rzecz to szacowanie przyczyn istotnej autokorelacji (np. opuszczanie istotnych przyczyn), (czy proces jest
nieliniowy, a wg modelu liniowy). Ostateczność

MNK lub różniczki zupełnej.

Przykład 2.

L.p. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
U

-1 -1 -2 -2 -2 1 2 -2 1 1

-1 0

t-1

-1 -1 -2 -2 -2 1 2 -2 1

-1 0

Dodatkowo wiadomo, że model posiada 2 zmienne objaśniające. k=2 n=20

=0,05

>0 (bo d<2)

(

)

∑

−

test tylko dla autokorelacji rzędu I

(

)

∑

−

∑

6918

=1,10 d

=1,54

d > d

Brak podstaw do odrzucenia H

, głoszącej, że

=0. Nieistotna autokorelacja składnika losowego.

UOGÓLNIONA METODA NAJMNIEJSZYCH KWADRATÓW

lekarstwo na autokorelację i niestałość wariancji

1. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o stałości

wariancji odchyleń

2. służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o braku

autokorelacji składnika losowego

Wówczas macierz wariancji i kowariancji może być zapisana jako:

D

(a) =

Ω

dowolna dodatnio określona macierz stopnia n

Wektor ocen parametrów strukturalnych dotyczy uogólnionej MNK dany:

(

)

−

Ω

KMNK analogicznie do

(

)

−

Wyznaczenie wektora ocen parametrów strukturalnych

Wyznaczenie macierzy wagowej P:

P jest taka, że

Ω

-1

= P’P

EKONOMETRIA

Dr Stanisław Barczak

UWAGA!
Następnie oblicza się ważone obserwacje zmiennych czyli: y

=Py

=PX

Praktyczne zastosowanie UMNK wymaga znajomości macierzy

Ω

. Macierz

Ω

zazwyczaj nie jest a priori znana.

1. przypadek

niestałość wariancji odchyleń losowych

Macierz

Ω

jest macierzą diagonalną jako:













Ω

...

Macierz odwrotna













Ω

−

...

A macierz wagowa P dana jest jako wektor

Wyznacznik macierzy diagonalnej

iloczyn głównej przekątnej

Elementami na głównej przekątnej mogą być:

a) realizacje wybranej zmiennej objaśniającej X (najprostszy

przypadek), czyli

Ω

= X

t = 1,2,3,...,n

b) moduły reszt modelu oszacowanego MNK, czyli

Ω

= |u

t = 1,2,3,...,n

c) w przypadku autokorelacji składnika losowego zakłada się nieciągłe{

} podleganie procesowi

autoregresyjnemu rzędu I czyli:

Ω

ρξ

t-1

t = 1,2,3,...,n

gdzie |

| < 1 wówczas

A macierz

Ω

jest macierzą współczynników autokorelacji odchyleń losowych o postaci:













Ω

−

...













−

Ω

−

...

Macierz wagowa P













−

...

Ocena współczynnika autokorelacji dana jest jako:

(

)

(

)

∑

−

k – liczba szacowanych parametrów w modelu

Wariancja resztowa dana jest następującą formułą:

−

Ω

−

u - kolumnowy wektor reszt













Ω

...

EKONOMETRIA

Dr Stanisław Barczak

Macierz wariancji i kowariancji dana jest jako:

( )

(

)

−

Ω

Zastosowanie UMNK dla poprawienia modelu wykazującego autokorelację składnika losowego.

6,5

5,5

-1

Oszacowano model w postaci:

Y

i otrzymano wynik:

Yt = 1,5X

+ 0,5X

+ 3,3 + u

         (0,52)    (0,42)     (0,61)

d = 3,0264     jeżeli d > 3 (ok 3,6) to można praktycznie od razu stwierdzić autokorelacja istotna.

Test Durbina-Watsona:
N = 10      K = 2
H

= 0

< 0

d’ = 0,9736

d

= 0,697

= 1,641

Obszar niekonkluzywności – nie wiadomo nic o składniku losowym (nie można podjąć decyzji).
Stosujemy UMNK i korzystamy w dalszym ciągu z modelu.
Reszty w modelu zanikają z czasem (w momencie spadków stałych, zaczyna się opóźnienie w modelu).

UMNK:
Wektor ocen parametrów strukturalnych UMNK dany jako:

(

)

−

≈

Ω

Założono, że na głównej przekątnej macierzy wprowadzone zostaną moduły reszt modelu oszacowanego KMNK:

Macierz 10x10:













Ω













Ω

−

...

też macierz 10x10

EKONOMETRIA

Dr Stanisław Barczak

Oszacowany model ma postać:
~Y

= 1,71X

+ 0,55X

+ 3,07 + u

(0,34) (0,27) (0,41)

S

= 1,0954

= 1,0466

Reszty również zanikają z czasem. Po zastosowaniu UMNK – zmniejszają się amplitudy wahań.

EKONOMETRYCZNA TEORIA PROGNOZ

Przewidywanie przyszłości – np. prognoza pogody na Śląsku o 12:48m etc.
Jeżeli nie dysponujemy historią, nie możemy prognozować ekonometrycznie.

nieracjonalne – wróżby, magia, proroctwa, wszystko co oparte na doświadczeniu, a nie wymaga stosowania
reguł naukowych

racjonalne – na podstawie racjonalnych przesłanek (zbiory faktów z przeszłości)

zdroworozsądkowa – na nosa, tak mi się wydaje; często wynika z doświadczenia

naukowe – fakty i tylko fakty

Naukowe to wiedza + metody, dowody.

Prognoza:

Zbigniew Hellwig – prognozą statystyczną nazywać będziemy każdy sąd, którego prawdziwość jest
zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla
celów praktycznych

Zbigniew Pawłowski – wnioskowaniem w przyszłość na podstawie modelu będziemy nazywać predykcją,
natomiast konkretny wynik otrzymany na skutek zastosowanego wnioskowania nazywać będziemy
prognozą.

Ostatecznie przez prognozę będziemy rozumieć sąd o następujących właściwościach:

Sformułowana z wykorzystaniem dorobku nauki

odnoszące się do określonej przyszłości – jest to sąd o stanie zmiennych, bądź zmiennej w przyszłości,
która jest określona explicite przez podanie momentu czasu (np. 30.06 przychód ze sprzedaży wyniesie
2mln zł), bądź implicite (np. Anna będzie dobrym lekarzem)

Jest to sąd weryfikowalny empirycznie, prognoza jest sformułowana precyzyjnie oraz istnieje określony
czas w którym będzie sprawdzona

Jest to sąd niepewny, ale akceptowany (dopuszczalna/niedopuszczalna)

Należy unikać stawiania prognoz banalnych (np. jutro będzie wtorek etc.)

Funkcje prognoz:

preparacyjna – prognozowanie jest działaniem, które przygotowuje inne działania

aktywizująca – ma za zadanie pobudzać do działania (prognozy ostrzegawcze)

informacyjna

Rodzaje prognoz:

ilościowe – prognoza wyrażona jest liczbą (punktowe – wielkość sprzedaży 2mln zł, lub przedziałowe, 2-
2,5mln zł)

jakościowe – najczęściej prognoza słownie opisana sytuacja (np. za 2 tygodnie kurs euro spadnie)

Ze względu na typ zmian zmiennej prognozowanej:

krótkoterminowe – na przedział czasu, w którym zachodzą tylko zmiany ilościowe

średnioterminowe – na przedział czasu, w którym zachodzą zmiany ilościowe, ale oczekuje się też zmian
jakościowych

długookresowe – zachodzą zmiany ilościowe i jakościowe, które też należy uwzględnić.

Podstawowe pojęcia prognozowania:
Dopuszczalność prognozy – prognoza jest dopuszczalna, wówczas gdy obdarzona jest przez odbiorcę stopniem
zaufania uprawniającym do tego by mogła być wykorzystana do celu, dla którego była budowana. Jest określana w
tym samym momencie, w którym wyznacza się prognozę.

EKONOMETRIA

Dr Stanisław Barczak

Maksymalny  horyzont  prognozy  –  należy  do  przyszłości,  najdalszy  moment  dla,  którego  prognoza  jest
dopuszczalna.

Żądany  horyzont  prognozy  –  odbiorca  prognozy  może  życzyć  sobie  prognozy  na  dowolny  moment  czasu,  przy
czym, nie może być ona zrealizowana w momencie gdy żądany horyzont jest dłuższy niż maksymalny.

Prognoza  wygasła  –  prognoza  wyznaczona  na  taki  moment,  dla  którego  znana  jest  prawdziwa  wartość  zmiennej
prognozowanej (prognozy ex post).

Zmienna  prognozowana  –  Yt,  zmienna  endogeniczna,  reprezentuje,  obiekt,  proces,  zjawisko,  które  podlega
prognozowaniu.
Cechy danych wykorzystywanych do budowy prognoz:

1.  Rzetelność – dane są rzetelne gdy są zgodnie z przedmiotem, którego dotyczą
2.  Jednoznaczność – dane powinny być tak przedstawiane, by każdy odbierał je tak samo
3.  Kompletność – dane powinny obejmować wszystkie ważne i istotne dla celów badawczych informacje
4.  Aktualność danych dla przyszłości – czy pewne czynniki nie przestaną wpływać na Yt
5.  Koszt zbierania i opracowywania danych
6.  Porównywalność danych – można je porównywać z punktu widzenia:

a.  Czasu – by między poszczególnymi realizacjami była ta sama przerwa (ten sam interwał)
b.  Terytorium – powinny dane pochodzić z tego samego terytorium
c.  Stosowane  pojęcia  i  kategorie  –  dane  powinny  być  podobnie  konstruowane  (ważne  dla

wskaźników makroekonomicznych)

d. Metody obliczeń – dokładność, formuły obliczania agregatów

Prezentacja danych:

szereg czasowy momentów – wyraża poziom zjawiska w danym momencie (wielkość sprzedaży w latach
97-2002 stan na 31.12

moment pomiaru)

szereg czasowy okresów – wielkość sprzedaży pewnego wyrobu w pierwszej połowie 2002 (od...do...)

interwał pomiędzy danymi taki sam, w systemie pn-pt, uznaje się, że pt-pn taki sam jak wt-śr, czy śr-czw.
Święta, niedziele itp. prognozuje się odrębnie

Składowe szeregu czasowego:

•

wahania przypadkowe

•

trend

•

stały/średni poziom

•

wahania sezonowe (krótkookresowe)

•

wahania cykliczne (długookresowe)

MODELE ADAPTACYJNE

Nie wymagają one szacowania, estymatorów, założeń, są one dobre dla krótkookresowych prognoz.

Cechy ogólne i zastosowanie:

dostosowane do przebiegu procesu – naśladowanie procesu

budowa prognoz krótkookresowych

prosta budowa

możliwość sprawdzenia symulacji

możliwość uwzględnienia wahań przypadkowych trendu oraz wahań sezonowych

Ogólna postać Y

+ u

Wady:

trudność w ustaleniu początkowych wartości do symulacji

strata informacji

założenia o liniowości zmiennej prognozowanej w przyszłości

postarzanie informacji

Symulacja – w przypadku modeli adaptacyjnych, symulacja polega na takim dobrze parametrów wygładzania by
zminimalizować dowolnie wybrany błąd ex post.

EKONOMETRIA

Dr Stanisław Barczak

Okres weryfikacji prognoz (ex post) jeżeli błąd 5% to zakładamy, że w przyszłości też 5% (na podstawie danych +
prognoz).

Ex ante – ex post + odcinek uwzględniający przyszłość, im dalej tym większy błąd.

Model wyrównywania wykładniczego Browna:
Zastosowania:

zmienna prognozowana wykazuje trend oraz wahania przypadkowe

Wady:

strata informacji, problem z doborem wartości początkowych

Zalety:

łatwość prowadzenia obliczeń

nie trzeba stosować długich szeregów czasowych (40, min. ilość to 8-12)

Wyłącznie dla prognoz krótkookresowych.
Postać modelu oraz trendu na moment t: m

+ (1 -

) m

t-1

- ocena trendu na moment poprzedni (t-1).

– parametr wygładzania (przyjmuje wartości od 0 do 1) – zakładamy go a’priori, im bliższy 1, tym szybciej model

reaguje.
y

– zmienna prognozowana

Jeżeli proces jest niestabilny w czasie (szybkie zmiany, nieregularne) to

bliżej 1.

Jeżeli proces jest stabilny w czasie (nie wykazuje radykalnych zmian) to

bliżej 0.

Równanie prognozy w tym modelu: Y

= m

+ (m

– m

t-1

n- zakładany z góry horyzont prognozy
z okresu na okres n=1. Jeden punkt w przyszłość n=1, drugi n=2.
n - daje nam wyprzedzenie czasowe.
Nie uwzględniamy czynników kształtujących Y.

Wartości początkowe do symulacji:
m

= y

lub m

= śr.y

Model Holta, postać klasyczna:
Zastosowanie:

zmienne prognozowane wykazują trend oraz wahania przypadkowe

Wady:

strata informacji, problem z doborem wartości początkowych

Zalety:

łatwość prowadzenia obliczeń

krótki szereg czasowy (40 obserwacji, min 12)

Ocena trendu: F

t-1

+ (1-

)(F

t-2

+ S

t-2

)

t-1

– realizacja zmiennej prognozowanej na okres t-1 (poprzedni).

t-2

– ocena przyrostu trendu na okres t-2.

- parametr wygładzania

Wyznaczenie wartości przyrostu trendu: S

t-1

– F

t-2

) + (1 -

t-2

- parametry wygładzania przyjmują wartości od 0 do 1.

Równanie prognozy: Y

= F

– S

(t – n); gdzie t > n t – n – wyprzedzenie czasowe;

n – horyzont prognozy.

Wartości początkowe do symulacji:
F

= Y

lub

Yt = a

+ a

+ u

– mówi o przeciętnych zmianach z okresu na okres i pokazuje kierunek (+/-)

– mówi o tym co było w okresie poprzedzającym okres weryfikacji.

= a

= y

– y

= a

EKONOMETRIA

Dr Stanisław Barczak

Model Holta – z trendem hiperbolicznym gasnącym

Ocena trendu: F

t-1

t-2

+ (1 -

) (F

t-2

+ S

t-2

)

Parametr

- odpowiedzialny za gasnący trend;

Parametry wygładzania przyjmują wartości od 0 do 1.

Równanie prognozy:

∑

−

; gdzie t > n

Model Wintersa – postać addytywna (ze stałą amplitudą wahań)
Zastosowanie:

w przypadku szeregów czasowych zawierających tendencję rozwojową, wahania przypadkowe oraz
wahania cykliczne

Wady:

strata informacji, problem z doborem wartości początkowych

Zalety:

łatwość prowadzenia obliczeń

krótki szereg czasowy (40 obserwacji, min 12)

Ocena trendu: F

t-1

– C

t-1-r

) + (1 -

)(F

t-2

– S

t-2

)

C – ocena wskaźnika sezonowości na moment t-1-r
R – liczba faz cyklu, określany z góry

Wyrównanie wartości przyrostu trendu: S

t-1

– F

t-2

) + (1 -

t-2

Ocena wskaźnika sezonowości C

t-1

– F

t-1

) + (1 +

) C

t-1-r

- parametr wygładzania

Wartości początkowe do symulacji:
F

= y

lub F

= śr.y

= y

– y

C1 = śr.

∆

- średnia arytmetyczna z pierwszych różnić Y.

∆

= y

– y

t-1

Równanie prognozy jako: Y

= F

+ S

(t – n) + C

t-r

t > n

Horyzont prognozy = r.

Postać multiplikatywna modelu:

Ocena trendu:

)

(

)

(

−

Wyrównana wartość przyrostu trendu: S

t-1

– F

t-2

) + (1 -

t-2

Ocena wskaźnika sezonowości:

−

)

(

Prognoza: Y

= [P

+ S

(t – n)]C

t-r

t > n r – maksymalny horyzont czasowy.

Ustalenie parametrów wygładzania:

parametry bliskie jedności, w przypadku gdy wszystkie składowe szeregu czasowego (trend, wahania
sezonowe, wahania cykliczne) zmieniają się szybko

parametry bliższe zeru – w przypadku gdy wszystkie składowe zmieniają się wolno

Minimalizacja ze względu na średni względny błąd prognoz ex post:

∑

−

EKONOMETRIA

Dr Stanisław Barczak

LINIOWA FUNKCJA TRENDU

Prognozowanie na podstawie funkcji trendu – modele rozwojowe.
Przyjmujemy, że poszukiwana funkcja trendu ma postać liniową.

F(t) = α

+ β

1+t

Jest modelem dynamicznym. Zmienne nielosowe.
Model szeregu czasowego:
Y

= α

+ α

+ ξ

– zmienna prognozowana

– parametr wolny

– parametr przy zmiennej czasowej

– składnik losowy

W  szeregu  czasowym  dane  są  ułożone  chronologicznie,  może  on  być:  wielowymiarowy  lub  jednowymiarowy  (1
zmienna prognozowana).
Dzielą się na szeregi czasowe momentów i szeregi czasowe okresów.

1. Wszystkie realizacje powinny być w tej samej jednostce.
2. Wszystkie realizacje powinny być z tego samego obszaru terytorialnego.
3.  Jeśli  istnieją  luki  informacyjne,  powinniśmy  uzupełnić  te  dane,  albo  z  innych  źródeł,  albo  metodami
statystycznymi/ekonometrycznymi.

Szacowanie za pomocą MNK – funkcja kryterium w postaci:

∑











 −

minumum

Rozwiązaniem układu równań normalnych względem parametrów jest:

= śr.y – α

1śr.t

∑

−

)

(

)

(

)

(

Wynik oszacowania parametrów modeli: y

= α

+ α

+ u

prognozy ex post – trend prognozy wygasłej.

= y

– y*

Modele dynamiczne uwzględniają upływ czasu.
Postać macierzowa modelu jest następująca:
y = X

gdzie:













...













...

























...

Wektor ocen parametrów strukturalnych dany jako:
a = (X’X)

-1

X’Y













∑













∑













przy czym det (X’X)

≠

Weryfikacja modelu
Wariancja resztowa:

EKONOMETRIA

Dr Stanisław Barczak

(

)

∑

−

stąd odchylenie standardowe reszt dane jest:

Średnie błędy szacunku, czyli macierz wariancji i kowariancji:
D

(a) – Su

(X’X)

-1

∑

−

)

(

)

(

∑











 −

)

(

Współczynnik zbieżności:

(

)

∑











 −

−

= [0,1]

Współczynnik determinacji:
R

= 1 – φ

Prognoza punktowa dana jest jako:

T = przyszły punkt w przyszłości, horyzont prognozy.

[ ]













Średni błąd predykcji dany jest jako: (prognoza ex ante) – przyjmuje on jednostki zmiennej prognozowanej
X’

– kolumnowy wektor przyszłych realizacji zmiennych objaśniających

D^(a) – macierz wariancji, kowariancji
Su^ - wariancje resztowe

)

(

Uwzględniony średni błąd predykcji dany jest jako:

100

- określa on dopuszczalność prognozy.

Prognoza przedziałowa budowana wokół prognozy punktowej:

P(y

– uV < y

< y

+ uV) = γ

– wiarygodność predykcji

– wartość zmiennej prognozowanej w jednostce czasu T

uV – współczynnik związany z wiarygodnością prognozy, rozkładem zmiennej prognozowanej oraz długością
przedziału czasowego próby.

Przykład
Na podstawie danych o bezrobociu w Polsce w tablicy oszacować funkcję trendu w postaci:
Y

= a

+ a

+ ξ

Lata

67,1

62,1

73,7

80,6

87,8

106

97,6

trend

62,25

87,93

73,6

79,28

84,95

90,63

96,3

101,98

EKONOMETRIA

Dr Stanisław Barczak

Dane wejściowe w postaci wektora:













...

Parametr wolny & czas:













– wyskalowanie czasu, te same odległości i suma równa do 0.

-2,5

-1,5

-0,5

0,5

1,5

2,5

Dla nieparzystej ilości danych by było 2 | 1 | 0 | 1 | 2 etc.

Stosując formułę na wektor. a = (X’X)

-1

X’y

























204

' X













−

0238

107

607

)

(

X’y =













3194

656













675

575

Model po szacowaniu Yt = 56,575 + 5,675 + u

(4,3747) (0,8663)

Interpretacja parametrów:

wolny – w roku 1994 poziom bezrobocia w Polsce wyniósł 56,575 tysięcy osób (dot 1 okresu)

przy zmiennej czasowej – w latach 95 – 02 bezrobocie w Polsce wzrosło z roku na rok średnio rzecz biorąc
o 5,675 tys osób.

Wartości teoretyczne bezrobocia:
Y1 = 56,575 + 5,675*1 = 62,25
Y8 = 56,575 + 5,675*8 = 101,975

Miary struktury stochastycznej:
Su

= 31,52 (tys.

)

= 5,614 tys

n = 8; k =2
_
Y – 82,115 [tys] – przeciętny poziom bezrobocia.
Dopasowanie modelu do danych empirycznych
Φ = 12,26% R

= 87,74%

Prognoza punktowa na rok 2003 t=9 Y9 = 56,575 + 5,675*9 = 107,65 tys.

Średni błąd predykcji:













EKONOMETRIA

Dr Stanisław Barczak

1 – przyszła realizacja ślepej zmiennej (zawsze 1)
9 – przyszła realizacja zmiennej czasowej.

V = 7,1176 tys
V* = 6,61%

Prognoza przedziałowa n-k = 6 (6 stopni swobody)
α = 0,05 tα = 2,447 testujemy t-studenta

107,65 – 2,447*7,1176 < yt < 107,65 + 2447*7,1176
90,2332 < yt < 125,0668
Ulega zmianie wraz ze wzrostem horyzontu czasowego – średni błąd predykcji wrasta.

METODA TRENDÓW JEDNOIMIENNYCH OKRESOWYCH

Metoda polega na oszacowaniu parametrów analitycznych funkcji trendu oddzielnie dla poszczególnych faz cyklu.
Prognoza otrzymana jest przez ekstrapolację oszacowanej funkcji trendu dla każdej fazy cyklu. Przyjmijmy, że
szereg czasowy składa się z „n” obserwacji. Szereg czasowy należy podzielić na „m” szeregów czasowych
odnoszących się do tej samej fazy cyklu.

y

= f

(l) + ξ

– funkcja trendu dla j-tej fazy trendu

– wartość szeregu czasowego w l-tym cyklu (l = 1,2,... n)

– składnik losowy

W metodzie trendów jednoimiennych okresów dla każdej fazy cyklu najczęściej wybierana jest postać liniowa
funkcji trendu.

Ostatecznie mamy:
y

= α

+ α

+ ξ

(l = 1, ... n) (j = 1, ... m)

gdzie α – parametry strukturalne j-tej liniowej funkcji trendu.

Przykład:

Lata

1999

2000

2001

2002

Kwartały I

III

IV I

III

IV I

III

IV I

III

Yt – przewozy ładunków w mln. Ton

Wyjściowy szereg czasowy dzielimy na m = 4
Szeregi czasowe jednoimiennych okresów:

1999 I

2000 I

2001 I

2002 I

1999 III

2000 III

2001 III

2002 III

1999 II

2000 II

2001 II

2002 II

1999 IV

2000 IV

2001 IV

2002 IV

EKONOMETRIA

Dr Stanisław Barczak

Dla każdego szeregu czasowego szacujemy model o:
y

= α

+ α

+ ξ

Każdy model szacujem wg formuły: a = (X’X)

-1

* X’Y

Macierz X zawsze będzie:

























' X













−

)

(

Pierwszy model I-kwartał:





































Model można zapisać jako:
Y*t = 0t + 6,5 + Ut
Y*t = 6,5 + Ut

Drugi model II-kwartał



































−

Y*t = -0,4t + 10 + Ut

Trzeci model – III-kwartał

























124











−

Y*t = -0,7t + 14,5 + Ut

Czwaty model – IV-kwartał

























146











−

Y*t = -0,3t + 15,5 + Ut

Analiza uzyskanych wyników

Su

= 0,5

Su = 0,7071













−

)

(

D(a1) = 0,3162 D(a2) = 0,866

Y*t = 6,5 + Ut
(0,866)

Y = 6,5 φ

= 100% R

= 0%

EKONOMETRIA

Dr Stanisław Barczak

Prognoza na 1-szy kwartał 2003 wynosi 6,5mln ton.

Średni błąd predykcji:













X’

(a) = [0,25 -0,5]

gdzie 5 to przyszła realizacja zmiennej czasowej, a 1 – stała, ślepa zmienna
X

’D

(a)X

= 0,75

V – wyliczane ze wzoru (poprzedni wykład)
V

= 1,25

V=1,118
Średnio rzecz biorąc odchyla się o +/- 1,118 mln ton od postawionej prognozy
Względny błąd predykcji V* = 17,2%
V* = V/Y

* 100%

Kwartał II
Su

= 0,6

Su = 0,7745

D(a

) = 0,3464 D(a

) = 0,9486

= 60% R

= 40%

= 8 V = 1,2247

V* = 15,31%

Kwartał III
Su

= 1,15

Su = 1,0723

D(a

) = 0,4975 D(a

) = 1,3133

= 48,42% R

= 51,58%

= 11,7

V = 1,6955

V* = 14,49%

Kwartał IV
Su

= 0,15

Su = 0,3872

D(a

) = 0,1732 D(a

) = 0,4743

= 40% R

= 60%

= 14

V = 0,9123

V* = 4,37%

Zalety metody trendów jednoimiennych okresów:
+ horyzontem są 4 kwartały w przyszłości i nie są obciążone błędem, we wszystkich 4 kwartałach najniższe z
możliwych błędów
+ szacujemy tylko i wyłącznie trendy liniowe
+ służy prognozowaniu, gdy zmiana prognoz wykazuje zmiany sezonowe
+ nie musimy wprowadzać zmiennych naśladujących sezonowość

Wady:

wymagana duża ilość obserwacji w szeregu czasowym

czasami jest dużym przybliżeniem, trend mało elastyczny

MODEL KLEINA

Model ze zmiennymi zerojedynkowymi.
Gdy zmienna wykazuje trend, wahania sezonowe i przypadkowe, z addytywnym przebiegiem sezonowości. Do
wyodrębnienia wahań sezonowych można wykorzystać zmienne zerojedynkowe (naśladujące).

m – odległość cyklu wahań
Do modelu wprowadzamy „m” zmiennych zerojedynkowych czyli V

, V

...V

wprowadzenie zmiennej

naśladującej wymaga wprowadzenia parametru strukturalnego.

Y

= f(t) +

+ ... +

Z parametrem

odpowiadają za sezonowość.

Z definicji addytywnych wahań sezonowych wynika że:

∑

−

Wprowadzając

do modelu otrzymamy jego następującą postać. Model ten nie ma zastosowania dla trendów

nieliniowych.
Y

= f(t) +

-V

) +

-V

) ... +

m-1

m-1t

– V

) +

EKONOMETRIA

Dr Stanisław Barczak

Parametry

i informują o ile średnio rzecz biorąc w i-tym okresie cykle wahań poziomów zjawiska różni się od

poziomu wynikającego z ogólnej tendencji rozwojowej.

Przykład:

‘95

‘96

‘97

‘98

-3

-2

-1

-V

) 1

-1

T sumujące się do 0 lepsze dla liczenia „na piechotę“

V

=> I połowa 1; II połowa 0

=> I połowa 0; II połowa 1

Model:
Y

-V

) +

Model szacujemy MNK:













−

























−

= 8,93t – 8,75 (V

– V

) + 51,25 + u

lub

= 8,93t – 8,75V

+ 8,75V

+ 51,25 + u

W latach 95-98 rozpatrywany proces wzrastał z półrocza na półrocze średnio rzecz biorąc o 8,93
W drugim półroczu roku ’94 przeciętny poziom rozpatrywanego procesu wynosił 51,25.
W rozpatrywanym okresie odchylenie od trendu wynosiło –8,75 w pierwszych półroczach oraz 8,75 w drugich
półroczach.

Wartość teoretyczna modelu
Y*

= 15,71 => 8,93(-3) – 8,57(1) + 51,25

= 42,14 => 8,93(-2) – 8,75 (-1) + 51,25

= 33,57

= 60

= 51,43

= 77,86

= 69,28

Suma u

= 42,857

n = 7; k = 3; S

u = 10,71; su = 3,27













−

)

(

D(a

) = 0,62 D(

) = 1,25 D(a

) = 1,25

Śr.Y = 50
Suma(Y

– śr.Y)

= 2800

= 1,53% (= 42,85/2800) R

= 98,47%

prognoza na drugie półrocze 98 t=4, V

-V

= -1

= 8,93(4) – 8,75(-1) + 51,25 = 95,71

Średni błąd predykcji:













−

V = 4,5175 V* = 4,72%

Wady:

tego typu modele są nieelastyczne, co generuje błędy

Zalety:
+ prosty w szacowaniu i identyfikacji

EKONOMETRIA

Dr Stanisław Barczak

PROGNOZOWANIE NA PODSTAWIE MODELU EKONOMETRYCZNEGO

Zgromadzono następujące dane:
Yt – zgony niemowląt na 1000 urodzeń żywych
X

– spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku

– PKB na jednego mieszkańca w $

Lata

1992

1993

1994

1995

1996

1997

1998

1999

2000

17,3

16,1

15,1

13,6

12,2

10,2

9,5

8,9

8,1

3,5

3,8

3,5

2,9

2,8

2,4

2,1

2,0

2198

2233

2402

3293

3724

3725

4098

4014

4078

Oszacowano model:

Y*

– 1,79X

– 0,0026X

+ 15,46 + u

(1,048) (0,00913) (5,998)

Budujemy prognozę na 2001.
Miary struktury stochastycznej.
N = 9; k = 3l Su

= 0,796954 Su = 0,892723

Istotność parametrów strukturalnych test t-studenta.

= 0,2 t

= 1,415

= 1,7118

= 2,8073

Obie zmienne wchodzą do modelu













−

986

005

134

005

0000008

0008

134

0008

098

)

(

= 5,29% R

= 94,71% Vs = 7,24%

Autokorelacja n = 9; k = 2
H

= 0

< 0

DW = 2,08 DW’ = 1,92
Jeżeli DW > 2 to hipotezę alternatywną j/w; jeśli < 2 to odwrotnie znak większości.

d

= 0,629 d

= 1,699

DW’ > du – brak podstaw do odrzucenia H

. Brak istotnie ujemnej autokorelacji.

Budujemy prognozę.

Prognozy przyszłych wartości zmiennych objaśniających budowane będą na podstawie modeli tendencji
rozwojowych o postaci liniowej.

Prognoza zmiennej X

= Y

tx1t

=> Y

tx1t

t = 1...9

tx1t

= -0,24t + 4,19 + u

= 89%

(0,032) (0,18)
Prognoza dla t=10 Y

TPx1t=10

= 1,79 (prognoza X

dla roku 2001)

Prognoza zmiennej X

= Y

tz2t

=> Y

tx2t

t = 1...9

tx2t

= 278,12t + 1916,64 + u

= 88%

(38,74) (217,98)
Prognoza dla t=10 Y

TPx2t=10

= 4697,84 (prognoza X

dla roku 2001)

Podstawiamy realizacje do modelu:
Y*

TP=2001

= 1,79 * 1,79 – 0,0026 * 4697,84 + 16,46 = 6,64

EKONOMETRIA

Dr Stanisław Barczak













4697

=> V = 1,08962; czyli mylimy się +/- 1 zgon.

Względny średni błąd predykcji V* = 16,41%
W roku 2001 faktycznie było 7,7 zgonów niemowląt (wg naszych prognoz 6,64).

Trafność prognozy Y

– Y

= -1,06

Błędy ex-post. Współczynnik Theila

∑

∈

−

)

(

Współczynnik rozbieżności Theila przybiera wartości równe zeru w przypadku gdy

predykcja jest idealnie dokładna.

Pierwiastek kwadratowy współczynnika Theila informuje jaki był przeciętny względny błąd prognozy w okresie
weryfikacji prognoz bez względu na to co było tego przyczyną.

I

= I

+ I

można całość podzielić przez I

i wtedy współczynniki sumują się do 0 i można określić jaki

jest udział poszczególnego we współczynniku I

∑

∈

−

)

(

m – wielkości „sparowane”. Wygasłe prognozy + rzeczywiste.

m – tyle ile jest tych par.

Mierzy czy predykcja jest rzeczywiście nieobciążona. W przypadku spełnienia tego warunku licznik równy jest 0.

∑

∈

−

)

(

S – odchylenie standardowe zmiennej prognozowanej
S

– odchylenie standardowe prognoz wygasłych

Służy do badania na ile estatyczność predykcji była dostosowana do rzeczywistych wahań zmiennej prognozowanej
– czy wahania zostały przewidziane.

∑

∈

−

)

(

r – współczynnik korelacji

Oparty o współczynnik korelacji
Informuje o błędach wynikających z niedostatecznej zgodności kierunku zmian prognoz, ze zmianami kierunku
zmiennej prognozowanej

∑

∈

∑

∈

- średnia z prognoz wygasłych (ex post).

EKONOMETRIA

Dr Stanisław Barczak

∑

∈

−

)

(

∑

∈

−

)

(

- odchylenie standardowe prognoz

∑

∈

−

)

(

)

(

- współczynnik korelacji liniowej między zmienną prognozowaną, a

prognozami.

Oszacowany model tendencji rozwojowej:
Yt = -0,24t + 4,19 + u

Współczynnik Theila
śr.Yt = 2,97

śr.Y

= 2,97

S = 0,6662

= 0,6282

V = 0,9429
I

= 0,005285

I – 0,07269

= 0,00000000000000000000000000000000218 = 0

= 0,000155

= 0,005129 <= największe zagrożenie dla nas to ten błąd.

Nie należy prognozować w oparciu o 1 model lub 1 błąd.

MODELE ZE ZMIENNYMI NAŚLADUJĄCYMI

Uwagi wstępne
Granger oraz Mansfield wykazali możliwość przewidywania zmian koniunktury na podstawie wcześniejszych zmian
zachodzących w pewnej klasie zmiennych nazywanych zmiennymi wiodącymi.

Typy zmiennych:
Zmienne wiodące – charakteryzują się określonymi zmianami swoich wartości, zachodzącymi wcześniej niż miary
wartości – innej grupy zmiennych, które określa się jako zmienne naśladujące.

Zmienne naśladujące – naśladują z pewnym opóźnieniem zmiany zachodzące w wartości zmiennych wiodących.

Znalezienie (identyfikacja) zmiennej wiodącej umożliwi budowę prognozy zmiennej naśladującej.

Warunek budowy prognozy:
podstawowym warunkiem budowy prognozy jest duże podobieństwo kształtowania się wartości obu zmiennych w
czasie
przy budowie prognoz oprócz podobieństwa zmiennych należy uwzględnić następujące opóźnienia w czasie

Podobieństwo i opóźnienia w czasie (p) [brak cykliczności]

Do  pomiaru  podobieństwa  oraz  wyznaczania  wielkości  opóźnienia  w  czasie  (p)  można  zastosować  współczynniki
korelacji liniowej. Opóźnienie zależy od szeregu czasowego.

Podobieństwo i opóźnienie w czasie (p) [istnieje cykliczność]
W  przypadkach  występowania  wahań  cyklicznych  (w  szeregu  czasowym  obu  zmiennych  opóźnienie  w  czasie  (p)
może  być  wyznaczone  jako  liczba  jednostek  czasu  dzieląca  okres  o  najwyższej/najniższej  wartości)  wartości
zmiennej  wiodącej  w  danym  cyklu  od  okresu  o  najwyższej/najniższej  wartości  zmiennej  naśladującej  w  jej
rozpatrywaniu.

Podobieństwo i opóźnienie w czasie [istnieje cykliczność]

p = t

maxY

– t

maxX

lub p = t

minY

– t

minX

p – opóźnienie
t

maxX

– numer okresu o najwyższej wartości zmiennej wiodącej

maxY

– numer okresu o najwyższej wartości zmiennej naśladującej

minX

– numer okresu o najniższej wartości zmiennej wiodącej

EKONOMETRIA

Dr Stanisław Barczak

minY

– numer okresu o najniższej wartości zmiennej naśladującej

Gdy w szeregach czasowych obu zmiennych następuje więcej niż 1 cykl wówczas opóźnienie może być wyznaczone
jako średnia arytmetyczna lub mediana opóźnień obliczanych dla poszczególnych cykli.
Uwaga!: daje czasami błędne rezultaty

Rozwiązanie przynoszące lepsze wyniki to:
Określenie wielkości opóźnienie na podstawie współczynników korelacji.
Polega na obliczeniu wartości współczynnika korelacji dla różnych opóźnień czasowych i wyborze tego opóźnienia
dla którego wartość współczynnika korelacji jest najwyższa.

Przykłady zmiennych wiodących:
barometr koniunktury całej gospodarki lub branży może stanowić zmienną wiodącą dla budowy prognoz sprzedaży
niektórych produktów
indeks siły nabywczej publikowany w USA, zawiera on informacje dotyczące oceny zmiany zaludnienia, dochodów
ludności, sprzedaży detalicznej oraz kompleksowy szacunek wielkości popytu
rynek samochodów, na którym zmienną wiodącą są dochody ludności, zmienna ta często wykazywana jest przez
producentów samochodów i ma za zadanie określić przyszły popyt poprzez pryzmat wcześniejszej sytuacji
finansowej konsumentów
liczba narodzin dzieci, liczba dzieci w wieku szkolnym, liczba dzieci w wieku przedszkolnym, mogą one stanowić
zbiór zmiennych wiodących dla prognoz przyszłego popytu na produkty skierowane do dzieci

Budowa prognozy zmiennej prognozowanej (naśladującej)

Dane jest opóźnienie czasowe między zmienną prognozowaną, a zmienną wiodącą.

∆

t+1

– względna zmiana (wzrost/spadek) wartości zmiennej prognozowanej w okresie t+1 w porównaniu z

okresem t.

−

∆

t-p

t+1-p

– względna zmienna (wzrost/spadek) wartości zmiennej wiodącej X w okresie t+1-p w porównaniu do

okresu t-p

−

∆

____

∆

- średnia bezwzględnych wartości

∆

w n przyszłych okresach.

______

−

∆

- średnia z bezwzględnych wartości

______

1 p

−

∆

w n przyszłych okresów.

W okresie prognozy t+1 > n; będzie zachodziła w przybliżeniu następująca równość.

−

∆

≈

∆

lub

(

)

(

)

−

∆

≈

−

Po dokonaniu odpowiednich przekształceń prognoza na okres t+1 będzie dana jako:













∆

−

∗

___

EKONOMETRIA

Dr Stanisław Barczak

Maksymalny horyzont prognozy będzie równy opóźnieniu p

Przykład:

III

1999

2000

2001

2002

Proces 1 165 167 201 245 267 269 261 257 205 175 165 155 153 151 161 165

Proces 2 243 271 299 281 259 209 179 169 157 153 149 161 179 203 219 229

Opóźniamy proces pierwszy kolejno o 1, 2 ,3 i 4 okresu [po prostu przepisujemy I 1999. kolejno na II 1999, III
1999, IV 1999, a przy opóźnieniu o 4 I 2000; i tak kolejno z wszystkimi obserwacjami].

Korelacje:
Opóźnienie o 1 kwartał = 0,57
Opóźnienie o 2 kwartały = 0,88
Opóźnienie o 3 kwartały = 0,98

max współczynnik korelacji i z tym opóźnieniem szacujemy model

Opóźnienie o 4 kwartały = 0,92

Najwyższą wartość współczynnika korelacji została wyznaczona przy opóźnieniu o 3 kwartały, stąd opóźnienie w
czasie dane jest jako p=3

(

)

−

∆

stąd:

(

)

1
3

−

∆

;

(

)

−

∆

średnia

_____

∆

= 0,0764

średnia

____

−

∆

= 0,0882

Ostatecznie przewidywana wielkość procesu 1 w I kwartale 2003 dana jest jako:













∆

−

∗

___

stąd:

159

184

165

088

134

076













∗

Model ekonometryczny

Przy porównywaniu czasowym wyznaczamy 3 budowane modele ekonometryczne o następującej postaci:
Y*

= a

t-p

+ a

Na podstawie MNK.
Y*

– prognoza na moment okres t.

t-p

– wartość zmiennej wiodącej w okresie t-p

– parametry strukturalne modelu.

t – czynnik losowy

= 0,87X

t-3

+ 18,49 + Ut

= 96,9%

Podstawiamy do modelu wartości zmiennej wiodącej z II 2002, czyli 203 i otrzymujemy prognozę procesu 1 na I
2003.
Y*

= 0,87

203 + 18,49 = 195,1

Modele ze zmiennymi wiodącymi pozwalają na przewidywanie w przyszłym kształtowaniu się zmiennej
prognozowanej zarówno w przypadku występowania wahań sezonowych jak i cyklicznych.
Modele mogą uwzględniać większą liczbę zmiennych wiodących.

EKONOMETRIA

Dr Stanisław Barczak

MODELE AUTOREGRESYJNE I ŚREDNIEJ RUCHOMEJ (ARMA) I (ARIMA)

Nie ma zmiennych objaśniających – same szeregi czasowe.

Określają związek funkcyjny między wartościami zmiennej prognozowanej w okresie / momencie t, a wartościami
tej zmiennej z okresów/momentów poprzednich t-1, t-2 ... t-p; p – opóźnienie.

Powody stosowania:

1) Istnieje wiele zjawisk gospodarczych wskazujących na występowanie opóźnienia ich przebiegu w czasie

np. popyt na wiele dóbr trwałego użytku charakteryzuje się cyklami opóźnień związanymi z okresem ich
użytkowania

2) Rezygnacja z uwzględniania niejednokrotnie wielu zmiennych objaśniających

Zastosowanie:
Modelowanie stacjonarnych szeregów czasowych czyli:

takich szeregów czasowych, w których występują jedynie wahania losowe wokół średniej

szeregów czasowych niestacjonarnych sprowadzanych do stacjonarnych

Klasyfikacja modeli autoregresyjnych i średniej ruchomej:

•

Modele autoregresji (AR)

•

Modele średniej ruchomej (MA)

•

Modele mieszane autoregresji i średniej ruchomej (ARMA)

Zintegrowane modele autoregresji i średniej ruchomej – w nich zakłada się stacjonarność zmiennej prognozowanej.

W przypadku braku stacjonarności:

dokonuje się przekształcenia szeregu czasowego w szereg stacjonarny, przeprowadzając operację
różnicowania, która polega na d-krotnym obliczaniu różnic sąsiednich wyrazów szeregu

Pierwsze różnice oblicza się jako: w

= y

– y

t-1

; drugie jako: z

= w

– w

t-1

= (y

– y

t-1

) - (y

t-1

– y

t-2

) = y

– 2y

t-1

+ y

t-2

Kolejne oblicza się analogicznie.
Przeprowadza się tą operacją, aż do momentu gdy szereg czasowy stanie się stacjonarny.

Budowane dla tych przekształconych szeregów czasowych modele określa się mianem zintegrowanych modeli:

1)  Autoregresyjne (ARI)
2)  Średniej ruchomej (IMA)
3)  Autoregresji i średniej ruchomej (ARIMA)

Przyjęta uniwersalna notacja modeli:
ARIMA (p,d,q)
p – rząd autoregresji, wielokrotność opóźnienia
d – krotność różnicowania
q – liczba parametrów średniej ruchomej
ARIMA(p,0,0)

AR(p)

ARIMA(0,0,q)

MA(q)

ARIMA(p,0,q)

ARMA(p,q)

ARIMA(p,d,0)

ARI(p,d)

Podejście do budowy modeli zaproponowane przez BOXa i JENKINSa w 1976

Zakładamy, że tworzymy nowy stacjonarny szereg czasowy zmiennej prognozowanej.
Po identyfikacji odpowiedniego dla danego szeregu czasowego modelu, czyli określenia jego postaci oraz wielkości
uwzględniających w modelu opóźnień, używa się współczynników autokorelacji i autokorelacji cząstkowej.

Główna zasada:
Jeśli wartość współczynnika autokorelacji wykładniczo maleje do 0, czyli liczba tych współczynników istotnie
różnych od 0 jest stosunkowo duża, a liczba współczynników autokorelacji cząstkowej istotnie różniących się od 0
jest bardzo mała to należy stosować MODEL AUTOREGRESYJNY

Jeśli wartość współczynników autokorelacji cząstkowej wykładniczo maleje do 0, czyli liczba tych współczynników
istotnie różniących się od 0 jest stosunkowo duża, a liczba współczynników autokorelacji istotnie różniących się od
0 jest bardzo mała to powinno się stosować MODELE ŚREDNIEJ RUCHOMEJ

EKONOMETRIA

Dr Stanisław Barczak

Jeśli współczynniki autokorelacji oraz autokorelacji cząstkowej wykładniczo maleją do 0, czyli liczby tych
współczynników istotnie różniących się od 0 są stosunkowo duże to należy stosować MODELE MIESZANE
AUTOKORELACJI I ŚREDNIEJ RUCHOMEJ

Ogólny proces liniowy [Yule]

Biały szum
Szeregi czasowe, w których kolejne wartości są silnie zależne przedstawione są jako szeregi generowane przez ciąg
niezależnych zakłóceń losowych impulsów

Zakłócenia te są realizacjami zmiennych losowych o ustalonym rozkładzie (najczęściej rozkład normalny) o
wartości oczekiwanej E(x) = 0 i

. Ciąg takich zmiennych losowych to biały szum.

Szereg czasowy o silnie skorelowanych wartościach traktowany jest jako realizacja procesu {Yt} określonego w
następujący sposób.

Yt =

t-1

t-2

...

- parametry (wagi) modelu

- określony poziom rozpatrywanego procesu, dla procesów stacjonarnych określa on poziom średni

– zakłócone impulsy losowe.

Wprowadzamy operator przesunięcia wstecz dany jako: B

t-i

Yt =

*(1 +

+ ...) => Yt =

(B)

; przy założeniu, że

B = 1 +

+ ...

Proces może być traktowany jako wyjaśnienie filtru liniowego funkcji danej jako:

B = 1 +

+ ... przekształcającej biały szum w proces stochastyczny.

Proces filtracji polega na przedstawieniu szeregu czasowego jako ważonych sum poprzednich zakłóceń losowych

Pojęcie funkcji losowej:
Przyjmijmy, że t jest nielosową wartością rzeczywistą w zbiorze T, oraz, że T może być przedziałem skończonym
lub nieskończonym.
W zastosowaniu ekonomicznych zakłada się, że t jest zmienną czasu.
Y(t) jest funkcją losową, jeżeli zna się odpowiednie dystrybuanty dowolnego zbioru zmiennych losowych czyli:
Y(t

); Y(t

)....(Yt

), gdzie ti należy do T; i = 1,2....n

Łączna dystrybuanta zmiennych losowych dana jest jako:
F

t1,t2...t2

...y

) = P [Y(t

) < y

; Y(t

) < y

...; Y(t

) < y

]

Są to warunki zgodności; jeśli znamy dystrybuantę – zgodny, jeśli nie znamy – niezgodny

Funkcja losowa Y(t) nielosowego rzeczywistego argumentu t nazywa się procesem stochastycznym.
Wg Boxa i Jenkinsa procesem stochastycznym jest zjawisko stochastyczne zmieniające się w czasie zgodnie z
rozkładem prawdopodobieństwa.

Proces stochastyczny z czasem dyskretnym (ozn. Y

) ma miejsce wówczas gdy zbiór argumentów t obejmuje tylko

liczby całkowite.

Pole losowe stanowi funkcję losową wielu nieskończonych argumentów.

W ekonomii polem nielosowym mogą być wydatki na żywność gospodarstw domowych, będące funkcją takich
argumentów jak: czas, grupa społeczno-ekonomiczna, dochód etc.

Charakterystyki procesu stochastycznego z czasem dyskretnym

1) średnia wartość m

= E(Y

); t = 0,

2 ...

2) wariancja D

) = E(Y

- m

)

; t = 0,

2 ...

3) funkcja kowariancji K(t,s) = E[(Y

– m

)

– m

)]’ t = 0,

2 ...... t

≠

s; s – chwila

4) funkcja autokorelacyjna:

( )

)

(

)

(

)

(

; gdzie

= t – s

5) spektrum – funkcja gęstości spektralnej:

( )

∑

∞

−∞

)

(

; gdzie

; i = 0,1,2... ½ N

EKONOMETRIA

Dr Stanisław Barczak

Procesy stochastyczne stacjonarne i niestacjonarne.

Proces stacjonarny oznacza, że ciąg wag

... jest skończony lub nieskończony, zbieżny, a parametr

jest

średnią wokół, której występują wahania przypadkowe.

Proces niestacjonarny oznacza, iż ciąg wag nie spełnia warunków skończoności/nieskończoności i zbieżności, a
parametr

nie ma większego znaczenia i służy jako punkt odniesienia poziomu procesu.

Procesy stochastyczne dzielimy na:
1)  stacjonarny w węższym i szerszym sensie
2)  niestacjonarne

Proces  stochastyczny  w  węższym  sensie  –  dystrybuanta  związana  z  n  obserwacjami  y

, y

, ..... y

dokonywanymi w dowolnych momentach czasu t

, t

, ... t

, jest taka sama jak dystrybuanta związana z n-

obserwcajami y

t1+k

, y

t2+k

....y

tn+k

dokonywanymi w momentach t

1+k

, t

2+k

...t

n+k

, czyli zachodzi warunek:

t1+k,t2+k....tn+k

t1+k

t2+k

....y

tn+k

) = F

t1,t2...tn

...y

)

Oznacza to, że łączna dystrybuanta dowolnego zbioru obserwacji nie ulega zmianie w czasie przy przesunięciu
na osi czasu o k-całkowitych jednostek do przodu lub do tyłu.

Proces stacjonarny w sensie szerszym – ma miejsce jeżeli wartość średnia i wariancja procesu są stałe,
niezależnie od czasu t, a funkcja kowariancji zależy od różnicy t – s =

, czyli spełnione są następujące warunki:

1) średnia wartość m

= E(Y

) = const.

2) wariancja D

) = E(Y

- m

)

= const.

3) funkcja kowariancji K(t,s) = K(

)

Stacjonarność w węższym

stacjonarność w szerszym.

Stacjonarność w szerszym sensie nie wymaga stabilności rozkładów, a jedynie stabilności pewnych parametrów tych
rozkładów (w/w).

W analizie ekonometrycznej wykorzystuje się metody procesów stacjonarnych w szerszym sensie.

Ergodyczność – oznacza, że każda poszczególna realizacja procesu stochastycznego jest pełnoprawnym
przedstawicielem całego zbioru możliwych realizacji.

Założenie o ergodyczności umożliwia obliczanie głównych charakterystyk procesu na podstawie jednej realizacji dla
wystarczająco długiego okresu, czyli po czasie t, a nie na podstawie pewnej liczby realizacji danego procesu, czyli
po realizacjach.

Proces jest niestacjonarny gdy nie jest spełniony przynajmniej 1 z 3 w/w warunków
Można wyróżnić następujące procesy niestacjonarne:

1)  procesy niestacjonarne w średniej, stacjonarne w wariancji
2)  procesy niestacjonarne w wariancji, stacjonarne w średniej
3)  procesy o niestacjonarnej funkcji kowariancji i stałych wartościach średnich
4)  procesy niestacjonarne w średniej i wariancji oraz funkcji kowariancji.

Ekonomiczny proces stochastyczny przedstawiany jest jako:
Y

= P

+ S

+ C

Pt – trend
St – wahania sezonowe
Ct – wahania cykliczne (koniunkturalne)

t – nieregularne wahania przypadkowe.

Przez trend Pt rozumie się ogólne tendencje rozwojowe (kierunek rozwoju) charakteryzują dany szereg czasowy na
przestrzeni dłuższego okresu. Trend kojarzony jest z powolnymi i systematycznymi zmianami poziomu procesu
ekonomicznego zachodzącego w długim okresie pod wpływem działania silnych, trwałych przyczyn. Zakłada się, że
funkcje opisujące trend powinny zachować się gładkością i spokojnością przebiegu.

Wahania sezonowe St

są wahaniami powtarzającymi się periodycznie w pewnych określonych podokresach

(miesiące, kwartały) każdego roku. Występowanie wahań sezonowych, które oscylują wokół trendu jest efektem
oddziaływania podstawowych czynników sezonowych: czynniki kalendarzowe, klimatyczno-przyrodnicze oraz

EKONOMETRIA

Dr Stanisław Barczak

czynników społeczno-ekonomicznych bezpośrednio lub pośrednio zależnych od podstawowych czynników
sezonowych. Ważne jest zawsze rozstrzygające o typie wahań sezonowych.

Wahania Ct

są wahaniami powtarzającymi się cyklicznie z mniejszą lub większą regularnością. Uważa się je za

odzwierciedlenie wahań koniunkturalnych w gospodarce. Charakteryzują się one duża zmiennością cykli, czasu
trwania poszczególnych wielkości, amplitud. Utrudnia ten fakt prowadzenie badań.
Można wyróżnić liczby faz:
2 – ekspansja i recesja
3 – wzrost większy od trendu, wzrost zbliżony do trendu, wzrost niższy od trendu
4 – ostrzeżenie, recesja, ożywienie, ekspansja
6 – wzrost, rozkwit, ostrzeżenie, recesja, depresja, ożywienie

Wahania nieregularne

trudno jest podać jeden ich schemat. Można jednak wyróżnić wahania przypadkowe i

wahania katastrofalne.

Linii trendu nie da się oddzielić od linii wahań cyklicznych ponieważ linie te nie powstały pod działaniem
oddzielnych zespołów przyczyn.
Do początku lat 70-tych zasadą stało się rozpatrywanie trendu i wahań koniunkturalnych łącznie. Zatem proces
ekonomiczny można zapisać jako: Y

= P

+ S

Z punktu widzenia teorii procesów stochastycznych model: Y

= P

+ S

można zapisać jako: E(Y

) = P

+ S

Co oznacza, że model opisuje niestacjonarny proces stochastyczny ze zmienną wartością oczekiwaną. Proces
odchyleń od trendu i wahań sezonowych

t jako stacjonarny o średniej równej zero.

Trend Pt procesu stochastycznego można nazwać pewną krzywą ciągłą wyznaczoną przez wartości oczekiwane
procesu w układzie współrzędnych prostokątnych, w którym oś odciętych (X) odpowiada ciągłej zmiennej czasowej
t.

Proces autoregresyjny AR(p)

Proces autoregresyjny rzędu p dany jako:
Yt =

t-1

t-2

+ .... +

t-p

Gdzie:

...

są parametrami procesu; p – opóźnienie czasowe;

- zakłócenia losowe i jest zmienną losową o

rozkładzie N(0,

)

Proces autoregresyjny AR(p) charakteryzuje się tym, że jego bieżąca wartość jest sumą skończonej kombinacji
liniowej poprzednich jego wartości oraz zakłócenia losowego.
Proces autoregresji można traktować jako liniowe równanie regresji wielorakiej zmiany Yt względem opóźnionych
w czasie wartości tej zmiennej.

Stosując operator przesunięcia wstecz B, proces można przedstawić jako:

(B)Yt =

gdzie:

= 1 -

- .... -

jest wielomianem charakterystycznym procesu rzędu

„p”.

(B) = 0

równanie charakterystyczne procesu.

Problem identyfikacji procesu autoregresyjnego AR(p)

Polega na stwierdzeniu, że rozpatrywany proces jest procesem autoregresyjnym oraz na określenie jego rzędu p.

Identyfikacja:
Polega na porównaniu własności teoretycznych funkcji autokorelacji i autokorelacji cząstkowej z zachowaniem się
współczynników autokorelacji i autokorelacji cząstkowej oszacowanych na podstawie szeregu czasowego.

Funkcja autokorelacji dana jako: Yt =

t-1

t-2

+ .... +

t-p

k-1

k-2

+ ...... +

k-p

gdzie

k-1

....

k-p

– współczynniki autokorelacji przy odstępie równym k, k-1, ... k-p

...

są parametrami procesu

Jeżeli proces jest stacjonarny to rozwiązaniem jest funkcja auokorelacji składająca się z zanikających funkcji
wykładniczych i sinusoid tłumionych.

Podstawiając do równania:

k-1

k-2

+ ...... +

k-p

; kolejno dla k=1,2...p

EKONOMETRIA

Dr Stanisław Barczak

Otrzymujemy układ równań Yule’a-Walkera dany jako:













−

....

..........

....

Zmieniając teoretyczne wartości współczynników autokorelacji na współczynniki autokorelacji

oszacowane na

podstawie szeregu czasowego otrzymane jest tzw. oszacowanie Yule’a-Walkera

Funkcja autokorelacji cząstkowej:

W celu oszacowania korzystamy równań Yule’a-Walkera
Dodatkowo przyjmuje się, że

to j-ty współczynnik w procesie autoregresji rzędu k. Oznacza to, że ostatni

współczynnik to

, który spełnia następujący uklad równań:

k,1

j-1

k,2

j-2

+ ...... +

k,k-1

j-(k-1)

k,k

j-k

j =1,2....k

Rozwiązując równania kolejne dla k = 1,2 otrzymujemy:

1,1

















































Wielkość

jest traktowana jako funkcja odstępu k i nazywa się funkcją autokorelacji cząstkowej. W przypadku

AR(p) jest ona różna od 0 dla k

≤

i równa 0 dla k > p, zatem funkcja ta urywa się w okresie p.

Wykorzystując procesy AR(p) modelowane są zarówno procesy stacjonarne jak i niestacjonarne.

Proces średniej ruchomej MA(q)
Przyjmuje, że tylko q początkowych wag procesu:
Yt =

t-1

t-2

+ .... +

t-p

Jest różny od 0 to proces taki nazywamy procesem średniej ruchomej dany jako:
Yt =

+ v

t-1

– v

t-2

- ....... - v

t-q

t-1

.....

t-q

– odchylenia losowe w okresach t, t-1, ... t-q o rozkładzie N(0,

)

- v

– v

- .... – v

– parametry modelu (wagi), q – wielkość opóźnienia

Średnia ruchoma – wagi modelu nie muszą się sumować do jedności i mogą przyjmować wartości ujemne.

Korzystając z operatora przesunięcia wstecz, model średniej ruchomej można zapisać jako:
Yt =

(B)

gdzie:

(B) = 1 – v

- .... – v

– wielomian charakterystyczny

(b) = 0 – równanie charakterystyczne

Identyfikacja procesu MA(q)

Identyfikacja procesu średniej ruchomej MA(q) odbywa się przez porównanie teoretycznych i empirycznych
współczynników autokorelacji i autokorelacji cząstkowej. Przy czym teoretyczna funkcja autokorelacji tego procesu
dana jest jako:











−

dla

;

...

;

...

....

Funkcja ta jest równa 0 dla wartości k większych niż rząd procesu oznacza, to że urywa się punkcje q.

Model średniej ruchomej jest zawsze stacjonarny, niezależnie od wartości parametrów.

EKONOMETRIA

Dr Stanisław Barczak

Proces autoregresji i średniej ruchomej ARMA(p,q)

W celu zwiększenia elastyczności oraz dopasowania modelu do danych empirycznych często łączy się 2 procesy
czyli AR(p) i MA(q).
Jest to spowodowane faktem, że nie zawsze możliwy jest wybór procesu o postaci AR(p) lub MA(q), który
charakteryzuje się niewielką liczbą parametrów i jest dobrze dopasowany do danych empirycznych.

Proces autoregresji i średniej ruchomej jest dany jako:
Yt =

t-1

t-2

+ .... +

t-p

- v

t-1

– v

t-2

- ....... - v

t-q

Stosując operator przesunięcia wstecz B, proces można zapisać jako:

(B)Y

(B)

Postać funkcji autokorelacji procesu ARMA(p,q) zależy od parametrów p i q:

jeżeli q-p < 0 to funkcja autokorelacji składa się z funkcji wykładniczych i/lub sinusoid tłumionych

jeżeli p-q > 0 to wystąpi q-p+1 początkowych wartości

....

p-q

, które nie są rozważane przez ten

proces.

Funkcja  autokorelacji  cząstkowej  procesu  ARMA(p,q)  zachuje  się  jak  funkcja  autokorelacji  cząstkowej  procesu
średniej ruchomej, zależnie od rzędu średniej ruchomej wartości parametrów. Urywa się w punkcie p.

Z góry założona stacjonarność.

Proces zintegrowany
W  przypadku  szeregu  czasowego,  który  nie  jest  stacjonarny  można  go  sprowadzić  do  stacjonarności  poprzez
operację różnicowania, czyli d-krotnym obliczaniu różnic sąsiednich wyrazów.

Szereg  czasowy,  którego  pierwsze  różnice  są  stacjonarne  nazywany  jest  szeregiem  zintegrowanym  stopnia
pierwszego.
Szereg czasowy, którego drugie różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia drugiego.
Itd.

Szereg, który jest stacjonarny nazywamy zintegrowanym szeregiem stopnia zerowego.

Proces można zapisać przy pomocy tzw. operatora różnic rzędu danego:

∇

= (1-B)

Proces przyjmuje postać:

∇

= y

– y

t-1

∇

t-1

= (y

- y

t-1

) – (y

t-1

– y

t-2

)

∇

d-1

t -

∇

d-1

t-1

Zatem jeżeli szereg czasowy dany jako (y

)

t=1,2....n

o liczbie wyrazów n zadziałamy operatorem (w

)

t=d+1....n

(

∇

)

t=d+1....n

; którego liczba wyrazów będzie wynosić n –d.

Jeżeli szereg taki okaże się stacjonarny to można go modelować stosując, jeden z procesów AR(p), MA(q),
ARMA(p,q) określonych mianem:

•

zintegrowanego procesu regresji ARI(p)

•

zintegrowanego procesu średniej ruchomej IMA(q)

•

zintegrowanego procesu autoregresji i średniej ruchomej ARIMA(p,d,q)