background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

ZAGADNIENIA WSTĘPNE 

 
Czym jest ekonometria? 
Umożliwia dokonywanie pomiarów procesów ekonomicznych. 
 
Twórcy: 
Frish (1936r) – unifikacja teorii ekonomii, statystyki i matematyki. Główny cel ekonometrystów to przewidywanie 
cykli koniunkturalnych. Początek od stworzenia zakłóconego ruchu wahadła (analogia do wahań giełdowych). 
 
Ekonometria to: 
Gregory C. Chaw – jest nauką i sztuką stosowania metod statystycznych do mierzenia relacji ekonomicznych. 
 
Zbigniew  Pawłowski  –  jest  nauką  o  metodach  badania  ilościowych  prawidłowości  występujących  w  zjawiskach 
ekonomicznych za pomocą odpowiednio wyspecjalizowanego aparatu matematyczno-statystycznego. 
 
Oskar  Lange  –  nauka  o  ilościowych  aspektach  procesów  ekonomicznych,  zajmująca  się  ustaleniem  za  pomocą 
statystyki konkretnych ilościowych prawidłowości zachodzących w życiu gospodarczym. 
 
Henry Theil – zajmuj się ona empiryczną weryfikacją spraw ekonomicznych. 
Słowo empiryczne wskazuje na to, że dane wykorzystywane do tej weryfikacji otrzymuje się z obserwacji, natomiast 
obserwacja  może  polegać  na  dokonaniu  kontrolowanego  eksperymentu  w  celu  weryfikacji  określonego 
interesującego go prawa lub też może to być obserwacja bierna. Bierna dominuje wśród ekonomistów. 
 
Historia metod ekonometrycznych. 
 
I  era  –  era  klasycznej  metody  najmniejszych  kwadratów,  modele  TIMBERGENA,  działy:  analiza  popytu 
konsumpcyjnego, podaży, kosztów produkcji, wydajności pracy. 
 
II era – rozwój estymacji 2MNK i 3MNK, metody zmiennych instrumentalnych, powstały modele Kleina, Kleina-
Goldbergena, podejście przyczynowo-skutkowe. 
 
III  era  –  zastosowanie  analizy  mnożnikowej,  Goldberger  w  1956  roku,  powstaje  analiza  przepływów 
międzygałęziowych. 
 
Po II WŚ można powiedzieć, że ekonometria jest już nauką. 
 
IV  era  –  wprowadzenie  analizy  spektralnej  do  ekonometrii,  prekursorzy  tego  to  Jevons  i  Moore,  lata  60te  to 
panowanie analizy spektralnej 
Od lat 60tych powszechna komputeryzacja. 
 
V era – powstają makromodele będące podstawą symulacji i prognozowania, metody „input-output”. Możliwe staje 
się prowadzenie badań o charakterze symulacyjnym. 
 
Ekonometria: 

bada związki ilościowe i jakościowe pomiędzy kategoriami  

jest zbiorem różnych metod  

nie ma wyraźnych granic 

rozważa się ją w powiązaniu z innymi naukami: ekonomią matematyczną (metody i zasady formułowania 
teorii  ekonomicznych),  teorią  ekonometrii  (konstrukcja  modeli  ekonometrycznych  i  opisu  danych), 
statystyką ekonomiczną (zbieranie, gromadzenie i organizacja danych statystycznych) 

 
Przedmiotem analizy ekonometrycznej jest: 

konstrukcja modeli ekonometrycznych 

estymacja jego parametru 

szeroko pojęte wnioskowanie na podstawie modelu ekonometrycznego 

 
Model ekonometryczny: 
Pawłowski  –  konstrukcja  formalna,  która  za  pomocą  jednego  równania,  bądź  też  wielu  równań  odwzorowuje 
zasadnicze powiązania ilościowe zachodzące między badanymi zjawiskami. 
 
Hellwig – model ogólnie rozumiany, musi być zawsze lepszą lub gorszą kopią oryginału i dlatego też, aby można 
było mówić o sensownym sporządzaniu kopii, należy wiedzieć czym jest oryginał; proces powstawania modelu to 
efekt świadomego i celowego odwzorowania fragmentu rzeczywistości 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

Klein – schematyczne uproszczenie rzeczywistości, pomijające nieistotne aspekty. 
 
Specyfikacja  modelu  ekonometrycznego  –  sprecyzowanie  zmiennych  objaśniających,  zmiennych  objaśnianych 
(endogenicznych), podjęcie decyzji co do charakteru występujących w modelu związków oraz podjęcie decyzji co 
do postaci analitycznej modelu (liniowa, nieliniowa sprowadzalna do liniowej, strikte nieliniowa).  
Specyfikacja  modelu  ekonometrycznego  opiera  się  na  informacjach  „a  priori”  (teorie  ekonomiczne)  oraz 
informacjach z badań empirycznych. 
 
Informacja „a priori”: 

istniejące teorie ekonomiczne 

ogólnie znane zależności ekonomiczne typu rozrachunkowego lub bilansowego 

informacje  pochodzące  z  poprzednio  prowadzonych  badań  ekonometrycznych  –  są  podstawą  do  nowych 
rozwiązań 

informacje  o  ustalonych  instytucyjnie  wartościach  odnoszących  się  do  pewnych  zmiennych 
ekonometrycznych (np. oprocentowanie kredytów, stopa dyskontowa, stopa podatku etc.) 

 
Jednorównaniowy model ekonometryczny: 
Y = f(X1,X2....Xk,

ξ

 
Y-  zmienna  endogeniczna  (objaśniana)  –  to  wyróżnione  zjawiska  ekonomiczne,  które  są  opisywane  (wyjaśniane) 
przez  poszczególne równania lub równanie modelu. 
X1-Xk – zmienne objaśniające – służą do opisu, wyjaśniania zmian zmiennych endogenicznych, w modelu jest ich 
pewna ilość 

ξ

  (ksi)  –  składnik  losowy  –  część  stochastyczną  modelu,  jest  zmienną  losową  o  wartości  oczekiwanej  (E(

ξ

)=0)  i 

rozkładzie normalnym, nie jest elementem pozytywnym. 
 
Nigdy nie możemy powiedzieć, że znaleźliśmy wszystkie zmienne X. 

ξ

  -  zawiera  w  sobie  błąd  jaki  popełniamy,  gdyby  nie  on  to  można  idealnie  przewidzieć  np.  kursy  walut., 

ξ

  jest 

pozostałymi zmiennymi X, nieuwzględnionymi w modelu. 
 
W modelu ekonometrycznym składnik losowy wynika z: 

uwzględnienia  wpływu  wszystkich  czynników  mało  istotnych,  niewyspecyfikowanych  w  równaniu  bądź 
równaniach modelu 

z różnic pomiędzy przyjętą postacią analityczną modelu, a istniejącą zależnością w rzeczywistości 

błąd pomiaru zmiennych 

czynniki losowe wpływające na zmienną endogeniczną (np. pobór energii elektrycznej) 

Jeśli dobieramy złą postać analityczną to „zwiększamy” wskaźnik losowści. 

 
Przykład 1 
Zbudujmy model ekonometryczny popytu na kompot z wiśni. Wyspecyfikujemy Y. 
Yt – popyt na kompot z wiśni 
X1t – cena kompotu z wiśni 
X2t – cena kompotu z czereśni 

ξ

 - składnik losowy 

Do konstrukcji modelu wykorzystujemy dane empiryczne. 
Model w sensie ogólnym Yt = f(X1t,X2t, 

ξ

t) 

Trzeba znaleźć postać analityczną modelu dla pełnej jego specyfikacji. 
 
Yt = f(Yt-

1

ξ

) – cena kompotu zależy tylko od czasu – jest to postać autoregresyjna. 

Rzeczą bardzo istotną – odpowiednie wyspecyfikowanie opóźnienia czasowego. 
 
Przykład: 
Model liniowy jednorównanionwy 
Yt = 

α

1

X

1t

+

α

0

 + 

ξξξξ

t

  

Jest  to  model  przyczynowo-skutkowy,  z  jedną  zmienną objaśniającą, gdzie 

α

1 i 

α

0(parametr wolny) to parametry 

strukturalne. 
Model dzieli się na dwie części: deterministyczną i stochastyczną (pogrubiona) 
Do takiej specyfikacji ekonometryk musi wybrać odpowiednie zmienne o charakterze liniowym. 
 
6 etapów budowy modeli ekonometrycznych. 
 

1.  Określenie celu oraz zakresu badania (potrzebne: wiedza i praktyka z zakresu teorii ekonomii i statystki). 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

2.  Specyfikacja  modelu  ekonometrycznego  (określenie  zmiennych  –  endogenicznych  i  objaśniających  oraz 

postać  analityczna  modelu).  Dodatkowo  należy  określić  źródła  danych  oraz  ich  wiarygodność.  Od  tego 
etapu  zależy  powodzenie  przedsięwzięcia  budowy  modelu  ekonometrycznego.  Daje  nam  to  analityczną 
postać  modelu,  wstępną  postać  modelu  –  można  ją  określić  jako  hipotezę  badawczą  –  przypuszczenie  o 
stanie procesu przed przeprowadzeniem badania, musi być jednoznacznie weryfikowalna. 

3.  Gromadzenie  odpowiednich  danych  statystycznych  na  podstawie  których  zostaną  oszacowane  parametry 

strukturalne  modelu  ekonometrycznego.  Parametry  nigdy  nie  będą  znane  (będą  to  tylko  parametry 
szacunkowe) 

4.  Estymacja parametrów strukturalnych modelu 
Y

t

 = 

α

1

X

1

 + 

α

2

X

2

 + 

α

0

 + 

ξ

t

  

Y

t

  =  a

1

X

1

  +  a

2

X

2

  +  a

0

  +  U

  oszacowany  model  ekonometryczny,  parametry  „a”  są  już  konkretnie 

oszacowanymi wartościami. 
Nie istnieje uniwersalna metoda szacowania parametrów strukturalnych. 
Dobór odpowiedniego estymatora (można „rozluźnić” warunki stosowania estymatorów). 
Dokonuje  się  weryfikacji  modelu  ekonometrycznego  (jeśli  weryfikacja  nie  przejdzie  pomyślnie  to  powrót  do 
etapu 1.) 
5.  Praktyczne  wykorzystanie  modelu  ekonometrycznego.  Dokonanie  badanej  analizy  na  podstawie 

historycznych  danych.  Wykorzystuje  się  do  przewidywania  przyszłości  –  narzędzie  do  budowy  prognoz, 
oraz wykorzystuje się je do eksperymentów symulacyjnych. 

6.  Możemy to dokonać w odpowiednich warunkach prac nad modelem makroekonomicznym. 

Często wszystkie te etapy prowadzone są równolegle. 
 
Klasyfikacja modeli ekonometrycznych: 
1. Na podstawie cech budowy modeli oraz typu modeli 

analityczno  opisowe  –  opisujące  stan  rzeczy  w  danym  momencie  czasu,  wykorzystanie  prawidłowości 
rządzących systemem 

prognostyczne – przewidywanie stanu w przyszłości, jeżeli analityczno-opisowy jest dobrze dopasowany to 
jego też można wykorzystać do prognoz 

symulacyjne i sterowania – analiza symulacyjna i sterowania 

2. 

liniowe 

Y

t

 = 

α

1

X

1

 + 

α

2

X

α

3

X

3

 + 

α

0

 + 

ξ

 3 zmienne objaśniające nie uwzględnia wpływu czasu – model statyczny 

Y

t

 = 

β

Y

t-1

 

α

1

X

1

 + 

α

2

X

α

0

 + 

ξ

 model dynamiczny – mamy zmienną opóźniającą, uwzględnia upływ czasu. 

nieliniowe – sprowadzalne do liniowych 

hiperboliczne 

t

t

t

X

Y

ξ

α

α

+

+

×

=

0

1

1

1

 

kwadratowy niezupełny 

t

t

t

X

Y

ξ

α

α

+

+

=

0

2

1

1

  

nieliniowe  

trend logistyczny (dynamiczny do badania trendu) 

t

t

t

e

Y

ξ

β

α

γ

+

+

=

1

 

 
3. Ze względu na udział czynnika: 

statyczne  

dynamiczne -> nie ma zależności tylko przyczynowo-skutkowej, bo nie zależy tylko od czasu. 

4. Ze względu na walory poznawcze: 

przyczynowo-opisowe – zmienne endogeniczne (skutek), a zmienna objaśniająca (przyczyny) i parametry 
strukturalne świadczą o sile związku pomiędzy zmienną endogeniczną, a zmiennymi objaśniającymi. 

symptomatyczne  –  modele,  w  których  pomiędzy  zmienną  endogeniczną,  a  zmiennymi  objaśniającymi 
zachodzi silna korelacja, natomiast interpretacja przyczynowo-skutkowa jest nieuprawniona; stosuje się gdy 
brak jest podstaw do oczekiwania przyczynowości badanej relacji ekonomicznej (brak akceptowanej teorii 
ekonomicznej)  lub  gdy  zmienne  reprezentujące  przyczyny  bądź  skutek  (zmienne  objaśniające)  są 
nieobserwowalne, takie modele stosuje się często  wobec prognozowania gospodarczego 

tendencji  rozwojowych  –  modele  trendu,  w  nich  jedyną  zmienna  objaśniającą  jest  zmienna  czasowa 
(pomija się w nim tak na dobrą sprawę istotne czynniki, co powoduje zwiększenie się czynnika losowości) 

 
Miary jakości modelu: 

stopień dopasowania modelu do danych empirycznych 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

dokładność parametru modelu (dokładne oszacowanie parametrów strukturalnych modelu) 

wartość informacyjna modelu 

sensowność interpretacji parametrów (jeśli nie ma sensownej to model nie nadaj się do niczego) 

wartość prognostyczna modelu 

 
Wg Tinbergena – należy patrzeć (przy wyborze modelu etc.): jaka relacja tak na dobrą sprawę nas interesuje, jeśli 
znamy dobrze zagadnienie ekonomiczne to „intuicja nam podpowie, którą metodę wybrać” 
 
 

 

DOBÓR ZMIENNYCH OBJAŚNIAJĄCYCH DO MODELU LINIOWEGO-

JEDNORÓWNANIOWEGO 

 
Musi być znana zmienna endogeniczna. 
 
Y

t

 = f(X

1

, X

2

...X

k

ξ

 dochodzimy do wniosku, że to będzie model liniowy i wybieramy najistotniejsze zmienne 

objaśniające. 
 
Zmienne objaśniające w modelu ekonometrycznym powinny charakteryzować się następującymi cechami: 

odpowiednią zmiennością 

wykazywać silną korelacją ze zmienną endogeniczną (istotną korelacje) 

powinny wykazywać słabe (nieistotne) korelacje między sobą 

 
Y

t

 = 

α

1

X

1t

 + 

α

2

X

2t

 + 

α

3

X

3t

 + 

α

0

 + 

ξ

 

Jeśli np korelacja X

1t

 i X

2t

 = 0,85 mówi, że w taki sam sposób kształtują one Y. Wystarczy wybrać tylko jedną z tych 

zmiennych, tę która jest bardziej skorelowana z Y. 
Jeśli nie mamy wszystkich danych to szukamy zmiennych naśladowczych, bądź pomijamy zwiększając tym samym 

ξ

 
Formalne etapy dobory zmiennych objaśniających do modelu ekonometrycznego: 

1.  Ustalenie liczby potencjalnych zmiennych objaśniających – tylko nazywamy zmienne, nie mamy danych 
2.  Gromadzimy materiał statystyczny 
3.  Usuwamy  zmienne  o  niskiej  zmienności  (jeśli  zmienna  endogeniczna  ma  niską  zmienność  –  brak 

konieczności budowy modelu), zmienne objaśniające muszą mieć ten sam okres zmienności co Y. 

4.  Ustalenie miernika jakości modelu ekonometrycznego 

 można rozpatrywać z trzech punktów widzenia: 

jego dopasowanie do rzeczywistych danych empirycznych 

istotność parametrów strukturalnych modelu 

brak autokorelacji składnika losowego 

5.  Obliczenie współczynnika korelacji pomiędzy wszystkimi rozpatrywanymi zmiennymi 
6.  Ustalenie kombinacji zmiennych, które wejdą do modelu 

 
Zmienne muszą wykazywać zróżnicowanie (liczone współczynnikiem zmienności) 

_

x

S

V

i

i

=

 

Wartość  kryterium  współczynnika  zmienności  to  0,1  poniżej  go  nie  jest  zmienną  –  wyrzucamy  ją  z  modelu,  lecz 
należy ją dodać przy parametrze wolnym (ślepa zmienna – zawsze 1). 
Quasi  stała  –  prawie  stała,  jeśli  bardzo  zaokrąglamy  i  wtedy  jest  taka  sama,  też  się  taką  odrzuca  (o  bardzo  małej 
zmienności). 
 
Metoda doboru zmiennych Pawłowskiego: 
Zgodnie z procedurą Pawłowskiego do modelu ekonometrycznego wejdzie kombinacja zmiennych objaśniających, 
która spowoduje, że: 

model będzie gwarantował pewną z góry ustaloną dokładność (dopasowanie do danych empirycznych) 

spośród  wszystkich  kombinacji  zmiennych  objaśniających  należy  wybrać  te  kombinację,  w  której 
uwzględnione zmienne objaśniające nie są skorelowane między sobą 

 
Tworzymy macierz potencjalnych zmiennych i wektor kolumnowy zmiennej endogenicznej 
 

n

y

y

y

Y

...

2

1

=

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

nt

n

n

t

t

X

X

X

X

X

X

X

X

X

X

...

...

...

...

...

...

...

2

1

2

22

21

1

12

11

=

 

 
Wartość współczynnika korelacji Rw między zmienną endogeniczną, a zmiennymi objaśniającymi była nie mniejsza 
niż z góra zadana liczba. 

 > 0 

 to może być pewną miarą służącą badaniu dokładności modelu. 

Rw – współczynnik korelacji wielorakiej. 
 

|

|

det

|

|

det

1

R

W

Rw

=

 

R

R

R

W

o

o

1

=

    R – współczynnik korelacji między wybranymi zmiennymi objaśniającymi 

R

o

  –  wektor  kolumnowy  współczynnika  korelacji  pomiędzy  wybranymi  zmiennymi  objaśniającymi,  a  zmienną 

endogeniczną. 
 
Przykład 
Dane są 3 potencjalne zmienne objaśniające X

1t

, X

2t

, X

3t

 oraz Y

t

  

1.Wyliczenie współczynnika korelacji pomiędzy zmiennymi objaśniającymi. 

1

34

,

0

18

,

0

34

,

0

1

4

,

0

18

,

0

4

,

0

1

=

R

          

wzór na ilość kombinacji L = 2

p

 – 1, gdzie P to liczba zmiennych objaśniających. 

Jest 7 kombinacji K1={x1}, K2={x2}.... K7={X1,X2,X3} 
 
Szukamy właściwej kombinacji 
Korelacje wszystkich zmiennych ze zmienną endogeniczną Y: 

3

,

0

7

,

0

88

,

0

=

O

R

 

Rozpatrujemy kombinację K={x1,x2} 

1

4

,

0

4

,

0

1

7

,

0

88

,

0

=

=

R

R

o

 

Tworzymy macierz W 

1

4

,

0

7

,

0

4

,

0

1

88

,

0

7

,

0

88

,

0

1

=

W

 

det |W| = 0,84 
det |R| = 0,684 
Rw = 0,9584 
W analogiczny sposób postępujemy z pozostałymi kombinacjami i wybieramy tę z najwyższym Rw. 
 
Metoda wskaźników pojemności informacyjnej (metoda Hellwiga): 
1.Indywidualne wskaźniki pojemności informacyjnej. 

=

+

=

pl

i

ij

oj

ij

r

r

h

1

2

|

|

1

 

l – elta kombinacja zmiennych objaśniających 
j – jota zmienna objaśniająca 
r

oj

 – współczynnik korelacji liniowej Pearsona między jotą zmienną objaśniającą i zmienną endogeniczną Y 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

r

ij

 – współczynnik korelacji liniowej Pearsona pomiędzy itą i jotą zmienną objaśniającą. 

Przyjmuje  on  wartość  z  przedziału  0  <=  h  <=  1,  jeżeli  poza  przedziałem  to  wiemy,  że  wzięliśmy  do  modelu 
nieliniowego współczynniki korelacji liniowej. 
 
Współczynnik (zmienne objaśniające) posiadają różną nośność informacyjną (np. X1 – 0,4; X2 – 0,5; etc.) 
 
2.Wskaźniki integralne pojemności informacyjnej H. 
H – suma h, przyjmuje wartości z tego samego przedziału 0<= H <= 1 
 
Przykład 
Dane są zmienne X

1t

, X

2t

, X

3t

  

Korzystając z procedury Hellwiga 

23

,

0

7

,

0

88

,

0

=

O

R

    

1

34

,

0

18

,

0

34

,

0

1

4

,

0

18

,

0

4

,

0

1

=

R

 

 
liczymy: 

0

1

)

88

,

0

(

2

11

+

=

h

0

1

)

7

,

0

(

2

22

+

=

h

0

1

)

23

,

0

(

2

33

+

=

h

 

4

,

0

1

)

88

,

0

(

2

41

+

=

h

4

,

0

1

)

7

,

0

(

2

42

+

=

h

 

18

,

0

1

)

88

,

0

(

2

51

+

=

h

18

,

0

1

)

23

,

0

(

2

53

+

=

h

 

34

,

0

1

)

7

,

0

(

2

62

+

=

h

34

,

0

1

)

23

,

0

(

2

63

+

=

h

 

18

,

0

4

,

0

1

)

88

,

0

(

2

71

+

+

=

h

34

,

0

4

,

0

1

)

7

,

0

(

2

72

+

+

=

h

18

,

0

34

,

0

1

)

23

,

0

(

2

73

+

+

=

h

 

 
Integralne wskaźniki H 
H

1

 = h

11

 

H

2

 = h

22

 

H

3

 = h

33

 

H

4

 = h

41

 + h

42

 

H

5

 = h

51

 + h

53

 

H

6

 = h

62

 + h

63

 

H

7

 = h

71

 + h

72

 +h

73

 

 
Na ich podstawie dokonujemy wyboru H

max.

 – z pośród w/w H  

Mogą być rozbieżności pomiędzy metodą Pawłowskiego i Hellwiga. 
 
Metoda współczynników korelacji 
 

2

*

2

2

+

=

n

t

t

r

   

 wartość krytyczna współczynnika korelacji 

t – wartość krytyczna odczytana z tablic t-Studenta 
n – liczba obserwacji 
 
Przykład: 
Przy poziomie istotności 

α

 = 0,05 oraz n = 28 wyznaczyć wartości krytyczne współczynników korelacji, a następnie 

zaproponować zmienne objaśniające do modelu. 
 
n – 2 = 26 

α

 = 0,05 

t

α

 = 2,056 

r* = 0,3739  - wszystko co poniżej tej wartości jest nieistotne statystycznie. 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

 

=

83

,

0

87

,

0

48

,

0

86

,

0

58

,

0

Ro

 wszystkie zmienne mogą wejść do modelu, są istotne (wartości wyższe od r*) 

 
 
 
zmienne których r są w [] mogą razem funkcjonować w modelu, nie 
są ze sobą skorelowane 
 
 
 
 

Klasyczna metoda najmniejszych kwadratów (KMNK). Idea metody: wyznaczenie ocen parametrów strukturalnych 
a

1

,  a

2

,...a

k

,  (konkretne  wartości)  parametrów  strukturalnych 

α

1

α

2

,  ... 

α

k

  aby  suma  kwadratów  odchyleń 

zaobserwowanych  wartości  zmiennej  endogenicznej  Y

t

  od  jej  wartości  teoretycznych  obliczonych  na  podstawie 

modelu była najmniejsza.  
 
 
 
 
 
 
 
 
 
 
 

Dany jest jednorównaniowy model ekonometryczny 
 
Y

t

 = 

α

1

X

1t

 + 

α

2

X

2t

 + ... + 

α

k-1

X

(k-1)t

 + 

α

k

 + 

ξ

t

  

t = 1,2...n 
Kryterium metody najmniejszych kwadratów ma postać: 

Ψ

 = 

 (y

t

 – a

1

X

1t

 – a

2

X

2t

 - .... – a

k-1

X

(k-1)t

 –a

k

)

 min. czyli wartości teoretyczne modelu dane są jako: 

 
Y*

t

 = a

1

X

1t

 + a

2

X

2t

 + ... + a

k-1

X

(k-1)t

 + 

α

 

Ostateczna postać KMNK dana jest jako: 

Ψ

 = 

 (y – y

t

*)

2

 

 min gdzie wyrażenie (y

t

 – y

t

*) = u

t

 ; gdzie t = 1,2...n  

 reszta modelu/równania. 

 
Y

t

 = 

α

1

X

1t

 + 

α

2

X

2t

 + 

α

0

 + 

ξξξξ

  t

 

 
Y

t

 = a

1

X

1t

 + a

1

X

2t

 + a

0

 + u

  t

   

 
Zastosowanie KMNK wymaga spełnienia następujących założeń: 

postać modelu jest liniowa względem parametrów bądź sprowadzana do liniowej 

zmienne objaśniające są wielkościami nielosowymi 

zmienne objaśniające nie wykazują współliniowości 

składnik losowy 

ξ

 ma wartość oczekiwaną równą zero E(

ξ

) = 0 oraz stałą wariancję D

2

(

ξ

) = 

σ

2

  

nie następuje autokorelacja składnika losowego (nie ma zależności korelacyjnych między poszczególnymi 
realizacjami składnika losowego – chodzi o zależność rządu pierwszego) 

 
Miara zależności, wariancja składnika losowego nie zależy od zmiennych objaśniających  (składnik losowy nie jest 
skorelowany ze zmiennymi objaśniającymi) 
 
Układ skalarny 
W celu wyznaczenie ocen parametrów strukturalnych modelu znajdujemy minimum funkcji 
 

[ ]

=

1

62

,

0

1

51

,

0

]

17

,

0

[

1

59

,

0

86

,

0

]

33

,

0

[

1

]

1

,

0

[

64

,

0

26

,

0

79

,

0

1

R

taką obserwację odrzucamy 
i rozpatrujemy osobno 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

2

1

*

)

(

=

=

n

t

t

t

y

y

ψ

 

 minimum 

0

=

Ψ

aj

σ

σ

(j = 1,2,...t) 

 
2

 (y

t

 – a

1

X

1t

 – a

2

X

2t

 -...- a

k

) (-X

1t

) = 0 

2

 (y

t

 – a

1

X

1t

 – a

2

X

2t

 -...- a

k

) (-X

2t

) = 0 

 

 (y

t

 – a

1

X

1t

 – a

2

X

2t

 -...- a

k

) (-1) = 0 

 
Po wykonaniu odpowiednich przekształceń otrzymujemy tzw. układ równań normalnych danych jako: 
 
a

1

X

1t

2

 + a

2

X

2t

 +...+ a

k

X

1t

 = 

X

1t

y

t

  

a

1

X

1t

X

2t

 + a

2

X

2t

2

 +...+ a

k

X

2t

 = 

X

2t

y

a

1

X

1t

 + a

2

X

2t

 + ....+ na

k

 = 

y

t

  

 
Układ macierzowy 
Jest to kolumnowy wektor zmiennej endogenicznej 
 

=

n

y

y

y

y

...

2

1

 

=

1

...

1

...

...

...

...

1

...

1

...

1

,

2

1

1

,

2

22

21

1

,

1

12

11

k

n

n

n

k

k

x

x

x

x

x

x

x

x

x

X

  Macierz realizacji zmiennych objaśniających. 

 
Kolumnowy wektor parametrów strukturalnych: 
 

=

n

α

α

α

α

...

2

1

 

 
Kolumnowy wektor ocen parametrów strukturalnych 

=

n

a

a

a

a

...

2

1

 

 
Kolumnowy wektor realizacji składnika losowego: 

=

n

ξ

ξ

ξ

ξ

...

2

1

 

 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

Kolumnowy wektor reszt: 

=

k

u

u

u

u

...

2

1

 

 
Wektor wartości teoretycznych 

=

*

*

2

*

1

...

*

k

y

y

y

Y

 

 
Tak więc model: 
Y=

α

1

X

1t

 + 

α

2

X

2t

 +... + 

α

k-1

X

(k-1)t

 + 

α

k

 + 

ξ

 

 
W zespole macierzowym ma następującą postać: 
Y = X

α

 + 

ξ

 

 
Wektor wartości teoretycznych zmiennej endogenicznej Y ma postać: 
 
Y* = X

α

 

 
Funkcja kryterium KMNK dana jest jako: 

Ψ

 = (y - Xa)’ (y – Xa) 

 min – transpozycja macierzy 

 
Formuła: 
A = (x’x)

-1 

x’y 

‘ – transpozycja prosta 

-1 

– macierz odwrotna 

 
Przykład (jedna zmienna objaśniająca) 
Na podstawie danych statystycznych zamieszczonych w tablicy oszacować parametry strukturalne modelu o postaci. 
Y

t

 = 

α

1

X

1t

 + 

α

0

 + 

ξ

 

y

t

 

3 2 2 1 1 

X

1t

 

2 2 1 1 0 

 
Wyznaczamy wykres rozrzutu 

=

1

1

2

2

3

y

   

=

1

0

1

1

1

1

1

2

1

2

X

 

 parametr wolny (na końcu jest 

ξ

Stosując formułę na wektor ocen parametrów strukturalnych czyli 
a = (X’X)

-1

 X’Y 

 

=

71

,

0

43

,

0

43

,

0

36

,

0

)

'

(

1

X

X

 

 
  

 ocena parametru a

1

 

  

 ocena parametru a

0

    

=

86

,

0

78

,

0

a

9

13

'

=

Y

X

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

10 

Model po oszacowaniu 
 
Y*

= 0,78X

1t

 + 0,86 + u

t

  

Intensywność wzrostu X

1t

 o 1 jednostkę spowoduje wzrost Y o 0,78. 

a

0

  =  0,86  –  taką  średnią  wartość  przyjmuje  zmienna  endogeniczna  Y

t

  w  przypadku  gdy  zmienna  objaśniająca  X

1t

 

będzie równe zero (= 0)  
 
Model liniowy z 2 zmiennymi objaśniającymi. 

 
 Każdy parametr szacowany na podstawie 2,5 obserwacji (zdecydowanie za mało – tutaj tylko 
dla uproszczenia). 
Yt – poziom produkcji 
X

1t

 – liczba pracowników 

X

2t

 – zużycie energii elektrycznej 

 
 
 
 
Yt = 

α

X

1t

β

1

 X

2t

β

2

 e

(

γ

-t) 

– postać statyczna. „e“ – elementem dynamicznym. 

 
Yt = 

α

1

X

1t

 + 

α

2

X

2t

 + 

α

0

 + 

ξ

 

 
Weryfikacja postaci analitycznej modelu, od wykresu rozrzutu (dla obu zmiennych) zależy czy model liniowy czy 
nie. 
 

=

1

2

,

14

23

1

14

22

1

8

,

13

24

1

4

,

13

23

1

5

,

12

25

X

   

14

13

13

12

11

=

Y

 

Tworzymy X’X. Później (X’X)

-1  

 
A

-1

 = (1/detA) * adjA 

 

 
 a

1

 

 a

2

 

 
a

3

 

 

Yt = 0,31X

1t

 + 2,04X

2t

 – 22,51 + U

 

 
Wzrost liczby pracowników o 1 etat spowoduje wzrost poziomu produkcji Yt o 0,31 tys sztuk, pod warunkiem, że 
zużycie energii elektrycznej nie ulegnie zmianie. 
 
Wzrost  zużycia  energii  elektrycznej  o  1  MWh  spowoduje  wzrost  poziomu  produkcji  o  2,04  tys  sztuk  pod 
warunkiem, że liczba pracowników nie ulegnie zmianie 
 
-22,51 taki średni poziom miałaby zmienna endogeniczna w przypadku gdy zmienne objaśniające są równe 0. 
  

 

WŁASNOŚCI ESTYMATORÓW 

 
Estymator nieobciążony: 

1.  Jeśli jego wartość oczekiwana (nadzieja matematyczna) jest równa estymowanemu parametrowi E(a)=a 
2.  Dla Modelu danego jako  y = Xa + 

ξ

 wektor parametrów strukturalnych dany jest jako a = (X’X)

-1

 X’Y 

3.  E(a) = E[(X’X)

-1

 X’Y] = E[(X’X)

-1

 X’ * (Xa + 

ξ

)] 

4.  Zakłada się, że zmienne objaśniające są nielosowe E(

ξ

)=0 

5.  Stąd estymator parametrów strukturalnych jest nieobciążony jeżeli: 

2

,

14

23

14

14

22

13

8

,

13

24

13

4

,

13

23

12

5

,

12

25

11

2

1

t

X

t

X

Yt

=

51

,

22

04

,

2

31

,

0

a

=

63

5

,

858

1

,

147

'Y

X

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

11 

a.  Zmienne  objaśniające  są  nielosowe  –  kowariancja  składnika  losowego  nie  zależy  od  zmiennych 

objaśniających E(X

ξ

)=0 

b.  Składnik losowy ma wartość oczekiwaną 0  

Estymator Zgodny: 

1.  Estymator parametru 

α

 jest zgodny jeżeli jest stohastycznie zbieżny do szacowanego parametru 

α

. Oznacza 

to, że przy wzroście liczby obserwacji do nieskończoności, jego wartość dąży stohastycznie do prawdziwej 
wartości szacowanego parametru: 

1

}

|

{|

lim

=

<

>

ε

a

a

P

n

 

 
Jeżeli  wraz  ze  wzrostem  liczebności  próby  oczekiwana  wartość  rozkładu  estymatora  zmierza  do  wartości 
szacowanego parametru, a jednocześnie wariancja estymatora zmierza do zera, to estymator taki jest zgodny 

 
Estymator efektywny: 
Przy danych kilku estymatorach zgodnych i nieobciążonych estymatorem najefektywniejszym jest ten, który posiada 
najmniejszą wariancję. 
 
Jeżeli spełnione są założenia KMNK (dotyczące składnika losowego oraz zmiennych objaśniających) to estymator a 
= (X’X)

-1

 X’Y jest estymatorem najefektywniejszym spośród estymatorów liniowych, gdzie jego wariancja dana jest 

następującą formułą: 
D^(a) = 

δ

^ * (X’X)

-1

 

 jako macierz wariancji i kowariancji, na głównej przekątnej wariancje estymatorów, poza 

nią kowariancje. 

δ

^ = S^(u) 

 
Założenia klasycznej metody najmniejszych kwadratów do własności estymatorów: 
 

1.  Jeżeli 

zmienne 

objaśniające 

są 

współliniowe, 

to 

nie 

istnieje 

estymator 

dany 

formułą  

a = (X’X)

-1

 X’Y, ponieważ nie istnieje macierz odwrotna do macierzy  (X’X) to wyznacznik jest równy 0, 

czyli det (X’X) = 0. 

2.  Jeżeli wariancja składnika losowego nie jest stała to: 
a  =  (X’X)

-1

  X’Y  jest  nieobciążony,  i  zgodny,  ale  nie  jest  najefektywniejszy.  Musi  istnieć  stałość  wariancji  w 

czasie 

δ

^

1

 = 

δ

^

. Często się rezygnuje z efektywności estymatora 

3.  Jeżeli składnik losowy jest zależny cov(

ξ

t

;

ξ

t+1

) różna od 0, a w zbiorze zmiennych objaśniających nie ma 

zmiennej endogenicznej opóźnionej (

α

1

Y

t-1

)w czasie to a = (X’X)

-1

 X’Y jest nieobciążony i zgodny, ale nie 

jest już najefektywniejszy 

4.  Jeżeli składnik losowy jest zależny [cov(

ξ

t

;

ξ

t+1

) różna od 0], a w zbiorze zmiennych objaśniających istnieje 

zmienna endogeniczna opóźniona w czasie to:  

a = (X’X)

-1

 X’Y nie jest zgodny 

5.  Jeżeli wariancja składnika losowego jest funkcją zmiennych objaśniających to estymator a = (X’X)

-1

 X’Y 

nie jest zgodny. 

 
Klasyczne założenia dotyczące składnika losowego: 
 
Dana jest macierz wariancji i kowariancji składnika losowego: 

=

)

(

^

...

)

(

)

(

...

...

...

...

)

(

...

)

(

^

)

(

)

(

...

)

(

)

(

^

)

'

,

(

2

1

2

2

1

2

1

1

1

n

n

n

n

n

D

E

E

E

D

E

E

E

D

E

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

ξ

 

 macierz kwadratowa i symetryczna 

 

jest kwadratowa i symetryczna 

na  głównej  przekątnej  znajdują  się  wariancje  składnika  losowego  poszczególnych 
okresów (w przypadku serii czasowych), natomiast poza główną przekątną znajdują się 
kowariancje między składnikami losowymi poszczególnych okresów. 

 
Można wyróżnić 4 sytuacje związane z założeniami: 

1.  Spełnione założenie MNK 

a.  Wariancja jest jednorodna D^(

ξ

1

) = D^(

ξ

2

) =... = D^(

ξ

n

) = 

δ

b.  Brak autokorelacji czyli składnik losowy jest niezależny E(

ξ

t

,

ξ

t+1

)=0 

c.  Macierz wariancji i kowariancji ma postać: 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

12 

In

E

2

2

2

2

...

0

0

...

...

...

...

0

...

0

0

...

0

)

'

,

(

δ

δ

δ

δ

ξ

ξ

=

=

     gdzie In to macierz jednostkowa 

2.  Nie jest spełnione założenie o jednorodności wariancji składnika losowego 

a.  D^(

ξ

1

 D^(

ξ

2

... 

 D^(

ξ

n

 

δ

b.  Brak autokorelacji czyli składnik losowy jest niezależny E(

ξ

t

,

ξ

t+1

)=0 

c.  Wówczas macierz wariancji i kowariancji składnika losowego jest macierz diagonalna i ma postać: 

=

)

(

^

...

0

0

...

...

...

...

0

...

)

(

^

0

0

...

0

)

(

^

)

'

,

(

2

1

n

D

D

D

E

ξ

ξ

ξ

ξ

ξ

 

3.  Jeżeli spełnione jest założenie o jednorodności wariancji składnika losowego, czyli (dzieli próbę na 2 części 

i w obu wariancje będą równe): 

a.  D^(

ξ

1

) = D^(

ξ

2

) =... = D^(

ξ

n

) = 

δ

b.  Składnik losowy jest zależny (występuje jego autokorelacja) 
c.  Wówczas  macierz  wariancji  i  kowariancji  składnika  losowego  jest  macierzą  symetryczną  i  ma 

postać: 

=

1

...

...

1

...

...

...

1

...

1

)

'

,

(

2

1

2

21

1

22

n

n

n

n

E

ρ

ρ

ρ

ρ

ρ

ρ

ξ

ξ

    

współczynniki autokorelacji między składnikiem losowym i-tego i –tgo okresy. 

4.  Jeżeli nie jest spełnione założenie o jednorodności wariancji składnika losowego: 

a.  D^(

ξ

1

 D^(

ξ

2

... 

 D^(

ξ

n

 

δ

b.  Oraz nie jest jest spełnione założenie o braku korelacji, czyli występuje sytuacja, w której E(

ξ

1

ξ

2

 0 

c.  Wówczas  macierz  wariancji  i  kowariancji  składnika  losowego  jest  macierzą  symetryczną  i  ma 

postać (tak jak w sytuacji 1). 

 
Sytuacje 3 i 4 to tzw. „egzamin” dla modelu i nie jest zależne od naszych błędów. 

 
 

MODELE NIELINOWE SPROWADZALNE DO LINIOWYCH 

 
MODEL HIPERBOLICZNY: 
 
Oszacować model o postaci Y

t

 = 

α

1

(1/X

1t

) + 

α

0

 + 

ξ

t

 

Na podstawie danych statystycznych stablicowanych: 

Y

t

 

1,1 

1,11 

1,12 

1,22 

1,25 

1,36 

1,54 

X

1t

 

11 

G

t

 

0,09 

0,126 

0,16 

0,25 

0,25 

0,33 

0,5 

0,5 

0,5 

 
Na podstawie wykresu rozrzutu 

 model hiperboliczny (wykres hiperboli) 

Model należy sprowadzić do postaci liniowej, by zastosować MNK. 
 
G

t

 = 1/X

1t

  

Stąd model będzie liniowy ze względu na zmienną G. 
Y

t

 = 

α

1

G

t

 + 

α

0

 + 

ξ

t

  

 
Stosujemny MNK: 
A = (X’X)

-1

X’Y 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

13 

 

=

1

1

1

5

,

0

1

5

,

0

1

5

,

0

1

33

,

0

1

25

,

0

1

25

,

0

1

166

,

0

1

126

,

0

1

09

,

0

X

=

2

2

54

,

1

36

,

1

25

,

1

22

,

1

12

,

1

11

,

1

1

,

1

1

Y

  

=

10

71

,

3

71

,

3

03

,

2

' X

X

 

=

31

,

0

56

,

0

56

,

0

52

,

1

)

'

(

1

X

X

 

=

7

,

13

86

,

5

'Y

X

 

 
ostatecznie a = 1,17 v 0,93 
 
Postać pierwsze Y

t

 = 1,17G

t

 + 0,93 + U

t

   

Postać druga i ostateczna: Y

t

 = 1,17 (1/X

1t

) + 0,93 + U

t

  

 
Wzrost ceny o 100zł spowoduje spadek wielkości sprzedaży o 1,17szt. 
 
Weryfikacja modelu ekonometrycznego: 
 
Oznacza to: 

zbadanie  czy  oszacowany  model  jest  zgodny  z  rzeczywistością  (kierunek  wpływu  zmiennych 
objaśniających jest zgodny z rzeczywistością( 

zbadanie czy model ekonometryczny jest wystarczająco przejrzysty 

zbadanie czy zmienne objaśniające istotnie wpływają na zmianę endogeniczną 

zbadanie czy spełnia założenie MNK 

 
Miary struktury stochastycznej: 

1.  Wariancja resztowa i odchylenie standardowe reszt: 

a.  Przy  spełnionych  warunkach  MNK  nieobciążonym  estymatorem  wariancji  resztowej  jest 

wariancja resztowa wyznaczona wg następującej formuły: 

=

=

=

=

n

t

n

t

t

u

k

n

Yt

Yt

k

n

u

S

1

1

*

2

1

)

(

1

)

(

  gdzie n – liczba obserwacji, k – liczba szacowanych 

parametrów. 
Pierwiastek kwadratowy wariancji resztowej daje tzw. Odchylenie standardowe reszt czyli S(u). 
 Odchylenie standardowe informuje o ile średnio rzecz biorąc in plus, bądź in minus odchylają się 
rzeczywiste realizacje zmiennej endogenicznej od wartości teoretycznych wyznaczonych przez model. 

2.   Macierz wariancji i kowariancji oraz średnie błędy szacunkowe 

a.  D

2

(a)=

δ

2

(X’X)

-1

 gdzie 

δ

= S

2

(u) czyli D

2

(a)= S

2

(u)(X’X)

-1

 

b.  Miary struktury stochastycznej (wariancja resztowa oraz macierz wariancji i kowariancji) modelu 

związane są ze zmienną 

ξ

Miara  precyzji  estymacji  parametru  struktury  są  średnie  błędy  szacunku.  Kwadraty  błędów  szacunku 
znajdują się na głównej przekątnej macierzy wariancji i kowariancji. Pierwiastek wariancji estymatora 
daje zatem średni błąd szacunku dla danego parametru. 

3.  Miary dopasowania modelu do danych empirycznych (badanie jakości modelu). 

a.  Współczynnik zbieżności (przyjmuje wartości od 0 do 1) – miara negatywna 

i. 

=

=

=

n

t

n

t

Y

Yt

Yt

Yt

1

2

_

1

2

*

2

)

(

)

(

ϕ

 

ii.  współczynnik  zbieżności  może  być  stosowany  tylko  w  przypadku  modeli  liniowych  i 

modeli do liniowych sprowadzalnych 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

14 

iii.  współczynnik  zbieżności  przyjmuje  wartość  0  w  przypadku  gdy  wszystkie  wartości 

teoretyczne  zmiennej  endogenicznej  są  równe  wartościom  rzeczywistym  zmiennej 
endogenicznej 

ϕ

2

=0 => model idealnie dopasowany 

iv.  jeżeli współczynnik zbieżności przyjmuje wartość 1 oznacza to, że zmienność, zmiennej 

endogenicznej  została  całkowicie  nie  wyjaśniona  przez  model  ekonometryczny  (na 
wykresie rozrzutu punkty emiryczne „wszędzie”) 

b.  Współczynnik determinacji 

i.  Jest  miarą  alternatywną  w  stosunku  do 

ϕ

  u  dana  jest  R

2

  =  1- 

ϕ

2

  nie  jest  jednak 

najważniejszą miarą modelu 

ii.  Przyjmuje wartości od 0 do 1 

iii.  Współczynnik determinacji jest kwadratem współczynnika korelacji wielorakiej (reaguje 

na ilość zmiennych) 

iv.  Informuje jaka cześć zmienności zmiennej endogenicznej została wyjaśniona przez model 

v.  Jego  wartości  związane  z  przyrostem  ilości  zmiennych  objaśniających  rośnie,  można 

zatem dodatkowo skorzystać ze skorygowanego współczynnika determinacji (gdy mamy 
dużo zmiennych objaśniających I będą budowane prognozy). 

)

1

(

1

1

1

2

~

2

R

m

n

n

R

=

gdzie n to liczba obserwacji, a m liczba zmiennych objaśniających 

 

 interpretacja analogiczna do R

2

 (tylko dla modeli liniowych bądź do liniowych sprowadzalnych) Zawsze 

skorygowany współczynnik determinacji niższy od normalnego. 

c.  Współczynnik zmienności losowej 

i.  Vs = Su/Y     I zawsze podawany w procentach (%). Współczynnik zmienności losowej 

informuje  jaką  część  średniego  poziomu  zmiennej  endogenicznej  stanowią  wahania 
przypadkowe. 

 
Przykład: 
 
Y

t

 = 

α

1

X

1t

 + 

α

0

 + 

ξ

1

  

 

Y

t

 

X

1t

 

-2 

-1 

 
Model po oszacowaniu MNK Yt = -0,31X

1t

 + 1,17 + u

t

  

Obliczamy wartości teoretyczne modelu: 
 
Y*1 = -0,31*2 + 1,17 = 0,542 
Y*2 = 1,17 
Y*3 = 1,8 
Y*4 = 1,485 
 
Wariancja resztowa: 
U1 = 0,457    U2 = -1,17   U3 = 0,2       U4 = 0,514 

 suma powinna się równać 0. 

u

2

 = 1,8857   n = 4    k = 2            =>  Su = 0,971 

Rzeczywiste  realizacje  zmiennej  endogenicznej  (Yt)  odchylają  się  średnio  rzecz  biorąc  +/-  o  0,971  (jednostki)  od 
wartości teoretycznych wyznaczonych przez model. 
 
Liczymy macierz wariancji i kowariancji oraz średnie błędy szacunku: 
 

D

2

(a) = S

2

(u)(X’X)

-1

= 0,9428

 *

 

257

,

0

028

,

0

028

,

0

114

,

0

 = 

242

,

0

026

,

0

026

,

0

107

,

0

 

 
Średnie błędy szacunku: 
D^(a1) = pierwiastek z 0,107 = 0,32 
D^(a2) = pierwiastek z 0,242 = 0,49 
 
Model zapisujemy: 
Y*

t

 = -0,31X

1t

 + 1,17 + u

t

 

           (0,32)       (0,49)  

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

15 

WERYFIKACJA ISTOTNOŚCI PARAMETRÓW STRUKTURALNYCH MODELU 

 
NP.  
 
Y

t

 = 10X

1t

 + 2X

2t

 + 5 + u

t

  

 
Jeżeli stwierdzimy, że nieistotny jest wpływ, którejś ze zmiennych to ją usuwamy.  
Wtedy ponownie szacujemy model bez tej zmiennej.  
Nie ma konieczności testowania parametru wolnego. 
 
Do przyczyn nieistotności parametrów strukturalnych modelu można zaliczyć: 

brak zależności między zmienną objaśniającą, albo endogeniczną 

mała dokładność lub nieodpowiednia jakość danych statystycznych 

słaba dokładność technik estymacji oraz wnioskowania statystycznego (ważny przy małych próbach) 

przyjęcie niewłaściwej postaci analitycznej modelu 

okoliczności przypadkowe wynikające z losowości próby 

pominięcie  istotnych  zmiennych  objaśniających,  te  braki  będą  się  kumulowały  w  resztach  co  spowoduje 
wysoką  wariancję  resztową,  co  z  kolei  spowoduje,  że  średnie  błędy  szacunku  będą  wysoki,  im  wyższa 
wartość wariancji szacunku tym większe średnie błędy. 

 
TEST T-STUDENTA 
 
H0: 

α

 = 0 wobec hipotezy alternatywnej takiej, że H1:

α

 0  

Jeżeli H0 odrzucamy tzn, że parametr jest istotny. 
 
Sprawdzeniem  hipotezy  H0  jest  statystyka  t-studenta  o  n-k  stopniach  swobody,  gdzie  k  to  liczba  szacowanych 
parametrów. 
 
T = a

i

/D(a

i

)    gdzie i = 1,2...k 

 
a

i

 - ocena parametru 

α

 

D(a

i

) – średni błąd szacunku parametru a

i

  

 
|t| > t

α

 gdzie t

α

 to wartość krytyczna odczytywana z tablic. 

W takim wypadku H0 odrzucamy na korzyść hipotezy alternatywnej. 
 
Przykład: 
 
Y

t

 = 6X

1t

 + 4X

2t

 – 8X

3t

 + 10 + u

t

   

        (2)       (1)       (4)      (6) 
 
S(u) = 0,4 
R^ = 0,98 
N = 20, k = 4, n-k = 16 
 
Zakładamy poziom istotności 

α

=0,05 => t

α

 =  2,120  

 
H0:

α

1 = 0 

H1:

α

 0 

 
T = 6/2 = 3     |t| > t

α

 H0: odrzucamy na korzyść H1, czyli 

α

 0 

Zmienna objaśniająca X

1t

 istotnie wpływa na zmienną endogeniczną Yt i należy ją pozostawić. 

 

α

t = 4    => pozostawiamy w modelu X

2t

  

 

α

3  

t = -2 => X

3t

 nieistotnie wpływa na Yt i należy ją z modelu wyrzucić. 

 

α

4 (ślepa zmienna) 

T = 1,8 => nieistotnie wpływa na model i należy ją z niego usunąć 
Jeżeli chcemy utrzymać model to musimy zmienić poziom istotności np. 

α

 = 0,1 gdzie t

α

 = 1,76   

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

16 

 
Jeżeli wypada nam jakaś zmienna to szacujemy model raz jeszcze i raz jeszcze sprawdzamy istotność zmiennych. 
 
Autokorelacja składnika losowego rzędu I. Test Durbina-Watsona 
Może ona wyrażać się w postaci: 

ξ

t

 = f(

ξ

t-1

ξ

t-2

...

ξ

t-

τ

 
Do najczęstszych odstępstw od założeń MNK można zaliczyć fakt iż składnik losowy 

ξ

t nie tworzy procesu czysto 

losowego,  lecz  zależy  od  wskaźnika  bieżącego  „t”.  Sytuacja  taka  ma  miejsce,  gdy  wskaźnik  t  wyznacza  pewne 
rozmieszczenie przestrzenna lub częściej gdy realizacje 

ξ

t są zależne w czasie. 

 
Autokorelacje  można  mierzyć  tzw.  współczynnikiem  autokorelacji  rzędu 

τ

,  który  jest  liczony  jako  współczynnik 

korelacji liniowej r

t

  

 

)

(

)

(

)

(

)

(

)

(

1

τ

τ

τ

τ

ξ

ξ

ξ

ξ

ξ

ξ

ρ

×

×

=

t

t

t

t

t

D

D

E

E

E

 

 
Estymator współczynnika autokorelacji rzędu 

τ

, dany jako 

 

×

×

×

×

×

=

+

=

+

=

+

=

+

=

+

=

+

=

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

τ

n

u

u

n

u

u

n

n

u

u

n

u

u

r

n

t

t

n

t

t

n

t

t

n

t

t

n

t

n

t

t

n

t

t

t

t

2

1

1

2

2

1

1

2

1

1

)

(

)

(

)

(

 

 
Współczynnik autokorelacji przyjmuje wartość z przedziału [-1,1] 
 
Przyczyny autokorelacji składnika losowego: 

błędy specyfikacji modelu: 

pominięcie istotnej zmiennej objaśniającej 

błędne określenie opóźnień czasowych zmiennej bądź kilku zmiennych objaśniającej 

przyjęcie niewłaściwej postaci analitycznej modelu 

 
test Durbina-Watsona stosowany jest tylko do testowania autokorelacji rzędu I 
 
H0:

ρ

1 = 0 

H1:

ρ

1 > 0  lub H1:

ρ

 < 0 

 
Sprawdzeniem Ho jest statystyka Durbina-Watsona (gdy dysponujemy resztami modelu danymi jako: 
 

=

=

=

n

t

t

n

t

t

t

U

U

U

d

1

2

2

2

1

)

(

, gdzie Ut to reszta równania z okresem t. 

 
Sprawdzian hipotezy H0 możemy przedstawić jako (gdy mamy współczynniki autokorelacji I rzędu) 
d = z (1 – r

1

)  gdzie r

1

 to współczynnik autokorelacji I rzędu 

 
Statystyka D-W przyjmuje wartości z przedziału [0,4] 
 
W przybliżeniu dla r = 1; d = 0, r = 0 d =2 i dla r = -1 d = 4 
Pomiędzy 0 a 2 zależność dodatnia (+), pomiędzy 2, a 4 ujemna (-)     
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

17 

Podjęcie decyzji w przypadku gdy: 
- mamy doczynienia z dodatnią korelacją składnika losowego H0:

ρ

1 = 0   i H1

ρ

1 > 0 

d

L

  - dolna wartość krytyczna odczytana z tablic 

d

n

  - górna wartość krytyczna odczytana z tablic 

 

• 

jeżeli d <= d

L

 to H0 odrzucamy, wtedy model należy poprawić (oszacować ponownie uogólnioną MNK lub 

zastosować metodę różniczki zupełnej) 

• 

jeżeli d

L

 < d < d

n

 to nie można podjąć decyzji odnośnie istotności bądź nieistotności autokorelacji składnika 

losowego – tzw. obszar niekonkluzywności 

• 

jeżeli d => d

n

 nie ma podstaw do odrzucenia H0. 

- mamy doczynienia z dodatnią korelacją składnika losowego H0:

ρ

1 = 0   i H1

ρ

1 < 0 

• 

liczymy d’ (d’= 4 – d) 

• 

jeżeli  d’  <=  d

L

  to  H0  odrzucamy,  wtedy  model  należy  poprawić  (oszacować ponownie uogólnioną MNK 

lub zastosować metodę różniczki zupełnej) 

• 

jeżeli  d

L

  <  d’  <  d

n

  to  nie  można  podjąć  decyzji  odnośnie  istotności  bądź  nieistotności  autokorelacji 

składnika losowego – tzw. obszar niekonkluzywności 

• 

jeżeli d’ => d

n

 nie ma podstaw do odrzucenia H0. 

 
Homoskedastyczność  –  jednorodność  wariancji  składnika  losowego  (

ρ

0  nie  jest  spełniona  –  poprawiamy  model 

uogólnioną MNK, tracimy na dokładności modelu). 
 
Homoskedastyczność jest: 

jednym z założeń MNK 

oznacza,  iż  wraz  ze  zmianą  wartości  zmiennej  endogenicznej  lub  zmiennych  objaśniających  lub  wraz  z 
upływem czasu wariancja składnika losowego ulega zmianie 

odstąpienie od tego założenia powoduje obniżenie efektywności estymatorów 

 
Test Goldfelda – Quandta 
Próbę statystyczną dzieli się na 2 części, (gdy ilość jest nieparzysta to odrzucamy środkową). 
Na podstawie równoliczących prób szacuje się dwa modele ekonometryczne, a następnie oblicza się ich wariancje 
resztowe 
 
S

2

u1

 oraz S

2

u2  

 

 

=

×

=

n

t

t

t

u

Y

Y

k

n

S

1

2

2

)

*

(

1

 

 
W teście weryfikowane są następujące hipotezy H0:

ρ

2

ρ

2

 H1:

ρ

2

ρ

2

2

   

Zakładając  prawdziwość  H0,  sprawdzianem  testu  jest  statystyka  F  o  rozkładzie  Fishera-Snedecora  danego 
następującą formułą: 

2

1

2

2

Su

Su

F

   

o m

1

 = (n

2

 – k)   i m

2

 = (n

1

 i k) stopniach swobody 

 
Decyzja: hipotezę o homoskedastyczności odrzucamy, gdy wartość sprawdzianu F przekroczy wartość krytyczną F

α

 

odczytaną z tablic rozkładu Fishera dla określonego poziomu istotności oraz określonej liczby stopni swobody. 

 
Na podstawie danych z tabeli oszacowano model ekonometryczny i otrzymano wyniki 
 
Yt = 2X

1t

 + 4 + u

t

           Su

2

 = 0,5 

 
Model 1 (z pierwszej części tabeli) 
Yt = 2,25X

1t

 + 3,5 + u

    Su

2

 = 0,9166 

 
Model 2 (z drugiej części tabeli) 
Yt = 2,07X

1t

 + 4,14 + u

t

     Su

2

 = 0,2619 

 
Test Fishera: 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

18 

α

 = 0,05     m

1

 = 3       m

2

 = 3  

 
F = 0,2619/0,9166 = 0,2857 
Wartość z tablic F

α

 = 9,28 

F < F

α

    

 brak podstaw do odrzucenia H0, głoszącej stałość wariancji składnika losowego. 

 
Przykład 1. 
 
Na podstawie 25 operacji oszacowano model ekonometryczny i otrzymano wyniki: 
Y

= 2X

1t 

- 3X

2t 

+ 4X

3t 

+ 5 + u

t  

Współczynnik autokorelacji rzędu I wynosi r

1

=-0,95; k=3; n=25; 

α

=0,05 

H

0

:r

1

=0 

H

1

:r

1

<0 

Statystyka:   d =2 (1 - r

1

) = 2(1 + 0,95) = 3,9  liczymy d’= 4 – 3,9 = 0,1 

d

L

=1,12  d

u

=1,66 

 

 

d’<d

L

 

 hipotezy zerowe odrzucamy na korzyść hipotezy alternatywnej głoszącej, że r

1

<0 Istotna 

autokorelacja ujemna składnika losowego. Model należy poprawić.  
Pierwsza rzecz to szacowanie przyczyn istotnej autokorelacji (np. opuszczanie istotnych przyczyn), (czy proces jest 
nieliniowy, a wg modelu liniowy). Ostateczność 

 MNK lub różniczki zupełnej. 

 
Przykład 2. 
 
L.p.  1  2  3  4  5  6  7  8  9  10  11  12  13  14  15  16  17  18  19  20 
U

t

 

-1  -1  -2  -2  -2  1  2  -2  1  1 

-1  0 

U

t-1 

-1  -1  -2  -2  -2  1  2  -2  1 

-1  0 

 
Dodatkowo wiadomo, że model posiada 2 zmienne objaśniające. k=2  n=20 

α

=0,05 

H

0

:

ρ

1

=0 

H

1

:

ρ

1

>0 (bo d<2) 

(

)

=

=

=

n

t

t

n

t

t

t

u

u

u

d

1

2

2

2

1

 test tylko dla autokorelacji rzędu I 

(

)

=

=

20

2

2

1

58

t

t

t

u

u

 

=

=

20

1

2

34

t

t

u

 

6918

,

1

34

58

=

=

d

 

d

L

=1,10 d

u

=1,54 

 

d > d

u

   

Brak podstaw do odrzucenia H

0

, głoszącej, że 

ρ

1

=0. Nieistotna autokorelacja składnika losowego. 

 
 

UOGÓLNIONA METODA NAJMNIEJSZYCH KWADRATÓW 

 
 lekarstwo na autokorelację i niestałość wariancji 
 

1.  służy do szacowania parametrów strukturalnych modeli liniowych przy niespełnionym założeniu o stałości 

wariancji odchyleń 

2.  służy  do  szacowania  parametrów  strukturalnych  modeli  liniowych  przy  niespełnionym  założeniu  o  braku 

autokorelacji składnika losowego 

 
Wówczas macierz wariancji i kowariancji może być zapisana jako: 
 
D

2

(a) = 

σ

2

 

 dowolna dodatnio określona macierz stopnia n 

 
Wektor ocen parametrów strukturalnych dotyczy uogólnionej MNK dany: 
 

(

)

y

X

X

X

a

1

1

'

'

=

 

KMNK analogicznie do 

(

)

y

X

X

X

a

'

'

1

=

 

 
Wyznaczenie wektora ocen parametrów strukturalnych 
 
Wyznaczenie macierzy wagowej P: 

P jest taka, że 

-1

 = P’P 

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

19 

UWAGA! 
Następnie oblicza się ważone obserwacje zmiennych czyli: y

*

=Py 

 

X

*

=PX 

Praktyczne zastosowanie UMNK wymaga znajomości macierzy 

. Macierz 

 zazwyczaj nie jest a priori znana. 

 

1.  przypadek 

 niestałość wariancji odchyleń losowych 

Macierz 

 jest macierzą diagonalną jako: 

=

n

...

0

0

...

...

...

...

0

...

0

0

...

0

2

1

  Macierz odwrotna 

  

=

n

1

...

0

0

...

...

...

...

0

...

1

0

0

...

0

1

2

1

1

 

A macierz wagowa P dana jest jako wektor 

 

 

 
Wyznacznik macierzy diagonalnej 

 iloczyn głównej przekątnej 

 
 
 
 
 
Elementami na głównej przekątnej mogą być: 

a)  realizacje  wybranej  zmiennej  objaśniającej  X  (najprostszy  

przypadek), czyli  

t

 = X

t = 1,2,3,...,n 

b) moduły reszt modelu oszacowanego MNK, czyli 

t

 = |u

t

t = 1,2,3,...,n 

c)  w  przypadku  autokorelacji  składnika  losowego  zakłada  się  nieciągłe{

ξ

}  podleganie  procesowi 

autoregresyjnemu rzędu I czyli: 

 

t

 = 

ρξ

t-1

 + 

η

t

 

 

t = 1,2,3,...,n 

gdzie |

ρ

| < 1 wówczas 

ρ

τ

 

ρ

τ

 

A macierz 

 jest macierzą współczynników autokorelacji odchyleń losowych o postaci: 

=

1

...

...

...

...

...

...

...

1

...

1

3

2

1

2

1

2

η

η

η

η

η

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

+

+

+

=

1

0

...

0

0

0

1

...

0

0

0

...

...

...

...

...

...

...

0

0

0

...

1

0

0

0

0

...

1

0

0

0

...

0

1

2

2

2

1

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

 

Macierz wagowa P 

=

1

0

...

0

0

0

0

1

...

0

0

0

...

...

...

...

...

...

...

0

0

0

...

1

0

0

0

0

...

0

1

0

0

0

...

0

0

1

2

ρ

ρ

ρ

ρ

ρ

P

 

Ocena współczynnika autokorelacji dana jest jako: 

(

)

(

)

=

=

+

=

n

t

t

n

t

t

t

u

n

u

u

k

n

r

1

2

1

1

1

1

1

1

 

k – liczba szacowanych parametrów w modelu 

Wariancja resztowa dana jest następującą formułą: 

u

u

k

n

S

u

1

2

'

1

1

=

  

u -  kolumnowy wektor reszt 

=

n

P

1

...

0

0

...

...

...

...

0

...

1

0

0

...

0

1

2

1

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

20 

Macierz wariancji i kowariancji dana jest jako: 

( )

(

)

1

1

2

2

'

=

X

X

S

a

D

u

 

 
Zastosowanie UMNK dla poprawienia modelu wykazującego autokorelację składnika losowego. 
 

Yt 

6,5 

5,5 

X

1t

 

X

2t

 

-1 

-1 

-1 

 
Oszacowano model w postaci: 
 
Y

t

 = 

α

1

X

1t

 + 

α

2

X

2t

 + 

α

0

 + 

ξ

t

 i otrzymano wynik: 

 
Yt = 1,5X

1t

 + 0,5X

2t

 + 3,3 + u

t

  

         (0,52)    (0,42)     (0,61) 
 
d = 3,0264     jeżeli d > 3 (ok 3,6) to można praktycznie od razu stwierdzić autokorelacja istotna. 
 
Test Durbina-Watsona: 
N = 10      K = 2 
H

0

ρ

1

 = 0 

H

1

ρ

1

 < 0  

d’ = 0,9736 
 
d

L

 = 0,697 

d

U

 = 1,641 

 
Obszar niekonkluzywności – nie wiadomo nic o składniku losowym (nie można podjąć decyzji). 
Stosujemy UMNK i korzystamy w dalszym ciągu z modelu. 
Reszty w modelu zanikają z czasem (w momencie spadków stałych, zaczyna się opóźnienie w modelu). 
 
UMNK: 
Wektor ocen parametrów strukturalnych UMNK dany jako: 

(

)

y

X

X

X

a

1

1

'

'

=

 

Założono, że na głównej przekątnej macierzy wprowadzone zostaną moduły reszt modelu oszacowanego KMNK: 
 
Macierz 10x10: 

=

3

,

0

2

,

0

3

,

0

0

2

,

0

8

,

0

2

,

0

8

,

0

0

2

,

1

3

,

1

7

,

1

 

=

3

,

0

1

...

0

0

...

...

...

...

0

...

3

,

1

1

0

0

...

0

7

,

1

1

1

      też macierz 10x10 

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

21 

Oszacowany model ma postać: 
~Y

t

 = 1,71X

1t

 + 0,55X

2t

 + 3,07 + u

t

  

         (0,34)        (0,27)     (0,41) 
 
S

2

u

 = 1,0954 

S

u

 = 1,0466 

 
Reszty również zanikają z czasem. Po zastosowaniu UMNK – zmniejszają się amplitudy wahań.   

 
 

EKONOMETRYCZNA TEORIA PROGNOZ 

 
Przewidywanie przyszłości – np. prognoza pogody na Śląsku o 12:48m etc. 
Jeżeli nie dysponujemy historią, nie możemy prognozować ekonometrycznie. 

nieracjonalne – wróżby, magia, proroctwa, wszystko co oparte na doświadczeniu, a nie wymaga stosowania 
reguł naukowych 

racjonalne – na podstawie racjonalnych przesłanek (zbiory faktów z przeszłości) 

zdroworozsądkowa – na nosa, tak mi się wydaje; często wynika z doświadczenia 

naukowe – fakty i tylko fakty 

 
Naukowe to wiedza + metody, dowody. 
 
Prognoza: 

Zbigniew  Hellwig  –  prognozą  statystyczną  nazywać  będziemy  każdy  sąd,  którego  prawdziwość  jest 
zdarzeniem losowym, przy czym prawdopodobieństwo tego zdarzenia jest znane i wystarczająco duże dla 
celów praktycznych 

Zbigniew Pawłowski – wnioskowaniem w przyszłość na podstawie modelu będziemy nazywać predykcją, 
natomiast  konkretny  wynik  otrzymany  na  skutek  zastosowanego  wnioskowania  nazywać  będziemy 
prognozą. 

 
Ostatecznie przez prognozę będziemy rozumieć sąd o następujących właściwościach: 

Sformułowana z wykorzystaniem dorobku nauki 

odnoszące  się  do  określonej  przyszłości  –  jest  to  sąd  o  stanie  zmiennych,  bądź  zmiennej  w  przyszłości, 
która  jest  określona  explicite  przez  podanie  momentu  czasu  (np.  30.06  przychód  ze  sprzedaży  wyniesie 
2mln zł), bądź implicite (np. Anna będzie dobrym lekarzem) 

Jest  to  sąd  weryfikowalny  empirycznie,  prognoza  jest  sformułowana  precyzyjnie  oraz  istnieje  określony 
czas w którym będzie sprawdzona 

Jest to sąd niepewny, ale akceptowany (dopuszczalna/niedopuszczalna) 

Należy unikać stawiania prognoz banalnych (np. jutro będzie wtorek etc.) 

 
Funkcje prognoz: 

preparacyjna – prognozowanie jest działaniem, które przygotowuje inne działania 

aktywizująca – ma za zadanie pobudzać do działania (prognozy ostrzegawcze) 

informacyjna 

 
Rodzaje prognoz: 
 

ilościowe – prognoza wyrażona jest liczbą (punktowe – wielkość sprzedaży 2mln zł, lub przedziałowe, 2-
2,5mln zł) 

jakościowe – najczęściej prognoza słownie opisana sytuacja (np. za 2 tygodnie kurs euro spadnie) 

 
Ze względu na typ zmian zmiennej prognozowanej: 

krótkoterminowe – na przedział czasu, w którym zachodzą tylko zmiany ilościowe 

średnioterminowe – na przedział czasu, w którym zachodzą zmiany ilościowe, ale oczekuje się też zmian 
jakościowych 

długookresowe – zachodzą zmiany ilościowe i jakościowe, które też należy uwzględnić. 

 
Podstawowe pojęcia prognozowania: 
Dopuszczalność  prognozy  –  prognoza  jest  dopuszczalna,  wówczas  gdy  obdarzona  jest  przez  odbiorcę  stopniem 
zaufania uprawniającym do tego by mogła być wykorzystana do celu, dla którego była budowana. Jest określana w 
tym samym momencie, w którym wyznacza się prognozę. 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

22 

Maksymalny  horyzont  prognozy  –  należy  do  przyszłości,  najdalszy  moment  dla,  którego  prognoza  jest 
dopuszczalna. 
 
Żądany  horyzont  prognozy  –  odbiorca  prognozy  może  życzyć  sobie  prognozy  na  dowolny  moment  czasu,  przy 
czym, nie może być ona zrealizowana w momencie gdy żądany horyzont jest dłuższy niż maksymalny. 
 
Prognoza  wygasła  –  prognoza  wyznaczona  na  taki  moment,  dla  którego  znana  jest  prawdziwa  wartość  zmiennej 
prognozowanej (prognozy ex post). 
 
Zmienna  prognozowana  –  Yt,  zmienna  endogeniczna,  reprezentuje,  obiekt,  proces,  zjawisko,  które  podlega 
prognozowaniu.  
Cechy danych wykorzystywanych do budowy prognoz: 

1.  Rzetelność – dane są rzetelne gdy są zgodnie z przedmiotem, którego dotyczą 
2.  Jednoznaczność – dane powinny być tak przedstawiane, by każdy odbierał je tak samo 
3.  Kompletność – dane powinny obejmować wszystkie ważne i istotne dla celów badawczych informacje 
4.  Aktualność danych dla przyszłości – czy pewne czynniki nie przestaną wpływać na Yt 
5.  Koszt zbierania i opracowywania danych 
6.  Porównywalność danych – można je porównywać z punktu widzenia: 

a.  Czasu – by między poszczególnymi realizacjami była ta sama przerwa (ten sam interwał) 
b.  Terytorium – powinny dane pochodzić z tego samego terytorium 
c.  Stosowane  pojęcia  i  kategorie  –  dane  powinny  być  podobnie  konstruowane  (ważne  dla 

wskaźników makroekonomicznych) 

d.  Metody obliczeń – dokładność, formuły obliczania agregatów 

 
Prezentacja danych: 

szereg czasowy momentów – wyraża poziom zjawiska w danym momencie (wielkość sprzedaży w latach 
97-2002 stan na 31.12 

 moment pomiaru) 

szereg czasowy okresów – wielkość sprzedaży pewnego wyrobu w pierwszej połowie 2002 (od...do...) 

interwał pomiędzy danymi taki sam, w systemie pn-pt, uznaje się, że pt-pn taki sam jak wt-śr, czy śr-czw. 
Święta, niedziele itp. prognozuje się odrębnie 

 
Składowe szeregu czasowego: 

• 

wahania przypadkowe 

• 

trend 

• 

stały/średni poziom 

• 

wahania sezonowe (krótkookresowe) 

• 

wahania cykliczne (długookresowe) 

 
 

MODELE ADAPTACYJNE 

 
Nie wymagają one szacowania, estymatorów, założeń, są one dobre dla krótkookresowych prognoz. 
 
Cechy ogólne i zastosowanie: 

dostosowane do przebiegu procesu – naśladowanie procesu 

budowa prognoz krótkookresowych 

prosta budowa 

możliwość sprawdzenia symulacji 

możliwość uwzględnienia wahań przypadkowych trendu oraz wahań sezonowych 

 
Ogólna postać Y

t

 = 

η

t

 + u

t

  

 
Wady: 

trudność w ustaleniu początkowych wartości do symulacji 

strata informacji 

założenia o liniowości zmiennej prognozowanej w przyszłości 

postarzanie informacji 

 
Symulacja  –  w  przypadku  modeli  adaptacyjnych,  symulacja  polega  na  takim  dobrze  parametrów  wygładzania  by 
zminimalizować dowolnie wybrany błąd ex post. 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

23 

Okres weryfikacji prognoz (ex post) jeżeli błąd 5% to zakładamy, że w przyszłości też 5% (na podstawie danych + 
prognoz). 
 
Ex ante – ex post + odcinek uwzględniający przyszłość, im dalej tym większy błąd. 
 
Model wyrównywania wykładniczego Browna: 
Zastosowania: 

zmienna prognozowana wykazuje trend oraz wahania przypadkowe 

Wady: 

strata informacji, problem z doborem wartości początkowych 

Zalety: 

łatwość prowadzenia obliczeń 

nie trzeba stosować długich szeregów czasowych (40, min. ilość to 8-12) 

 
Wyłącznie dla prognoz krótkookresowych. 
Postać modelu oraz trendu na moment t:  m

1

 = 

α

y

1

 + (1 - 

α

) m

t-1

  

m

t-1

- ocena trendu na moment poprzedni (t-1). 

α

 – parametr wygładzania (przyjmuje wartości od 0 do 1) – zakładamy go a’priori, im bliższy 1, tym szybciej model 

reaguje. 
y

1

 – zmienna prognozowana 

 
Jeżeli proces jest niestabilny w czasie (szybkie zmiany, nieregularne) to 

α

 bliżej 1. 

Jeżeli proces jest stabilny w czasie (nie wykazuje radykalnych zmian) to 

α

 bliżej 0. 

 
Równanie prognozy w tym modelu: Y

Tp

 = m

t

 + (m

t

 – m

t-1

)n  

n- zakładany z góry horyzont prognozy 
z okresu na okres n=1. Jeden punkt w przyszłość n=1, drugi n=2. 
n -  daje nam wyprzedzenie czasowe. 
Nie uwzględniamy czynników kształtujących Y. 
 
Wartości początkowe do symulacji: 
m

1

 = y

t

   lub    m

1

 = śr.y 

 
Model Holta, postać klasyczna: 
Zastosowanie: 

zmienne prognozowane wykazują trend oraz wahania przypadkowe 

Wady: 

strata informacji, problem z doborem wartości początkowych 

Zalety: 

łatwość prowadzenia obliczeń 

krótki szereg czasowy (40 obserwacji, min 12) 

 
Ocena trendu: F

t-1

 = 

α

y

t-1 

+ (1-

α

)(F

t-2

 + S

t-2

y

t-1

 – realizacja zmiennej prognozowanej na okres t-1 (poprzedni). 

S

t-2

 – ocena przyrostu trendu na okres t-2. 

α

 - parametr wygładzania 

 
Wyznaczenie wartości przyrostu trendu: S

t-1

 = 

β

(F

t-1

 – F

t-2

) + (1 - 

β

)S

t-2

   

 

α

,

β

 - parametry wygładzania przyjmują wartości od 0 do 1. 

 
Równanie prognozy: Y

Tp

 = F

n

 – S

n

(t – n); gdzie t > n     t – n – wyprzedzenie czasowe; 

n – horyzont prognozy. 
 
Wartości początkowe do symulacji: 
F

1

 = Y

1

 lub 

Yt = a

1t

 + a

0

 + u

t

  

a

1

 – mówi o przeciętnych zmianach z okresu na okres i pokazuje kierunek (+/-) 

a

0

 – mówi o tym co było w okresie poprzedzającym okres weryfikacji. 

F

1

 = a

0

  

S

1

 = y

2

 – y

S

1

 = a

1t

  

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

24 

Model Holta – z trendem hiperbolicznym gasnącym 
 
Ocena trendu: F

t-1

 = 

α

y

t-2

 + (1 - 

α

) (F

t-2

 + S

t-2

)

ϕ

  

Parametr 

ϕ

 - odpowiedzialny za gasnący trend; 

Parametry wygładzania przyjmują wartości od 0 do 1. 
 

Równanie prognozy: 

=

+

=

n

t

i

i

Tp

Sn

Fn

Y

1

ϕ

  ; gdzie t > n 

 
Model Wintersa – postać addytywna (ze stałą amplitudą wahań) 
Zastosowanie: 

w  przypadku  szeregów  czasowych  zawierających  tendencję  rozwojową,  wahania  przypadkowe  oraz 
wahania cykliczne 

Wady: 

strata informacji, problem z doborem wartości początkowych 

Zalety: 

łatwość prowadzenia obliczeń 

krótki szereg czasowy (40 obserwacji, min 12) 

 
Ocena trendu: F

t-1

 = 

α

(y

t-1

 – C

t-1-r

) + (1 - 

α

)(F

t-2

 – S

t-2

 
C – ocena wskaźnika sezonowości na moment t-1-r 
R – liczba faz cyklu, określany z góry 
 
Wyrównanie wartości przyrostu trendu: S

t-1

 = 

β

(F

t-1

 – F

t-2

) + (1 - 

β

)S

t-2

   

Ocena wskaźnika sezonowości  C

t-1

 = 

γ

(y

t-1

 – F

t-1

) + (1 + 

γ

) C

t-1-r

      

γ

 - parametr wygładzania 

 
Wartości początkowe do symulacji: 
F

1

 = y

t

  lub F

1

 = śr.y  

S

1

 = y

2

 – y

1

   

 
C1 = śr.

y

t

  - średnia arytmetyczna z pierwszych różnić Y. 

y

t

 = y

t

 – y

t-1

  

 
Równanie prognozy jako: Y

Tp

 = F

n

 + S

n

(t – n) + C

t-r

   t > n 

Horyzont prognozy = r. 
 
Postać multiplikatywna modelu: 
 

Ocena trendu: 

)

(

)

1

(

2

2

1

1

1

+

+

+

+

×

=

t

t

r

t

t

t

S

F

C

y

F

α

α

 

Wyrównana wartość przyrostu trendu: S

t-1

 = 

β

(F

t-1

 – F

t-2

) + (1 - 

β

)S

t-2

  

Ocena wskaźnika sezonowości: 

r

t

t

t

t

C

F

y

C

×

+

×

=

1

1

1

1

)

1

(

γ

γ

 

Prognoza: Y

Tp

 = [P

n

 + S

n

(t – n)]C

t-r

        t > n    r – maksymalny horyzont czasowy. 

 
Ustalenie parametrów wygładzania: 

parametry  bliskie  jedności,  w  przypadku  gdy  wszystkie  składowe  szeregu  czasowego  (trend,  wahania 
sezonowe, wahania cykliczne) zmieniają się szybko 

parametry bliższe zeru – w przypadku gdy wszystkie składowe zmieniają się wolno 

 
Minimalizacja ze względu na średni względny błąd prognoz ex post: 

00

1

1

1

=

×

×

=

m

t

t

Tp

t

y

y

y

m

ψ

 

 
 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

25 

LINIOWA FUNKCJA TRENDU 

 
Prognozowanie na podstawie funkcji trendu – modele rozwojowe. 
Przyjmujemy, że poszukiwana funkcja trendu ma postać liniową. 
 
F(t) = α

0

 + β

1+t

  

Jest modelem dynamicznym. Zmienne nielosowe. 
Model szeregu czasowego: 
Y

t

 = α

o

 + α

1t

 + ξ

Y

– zmienna prognozowana 

α

0

 – parametr wolny 

α

1t

 – parametr przy zmiennej czasowej 

ξ

t

 – składnik losowy 

 
W  szeregu  czasowym  dane  są  ułożone  chronologicznie,  może  on  być:  wielowymiarowy  lub  jednowymiarowy  (1 
zmienna prognozowana). 
Dzielą się na szeregi czasowe momentów i szeregi czasowe okresów. 
 
1. Wszystkie realizacje powinny być w tej samej jednostce. 
2. Wszystkie realizacje powinny być z tego samego obszaru terytorialnego. 
3.  Jeśli  istnieją  luki  informacyjne,  powinniśmy  uzupełnić  te  dane,  albo  z  innych  źródeł,  albo  metodami 
statystycznymi/ekonometrycznymi.  
 
Szacowanie za pomocą MNK – funkcja kryterium w postaci: 

=

 −

=

n

t

t

t

y

y

1

2

_

ϕ

 

 minumum 

Rozwiązaniem układu równań normalnych względem parametrów jest: 

α

0

 = śr.y – α

1śr.t 

 

=

=

×

=

n

t

n

t

t

t

t

y

y

t

t

1

2

_

1

_

_

1

)

(

)

(

)

(

α

 

Wynik oszacowania parametrów modeli: y

t

 = α

0

 + α

1t

 + u

t

 

 prognozy ex post – trend prognozy wygasłej. 

u

t

 = y

t

 – y*

t

  

 
Modele dynamiczne uwzględniają upływ czasu. 
Postać macierzowa modelu jest następująca: 
y = X

α

 + 

ξ

 

gdzie: 

=

n

y

y

y

y

...

2

1

   

=

n

X

1

...

...

2

1

1

1

   

=

1

0

α

α

α

 

=

n

ξ

ξ

ξ

ξ

...

2

1

 

Wektor ocen parametrów strukturalnych dany jako: 
a = (X’X)

-1

 X’Y 

 

=

=

=

n

t

t

n

t

t

ty

y

Y

X

1

1

'

     

=

=

=

=

n

t

n

t

n

t

t

t

t

n

X

X

1

2

1

1

'

       

=

1

0

a

a

a

 

 
przy czym det (X’X) 

 0 

 
Weryfikacja modelu 
Wariancja resztowa: 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

26 

(

)

=

×

=

n

t

t

t

y

y

k

n

Su

1

2

2

*

1

  stąd odchylenie standardowe reszt dane jest: 

2

Su

Su

=

 

Średnie błędy szacunku, czyli macierz wariancji i kowariancji: 
D

2

(a) – Su

2

(X’X)

-1

  

 

=

=

×

×

=

n

t

n

t

t

t

n

t

Su

a

D

1

2

_

1

2

2

0

)

(

)

(

    

=

 −

=

n

t

t

t

Su

a

D

1

2

_

2

1

)

(

 

 
Współczynnik zbieżności: 

(

)

=

=

 −

=

n

t

t

n

t

t

t

y

y

y

y

1

2

_

1

2

2

*

ϕ

 

φ

2

 = [0,1] 

 
Współczynnik determinacji: 
R

2

 = 1 – φ

2

 

 
Prognoza punktowa dana jest jako: 
 
T = przyszły punkt w przyszłości, horyzont prognozy. 

[ ]

T

a

a

a

a

T

y

P

T

1

0

1

0

1

+

=

=

 

 
Średni błąd predykcji dany jest jako: (prognoza ex ante) – przyjmuje on jednostki zmiennej prognozowanej 
X’

– kolumnowy wektor przyszłych realizacji zmiennych objaśniających 

D^(a) – macierz wariancji, kowariancji 
Su^ - wariancje resztowe 
 

2

2

)

(

'

Su

X

a

D

X

V

T

T

+

×

×

=

 

 
Uwzględniony średni błąd predykcji dany jest jako: 

100

*

×

=

P

T

y

V

V

  - określa on dopuszczalność prognozy. 

 
Prognoza przedziałowa budowana wokół prognozy punktowej: 
 
P(y

P

T

 – uV < y

T

 < y

P

T

 + uV) = γ

 

γ

– wiarygodność predykcji 

y

T

 – wartość zmiennej prognozowanej w jednostce czasu T 

uV  –  współczynnik  związany  z  wiarygodnością  prognozy,  rozkładem  zmiennej  prognozowanej  oraz  długością 
przedziału czasowego próby. 
 
Przykład 
Na podstawie danych o bezrobociu w Polsce w tablicy oszacować funkcję trendu w postaci: 
Y

t

 = a

0

 + a

1t

 + ξ

t

  

Lata 

95 

96 

97 

98 

99 

00 

01 

02 

Yt 

67,1 

62,1 

73,7 

80,6 

82 

87,8 

106 

97,6 

trend 

62,25 

87,93 

73,6 

79,28 

84,95 

90,63 

96,3 

101,98 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

27 

 
Dane wejściowe w postaci wektora: 

=

6

,

97

...

1

,

67

y

      

Parametr wolny & czas: 

=

8

1

7

1

6

1

5

1

4

1

3

1

2

1

1

1

X

                     t

II 

– wyskalowanie czasu, te same odległości i suma równa do 0. 

 

Yt 

10 

15 

13 

11 

15 

16 

t

I

 

t

II

 

-2,5 

-1,5 

-0,5 

0,5 

1,5 

2,5 

 
Dla nieparzystej ilości danych by było 2 | 1 | 0 | 1 | 2    etc. 
 
Stosując formułę na wektor. a = (X’X)

-1

 X’y 

 

=

8

7

6

5

4

3

2

1

1

1

1

1

1

1

1

1

'

X

  

=

204

36

36

8

' X

X

     

=

0238

,

0

107

,

0

107

,

0

607

,

0

)

'

(

1

X

X

 

X’y = 

4

,

3194

9

,

656

     

=

675

,

5

575

,

56

a

 

 
Model po szacowaniu Yt = 56,575 + 5,675 + u

t

 

 

 

 

        (4,3747)  (0,8663) 

 
Interpretacja parametrów: 

wolny – w roku 1994 poziom bezrobocia w Polsce wyniósł 56,575 tysięcy osób (dot 1 okresu) 

przy zmiennej czasowej – w latach 95 – 02 bezrobocie w Polsce wzrosło z roku na rok średnio rzecz biorąc 
o 5,675 tys osób. 

 
Wartości teoretyczne bezrobocia: 
Y1 = 56,575 + 5,675*1 = 62,25 
Y8 = 56,575 + 5,675*8 = 101,975 
 
Miary struktury stochastycznej: 
Su

2

 = 31,52 (tys.

2

)  

Su

2

 = 5,614 tys  

n = 8; k =2 

Y – 82,115 [tys] – przeciętny poziom bezrobocia. 
Dopasowanie modelu do danych empirycznych 
Φ = 12,26% R

2

 = 87,74%  

Prognoza punktowa na rok 2003 t=9 Y9 = 56,575 + 5,675*9 = 107,65 tys. 
 
Średni błąd predykcji: 

=

9

1

Xt

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

28 

1 – przyszła realizacja ślepej zmiennej (zawsze 1) 
9 – przyszła realizacja zmiennej czasowej. 
 
V = 7,1176 tys 
V* = 6,61% 
 
Prognoza przedziałowa n-k = 6 (6 stopni swobody) 
α = 0,05     tα = 2,447    testujemy t-studenta 
 
107,65 – 2,447*7,1176 < yt < 107,65 + 2447*7,1176 
90,2332 < yt < 125,0668 
Ulega zmianie wraz ze wzrostem horyzontu czasowego – średni błąd predykcji wrasta. 

 
 

METODA TRENDÓW JEDNOIMIENNYCH OKRESOWYCH 

 
Metoda polega na oszacowaniu parametrów analitycznych funkcji trendu oddzielnie dla poszczególnych faz cyklu. 
Prognoza  otrzymana  jest  przez  ekstrapolację  oszacowanej  funkcji  trendu  dla  każdej  fazy  cyklu.  Przyjmijmy,  że 
szereg  czasowy  składa  się  z  „n”  obserwacji.  Szereg  czasowy  należy  podzielić  na  „m”  szeregów  czasowych 
odnoszących się do tej samej fazy cyklu. 
 
y

lj

 = f

j

(l) + ξ

lj

   

f

j

 – funkcja trendu dla j-tej fazy trendu 

y

lj

 – wartość szeregu czasowego w l-tym cyklu (l = 1,2,... n) 

ξ

lj

 – składnik losowy 

 
W  metodzie  trendów  jednoimiennych  okresów  dla  każdej  fazy  cyklu  najczęściej  wybierana  jest  postać  liniowa 
funkcji trendu. 
 
Ostatecznie mamy: 
y

lj

 = α

oj

 + α

lj

 + ξ

lj

   (l = 1, ... n) (j = 1, ... m) 

 
gdzie α – parametry strukturalne j-tej liniowej funkcji trendu. 
 
Przykład: 
 

Lata 

1999 

2000 

2001 

2002 

Kwartały  I 

II 

III 

IV  I 

II 

III 

IV  I 

II 

III 

IV  I 

II 

III 

IV 

Yt 

10 

13 

15 

14 

15 

13 

15 

11 

14 

Yt – przewozy ładunków w mln. Ton 
 
Wyjściowy szereg czasowy dzielimy na m = 4 
Szeregi czasowe jednoimiennych okresów: 

1999  I 

2000  I 

2001  I 

2002  I 

 
 

1999  III 

13 

2000  III 

14 

2001  III 

13 

2002  III 

11 

 

1999  II 

10 

2000  II 

2001  II 

2002  II 

1999  IV 

15 

2000  IV 

15 

2001  IV 

15 

2002  IV 

14 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

29 

Dla każdego szeregu czasowego szacujemy model o: 
y

t

 = α

1t

 + α

0

 + ξ

t

  

 
Każdy model szacujem wg formuły: a = (X’X)

-1

 * X’Y 

 

Macierz X zawsze będzie: 

=

1

1

1

1

4

3

2

1

X

 

=

4

10

10

30

' X

X

   

=

5

,

1

5

,

0

5

,

0

2

,

0

)

'

(

1

X

X

 

Pierwszy model I-kwartał: 
 

=

7

6

6

7

Y

   

=

26

65

'Y

X

  

=

5

,

6

0

α

 

Model można zapisać jako: 
Y*t = 0t + 6,5 + Ut 
Y*t = 6,5 + Ut 
 
Drugi model II-kwartał 

=

9

8

9

10

Y

   

=

36

88

'Y

X

  

−

=

10

4

,

0

α

 

Y*t = -0,4t + 10 + Ut 
 
Trzeci model – III-kwartał 

=

11

13

14

13

Y

   

=

51

124

'Y

X

  

−

=

5

,

14

7

,

0

α

 

Y*t = -0,7t + 14,5 + Ut 
 
Czwaty model – IV-kwartał 

=

14

15

15

15

Y

   

=

59

146

'Y

X

  

−

=

5

,

15

3

,

0

α

 

Y*t = -0,3t + 15,5 + Ut 
 
Analiza uzyskanych wyników 
 
Su

2

 = 0,5 

Su = 0,7071 

 

=

75

,

0

25

,

0

25

,

0

1

,

0

)

(

2

a

D

       D(a1) = 0,3162     D(a2) = 0,866 

 
Y*t = 6,5 + Ut 
          (0,866) 
 
Y = 6,5    φ

2

 = 100%    R

2

 = 0%  

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

30 

 
Prognoza na 1-szy kwartał 2003 wynosi 6,5mln ton. 
 
Średni błąd predykcji: 

=

1

5

T

X

  X’

T

D

2

(a) = [0,25   -0,5] 

gdzie 5 to przyszła realizacja zmiennej czasowej, a 1 – stała, ślepa zmienna 
X

T

’D

2

(a)X

= 0,75 

V – wyliczane ze wzoru (poprzedni wykład) 
V

2

 = 1,25  

V=1,118 
Średnio rzecz biorąc odchyla się o +/- 1,118 mln ton od postawionej prognozy 
Względny błąd predykcji V* = 17,2% 
V* = V/Y

TP 

* 100% 

 
Kwartał II 
Su

2

 = 0,6 

Su = 0,7745 

D(a

1

) = 0,3464  D(a

0

) = 0,9486 

 
φ

2

 = 60%    R

2

 = 40% 

Y

TP

 = 8  V = 1,2247 

V* = 15,31% 

 
Kwartał III 
Su

2

 = 1,15 

Su = 1,0723 

D(a

1

) = 0,4975  D(a

0

) = 1,3133 

 
φ

2

 = 48,42%    R

2

 = 51,58% 

Y

TP

 = 11,7 

V = 1,6955 

V* = 14,49% 

 
Kwartał IV 
Su

2

 = 0,15 

Su = 0,3872 

D(a

1

) = 0,1732  D(a

0

) = 0,4743 

 
φ

2

 = 40%    R

2

 = 60% 

Y

TP

 = 14 

V = 0,9123 

V* = 4,37% 

 
Zalety metody trendów jednoimiennych okresów: 
+  horyzontem  są  4  kwartały  w  przyszłości  i  nie  są  obciążone  błędem,  we  wszystkich  4  kwartałach  najniższe  z 
możliwych błędów 
+ szacujemy tylko i wyłącznie trendy liniowe 
+ służy prognozowaniu, gdy zmiana prognoz wykazuje zmiany sezonowe 
+ nie musimy wprowadzać zmiennych naśladujących sezonowość 
 
Wady: 

wymagana duża ilość obserwacji w szeregu czasowym 

czasami jest dużym przybliżeniem, trend mało elastyczny 

 
 

MODEL KLEINA 

 
Model ze zmiennymi zerojedynkowymi. 
Gdy  zmienna  wykazuje  trend,  wahania  sezonowe  i  przypadkowe,  z  addytywnym  przebiegiem  sezonowości.  Do 
wyodrębnienia wahań sezonowych można wykorzystać zmienne zerojedynkowe (naśladujące). 
 
m – odległość cyklu wahań 
Do  modelu  wprowadzamy  „m”  zmiennych  zerojedynkowych  czyli  V

1t

,  V

2t

...V

mt

    wprowadzenie  zmiennej 

naśladującej wymaga wprowadzenia parametru strukturalnego. 
 
Y

t

 = f(t) + 

β

1

V

1t

 + 

β

2

V

2t

 + ... +

β

m

V

mt

 + 

ξ

t

  

Z parametrem 

β

 odpowiadają za sezonowość. 

Z definicji addytywnych wahań sezonowych wynika że: 

=

=

=

=>

=

m

i

m

i

i

m

i

1

1

1

0

β

β

β

 

Wprowadzając 

β

m

  do  modelu  otrzymamy  jego  następującą  postać.  Model  ten  nie  ma  zastosowania  dla  trendów 

nieliniowych. 
Y

t

 = f(t) + 

β

1

(V

1t

-V

mt

) + 

β

2

(V

2t

-V

mt

) ... + 

β

m-1

(V

m-1t

 – V

mt

) + 

ξ

t

   

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

31 

Parametry 

β

i  informują  o  ile  średnio  rzecz  biorąc  w  i-tym  okresie  cykle  wahań  poziomów  zjawiska  różni  się  od 

poziomu wynikającego z ogólnej tendencji rozwojowej. 
 
Przykład: 

 

‘95 

 

‘96 

 

‘97 

 

‘98 

 

II 

II 

II 

Yt 

20 

40 

30 

60 

50 

80 

70 

-3 

-2 

-1 

(V

1

-V

2

)  1 

-1 

-1 

-1 

 
T sumujące się do 0 lepsze dla liczenia „na piechotę“ 
 
V

1t

 => I połowa 1; II połowa 0 

V

2t

 => I połowa 0; II połowa 1 

 
Model: 
Y

t

 = 

α

1

 + 

β

1

(V

1t

-V

2t

) + 

α

0

 + 

ξ

t

  

 
Model szacujemy MNK: 

=

1

1

3

1

1

2

1

1

1

1

1

0

1

1

1

1

1

2

1

1

3

X

    

=

70

80

50

60

30

40

20

Y

    

=

25

,

51

75

,

8

93

,

8

a

 

Y*

t

 = 8,93t – 8,75 (V

1t

 – V

2t

) + 51,25 + u

t

   lub 

Y*

t

 = 8,93t – 8,75V

1t

 + 8,75V

2t

 + 51,25 + u

t

  

 
W latach 95-98 rozpatrywany proces wzrastał z półrocza na półrocze średnio rzecz biorąc o 8,93 
W drugim półroczu roku ’94 przeciętny poziom rozpatrywanego procesu wynosił 51,25. 
W  rozpatrywanym  okresie  odchylenie  od  trendu  wynosiło  –8,75  w  pierwszych  półroczach  oraz  8,75  w  drugich 
półroczach. 
 
Wartość teoretyczna modelu 
Y*

1

 = 15,71 => 8,93(-3) – 8,57(1) + 51,25 

Y*

2

 = 42,14 => 8,93(-2) – 8,75 (-1) + 51,25 

Y*

3

 = 33,57 

Y*

4

 = 60 

Y*

5

 = 51,43 

Y*

6

 = 77,86 

Y*

7

 = 69,28 

 
Suma u

2

 = 42,857 

n = 7; k = 3; S

2

u = 10,71; su = 3,27 

 

=

56

,

1

22

,

0

22

,

0

56

,

1

38

,

0

)

(

2

a

D

 

D(a

1

) = 0,62   D(

β

) = 1,25    D(a

0

) = 1,25 

Śr.Y = 50 
Suma(Y

t

 – śr.Y)

2

 =  2800 

φ

2

 = 1,53% (= 42,85/2800)  R

2

 = 98,47% 

 
prognoza na drugie półrocze 98 t=4, V

1

-V

2

 = -1  

Y

TP 

= 8,93(4) – 8,75(-1) + 51,25 = 95,71 

 
Średni błąd predykcji: 

=

1

1

4

T

X

  V = 4,5175     V* = 4,72% 

Wady: 

tego typu modele są nieelastyczne, co generuje błędy 

Zalety: 
+ prosty w szacowaniu i identyfikacji 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

32 

PROGNOZOWANIE NA PODSTAWIE MODELU EKONOMETRYCZNEGO 

 
Zgromadzono następujące dane: 
Yt – zgony niemowląt na 1000 urodzeń żywych 
X

1t

 – spożycie wódki czystej i gatunkowej w przeliczeniu na alkohol 100% w litrach na osobę w ciągu roku 

X

2t

 – PKB na jednego mieszkańca w $ 

Lata 

1992 

1993 

1994 

1995 

1996 

1997 

1998 

1999  

2000 

Yt 

17,3 

16,1 

15,1 

13,6 

12,2 

10,2 

9,5 

8,9 

8,1 

X

1t

 

3,5 

3,8 

3,8 

3,5 

2,9 

2,8 

2,4 

2,1 

2,0 

X

2t

 

2198 

2233 

2402 

3293 

3724 

3725 

4098 

4014 

4078 

 
Oszacowano model: 
 
Y*

– 1,79X

1t

 – 0,0026X

2t

 + 15,46 + u

t

  

         (1,048)    (0,00913)     (5,998) 
 
Budujemy prognozę na 2001. 
Miary struktury stochastycznej. 
N = 9; k = 3l      Su

2

 = 0,796954      Su = 0,892723 

Istotność parametrów strukturalnych test t-studenta.    

α

 = 0,2   t

α

 = 1,415 

t

α

1

 = 1,7118 

t

α

2

 = 2,8073 

Obie zmienne wchodzą do modelu 
 

=

986

,

35

005

,

0

134

,

6

005

,

0

0000008

,

0

0008

,

0

134

,

6

0008

,

0

098

,

1

)

(

2

a

D

 

φ

2

 = 5,29%     R

2

 = 94,71%     Vs = 7,24% 

 
Autokorelacja n = 9;   k = 2 
H

0

:r

1

 = 0  

H

1

:r

1

< 0 

 
DW = 2,08      DW’ = 1,92 
Jeżeli DW > 2 to hipotezę alternatywną j/w; jeśli < 2 to odwrotnie znak większości. 
 
d

l

 = 0,629    d

u

 = 1,699 

 
DW’ > du – brak podstaw do odrzucenia H

0

. Brak istotnie ujemnej autokorelacji. 

 
Budujemy prognozę. 
 
Prognozy  przyszłych  wartości  zmiennych  objaśniających  budowane  będą  na  podstawie  modeli  tendencji 
rozwojowych o postaci liniowej. 
 
Prognoza zmiennej X

1t

 

X

1t

 = Y

tx1t

  => Y

tx1t 

α

1t

 + 

α

0

 + 

ξ

       t = 1...9 

Y*

tx1t 

= -0,24t + 4,19 + u

t

     R

2

 = 89% 

             (0,032)  (0,18) 
Prognoza dla t=10       Y

TPx1t=10

 = 1,79 (prognoza X

1t

 dla roku 2001) 

 
Prognoza zmiennej X

2t

 

X

2t

 = Y

tz2t

  => Y

tx2t 

α

1t

 + 

α

0

 + 

ξ

       t = 1...9 

Y*

tx2t 

= 278,12t + 1916,64 + u

t

     R

2

 = 88% 

            (38,74)      (217,98) 
Prognoza dla t=10       Y

TPx2t=10

 = 4697,84 (prognoza X

2t

 dla roku 2001) 

 
Podstawiamy realizacje do modelu: 
Y*

TP=2001 

= 1,79 * 1,79 – 0,0026 * 4697,84 + 16,46 = 6,64 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

33 

=

1

84

,

4697

79

,

1

T

X

   => V = 1,08962; czyli mylimy się +/- 1 zgon. 

 
Względny średni błąd predykcji V* = 16,41% 
W roku 2001 faktycznie było 7,7 zgonów niemowląt (wg naszych prognoz 6,64). 
 
Trafność prognozy Y

t

 – Y

TP

 = -1,06 

 
Błędy ex-post. Współczynnik Theila 
 

=

ep

ep

I

t

t

I

t

TP

t

y

y

y

I

2

2

2

)

(

              Współczynnik  rozbieżności  Theila  przybiera  wartości  równe  zeru  w  przypadku  gdy 

predykcja jest idealnie dokładna. 
 

2

I

I

=

 

Pierwiastek  kwadratowy  współczynnika  Theila  informuje  jaki  był  przeciętny  względny  błąd  prognozy  w  okresie 
weryfikacji prognoz bez względu na to co było tego przyczyną. 
 
I

2

 = I

2

1

 + I

2

2

 + I

2

3

     

 można całość podzielić przez I

2

 i wtedy współczynniki sumują się do 0 i można określić jaki 

jest udział poszczególnego we współczynniku I

2

 

×

=

ep

ep

I

t

t

I

t

TP

t

y

m

y

y

I

2

2

_

_

2

1

1

)

(

     m – wielkości „sparowane”. Wygasłe prognozy + rzeczywiste. 

m – tyle ile jest tych par. 
 
Mierzy czy predykcja jest rzeczywiście nieobciążona. W przypadku spełnienia tego warunku licznik równy jest 0. 

×

=

ep

ep

I

t

t

I

t

P

y

m

S

S

I

2

2

2

2

1

)

(

 

S – odchylenie standardowe zmiennej prognozowanej 
S

P

 – odchylenie standardowe prognoz wygasłych 

 
Służy do badania na ile estatyczność predykcji była dostosowana do rzeczywistych wahań zmiennej prognozowanej 
– czy wahania zostały przewidziane. 
 

×

×

×

×

=

ep

I

t

t

P

y

m

r

S

S

I

2

2

3

1

)

1

(

2

       r – współczynnik korelacji 

Oparty o współczynnik korelacji 
Informuje  o  błędach  wynikających  z  niedostatecznej  zgodności  kierunku  zmian  prognoz,  ze  zmianami  kierunku 
zmiennej prognozowanej 
 

=

ep

I

t

t

y

m

y

1

_

                

=

ep

I

t

TP

TP

y

m

y

1

_

  - średnia z prognoz wygasłych (ex post). 

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

34 

=

ep

I

t

t

t

y

y

m

S

2

_

)

(

1

            

=

ep

I

t

TP

TP

P

y

y

m

S

2

_

)

(

1

 - odchylenie standardowe prognoz 

S

S

y

y

y

y

m

r

P

I

t

TP

TP

t

t

ep

×

=

)

(

)

(

1

_

_

          -  współczynnik  korelacji  liniowej  między  zmienną  prognozowaną,  a 

prognozami. 
 
Oszacowany model tendencji rozwojowej: 
Yt = -0,24t + 4,19 + u

t

 

 
Współczynnik Theila  
śr.Yt = 2,97 

śr.Y

TP

 = 2,97 

S = 0,6662 

S

P

 = 0,6282 

V = 0,9429 
I

2

 = 0,005285 

I – 0,07269 

I

2

1

 = 0,00000000000000000000000000000000218 = 0 

I

2

= 0,000155 

I

2

= 0,005129 <= największe zagrożenie dla nas to ten błąd. 

 
Nie należy prognozować w oparciu o 1 model lub 1 błąd. 
 
 

MODELE ZE ZMIENNYMI NAŚLADUJĄCYMI 

 
Uwagi wstępne 
Granger oraz Mansfield wykazali możliwość przewidywania zmian koniunktury na podstawie wcześniejszych zmian 
zachodzących w pewnej klasie zmiennych nazywanych zmiennymi wiodącymi. 
 
Typy zmiennych: 
Zmienne wiodące – charakteryzują się określonymi zmianami swoich wartości, zachodzącymi wcześniej niż miary 
wartości – innej grupy zmiennych, które określa się jako zmienne naśladujące. 
 
Zmienne naśladujące – naśladują z pewnym opóźnieniem zmiany zachodzące w wartości zmiennych wiodących. 
 
Znalezienie (identyfikacja) zmiennej wiodącej umożliwi budowę prognozy zmiennej naśladującej. 
 
Warunek budowy prognozy: 
podstawowym warunkiem budowy prognozy jest duże podobieństwo kształtowania się wartości obu zmiennych w 
czasie 
przy budowie prognoz oprócz podobieństwa zmiennych należy uwzględnić następujące opóźnienia w czasie 
 
Podobieństwo i opóźnienia w czasie (p) [brak cykliczności] 
 
Do  pomiaru  podobieństwa  oraz  wyznaczania  wielkości  opóźnienia  w  czasie  (p)  można  zastosować  współczynniki 
korelacji liniowej. Opóźnienie zależy od szeregu czasowego. 
 
Podobieństwo i opóźnienie w czasie (p) [istnieje cykliczność] 
W  przypadkach  występowania  wahań  cyklicznych  (w  szeregu  czasowym  obu  zmiennych  opóźnienie  w  czasie  (p) 
może  być  wyznaczone  jako  liczba  jednostek  czasu  dzieląca  okres  o  najwyższej/najniższej  wartości)  wartości 
zmiennej  wiodącej  w  danym  cyklu  od  okresu  o  najwyższej/najniższej  wartości  zmiennej  naśladującej  w  jej 
rozpatrywaniu. 
 
Podobieństwo i opóźnienie w czasie [istnieje cykliczność] 
 
p = t

maxY

 – t

maxX  

lub   p = t

minY

 – t

minX 

 
p – opóźnienie 
t

maxX 

– numer okresu o najwyższej wartości zmiennej wiodącej 

t

maxY 

– numer okresu o najwyższej wartości zmiennej naśladującej 

t

minX 

– numer okresu o najniższej wartości zmiennej wiodącej 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

35 

t

minY 

– numer okresu o najniższej wartości zmiennej naśladującej 

 
Gdy w szeregach czasowych obu zmiennych następuje więcej niż 1 cykl wówczas opóźnienie może być wyznaczone 
jako średnia arytmetyczna lub mediana opóźnień obliczanych dla poszczególnych cykli. 
Uwaga!: daje czasami błędne rezultaty 
 
Rozwiązanie przynoszące lepsze wyniki to: 
Określenie wielkości opóźnienie na podstawie współczynników korelacji. 
Polega na obliczeniu wartości współczynnika korelacji dla różnych opóźnień czasowych i wyborze tego opóźnienia 
dla którego wartość współczynnika korelacji jest najwyższa. 
 
Przykłady zmiennych wiodących: 
barometr koniunktury całej gospodarki lub branży może stanowić zmienną wiodącą dla budowy prognoz sprzedaży 
niektórych produktów 
indeks siły nabywczej publikowany w USA, zawiera on informacje dotyczące oceny zmiany zaludnienia, dochodów 
ludności, sprzedaży detalicznej oraz kompleksowy szacunek wielkości popytu 
rynek  samochodów,  na  którym  zmienną  wiodącą  są  dochody  ludności,  zmienna  ta  często  wykazywana  jest  przez 
producentów  samochodów  i  ma  za  zadanie  określić  przyszły  popyt  poprzez  pryzmat  wcześniejszej  sytuacji 
finansowej konsumentów 
liczba narodzin dzieci, liczba dzieci w wieku szkolnym, liczba dzieci w wieku przedszkolnym, mogą one stanowić 
zbiór zmiennych wiodących dla prognoz przyszłego popytu na produkty skierowane do dzieci 
 
Budowa prognozy zmiennej prognozowanej (naśladującej) 
 
Dane jest opóźnienie czasowe między zmienną prognozowaną, a zmienną wiodącą. 
 

Y

t

t+1

  –  względna  zmiana  (wzrost/spadek)  wartości  zmiennej  prognozowanej  w  okresie  t+1  w  porównaniu  z 

okresem t. 
 

t

t

t

t

t

y

y

y

Y

=

+

+

1

1

 

X

t-p

t+1-p

  –  względna  zmienna  (wzrost/spadek)  wartości  zmiennej  wiodącej  X  w  okresie  t+1-p  w  porównaniu  do 

okresu t-p 

p

t

p

t

p

t

p

t

p

t

y

x

x

X

+

+

=

1

1

 

____

1

n

y

- średnia bezwzględnych wartości 

1

+

t

t

y

 w n przyszłych okresach. 

______

1

p

n

p

x

- średnia z bezwzględnych wartości 

______

1 p

n

p

t

x

+

 w n przyszłych okresów. 

 
W okresie prognozy t+1 > n; będzie zachodziła w przybliżeniu następująca równość. 

__

1

__

1

1

1

p

n

p

n

p

t

p

t

t

t

x

y

x

y

+

+

 

lub 

(

)

(

)

__

1

__

1

1

1

p

n

p

n

p

t

p

t

p

t

t

t

t

x

y

x

x

x

y

y

y

+

+

 

Po dokonaniu odpowiednich przekształceń prognoza na okres t+1 będzie dana jako: 
 

t

p

n

p

p

t

t

n

t

y

x

x

y

y

×

×

+

=

+

+

___

1

1

1

__

1

1

1

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

36 

Maksymalny horyzont prognozy będzie równy opóźnieniu p 
 
Przykład: 

 

II 

III 

IV 

II 

III 

IV 

II 

III 

IV 

II 

III 

IV 

 

1999 

2000 

2001 

2002 

Proces 1  165  167  201  245  267  269  261  257  205  175  165  155  153  151  161  165 

Proces 2  243  271  299  281  259  209  179  169  157  153  149  161  179  203  219  229 

 
Opóźniamy  proces  pierwszy  kolejno  o  1,  2  ,3  i  4  okresu  [po  prostu  przepisujemy  I  1999.  kolejno  na  II  1999,  III 
1999, IV 1999, a przy opóźnieniu o 4 I 2000; i tak kolejno z wszystkimi obserwacjami]. 
 
Korelacje: 
Opóźnienie o 1 kwartał = 0,57 
Opóźnienie o 2 kwartały = 0,88 
Opóźnienie o 3 kwartały = 0,98   

 max współczynnik korelacji i z tym opóźnieniem szacujemy model 

Opóźnienie o 4 kwartały = 0,92 
 
Najwyższą wartość współczynnika korelacji została wyznaczona przy opóźnieniu o 3 kwartały, stąd opóźnienie w 
czasie dane jest jako p=3 
 

(

)

p

t

p

t

p

t

p

t

p

t

x

x

x

x

+

+

=

1

1

    stąd: 

(

)

3

3

3

1

3

1
3

+

+

=

t

t

t

t

t

x

x

x

x

(

)

3

3

2

2

3

=

t

t

t

t

t

x

x

x

x

 

średnia 

_____

1

4

+

t

y

= 0,0764 

średnia 

____

2

3

t

t

x

= 0,0882 

Ostatecznie przewidywana wielkość procesu 1 w I kwartale 2003 dana jest jako: 

t

p

n

p

p

t

t

n

t

y

x

x

y

y

×

×

+

=

+

+

___

1

1

1

__

1

1

1

 stąd: 

159

,

184

165

088

,

0

134

,

0

076

,

0

1

16

=

×

×

+

=

y

 

 

Model ekonometryczny 

Przy porównywaniu czasowym wyznaczamy 3 budowane modele ekonometryczne o następującej postaci: 
Y*

t

 = a

1

 

×

 x

t-p

 + a

0

 + 

ξ

t  

 
Na podstawie MNK. 
Y*

t

 – prognoza na moment okres t. 

X

t-p

 – wartość zmiennej wiodącej w okresie t-p 

a

0

,a

1

 – parametry strukturalne modelu. 

ξ

t – czynnik losowy 

 
Y*

t

 = 0,87X

t-3

 + 18,49 + Ut 

R

2

 = 96,9% 

Podstawiamy do modelu wartości zmiennej wiodącej z II 2002, czyli 203 i otrzymujemy prognozę procesu 1 na I 
2003. 
Y*

t

 = 0,87

×

203 + 18,49 = 195,1 

 
Modele  ze  zmiennymi  wiodącymi  pozwalają  na  przewidywanie  w  przyszłym  kształtowaniu  się  zmiennej 
prognozowanej zarówno w przypadku występowania wahań sezonowych jak i cyklicznych. 
Modele mogą uwzględniać większą liczbę zmiennych wiodących. 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

37 

 

MODELE AUTOREGRESYJNE I ŚREDNIEJ RUCHOMEJ (ARMA) I (ARIMA) 

 
Nie ma zmiennych objaśniających – same szeregi czasowe. 
 
Określają związek funkcyjny między wartościami zmiennej prognozowanej w okresie / momencie t, a wartościami 
tej zmiennej z okresów/momentów poprzednich t-1, t-2 ... t-p; p – opóźnienie. 
 
Powody stosowania: 

1)  Istnieje  wiele  zjawisk  gospodarczych  wskazujących  na  występowanie  opóźnienia  ich  przebiegu  w  czasie 

np. popyt na wiele dóbr trwałego użytku charakteryzuje się cyklami opóźnień związanymi z okresem ich 
użytkowania 

2)  Rezygnacja z uwzględniania niejednokrotnie wielu zmiennych objaśniających 

 
Zastosowanie: 
Modelowanie stacjonarnych szeregów czasowych czyli: 

takich szeregów czasowych, w których występują jedynie wahania losowe wokół średniej 

szeregów czasowych niestacjonarnych sprowadzanych do stacjonarnych 

 
Klasyfikacja modeli autoregresyjnych i średniej ruchomej: 

• 

Modele autoregresji (AR) 

• 

Modele średniej ruchomej (MA) 

• 

Modele mieszane autoregresji i średniej ruchomej (ARMA) 

 
Zintegrowane modele autoregresji i średniej ruchomej – w nich zakłada się stacjonarność zmiennej prognozowanej. 
 
W przypadku braku stacjonarności: 

dokonuje  się  przekształcenia  szeregu  czasowego  w  szereg  stacjonarny,  przeprowadzając  operację 
różnicowania, która polega na d-krotnym obliczaniu różnic sąsiednich wyrazów szeregu 

 
Pierwsze różnice oblicza się jako: w

t

 = y

t

 – y

t-1

 ; drugie jako: z

t

 = w

t

 – w

t-1

 = (y

t

 – y

t-1

) - (y

t-1

 – y

t-2

) = y

t

 – 2y

t-1

 + y

t-2

 . 

Kolejne oblicza się analogicznie. 
Przeprowadza się tą operacją, aż do momentu gdy szereg czasowy stanie się stacjonarny. 
 
Budowane dla tych przekształconych szeregów czasowych modele określa się mianem zintegrowanych modeli: 

1)  Autoregresyjne (ARI) 
2)  Średniej ruchomej (IMA) 
3)  Autoregresji i średniej ruchomej (ARIMA) 

 
Przyjęta uniwersalna notacja modeli: 
ARIMA (p,d,q) 
p – rząd autoregresji, wielokrotność opóźnienia 
d – krotność różnicowania 
q – liczba parametrów średniej ruchomej 
ARIMA(p,0,0) 

AR(p) 

ARIMA(0,0,q) 

 MA(q) 

ARIMA(p,0,q) 

 ARMA(p,q) 

ARIMA(p,d,0) 

 ARI(p,d) 

 
Podejście do budowy modeli zaproponowane przez BOXa i JENKINSa w 1976 
 
Zakładamy, że tworzymy nowy stacjonarny szereg czasowy zmiennej prognozowanej. 
Po identyfikacji odpowiedniego dla danego szeregu czasowego modelu, czyli określenia jego postaci oraz wielkości 
uwzględniających w modelu opóźnień, używa się współczynników autokorelacji i autokorelacji cząstkowej. 
 
Główna zasada: 
Jeśli  wartość  współczynnika  autokorelacji  wykładniczo  maleje  do  0,  czyli  liczba  tych  współczynników  istotnie 
różnych od 0 jest stosunkowo duża, a liczba współczynników autokorelacji cząstkowej istotnie różniących się od 0 
jest bardzo mała to należy stosować MODEL AUTOREGRESYJNY 
 
Jeśli wartość współczynników autokorelacji cząstkowej wykładniczo maleje do 0, czyli liczba tych współczynników 
istotnie różniących się od 0 jest stosunkowo duża, a liczba współczynników autokorelacji istotnie różniących się od 
0 jest bardzo mała to powinno się stosować MODELE ŚREDNIEJ RUCHOMEJ 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

38 

Jeśli  współczynniki  autokorelacji  oraz  autokorelacji  cząstkowej  wykładniczo  maleją  do  0,  czyli  liczby  tych 
współczynników  istotnie  różniących  się  od  0  są  stosunkowo  duże  to  należy  stosować  MODELE  MIESZANE 
AUTOKORELACJI I ŚREDNIEJ RUCHOMEJ 
 
Ogólny proces liniowy [Yule] 
 
Biały szum 
Szeregi czasowe, w których kolejne wartości są silnie zależne przedstawione są jako szeregi generowane przez ciąg 
niezależnych zakłóceń losowych impulsów 

ξ

t. 

Zakłócenia  te  są  realizacjami  zmiennych  losowych  o  ustalonym  rozkładzie  (najczęściej  rozkład  normalny)  o 
wartości oczekiwanej E(x) = 0 i 

δ

ξ

2

 . Ciąg takich zmiennych losowych to biały szum. 

 
Szereg  czasowy  o  silnie  skorelowanych  wartościach  traktowany  jest  jako  realizacja  procesu  {Yt}  określonego  w 
następujący sposób. 
 
Yt = 

µ

 + 

ε

t

 + 

ψ

1

*

ε

t-1

 + 

ψ

2

*

ε

t-2

 ... 

ψ

 - parametry (wagi) modelu 

µ

 - określony poziom rozpatrywanego procesu, dla procesów stacjonarnych określa on poziom średni 

ε

t

 – zakłócone impulsy losowe. 

 
Wprowadzamy operator przesunięcia wstecz dany jako: B

i

 = 

ε

t-i

  

 
Yt = 

µ

*(1 + 

ψ

1

B

1

 + 

ψ

2

B

2

 + ...) => Yt = 

ψ

(B)

ε

t

 ; przy założeniu, że 

ψ

B = 1 + 

ψ

1

B

1

 + 

ψ

2

B

2

 + ... 

 
Proces może być traktowany jako wyjaśnienie filtru liniowego funkcji danej jako:  

ψ

B = 1 + 

ψ

1

B

1

 + 

ψ

2

B

2

 + ...   przekształcającej biały szum w proces stochastyczny. 

 
Proces filtracji polega na przedstawieniu szeregu czasowego jako ważonych sum poprzednich zakłóceń losowych 

ε

t

 

 
Pojęcie funkcji losowej: 
Przyjmijmy, że t jest nielosową wartością rzeczywistą w zbiorze T, oraz, że T może być przedziałem skończonym 
lub nieskończonym. 
W zastosowaniu ekonomicznych zakłada się, że t jest zmienną czasu. 
Y(t) jest funkcją losową, jeżeli zna się odpowiednie dystrybuanty dowolnego zbioru zmiennych losowych czyli: 
Y(t

1

); Y(t

2

)....(Yt

n

), gdzie ti należy do T; i = 1,2....n 

Łączna dystrybuanta zmiennych losowych dana jest jako: 
 F

t1,t2...t2

 (y

1

,y

2

...y

n

) = P [Y(t

1

) < y

1

; Y(t

2

) < y

2

 ...; Y(t

n

) < y

n

Są to warunki zgodności; jeśli znamy dystrybuantę – zgodny, jeśli nie znamy – niezgodny 
 
Funkcja losowa Y(t) nielosowego rzeczywistego argumentu t nazywa się procesem stochastycznym. 
Wg  Boxa  i  Jenkinsa  procesem  stochastycznym  jest  zjawisko  stochastyczne  zmieniające  się  w  czasie  zgodnie  z 
rozkładem prawdopodobieństwa. 
 
Proces stochastyczny z czasem dyskretnym (ozn. Y

t

) ma miejsce wówczas gdy zbiór argumentów t obejmuje tylko 

liczby całkowite. 
 
Pole losowe stanowi funkcję losową wielu nieskończonych argumentów. 
 
W  ekonomii  polem  nielosowym  mogą  być  wydatki  na  żywność  gospodarstw  domowych,  będące  funkcją  takich 
argumentów jak: czas, grupa społeczno-ekonomiczna, dochód etc.  
 
Charakterystyki procesu stochastycznego z czasem dyskretnym 

1)  średnia wartość m

t

 = E(Y

t

); t = 0, 

±

1, 

±

2 ...  

2)  wariancja D

2

(Y

t

) = E(Y

t

 - m

t

)

2

; t = 0, 

±

1, 

±

2 ...  

3)  funkcja kowariancji K(t,s) = E[(Y

t

 – m

t

×

 (Y

s

 – m

s

)]’ t = 0, 

±

1, 

±

2 ...... t 

 s; s – chwila 

4)  funkcja autokorelacyjna: 

( )

( )

)

0

(

)

(

)

(

2

K

K

Y

D

K

R

τ

τ

τ

υ

=

=

; gdzie 

τ

 = t – s 

5)  spektrum – funkcja gęstości spektralnej: 

( )

=

−∞

=

Π

=

t

t

K

f

)

(

2

1

τ

ω

; gdzie 

N

i

Π

=

2

ω

; i = 0,1,2... ½ N 

 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

39 

Procesy stochastyczne stacjonarne i niestacjonarne. 
 
Proces stacjonarny oznacza, że ciąg wag 

ψ

1

ψ

2

... jest skończony lub nieskończony, zbieżny, a parametr 

µ

 jest 

średnią wokół, której występują wahania przypadkowe. 
 
Proces niestacjonarny oznacza, iż ciąg wag nie spełnia warunków skończoności/nieskończoności i zbieżności, a 
parametr 

µ

 nie ma większego znaczenia i służy jako punkt odniesienia poziomu procesu. 

 
Procesy stochastyczne dzielimy na: 
1)  stacjonarny w węższym i szerszym sensie 
2)  niestacjonarne 
 
Proces  stochastyczny  w  węższym  sensie  –  dystrybuanta  związana  z  n  obserwacjami  y

t1

,  y

t2

,  .....  y

tn

dokonywanymi  w  dowolnych  momentach  czasu  t

1

,  t

2

,  ...  t

n

,  jest  taka  sama  jak  dystrybuanta  związana  z  n-

obserwcajami y

t1+k

, y

t2+k

....y

tn+k

 dokonywanymi w momentach t

1+k

, t

2+k

...t

n+k

, czyli zachodzi warunek: 

F

t1+k,t2+k....tn+k

(y

t1+k

,y

t2+k

....y

tn+k

) = F

t1,t2...tn

(y

t1

,y

t2

...y

tn

Oznacza to, że łączna dystrybuanta dowolnego zbioru obserwacji nie ulega zmianie w czasie przy przesunięciu 
na osi czasu o k-całkowitych jednostek do przodu lub do tyłu. 
 
Proces  stacjonarny  w  sensie  szerszym  –  ma  miejsce  jeżeli  wartość  średnia  i  wariancja  procesu  są  stałe, 
niezależnie od czasu t, a funkcja kowariancji zależy od różnicy t – s = 

τ

, czyli spełnione są następujące warunki: 

1)  średnia wartość m

t

 = E(Y

t

) = const. 

2)  wariancja D

2

(Y

t

) = E(Y

t

 - m

t

)

σ

2

 = const. 

3)  funkcja kowariancji K(t,s) = K(

τ

 
Stacjonarność w węższym 

 stacjonarność w szerszym. 

 
Stacjonarność w szerszym sensie nie wymaga stabilności rozkładów, a jedynie stabilności pewnych parametrów tych 
rozkładów (w/w). 
 
W analizie ekonometrycznej wykorzystuje się metody procesów stacjonarnych w szerszym sensie. 
 
Ergodyczność  –  oznacza,  że  każda  poszczególna  realizacja  procesu  stochastycznego  jest  pełnoprawnym 
przedstawicielem całego zbioru możliwych realizacji. 
 
Założenie o ergodyczności umożliwia obliczanie głównych charakterystyk procesu na podstawie jednej realizacji dla 
wystarczająco długiego okresu, czyli po czasie t, a nie na podstawie pewnej liczby realizacji danego procesu, czyli 
po realizacjach. 
 
Proces jest niestacjonarny gdy nie jest spełniony przynajmniej 1 z 3 w/w warunków 
Można wyróżnić następujące procesy niestacjonarne: 

1)  procesy niestacjonarne w średniej, stacjonarne w wariancji 
2)  procesy niestacjonarne w wariancji, stacjonarne w średniej 
3)  procesy o niestacjonarnej funkcji kowariancji i stałych wartościach średnich 
4)  procesy niestacjonarne w średniej i wariancji oraz funkcji kowariancji. 

 
Ekonomiczny proces stochastyczny przedstawiany jest jako: 
Y

= P

t

 + S

t

 + C

t

 + 

µ

t

  

Pt – trend 
St – wahania sezonowe 
Ct – wahania cykliczne (koniunkturalne) 

µ

t – nieregularne wahania przypadkowe. 

 
Przez trend Pt rozumie się ogólne tendencje rozwojowe (kierunek rozwoju) charakteryzują dany szereg czasowy na 
przestrzeni  dłuższego  okresu.  Trend  kojarzony  jest  z  powolnymi  i  systematycznymi  zmianami  poziomu  procesu 
ekonomicznego zachodzącego w długim okresie pod wpływem działania silnych, trwałych przyczyn. Zakłada się, że 
funkcje opisujące trend powinny zachować się gładkością i spokojnością przebiegu. 
 
Wahania  sezonowe  St

  są  wahaniami  powtarzającymi  się  periodycznie  w  pewnych  określonych  podokresach 

(miesiące,  kwartały)  każdego  roku.  Występowanie  wahań  sezonowych,  które  oscylują  wokół  trendu  jest  efektem 
oddziaływania  podstawowych  czynników  sezonowych:  czynniki  kalendarzowe,  klimatyczno-przyrodnicze  oraz 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

40 

czynników  społeczno-ekonomicznych  bezpośrednio  lub  pośrednio  zależnych  od  podstawowych  czynników 
sezonowych. Ważne jest zawsze rozstrzygające o typie wahań sezonowych. 
 
Wahania  Ct

  są  wahaniami  powtarzającymi  się  cyklicznie  z  mniejszą  lub  większą  regularnością.  Uważa  się  je  za 

odzwierciedlenie  wahań  koniunkturalnych  w  gospodarce.  Charakteryzują  się  one  duża  zmiennością  cykli,  czasu 
trwania poszczególnych wielkości, amplitud. Utrudnia ten fakt prowadzenie badań. 
Można wyróżnić liczby faz: 
2 – ekspansja i recesja 
3 – wzrost większy od trendu, wzrost zbliżony do trendu, wzrost niższy od trendu 
4 – ostrzeżenie, recesja, ożywienie, ekspansja 
6 – wzrost, rozkwit, ostrzeżenie, recesja, depresja, ożywienie 
 
Wahania  nieregularne 

µ

t

  trudno  jest  podać  jeden  ich  schemat.  Można  jednak  wyróżnić  wahania  przypadkowe  i 

wahania katastrofalne. 
 
Linii  trendu  nie  da  się  oddzielić  od  linii  wahań  cyklicznych  ponieważ  linie  te  nie  powstały  pod  działaniem 
oddzielnych zespołów przyczyn. 
Do  początku  lat  70-tych  zasadą  stało  się  rozpatrywanie  trendu  i  wahań  koniunkturalnych  łącznie.  Zatem  proces 
ekonomiczny można zapisać jako: Y

t

 = P

t

 + S

t

 + 

µ

t

Z punktu widzenia teorii procesów stochastycznych model: Y

t

 = P

t

 + S

t

 + 

µ

t, 

można zapisać jako: E(Y

t

) = P

t

 + S

t

  

 
Co  oznacza,  że  model  opisuje  niestacjonarny  proces  stochastyczny  ze  zmienną  wartością  oczekiwaną.  Proces 
odchyleń od trendu i wahań sezonowych 

µ

t jako stacjonarny o średniej równej zero. 

 
Trend  Pt  procesu  stochastycznego  można  nazwać  pewną  krzywą  ciągłą  wyznaczoną  przez  wartości  oczekiwane 
procesu w układzie współrzędnych prostokątnych, w którym oś odciętych (X) odpowiada ciągłej zmiennej czasowej 
t. 
 
Proces autoregresyjny AR(p) 
 
Proces autoregresyjny rzędu p dany jako: 
Yt = 

ϕ

0

 + 

ϕ

1

Y

t-1

 + 

ϕ

2

Y

t-2

 + .... + 

ϕ

p

Y

t-p

 + 

ε

t

  

Gdzie: 

ϕ

0

ϕ

1

...

ϕ

p

 są parametrami procesu; p – opóźnienie czasowe; 

ε

 - zakłócenia losowe i jest zmienną losową o 

rozkładzie N(0,

σ

2

 
Proces  autoregresyjny  AR(p)  charakteryzuje  się  tym,  że  jego  bieżąca  wartość  jest  sumą  skończonej  kombinacji 
liniowej poprzednich jego wartości oraz zakłócenia losowego. 
Proces autoregresji można traktować jako liniowe równanie regresji wielorakiej zmiany Yt względem opóźnionych 
w czasie wartości tej zmiennej. 
 
Stosując operator przesunięcia wstecz B, proces można przedstawić jako: 

φ

p

(B)Yt = 

ϕ

0

 + 

ε

t

  gdzie: 

φ

p

 = 1 - 

ϕ

1

B

1

 - 

ϕ

2

B

2

 - .... - 

ϕ

p

B

p

  

 jest wielomianem charakterystycznym procesu rzędu 

„p”. 

φ

(B) = 0 

 równanie charakterystyczne procesu. 

 
Problem identyfikacji procesu autoregresyjnego AR(p) 
 
Polega na stwierdzeniu, że rozpatrywany proces jest procesem autoregresyjnym oraz na określenie jego rzędu p. 
 
Identyfikacja: 
Polega na porównaniu własności teoretycznych funkcji autokorelacji i autokorelacji cząstkowej z zachowaniem się 
współczynników autokorelacji i autokorelacji cząstkowej oszacowanych na podstawie szeregu czasowego. 
 
Funkcja autokorelacji dana jako: Yt = 

ϕ

0

 + 

ϕ

1

Y

t-1

 + 

ϕ

2

Y

t-2

 + .... + 

ϕ

p

Y

t-p

 + 

ε

t

  

ρ

k

 = 

ϕ

1

ρ

k-1

 + 

ϕ

2

ρ

k-2

 + ...... + 

ϕ

p

ρ

k-p 

 

gdzie 

ρ

k

ρ

k-1

 .... 

ρ

k-p

 – współczynniki autokorelacji przy odstępie równym k, k-1, ... k-p 

ϕ

0

ϕ

1

...

ϕ

p

 są parametrami procesu 

 
Jeżeli  proces  jest  stacjonarny  to  rozwiązaniem  jest  funkcja  auokorelacji  składająca  się  z  zanikających  funkcji 
wykładniczych i sinusoid tłumionych. 
 
Podstawiając do równania: 

ρ

k

 = 

ϕ

1

ρ

k-1

 + 

ϕ

2

ρ

k-2

 + ...... + 

ϕ

p

ρ

k-p 

; kolejno dla k=1,2...p 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

41 

Otrzymujemy układ równań Yule’a-Walkera dany jako: 



+

+

+

=

+

+

+

=

+

+

+

=

p

p

p

p

p

p

p

p

ϕ

ρ

ϕ

ρ

ϕ

ρ

ρ

ϕ

ϕ

ρ

ϕ

ρ

ρ

ϕ

ρ

ϕ

ϕ

ρ

....

2

.

..........

..........

..........

..........

..........

....

2

....

2

2

1

1

2

1

1

2

1

1

1

1

 

 
Zmieniając  teoretyczne  wartości  współczynników  autokorelacji  na  współczynniki  autokorelacji 

ρ

k

  oszacowane  na 

podstawie szeregu czasowego otrzymane jest tzw. oszacowanie Yule’a-Walkera 
 
Funkcja autokorelacji cząstkowej:

 

W celu oszacowania korzystamy równań Yule’a-Walkera 
Dodatkowo  przyjmuje  się,  że 

ϕ

k

  to  j-ty  współczynnik  w  procesie  autoregresji  rzędu  k.  Oznacza  to,  że  ostatni 

współczynnik to 

ϕ

kk

, który spełnia następujący uklad równań: 

ρ

j

 = 

ϕ

k,1

ρ

j-1

 + 

ϕ

k,2

ρ

j-2

 + ...... + 

ϕ

k,k-1

ρ

j-(k-1) 

 + 

ϕ

k,k

ρ

j-k

    j =1,2....k 

 
Rozwiązując równania kolejne dla k = 1,2 otrzymujemy: 

ϕ

1,1

 = 

ρ

1

  

=

1

1

1

1

1

2

1

1

2

,

2

ρ

ρ

ρ

ρ

ρ

ϕ

                   

=

1

1

1

1

1

1

2

1

1

2

1

3

2

1

2

1

1

1

3

,

3

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ρ

ϕ

 

 
Wielkość 

ϕ

kk

 jest traktowana jako funkcja odstępu k i nazywa się funkcją autokorelacji cząstkowej. W przypadku 

AR(p) jest ona różna od 0 dla k 

 p

i

 i równa 0 dla k > p, zatem funkcja ta urywa się w okresie p. 

 
Wykorzystując procesy AR(p) modelowane są zarówno procesy stacjonarne jak i niestacjonarne. 
 
Proces średniej ruchomej MA(q) 
Przyjmuje, że tylko q początkowych wag procesu: 
Yt = 

ϕ

0

 + 

ϕ

1

Y

t-1

 + 

ϕ

2

Y

t-2

 + .... + 

ϕ

p

Y

t-p

 + 

ε

t  

Jest różny od 0 to proces taki nazywamy procesem średniej ruchomej dany jako: 
Yt = 

µ

 + 

ε

t

 + v

1

ε

t-1

 – v

2

ε

t-2

 - ....... - v

q

ε

t-q

  

ε

t

ε

t-1

.....

ε

t-q

 – odchylenia losowe w okresach t, t-1, ... t-q o rozkładzie N(0,

σ

2

µ

 - v

1

 – v

2

 - .... – v

q

 – parametry modelu (wagi), q – wielkość opóźnienia 

 
Średnia ruchoma – wagi modelu nie muszą się sumować do jedności i mogą przyjmować wartości ujemne. 
 
Korzystając z operatora przesunięcia wstecz, model średniej ruchomej można zapisać jako: 
Yt = 

µ

 + 

θ

q

(B) 

ε

t

 gdzie: 

θ

q

(B) = 1 – v

1

B

1

 - .... – v

q

B

q

 – wielomian charakterystyczny 

 

θ

q

(b) = 0 – równanie charakterystyczne 

 
Identyfikacja procesu MA(q) 
 
Identyfikacja  procesu  średniej  ruchomej  MA(q)  odbywa  się  przez  porównanie  teoretycznych  i  empirycznych 
współczynników autokorelacji i autokorelacji cząstkowej. Przy czym teoretyczna funkcja autokorelacji tego procesu 
dana jest jako: 

>

=

+

+

+

+

+

=

q

k

dla

q

k

dla

v

v

v

v

v

v

v

q

q

k

q

k

k

k

_

;

0

...

2

,

1

_

;

...

1

....

2

2

1

1

1

ρ

 

Funkcja ta jest równa 0 dla wartości k większych niż rząd procesu oznacza, to że urywa się punkcje q. 
 
Model średniej ruchomej jest zawsze stacjonarny, niezależnie od wartości parametrów. 
 

background image

EKONOMETRIA 

Dr Stanisław Barczak 

 

42 

Proces autoregresji i średniej ruchomej ARMA(p,q) 
 
W  celu  zwiększenia  elastyczności  oraz  dopasowania  modelu  do  danych  empirycznych  często  łączy  się  2  procesy 
czyli AR(p) i MA(q). 
Jest  to  spowodowane  faktem,  że  nie  zawsze  możliwy  jest  wybór  procesu  o  postaci  AR(p)  lub  MA(q),  który 
charakteryzuje się niewielką liczbą parametrów i jest dobrze dopasowany do danych empirycznych. 
 
Proces autoregresji i średniej ruchomej jest dany jako: 
Yt = 

ϕ

0

 + 

ϕ

1

Y

t-1

 + 

ϕ

2

Y

t-2

 + .... + 

ϕ

p

Y

t-p 

- v

1

ε

t-1

 – v

2

ε

t-2

 - ....... - v

q

ε

t-q

 + 

ε

t

 

 
Stosując operator przesunięcia wstecz B, proces można zapisać jako: 

φ

p

(B)Y

t

 = 

ϕ

0

 + 

θ

q

(B)

ε

t

 

 

 

 
Postać funkcji autokorelacji procesu ARMA(p,q) zależy od parametrów p i q: 

jeżeli q-p < 0 to funkcja autokorelacji składa się z funkcji wykładniczych i/lub sinusoid tłumionych 

jeżeli  p-q  >  0  to  wystąpi  q-p+1  początkowych  wartości 

ρ

0

ρ

1

....

ρ

p-q

,  które  nie  są  rozważane  przez  ten 

proces. 

 
Funkcja  autokorelacji  cząstkowej  procesu  ARMA(p,q)  zachuje  się  jak  funkcja  autokorelacji  cząstkowej  procesu 
średniej ruchomej, zależnie od rzędu średniej ruchomej wartości parametrów. Urywa się w punkcie p. 
 
Z góry założona stacjonarność. 
 
Proces zintegrowany 
W  przypadku  szeregu  czasowego,  który  nie  jest  stacjonarny  można  go  sprowadzić  do  stacjonarności  poprzez 
operację różnicowania, czyli d-krotnym obliczaniu różnic sąsiednich wyrazów. 
 
Szereg  czasowy,  którego  pierwsze  różnice  są  stacjonarne  nazywany  jest  szeregiem  zintegrowanym  stopnia 
pierwszego. 
Szereg czasowy, którego drugie różnice są stacjonarne nazywany jest szeregiem zintegrowanym stopnia drugiego.   
Itd. 
 
Szereg, który jest stacjonarny nazywamy zintegrowanym szeregiem stopnia zerowego. 
 
Proces można zapisać przy pomocy tzw. operatora różnic rzędu danego: 

d

 = (1-B)

d

  

 
Proces przyjmuje postać: 

y

t

 = y

t

 – y

t-1

  

2

y

y

t

 - 

y

t-1

 = (y

t

 - y

t-1

) – (y

t-1

 – y

t-2

d

y

d-1

y

t - 

d-1

y

t-1 

 

Zatem  jeżeli  szereg  czasowy  dany  jako  (y

t

)

t=1,2....n 

o  liczbie  wyrazów  n  zadziałamy  operatorem  (w

t

)

t=d+1....n

    = 

(

d

y

t

)

t=d+1....n

 ; którego liczba wyrazów będzie wynosić n –d. 

 
Jeżeli  szereg  taki  okaże  się  stacjonarny  to  można  go  modelować  stosując,  jeden  z  procesów  AR(p),  MA(q), 
ARMA(p,q) określonych mianem: 

• 

zintegrowanego procesu regresji ARI(p) 

• 

zintegrowanego procesu średniej ruchomej IMA(q) 

• 

zintegrowanego procesu autoregresji i średniej ruchomej ARIMA(p,d,q)