1533


Wykład 1

1. Podstawowe pojęcia.

Co jest przedmiotem prognozowania? Budowanie prognoz, np. prognoz gospodarczych, społecznych, politycznych, rozwoju całego świata, rozwoju gminy, lokalnej społeczności, rozwoju branży, firmy…

Co rozumiemy przez prognozę danego zjawiska? - wskazanie najbardziej prawdopodobnej drogi rozwoju tego zjawiska w oparciu o naszą wiedzę, dotychczasowy przebieg zjawiska, wiedzę o obecnym stanie zjawiska.

Prognoza to wypowiedź o przyszłości. Nie wiemy jaka będzie przyszłość. Prognoza jest efektem prognozowania.

Oszacowanie to wypowiedź o przeszłości lub teraźniejszości Dotyczy parametrów, których dokładnych wielkości nie znamy. Oszacowanie to wynik szacowania.

Wypowiedzi na temat przyszłości - przewidywanie przyszłości, możemy podzielić na:

0x01 graphic

(Cieślak, 1997, Prognozowanie gospodarcze)

Przyjmujemy, że prognozowanie:

Prognoza:

My będziemy zajmować się tylko prognozami ekonometrycznymi, budowanymi na podstawie modeli ekonometrycznych.

Termin prognoza bywa też używany w nieco innym znaczeniu - bez zakładania, że jest to wypowiedź o przyszłości, np. prognoza zawartości złoża przed przystąpieniem do eksploatacji. My powiedzielibyśmy szacowanie wielkości złoża.

Prognoza pogody na jutro mówi jakie, z dużym prawdopodobieństwem, będą warunki pogodowe następnego dnia. Prognoza pogody ma charakter bezwarunkowy.

Prognoza zjawisk ekonomicznych ma często charakter warunkowy. Jeśli będą spełnione pewne warunki, zrealizowane pewne działania, to nastąpi określone zjawisko ekonomiczne.

Funkcje prognozy:

Konstruowanie prognozy jest wskazane gdy:

Główne zastosowanie w gospodarce to prognozowanie:

W literaturze wprowadza się też pojęcie predykcji (predykcji ekonometrycznej) i rozumie się predykcję jako ogół zasad i metod wnioskowania o przyszłości na podstawie rozważanego modelu ekonometrycznego. Prognoza w tym ujęciu to skonkretyzowany proces wnioskowania lub wynik tego wnioskowania.

2. Metody prognozowania

0x01 graphic

Schemat głównych metod prognostycznych (Zeliaś, 1997, Teoria prognozy)

3. Rodzaje prognoz - klasyfikacja

Kryterium podziału

Rodzaje prognoz

Horyzont czasowy

Długoterminowe - ponad 2 lata

Średnioterminowe - do 2 lat

Krótkoterminowe - 1 do 3 miesięcy

Bezpośrednia - do 1 miesiąca

Bieżąca - do kilku dni

Operacyjna - do planowania bieżącej działalności (najczęściej średnioterminowe)

Strategiczna - do podejmowania długofalowych decyzji (długoterminowe czasem średnioterminowe)

Charakter lub struktura

Proste - dotyczące jednej zmiennej ekonomicznej

- budowane bez udziału innych prognoz,

Złożone - dotyczące więcej niż jednej zmiennej ekonomicznej

- konstruowane na podstawie innych prognoz

Jakościowe - prognoza nie wyraża się liczbą lecz jakościowo

Ilościowe - wielkość prognozy wyraża się liczbą

- punktowe, przedziałowe,

- skalarne, wektorowe,

Jednorazowe, powtarzalne;

Kompleksowe - całościowo opisujące dane przyszłą sytuację złożonego zjawiska.

Sekwencyjne - opis dla kilku momentów lub okresów w przyszłości (sekwencji).

Samosprawdzające się, destrukcyjne.

Stopień szczegółowości

Ogólne (globalne) - opisujące zjawisko agregat,

Szczegółowe - opisujące pewien aspekt badanego zjawiska.

Zakres ujęcia

Całościowe (globalne), częściowe (odcinkowe).

Zasięg terenowy

Światowe, międzynarodowe, krajowe, regionalne.

Metoda opracowania

Minimalne, średnie, maksymalne.

Czyste (pierwotne) - ekstrapolacja obserwowanego trendu (krótkoterminowe), często tylko prognozy wstępne.

Weryfikowalne - zazwyczaj prognozy powtarzalne, weryfikowane na podstawie napływających danych.

Modelowe - zbudowane na podstawie pewnego modelu (ekonometrycznego).

Predykcje ilościowe

Prognozy nieobciążone - nie niosące systematycznego błędu, założenie co do wartości oczekiwanej prognozy.

Prognozy budowane metodą największego prawdopodobieństwa - związane z metodą estymacji współczynników modelu, wybieramy wielkości „najbardziej” prawdopodobne.

Minimalizujące oczekiwaną stratę - metoda niosąca wartościowanie ekonomiczne, funkcję straty. Prognoza uwzględnia prawdopodobieństwo wystąpienia zjawiska i stratę związaną z jego wystąpieniem.

Predykcje jakościowe

Predykcja punktów zwrotnych - przewidywanie wystąpienia momentów zmiany tendencji (np. ze wzrostowej na spadkową).

Predykcja przewyższeń ­- budowanie prognozy mówiącej, że w pewnym okresie zmienna prognozowana osiągnie wartości wyższe (lub niższe) od z góry ustalonych. Zazwyczaj tą wartością jest jakiś poziom istotny z ekonomicznego punktu widzenia.

Predykcja ciągów monotonicznych - prognoza czy utrzyma się tendencja spadkowa lub wzrostowa.

Cel lub funkcja

Prognozy badawcze - mają na celu zrozumienie i poznanie zjawiska.

ostrzegawcze - mające na celu zwrócenie uwagi na niekorzystne zjawiska,

normatywne - mające ustalić pewne obowiązujące normy, powinny być zrealizowane

aktywne - pobudzające do działania,

pasywne - zniechęcające do działania.

Wspomagająca ( przygotowująca, preparacyjna) - wspomagająca działalność, podejmowanie decyzji.

Aktywizująca

Informacyjna

(Zeliaś, 1997, Teoria prognozy)

Przykład 1

W marcu 2004 wykonano prognozę dotyczącą sytuacji finansowej Firmy w maju 2004. Prognozowano wielkość produkcji, stan zapasów, wielkość sprzedaży, ściągalność należności, przepływy finansowe uwzględniające zmiany kursów walut.

Określić wykonaną prognozę na podstawie podanych na wykładzie kryteriów (klasyfikacji).

Rozwiązanie

Jest to prognoza:

4. Horyzont prognozy

Oznaczenia: Yt - zmienna opisująca badane zjawisko ekonomiczne,

t - zmienna czasowa

(t - oznacza moment lub okres, t = 1, 2, 3, …m),

yt - szereg czasowy realizacji zmiennej Yt w badanych momentach lub okresach,

Id - przedział czasowy w którym są zbierane dane statystyczne,

td - środek przedziału Id.

Horyzont prognozy to przedział postaci:

(tb , T]

gdzie: tb okres (chwila) bieżąca, T okres (chwila) końcowa

Wyprzedzenie czasowe prognozy h' (w stosunku do bieżącego okresu), to długość horyzontu prognozy, czyli:

h' = T - tb

Horyzont predykcji (dla bieżącego okresu) to przedział postaci:

(tb , tb + 2]

gdzie: tb okres (chwila) bieżąca, 2 długość horyzontu predykcji wynikająca z przyjętego modelu prognostycznego. 2 jest trudne to określenia, zazwyczaj pełni funkcję teoretyczną.

Niech 1 oznacza czas niezbędny do podjęcia efektywnych kroków mogących wpłynąć na prognozowane zjawisko.

Jeśli zachodzą nierówności:

1 ≤ h' ≤ 2

to możliwa jest reakcja na wyniki prognozy.

Opóźnienie bieżące modelu0 (w stosunku do bieżącego okresu) to odległość między okresem bieżącym i środkiem przedziału zbierania danych:

0 = tb - td

Predyktywne opóźnienie modelu L to suma opóźnienia bieżącego modelu i wyprzedzenia czasowego prognozy

L = 0 + h' = T - td

Wyjściowy okres prognozy tn - to ostatni okres dla którego dysponujemy informacją o rzeczywistej wartości zmiennej prognozowanej.

Horyzont predykcji (dla wyjściowego okresu prognozy) to przedział: (tn , tn + 2)

Opóźnienie w dopływie danych statystycznych3 = tb - tn .

Realne wyprzedzenie czasowe prognozy h to długość okresu na który się prognozuje (od wyjściowego okresu prognozy):

h = T - tn = h' + 3 = T - tb + 3 .

Zachodzą więc nierówności:

h' ≤ h ≤ 2 .

Przykład 2

Od stycznia 2000 roku do grudnia 2003 obserwowano miesięczne wielkość zmiennej Yt. W lutym 2004 wykonano prognozę dla maja 2004.

Oblicz wielkości związane z horyzontem prognozy:

  1. zakres zmienności zmiennej czasowej t;

  2. Id przedział w którym zbierane są dane;

  3. td środek przedziału w którym zbierane są dane;

  4. tb bieżący okres;

  5. tn wyjściowy okres prognozy;

  6. T okres końcowy;

  7. (tb , T] horyzont prognozy;

  8. h' wyprzedzenie czasowe prognozy (w stosunku do bieżącego okresu);

  9. 0 opóźnienie bieżące modelu (w stosunku do bieżącego okresu);

  10. L predyktywne opóźnienie modelu;

  11. 3 opóźnienie w dopływie danych statystycznych;

  12. h realne wyprzedzenie czasowe prognozy;

Rozwiązanie

  1. t przybiera wartości od 1 do 53; ilość miesięcy od stycznia 2000 do maja 2004;

  2. [1, 48] począwszy od stycznia 2000 do grudnia 2003 włącznie;

  3. td = 24,5 środek przedziału [1, 48];

  4. tb = 50 numer miesiąca „luty 2004” przy numeracji zaczynającej się od miesiąca „styczeń 2000”;

  5. tn = 48 numer miesiąca „grudzień 2003” ;

  6. T = 53 numer miesiąca „maj 2004”;

  7. (50 , 53] ;

  8. h' = T - tb = 53 - 50 = 3;

  9. 0 = tb - td = 50 - 24,5 = 25,5;

  10. L = T - td = 53 - 24,5 = 28,5;

  11. 3 = tb - tn = 50 - 48 = 2;

  12. h = T - tn = 53 - 48 = 5;

Przykład 3

Od 1 lipca 2000 roku do 15 grudnia 2001 obserwowano codziennie wielkość zmiennej Yt. W dniu 28 grudnia 2001 zbudowano prognozę dla 10stycznia 2002.

Oblicz wielkości związane z horyzontem prognozy:

  1. zakres zmienności zmiennej czasowej t;

  2. Id przedział w którym zbierane są dane;

  3. td środek przedziału w którym zbierane są dane;

  4. tb bieżący okres;

  5. tn wyjściowy okres prognozy;

  6. T okres końcowy;

  7. (tb , T] horyzont prognozy;

  8. h' wyprzedzenie czasowe prognozy (w stosunku do bieżącego okresu);

  9. 0 opóźnienie bieżące modelu (w stosunku do bieżącego okresu);

  10. L predyktywne opóźnienie modelu;

  11. 3 opóźnienie w dopływie danych statystycznych;

  12. h realne wyprzedzenie czasowe prognozy;

5. Błąd prognozy ex post i ocena ex ante błędu

Dwa podstawowe postulaty predykcji to:

  1. Prognoza powinna być obliczona wraz z odpowiednim miernikiem rzędu dokładności.

  2. Przy wyborze sposobu budowania prognozy należy dążyć do wysokiej efektywności predykcji, czyli osiągnięcia zadowalającego rzędu dokładności predykcji.

Wyróżniamy dwa rodzaje mierników dokładności predykcji:

6. Prognozy dopuszczalne

Wiele jest kryteriów dopuszczalności prognoz. Dopuszczalność prognozy jest ważnym zagadnieniem.

Prognoza jest dopuszczalna jeśli realne wyprzedzenie czasowe jest nie większe niż długość horyzontu predykcji: h ≤ 2.

Horyzont prognozy zależy od wybranego modelu prognostycznego, zależy też inercji zmiennych objaśnianych.

Zwiększenie pewności prognozy można osiągnąć stosując kilka metod prognozowania.

7. Dane statystyczne wykorzystywane w prognozowaniu.

Ważny etap prac prognostycznych to pozyskanie danych statystycznych. Na ich podstawie następuje wybór klasy modelu prognostycznego (predykcji) czyli postaci zależności, oszacowań parametrów, weryfikacji prognoz wygasłych itd.

Liczbowe dane statystyczne powinny być:

Wyróżnia się dwa rodzaje błędów:

Podstawowe źródła błędów w trakcie zbierania i opracowywania danych to:

Błędy systematyczne są groźne. Błędy losowe nie są bardzo groźne.

8. Szacowanie brakujących danych (ilościowych i jakościowych)

Braki danych ilościowych związane są z niedostępnością danych statystycznych.

Braki danych związane z niedostępnością danych jakościowych.

Przy braku danych niemożliwe jest bezpośrednie wykorzystanie klasycznych metod ekonometrycznych.

Stosujemy jedną z trzech metod:

9. Prognozy w procesie decyzyjnym

Jaką rolę powinna odgrywać prognoza w procesie decyzyjnym?

Decyzja zazwyczaj podejmowana jest w warunkach niepewności. Prognoza oparta na posiadanej wiedzy i naukowych metodach matematyki i statystyki, pozwala redukować niepewność przyszłości.

Redukcja niepewności zależy od wielu czynników. Niektóre prognozy są nieomal bezbłędne, inne obciążone dużą dozą niepewności. Prognozy ekonometryczne zazwyczaj są obciążone dużą niepewnością.

Potrzebne są dodatkowe kryteria lub metody przy podejmowaniu decyzji w warunkach niepewności.

  1. „Naiwna strategia postępowania” postępujemy tak, jakby prognoza była pewna.

  2. Maksymalizowanie korzyść - jeśli potrafimy powiązać wielkość korzyści z prognozowanymi stanami wielkości Yt oraz potrafimy oszacować prawdopodobieństwa trafności danego wariantu prognozy, to możemy tak postępować by maksymalizować wartość oczekiwaną korzyści.

  3. Możemy też tak postępować by maksymalizować osiągany zysk (korzyść).

Można zwiększać trafność prognozy przez zwiększanie nakładów na prognozę. Nie zawsze jednak jest to opłacalne.

Jakość prognozę oceniamy oceniając jej trafność. Trafność prognozy oceniamy za pomocą określania błędów ex post. Jest to jednak możliwe tylko dla prognoz ilościowych.

Wykład 2

Zasady budowania prognoz ekonometrycznych

1. Wybór modelu prognostycznego.

  1. Pierwszy etap. Określenie zjawisko, które chce się prognozować. Wybór postaci analitycznej funkcji prognozy. Wybór modelu ekonometrycznego (modelu prognostycznego). Wybór postaci zależności w ramach wybranego modelu prognostycznego.

    1. Możemy oprzeć się na zebranym materiale statystycznym i na jego analizie:

      1. Analiza graficzna,

      2. Analiza ilościowa - analiza dopasowania modelu do danych statystycznych.

    2. Możemy oprzeć się na teorii ekonomicznej:

      1. Korzystanie ze znanych i sprawdzonych zależności występujących między wielkościami ekonomicznymi

    3. Możemy oprzeć się na doświadczeniu zebranym przy budowaniu podobnego typu prognoz oraz na towarzyszącym prognozowaniu badaniach.

Przyjęcie danego modelu prognostycznego związane jest z:

  1. możliwością jasnej interpretacji ekonomicznej parametrów modelu,

  2. możliwością względnie łatwej estymacji parametrów modelu,

  3. stopniem dokładności, z jakim model opisuje badane zjawisko (w przeszłości i przyszłości).

Należy też dobrać zmienne objaśniające. Istnieje wiele metod doboru zmiennych objaśniających. Np:

  1. odwołanie się do istniejącej teorii,

  2. analiza materiału empirycznego,

  3. wybranie zmiennych najsilniej skorelowanych ze zmiennymi objaśnianymi.

  1. Drugi etap. Zebranie danych statystycznych, na podstawie których będą oszacowane parametry występujące w modelu. Dane powinny być: rzetelne, zgodne z przedmiotem badań, jednoznaczne, kompletne, aktualne, porównywalne w czasie i przestrzeni. Powinny być wyeliminowane dane odstające, rzadkie, obce. Możliwa jest redukcja danych objaśniających na tym etapie.

  1. Trzeci etap. Estymacja parametrów modelu. Często metodą najmniejszych kwadratów.

  1. Czwarty etap. Weryfikacja modelu. Czy otrzymane parametry strukturalne modelu są zgodne z obserwowaną rzeczywistością.

  1. Piąty etap. Praktyczne wykorzystanie zbudowanego modelu. Do opisu rzeczywistości, wnioskowania o przyszłości, podejmowania decyzji.

2. Podstawowe założenia występujące przy wnioskowaniu o przyszłości.

Klasyczne założenia teorii predykcji:

  1. znajomość modelu kształtowania się zmiennej prognozowanej,

    1. znajomość postaci analitycznej

    2. znajomość parametrów strukturalnych, stochastycznych

  2. stabilność w czasie prawidłowości ekonomicznej na której opiera się model,

    1. stabilność w czasie zarówno w przedziale z którego pochodzą dane do estymacji jak i w okresie prognozy,

  3. stabilność rozkładu czynnika losowego (zaburzenia, błędu),

    1. stabilność co najmniej do okresu T,

  4. znajomość wartości zmiennych objaśniających model w okresie na który budowana jest prognoza,

    1. znajomość dla okresu T zmiennych objaśniających jest istotnym ograniczeniem do stosowania modeli przyczynowo-skutkowych i wielorównaniowych modeli ekonometrycznych, ograniczeniem do przypadku, gdy zmienne objaśniające są zmiennymi planowanymi niezależnymi od innych czynników,

  5. dopuszczalność ekstrapolacji modelu poza obserwowany w „próbie” obszar zmienności zmiennych objaśnianych.

    1. najbardziej kłopotliwe założenie, służy ograniczeniu bezkrytycznych uogólnień.

Przyjmujemy, że klasyczne założenia teorii predykcji przy krótkookresowych prognozach są zawsze spełnione. Przy prognozach długookresowych klasyczne założenia teorii predykcji są zbyt restrykcyjne.

Zmodyfikowane założenia teorii predykcji:

  1. znajomość modelu kształtowania się zmiennej prognozowalnej uwzględniająca możliwe małe niestabilności tej prawidłowości,

  2. stabilność lub zachowanie się „bliskie” stabilności w czasie badanego zjawiska,

  3. stabilność lub zachowanie się „bliskie” stabilności w czasie składnika losowego,

  4. znajomość wartości zmiennych objaśniających model lub rozkładu tych zmiennych, w okresie na który wykonywana jest prognoza,

  5. możliwość ekstrapolacji modelu poza obszar zmienności zaobserwowanej w „próbie” z błędem nie większym niż zadany z góry.

3. Zasady budowy predykcji ilościowych

Predykcja punktowa.

  1. zasada nieobciążoności predykcji (zasada statystyczna)

yPT = E(YT)

  1. zasada największego prawdopodobieństwa predykcji (zasada statystyczna)

yPT = M(YT)

  1. zasada minimalizacji funkcji straty (zasada ekonomiczna)

E[W(YT - yPT)] = min { E[W(YT - y^PT)] ; y^PT dowolna predykcja}

Predykcja przedziałowa

  1. Ustalamy z góry wiarygodność predykcji γT , należy wskazać przedział IPT spełniający:

P( YT ∈ IPT ) = γT

Wiarygodność predykcji γT to liczba z przedziału [0, 1], zazwyczaj γT ≥ 0,9.

4. Miary dokładności wnioskowania w przyszłość EX ANTE

W predykcji punktowej możemy rozważać następujące błędy:

  1. DT = YT - yTP - błąd predykcji, zmienna losowa

  2. D'T = YT - YTP - pełny błąd predykcji, YTP zmienna losowa, brak oszacowań parametrów modelu

  3. D*T = YT - ES(YTP) - czysty błąd predykcji, ES(.) to wartość oczekiwana po wszystkich możliwych zbiorach danych, zgodnie z ich rozkładem.

W praktycznych obliczeniach stosuje się najczęściej błąd predykcji. Oszacowanie parametrów rozkładu błędu predykcji ex ante jest często stosowanym miernikiem jakości wnioskowania w przyszłość. Szacujemy parametry:

  1. E(DT) - obciążenie predykcji,

  2. var(DT) - wariancja predykcji,

  3. σ(DT) = (var(DT))0,5 - odchylenie standardowe predykcji (średni błąd predykcji),

  4. V(DT) = σ(DT) / |yTP| - względny błąd predykcji.

W predykcji przedziałowej stosujemy często następujące mierniki dokładności predykcji ex ante:

  1. wiarygodność predykcji γT (z góry ustalona) ,

  2. precyzja predykcji d(IPT) - połowa przedziału predykcji IPT ,

  3. względna precyzja predykcji V(IPT) = d(IPT) / | yPT|

5. Miary dokładności wnioskowania w przyszłość EX POST

Ocenę ex post możemy przedstawić jako ocenę dla prognoz wygasłych.

Prognoza wygasła to prognoza dla okresu t, dla którego znana jest już prawdziwa wartość zmiennej prognozowanej Yt , czyli t ∈ Id (zamiast T piszemy teraz t).

Oznaczmy:

Iemp - okres weryfikacji empirycznej prognozy,

m - ilość okresów w Iemp , czyli ilość okresów w których następuje empiryczna weryfikacja.

Mierniki dokładności predykcji ex post:

  1. Średnie obciążenie predykcji ex post:

0x01 graphic

  1. Względne obciążenie predykcji ex post:

0x01 graphic

  1. Średni błąd predykcji ex post:

0x08 graphic
0x01 graphic

  1. Względny błąd predykcji ex post:

0x08 graphic
0x01 graphic

  1. Współczynnik Theila

0x08 graphic
0x01 graphic

gdzie 0x01 graphic

  1. Całkowity względny błąd predykcji

0x08 graphic
0x01 graphic

  1. Rozkład współczynnika Theila na sumę trzech składników pozwala ocenić źródła błędów predykcji

I2 = I12 + I22 + I32

gdzie:

0x01 graphic
określa obciążenie predykcji

0x01 graphic
określa niedostateczność elastyczności predykcji

0x01 graphic
określa niedostateczność predykcji punktów zwrotnych

gdzie:

0x01 graphic
- średnie arytmetyczne, odpowiednio, wartości rzeczywistych i wygasłych prognoz;

0x01 graphic
- odchylenia standardowe, odpowiednio, wartości yt i ytP;

0x01 graphic
- współczynnik korelacji liniowej między wartościami yt i ytP;

dla t ∈ Iemp czyli na przedziale empirycznej weryfikacji prognoz.

  1. Dzieląc rozkład z punktu 7. przez współczynnik Thiela I2 dostajemy:

0x01 graphic

gdzie interpretujemy:

0x01 graphic
jako miernik całkowitego względnego obciążenia predykcji wynikającego z obciążenia predykcji (małej zgodności średnich wartości yt i ytP w przedziale Iemp),

0x01 graphic
jako miernik całkowitego względnego obciążenia predykcji wynikającego z niedostatecznej elastyczności predykcji (małej zgodności zróżnicowania wartości yt i ytP w przedziale Iemp),

0x01 graphic
jako miernik całkowitego względnego obciążenia predykcji wynikającego z niedostatecznej predykcji punktów zwrotnych (małej zgodności kierunków zmian wartości yt i ytP w przedziale Iemp),

  1. Do badania dopuszczalności prognoz stosowany jest również współczynnik Janusowy:

0x01 graphic

w liczniku występuje wariancja średniego błędu predykcji ex post, w mianowniku wariancja resztowa modelu.

Współczynnik Janusowy pozwala badać aktualność modelu. Na jego podstawie oceniamy, czy model nadal jest aktualny.

Jeżeli J2 ≤ 1 + δ dla δ małej liczby rzeczywistej (nieco większej od zera) to model nadal jest aktualny. Wariancja średniego błędu predykcji ex post nie jest dużo większa od wariancji resztowej modelu. Jeżeli J2 jest dużo większe od 1 uznajemy, że model już się zdezaktualizował.

Mierniki dokładności predykcji (zarówno ex ante jak i ex post) dzielimy na mierniki bezwzględne (zachowujące „jednostkę” miary) i względne (procentowe).

Jeżeli odbiorca prognozy nie ma własnych kryteriów dopuszczalności prognozy, to przyjmujemy następującą ocenę dokładności (zarówno ex post jak i ex ante):

V ≤ 3% - prognoza bardzo dobra,

3% < V ≤ 5% - prognoza dobra,

5% < V ≤ 10% - prognoza może być dopuszczalna,

10% < V - prognoza nie jest dopuszczalna,

Przykład 1 (Zeliaś, przykład 2.2 str. 53)

Prognozowana jest wartość indeksu WIG (na zamknięciu sesji) na GPW w Warszawie. Szereg czasowy obserwacji („próby”) składa się z 10 momentów zamknięcia sesji od 27 listopada 2000 do 8 grudnia 2000.

Obliczono prognozę sekwencyjną dla T = 11, 12, 13 (11, 12, 13 grudnia 2000).

Dane i obliczenia w tabeli 1.

  1. Średnia rzeczywistych wartości WIG w okresach 11, 12, 13 wynosi: yśrT = 17.089,05

Średnia wartości prognoz WIG w okresach 11, 12, 13 wynosi: yPśrT = 17.056,75

Średnia prognozy ma niższą wartość od średniej wartości rzeczywistych, może to wskazywać na to, że prognozy są obciążone.

Różnica średnich czyli średnie obciążenie ex post prognozy: 0x01 graphic
= uśr = yśrT - yPśrT = 32,30

A więc istotnie prognoza jest obciążona, niedoszacowanie wynosi 32,2 punktu.

  1. Czy występujące obciążenie prognozy jest dużym obciążeniem? Liczymy względne obciążenie ex post prognozy:

V(uśr) = | uśr | / | yśrT | = 32,30 / 17.056,75 = 0,19%

Obciążenie prognozy jest bardzo małe.

  1. Średni błąd prognozy ex post wynosi: 0x01 graphic
    = 37,33

  1. Względny błąd prognozy ex post wynosi: 0x01 graphic

Średni błąd prognozy to 37,33 jest to jednak zaledwie 0,22% średniej wartości rzeczywistej.

  1. Współczynnik Theila: 0x01 graphic

  1. Względny błąd predykcji ex post wynosi: 0x01 graphic

  1. Identyfikując przyczyny błędu korzystamy z rozkładu współczynnika Thiela I2 = I12 + I22 + I32 :

0x01 graphic
obciążenie predykcji

0x01 graphic
niedostateczność elastyczności predykcji

0x01 graphic
niedostateczność predykcji punktów zwrotnych

  1. Wyliczymy teraz udział procentowy tych błędów w całkowitym błędzie ex post:

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

  1. Obliczmy współczynnik Janusowy:

0x01 graphic

ponieważ współczynnik jest mniejszy od 1 model nadal jest aktualny.

Wykład 3

Prognozowanie na podstawie klasycznych modeli trendu

Interesuje nas dyskretny proces stochastyczny (Yt)t=1,2,….Zaobserwowane wartości tego szeregu oznaczamy: y1, y2,… yn i nazywamy szeregiem czasowym. Możemy rozważać szereg czasowy momentów lub okresów. Dodatkowo zakładamy, że odstępy czasowe są równe.

Zdajemy sobie sprawę z tego, że zaobserwowane wartości Y nie musiały wystąpić, mogły być inne bliskie bądź dalekie od zanotowanych. Obserwowany proces jest procesem stochastycznym. Przyjmujemy następujący model opisu obserwowanego procesu. Przyjmujemy, że jest on wypadkową działania:

  1. składowej deterministycznej (składowa systematyczna, przyczyny główne);

    1. trendu

    2. stałego poziomu;

    3. składowej okresowej:

      1. wahań cyklicznych;

      2. wahań sezonowych;

  2. procesu stochastycznego (przyczyn ubocznych, przypadkowych).

Proces wyznaczania składowych szeregu czasowego nazywamy procesem dekompozycji szeregu czasowego. Proces dekompozycji polega na budowie modelu szeregu czasowego.

Wyróżniamy dwa główne typy modelu szeregu czasowego:

  1. addytywny: yt = f(t) + g(t) + h(t) + ξt ; t = 1, 2, … n ;

  2. multiplikatywny: yt = f(t) ⋅ g(t) ⋅ h(t) ⋅ ξt ; t = 1, 2, … n ;

gdzie:

f() - funkcja opisująca trend ;

g() - funkcja opisująca wahania sezonowe ;

h() - funkcja opisująca wahania cykliczne ;

ξt - składnik losowy.

Budując model musimy ustalić postać analityczną funkcji f, g, h. Krokiem w kierunku ustalenia postaci funkcji może być analiza graficzna zaobserwowanych wielkości y1, y2¸ … yn i na tej podstawie próba ustalenia postaci funkcji trendu.

Przyjmiemy, że funkcja trendu jest funkcją:

  1. liniową, gdy (t, yt) układają się w przybliżeniu wzdłuż linii prostej; (yt = a + bt)

  2. wykładniczą, gdy (t, ln(yt)) układają się w przybliżeniu wzdłuż linii prostej; (yt = a ⋅ bt)

  3. logarytmiczną, gdy (ln(t), yt) układają się w przybliżeniu wzdłuż linii prostej; (yt = a ⋅ ln(t))

  4. potęgową, gdy (ln(t), ln(yt)) układają się w przybliżeniu wzdłuż linii prostej; (yt = a ⋅ tb)

Musimy teraz zweryfikować wybór analitycznej postaci funkcji trendu.

Ad a) Jeśli funkcja trendu ma postać liniową f(t) = a + b⋅t , to przyrosty są stałe (z dokładnością do składnika losowego):

Δyt = yt - yt-1 = b + (ξt - ξt-1) ;

Weryfikujemy hipotezę, o stałości przyrostów zakładając liniowość przyrostów: Δyt = α + β⋅t + εt ;

a następnie weryfikując hipotezę zerową H0 , że parametr β różni się od zera w sposób nieistotny.

Ad b) Jeśli funkcja trendu ma postać wykładniczą f(t) = a ⋅ bt , to spełniony jest warunek:

( f(t) - f(t-1) ) / f(t-1) = b - 1

A to oznacza, że szereg czasowy ma stałe przyrosty względne (z dokładnością do składnika losowego) lub inaczej mówiąc, że indeksy łańcuchowe dla tego szeregu są stałe z dokładnością do czynnika losowego:

Δyt / yt - yt-1 = const + εt ;

Prognozowanie na podstawie trendu.

Rozważmy obecnie modele szeregów czasowych, w których składowa systematyczna ma postać trendu oraz w których występuje składowa losowa. Rozważamy więc modele postaci:

Yt = f(t) + ξt - postać addytywna (A)

Yt = f(t) ⋅ ξt - postać multyplikatywna (M)

dla t = 1, 2, …n

Będziemy obecnie zakładać, że f jest funkcją liniową: f(t) = α0 + α1⋅t

Dodatkowo zakładamy, że :

  1. w modelu (A) addytywnym E(ξt) = 0 ;

  2. w modelu (M) multyplikatywnym E(ξt) = 1 ;

Tak więc model szeregu czasowego ma postać:

yt = α0 + α1⋅t + ξt , t = 1, 2, … n;

Parametry α0 , α1 są nam nieznane. Musimy je oszacować. Szacujemy za pomocą metody najmniejszych kwadratów i jako wynik dostajemy a 0 , a1 :

0x01 graphic

0x01 graphic
gdzie 0x01 graphic
są średnimi arytmetycznymi

Szereg czasowy możemy więc przedstawić następująco:

yt = a0 + a1⋅t + et ; t = 1, 2, … n ;

gdzie

0x01 graphic
to reszty modelu;

zaś 0x01 graphic
to wartości teoretyczne prognozowanej zmiennej

Model trendu możemy zapisać w postaci macierzowej: y = X α + ξ

gdzie:

0x01 graphic
, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
.

Przez a oznaczmy oszacowanie wektora α za pomocą metodą najmniejszych kwadratów. Wektor a dany jest więc wzorem:

0x01 graphic
0x01 graphic

Zachodzi tożsamość:

y = X a + e

gdzie e to wektor reszt: e = y - X a = 0x01 graphic

zaś 0x01 graphic
to wektor wartości teoretycznych prognozowanej zmiennej.

Weryfikacja modelu trendu liniowego - ocena dopasowania do danych empirycznych.

  1. Wariancja resztowa:

0x01 graphic

  1. Standardowe odchylenie składnika resztowego:

0x01 graphic

  1. Współczynnik zmienności resztowej

0x01 graphic

Zakładamy z góry pewną wartość krytyczną V* współczynnika zmienności losowej, np. V*=10%. Jeśli zachodzi nierówność:

Ve ≤ V*

to model uważamy za dostatecznie dopasowany do zmiennych empirycznych.

  1. Współczynnik zbieżności ϕ2 :

0x01 graphic

Współczynnik zbieżności przyjmuje wartości z przedziału [0, 1], informuje on jaka część całkowitej zmienności zmiennej objaśnianej nie jest wyjaśniona przez model. Dopasowanie modelu do danych jest tym lepsze im mniejsze jest ϕ2.

  1. Współczynnik determinacji R2 :

0x01 graphic

Współczynnik determinacji przyjmuje wartości z przedziału [0, 1], informuje on jaka część całkowitej zmienności zmiennej objaśnianej jest wyjaśniona przez model. Dopasowanie modelu do danych jest tym lepsze im większe jest R2.

Zachodzi równość: ϕ2 + R2 = 1 .

  1. Współczynnik korelacji wielorakiej R: 0x01 graphic

  1. Dopasowanie modelu do danych empirycznych weryfikuje się poprzez weryfikację hipotezy o istotności współczynnika determinacji (korelacji wielorakiej). Testuje się hipotezę zerową postaci H0 : [R2 = 0] przeciwko hipotezie alternatywnej H1 : [R2 ≠ 0].

Hipotezę testujemy przy pomocy statystyki F Fishera-Snedecora o m1 = k i m2 = (n - k - 1) stopniach swobody, gdzie k to ilość zmiennych objaśniających (u nas obecnie k = 1), n to ilość obserwacji. U nas m1 = 1; m2 = n - 2. Hipotezę testujemy na zadanym poziomie istotności γ (np. γ = 0,05).

0x01 graphic

Jeśli wykonujemy obliczenia „ręcznie” to dla ustalonego poziomu istotności γ wyznaczamy z tablic wartość krytyczną F* dla m1 , m2 stopni swobody.

Jeśli mamy do dyspozycji arkusz kalkulacyjny Excel to możemy wyznaczyć wartość krytyczną F* przy pomocy funkcji

=ROZKŁAD.F.ODW(γ; m1; m2)

Jeśli F ≤ F* to nie ma podstaw do odrzucenia hipotezy H0 , czyli przyjmujemy, że współczynnik determinacji jest nieistotnie różny od zera. Jeśli F > F* to odrzucamy hipotezę H0 na rzecz hipotezy alternatywnej H1 , współczynnik determinacji jest istotnie różny od zera.

Jeśli mamy do dyspozycji arkusz kalkulacyjny Excel oraz dysponujemy danymi, możemy wykonać wszystkie obliczenia w Excelu.

  1. Weryfikacja modelu polega na weryfikacji hipotez o istotności po kolei każdego parametru. Stawiamy więc hipotezę zerową H0 : [αi = 0] wobec hipotezy alternatywnej H1 : [αi ≠ 0] . Hipotezy weryfikujemy statystyką t­­-Studenta dla n-2 stopni swobody:

0x01 graphic
, i= 0, 1 .

gdzie:

0x01 graphic
, 0x01 graphic
.

Z tablic t-Studenta dla n-2 stopni swobody (n-k-1 stopni swobody) i danego poziomu istotności γ odczytujemy wartość krytyczną0x01 graphic
. Jeżeli:

0x01 graphic

to odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej. Czyli przyjmujemy, że i-ty parametr jest istotny.

Jeśli mamy do dyspozycji arkusz kalkulacyjny Excel to możemy wyznaczyć wartość krytyczną 0x01 graphic
przy pomocy funkcji

=ROZKŁAD.T.ODW(γ; ilość stopni swobody)

W przeciwnym wypadku nie mamy podstaw do odrzucenia H0 , czyli parametr strukturalny αi różni się nieistotnie od zera, a to oznacza, że czas czyli zmienna t nie wpływa w sposób istotny na wartość zmiennej objaśnianej Y.

Prognoza punktowa

Wartość prognozy na okres T = n+1, n+2, … obliczamy zgodnie z zasadą predykcji nieobciążonej przez ekstrapolację oszacowanej funkcji trendu:

0x01 graphic

gdzie c traktujemy jak „kolejny” wiersz macierzy obserwacji X, zaś a to wektor oceny parametrów strukturalnych modelu.

Ocena ex ante średniego błędu predykcji wyliczana jest ze wzoru:

0x01 graphic

Ocena ex ante względnego błędu predykcji wyliczana jest ze wzoru:

0x01 graphic

Prognoza przedziałowa

Przedział predykcji na okres (moment) T budujemy tak, aby:

0x01 graphic

gdzie yTP - prognoza punktowa, S(DT) - średni błąd predykcji, γT - wiarygodność predykcji (=0,05 np.), u współczynnik odczytany z tablic dwustronnych t-Studenta dla n-2 stopni swobody i prawdopodobieństwa (1-γT), przy założeniu normalności rozkładu reszt trendu liniowego.

Przykład 1 (Zeliaś 3.1)

Rozpatrujemy zagadnienie predykcji liczby udzielonych noclegów (w mln) w hotelach w Polsce. Dysponujemy danymi:

Rok

1990

1991

1992

1993

1994

1995

1996

1997

1998

Okres

1

2

3

4

5

6

7

8

9

noclegi (mln)

6,11

6,50

6,77

7,15

7,52

8,05

8,53

8,89

9,28

Naszym zadanie jest wyznaczenie prognoz punktowych i przedziałowych liczby udzielonych noclegów w hotelach na lata 1999, 2000, 2001.

Prognozy uznamy za dopuszczalne jeśli będą obarczone błędem nie większym niż 4%, zaś wiarygodność prognoz przedziałowych powinna wynosić 95%.

Rozwiązanie

Badamy graficzne przedstawienie danych:

0x01 graphic

Stwierdzamy, że szereg czasowy ma dwie składowe: trend i wahania losowe. Przyjmujemy, że naszym modelem tendencji rozwojowej będzie liniowa funkcja trendu. Czyli naszym modelem prognostycznym jest :

yt = α0 + α1⋅t + ξt , t = 1, 2, … n;

Przeprowadzimy teraz weryfikację naszego modelu.

Estymacja parametrów

t

yt

t-tśr

yt-ytśr

(t-tśr)2

(yt-ytśr)2

(t-tśr)(yt-ytśr)

1

2

3

4

5

6

7

1

6,11

-4

-1,5344

16

2,3545

6,1378

2

6,50

-3

-1,1444

9

1,3098

3,4333

3

6,77

-2

-0,8744

4

0,7647

1,7489

4

7,15

-1

-0,4944

1

0,2445

0,4944

5

7,52

0

-0,1244

0

0,0155

0,0000

6

8,05

1

0,4056

1

0,1645

0,4056

7

8,53

2

0,8856

4

0,7842

1,7711

8

8,89

3

1,2456

9

1,5514

3,7367

9

9,28

4

1,6356

16

2,6750

6,5422

Suma

45

68,8

0

0,0000

60

9,8640

24,2700

Średnia

5

7,6444

Obliczamy:

0x01 graphic

0x01 graphic

Oszacowana funkcja trendu ma więc postać:

0x01 graphic

Weryfikacja modelu:

Ocenę zgodności danych empirycznych z wartościami teoretycznymi (wynikającymi z postaci modelu) dokonamy na podstawie ocen parametrów struktury stochastycznej, odchylenia standardowego składnika resztowego, współczynnika zmienności resztowej, współczynnika zbieżności i współczynnika determinacji liniowej.

t

yt

yt^

et=yt-yt^

(yt-yt^ )2

1

2

3

4

5

1

6,11

6,0264

0,0836

0,0070

2

6,50

6,4309

0,0691

0,0048

3

6,77

6,8354

-0,0654

0,0043

4

7,15

7,2399

-0,0899

0,0081

5

7,52

7,6444

-0,1244

0,0155

6

8,05

8,0489

0,0011

0,0000

7

8,53

8,4534

0,0766

0,0059

8

8,89

8,8579

0,0321

0,0010

9

9,28

9,2624

0,0176

0,0003

Suma

45

68,8

68,8000

0,0000

0,0468

Średnia

5

7,6444

  1. Standardowe odchylenie składnika resztowego:

0x01 graphic

  1. Współczynnik zmienności resztowej

0x01 graphic

  1. Współczynnik zbieżności ϕ2 :

0x01 graphic

  1. Współczynnik determinacji R2 :

0x01 graphic

W arkuszu kalkulacyjnym Excel możemy na wykresie dodać linie trendu i zażądać wyświetlenia równania linii trendu oraz wielkości współczynnika determinacji R2 .

Po zaznaczeniu obiektu wykres wybieramy z menu: Wykres; Dodaj linię trendu; w typie wybieramy liniowy, w opcjach zaznaczamy Wyświetl równanie, Wyświetl R-kwadrat.

0x01 graphic

W arkuszu kalkulacyjnym Excel możemy wykonać wszystkie obliczenia wywołując odpowiednie polecenie analizy danych. Jeżeli Analiza danych nie jest dostępna to musimy ją doinstalować z płytki i uaktywnić (Dodatki).

Analizę danych uruchamiamy następująco:

Menu: Narzędzia, Analiza danych, Regresja.

W tabeli regresja zaznaczymy zakres y, zakres x, czy są tytuły, gdzie mają być zapisane wyniki.

PODSUMOWANIE - WYJŚCIE

Statystyki regresji

Wielokrotność R

0,997624555

R kwadrat

0,995254753

Dopasowany R kwadrat

0,994576861

Błąd standardowy

0,081772526

Obserwacje

9

ANALIZA WARIANCJI

 

df

SS

MS

F

Istotność F

Regresja

1

9,8172

9,817215

1468,1603

2,14606E-09

Resztkowy

7

0,0468

0,0066867

Razem

8

9,864

 

 

 

 

Współcz.

Błąd standard.

t Stat

Wartość-p

Dolne 95%

Górne 95%

Przecięcie

5,6219444

0,059406363

94,635392

3,876E-12

5,481470818

5,762418071

Zmienna X1

0,4045

0,010556788

38,31658

2,146E-09

0,379537182

0,429462818

Prognoza punktowa

Na rok 1999: y10P = 5,6215 + 0,4045 ⋅ 10 = 9,667 mln ,

Na rok 2000: y11P = 5,6215 + 0,4045 ⋅ 11 = 10,071 mln ,

Na rok 2001: y12P = 5,6215 + 0,4045 ⋅ 12 = 10,476 mln ,

Wartości ocen ex ante średnich błędów predykcji obliczonych prognoz:

0x01 graphic
mln

0x01 graphic
mln

0x01 graphic
mln

Wartości ocen ex ante względnych błędów predykcji obliczonych prognoz:

0x01 graphic

0x01 graphic

0x01 graphic

Prognoza przedziałowa:

Wartość współczynnika u odczytujemy z tablic dwustronnych rozkładu t-Studenta dla n-2 = 7 stopni swobody i prawdopodobieństwie (1 - 0,95) = 0,05 . Z tablicy odczytujemy, że u = 2,3646 .

Możemy też odczytać z arkusza Excela:

=ROZKŁAD.T.ODW(0,05;7) = 2,36462

Tak więc prognoza przedziałowa na poziomie wiarygodności 0,95 na kolejne lata wynosi:

Na rok 1999: (9,667 - 2,3646 ⋅ 0,1011 ; 9,667 + 2,3646 ⋅ 0,1011) = ( 9,428 ; 9,906 )

Na rok 2000: (10,071 - 2,3646 ⋅ 0,1069 ; 10,071 + 2,3646 ⋅ 0,1069) = ( 9,819 ; 10,324 )

Na rok 2001: (10,476 - 2,3646 ⋅ 0,1135 ; 10,476 + 2,3646 ⋅ 0,1135) = ( 10,208 ; 10,744 )

Wykład 4

Predykcja na podstawie modeli liniowych

Często używanym modelem ekonometrycznym jest jednorównaniony model postaci: Yt = f( Xt1, Xt2, … , Xtk, t)

gdzie Yt - zmienna objaśniana (zależna)

Xt1, Xt2, … , Xtk - zmienne objaśniające (niezależne)

t - składnik losowy

Model ten może być modelem przyczynowo-skutkowym lub opisowym (symptomatycznym).

Zalety modelu:

  1. Przedstawia w prosty sposób (jednym równaniem) zasadnicze związki w analizowanym zjawisku ekonomicznym.

  2. Pozwala łatwo ocenić siłę wpływu poszczególnych zmiennych objaśniających.

  3. Łatwa jest interpretacja parametrów równania.

  4. Umożliwia łatwe budowanie prognoz krótko i średnio terminowych.

  5. Umożliwia łatwą oceny ex ante średnich błędów predykcji.

  6. Umożliwia łatwe uzyskiwania prognoz wariantowych.

Wady modelu:

  1. Dopasowywanie modelu - często musimy modyfikować model, odrzucając jego kolejne wersje.

  2. Dopasowanie postaci analitycznej.

  3. Dobór zmiennych objaśniających.

  4. Eliminowanie współliniowości zmiennych objaśniających.

  5. Badanie stabilności parametrów modelu w czasie.

  6. Konieczność prognozy wartości zmiennych objaśniających na okres na który wyznacza się prognozę zmiennej objaśnianej. Zmienne objaśniające muszą dawać się lepiej prognozować niż zmienna objaśniana.

Skupimy się na jednorównaniowym modelu liniowym lub sprowadzalnym do postaci liniowej. Model taki ma postać wielowymiarowej liniowej funkcji regresji:

Yt = 0·Xt0 + 1·Xt1 + … + k·Xtk + t ; t = 1, 2, …, n ;

gdzie Yt - zmienna objaśniana (zależna)

Xt0, Xt1, … , Xtk - zmienne objaśniające (niezależne) ; X0 = 1;

0, 1,…, k - nieznane parametry modelu

t - składnik losowy

Często wygodnie jest stosować zapis wektorowy: y = X +  ;

gdzie:

0x01 graphic
;

y - to wektor zaobserwowanych wartości zmiennej zależnej Yt ;

X - to macierz wartości zmiennych objaśniających

 - wektor a priori wartości parametrów równania

 - składników losowych równania

Przy klasycznych założeniach modelu regresji liniowej szacujemy parametry 0, 1, … , k metodą najmniejszych kwadratów. Wektor b = [b1, b2, … ,bk] estymata tych parametrów dany jest wzorem:

b = (XT X)-1 XT y

Założenia klasycznej metoda najmniejszych kwadratów:

  1. zmienne objaśniające Xi (i=1, 2,… k) są nielosowe i nieskorelowane z i

  2. rząd(X) = k+1 ≤ n

  3. i ma rozkład N(0,σ2)

zapewniają nam uzyskanie estymatorów o dobrych własnościach: nieobciążonych, zgodnych, efektywnych. Niestety często klasyczne założenia nie są spełnione. Prowadzi do trudności w budowie modelu.

Jedną z trudności jest współliniowość (nadmierne skorelowanie) zmiennych objaśniających.

Wykrywanie i mierzenia stopnia współliniowości zmiennych niezależnych oraz eliminowanie zmiennych współliniowych.

Badamy macierz współczynników korelacji:

0x01 graphic
gdzie rij = cor(Xi , Xj ).

Macierz r jest macierzą symetryczną. Wyznacznik tej macierzy det(r) jest miernikiem współliniowości (skorelowania) zmiennych objaśniających. Zachodzi zawsze:

0 ≤ Det(r) ≤ 1 .

Det(r) bliskie 1 świadczy o małym stopniu skorelowania.

Det(r) bliskie 0 świadczy o dużym stopniu skorelowania.

Det(r) jest miarą stabilności modelu. Zwiększanie ilości zmiennych obniża stabilność modelu.

W excelu istnieje funkcja „Wyznacznik.Macierzy()”. Wyznacznik możemy liczyć tylko dla macierzy kwadratowych.

Przypomnienie

a) 0x01 graphic
; det(X) = ad - bc ;

b) 0x01 graphic
; det(X) = x11⋅det(X11) - x12⋅det(X12) + … + (-1)n+1⋅x1n⋅det(X1n) ;

gdzie Xij to macierz otrzymana z macierzy X przez wykreślenie i-tego wiersza oraz j-tej kolumny.

Przykład

a) 0x01 graphic
; det(X) = 2 ⋅ 4 - 3 ⋅ 3 = 8 - 9 = -1;

b) 0x01 graphic
; 0x01 graphic

= 0x01 graphic

Jeśli det(r) jest zbyt małe, musimy modyfikować model. Możemy eliminować zmienne współliniowe.

Istnienie silnej korelacji między zmiennymi objaśniającymi poważnie wpływa na efektywność estymatorów parametrów modelu. Im większa korelacja tym mniejsza efektywność, tym większa wariancja, tym trudniej poprawnie oszacować parametry strukturalne modelu.

Liczymy test istotności t-Studenta ze statystyką z (n-k-1) stopniami swobody:

0x01 graphic

Jeśli t < t*γ,(n-k-1) , to uznajemy oszacowanie parametru za nieistotne. Jeśli t > t*γ,(n-k-1) , to uznajemy parametr za istotny.

Tutaj t*γ,(n-k-1) oznacza wartość krytyczna testu studenta na poziomie istotności γ i z (n-k-1) stopniami swobody, bi to estymata parametru i modelu, zaś D(bi) to ocena średniego błędu parametru i .

Przy wykonywaniu obliczeń przy pomocy „Regresji” z „Analizy danych” Excela dostajemy obliczoną wartość statystyki t dla każdej estymaty parametru (t Stat), a także „Wartość-p”. Wartość p porównujemy z poziomem istotności γ . Jeśli p < γ , to odrzucamy hipotezę o nieistotności parametru i.

Ustalenie zbioru zmiennych objaśniających modelu ekonometrycznego.