dr M. Chrzanowska
Wykład 3
OPISOWE MODELE EKONOMETRYCZNE
METODY PROGNOZOWANIA Wykład 3
1
Wprowadzenie
Z kursu statystyki wiadomo, że jeśli
zmienne losowe X i Y są statystycznie
zależne (są skorelowane), to można
ustalić jakich oczekiwać wartości y
zmiennej Y, gdy zmienna X przyjmie
wartość x i stąd rozważa się
warunkową wartość oczekiwaną
zmiennej Y przy warunku
X = x, czyli lub krótko
.
METODY PROGNOZOWANIA Wykład3
2
)
(
x
X
Y
E
)
( X
Y
E
Wprowadzenie
W szczególności, gdy zmienne X i Y
są statystycznie niezależne,
wówczas warunkowa wartość
oczekiwana jest równa
wartości oczekiwanej E(Y).
Warunkową wartość oczekiwaną
nazywa się regresją zmiennej Y
względem zmiennej X.
METODY PROGNOZOWANIA Wykład3
3
)
(
x
X
Y
E
Wprowadzenie
Regresja to pewna funkcja, która
wartościom przyjmowanym przez
zmienną objaśniającą X w populacji
generalnej, przypisuje oczekiwane
wartości zmiennej objaśnianej Y i
stąd nazywana jest regresją w
populacji generalnej lub regresją
I rodzaju.
METODY PROGNOZOWANIA Wykład3
4
Wprowadzenie
Pełna informacja o populacji generalnej
zwykle nie jest dostępna i w konsekwencji
nie jest znana postać funkcyjna, ani też
wartości parametrów funkcji regresji I
rodzaju. Należy zatem wyciągnąć wnioski o
związkach zachodzących w populacji
generalnej na podstawie zaobserwowanych
zależności między wartościami zmiennych
X i Y w próbie statystycznej pobranej z
populacji generalnej.
METODY PROGNOZOWANIA Wykład3
5
Wprowadzenie
Regresja II rodzaju jest aproksymacją
regresji I rodzaju uzyskaną w oparciu o
dane statystyczne w próbie i stąd
nazywana jest także regresją
empiryczną lub regresją w próbie.
Jeżeli równanie regresji zależy od więcej
niż jednej zmiennej objaśniającej, to
mówi się wówczas o regresji
wielorakiej.
METODY PROGNOZOWANIA Wykład3
6
UWAGA
Empiryczna krzywa regresji, jako przybliżenie
nieznanej krzywej regresji I rodzaju, nie jest
wystarczającym narzędziem dla potrzeb
praktycznych zastosowań, gdyż konieczna jest
wiedza o analitycznej postaci i wartościach
parametrów regresji. Należy zatem
skonstruować tak zwany model regresji, który
wyjaśni w sposób analityczny kształtowanie
się wartości zmiennej losowej Y w zależności
od zmian wartości zmiennej X.
METODY PROGNOZOWANIA Wykład3
7
Wprowadzenie
Klasyczny model regresji liniowej jest
podstawowym modelem regresji, gdzie
zmienna losowa Y ma warunkowy rozkład
z wartością oczekiwaną oraz wariancją
Parametry tego modelu, czyli
współczynniki α, β oraz wariancja σ
2
są
nieznanymi wielkościami odnoszącymi się
do populacji generalnej i podlegają
estymacji na podstawie próby losowej.
METODY PROGNOZOWANIA Wykład3
8
x
x
X
Y
E
)
(
2
2
)
(
X
Y
D
Wprowadzenie
Rozważmy n – elementową próbę losową
,
z populacji dwuwymiarowej, stanowiącą
podstawę estymacji parametrów badanej
zależności, gdzie wartości ( )
zmiennej X są nielosowe. Kształtowanie się
wartości ( ) zmiennej losowej Y
można objaśnić za pomocą zależności:
gdzie są zmiennymi losowymi, dla których
spełnione są założenia:
METODY PROGNOZOWANIA Wykład3
9
)
,
(
1
1
y
x
)
,
(
2
2
y
x
)
,
(
n
n
y
x
n
i
,
,
2
,
1
i
x
i
y
n
i
,
,
2
,
1
i
i
i
x
X
Y
E
y
)
(
Wprowadzenie
METODY PROGNOZOWANIA Wykład3
10
0
)
(
E
i
2
2
2
)
(
E
)
(
D
i
i
j
i
j
i
j
i
dla
0
)
(
E
)
,
(
cov
Tak opisany model klasycznej regresji
liniowej nazywamy
jednorównaniowym liniowym
modelem ekonometrycznym i
opisujemy układem równań:
,
,
,
2
,
1
2
2
1
1
0
n
i
x
x
x
y
i
ik
k
i
i
i
Inny zapis postaci modelu to:
Gdzie:
METODY PROGNOZOWANIA Wykład3
11
,
1
1
1
3
2
2
23
22
1
13
12
nk
n
n
k
k
x
x
x
x
x
x
x
x
x
X
,
2
1
n
y
y
y
y
,
2
1
k
α
.
n
2
1
ε
ε
Xα
y
)
2
(
ZAŁOŻENIA KLASYCZNEJ METODY
NAJMNIEJSZYCH KWADRATÓW
•
postać modelu jest liniowa względem
parametrów (lub sprowadzalna do
liniowej;
•
zmienne objaśniające są wielkościami
nielosowymi;
•
zmienne są niezależne i wolne od
współliniowości (pomiędzy nimi nie
występuje dokładna zależność liniowa);
•
rz(X)=m<n (X – Macierz obserwacji
na zmiennych objaśniających)
METODY PROGNOZOWANIA Wykład3
12
ZAŁOŻENIA KLASYCZNEJ METODY NAJMNIEJSZYCH
KWADRATÓW
•
Składniki losowe dla wszystkich
obserwacji (składowe wektora składników
losowych) mają wartości oczekiwane
równe zero.
•
Składnik losowy dla każdej obserwacji
ma skończoną wariancję równą
natomiast kowariancje między różnymi
składnikami losowymi są równe zero.
•
Składnik losowy nie jest skorelowany
ze zmiennymi objaśniającymi.
METODY PROGNOZOWANIA Wykład3
13
KLASYCZNA METODA NAJMNIEJSZYCH
KWADRATÓW – Estymacja parametrów
modelu
Parametry liniowego modelu
ekonometrycznego szacuje się
wyznaczając minimum S:
W zapisie macierzowym modelu
Ocenę a wektora znajduje się poprzez
minimalizację funkcji:
po zróżniczkowaniu względem wektora a i
po rozwiązaniu równania, funkcja f osiąga
minimum w punkcie , przy
założeniu, że
METODY PROGNOZOWANIA Wykład3
14
n
i
ik
k
i
i
i
n
i
i
x
x
a
x
a
a
y
e
S
1
2
2
2
1
1
0
1
2
min
)
(
)
(
)
(
)
(
T
T
Xa
y
Xa
y
e
e
a
f
y
X
X
X
a
T
1
T
MNK
)
(
0
)
det(
X
X
T
Przykład 1
Ustalono, że zależność popytu na
cukier y
i
[średnia miesięczna w
roku w kg] od dochodu konsumenta
x
1i
[tys. zł. rocznie] oraz ceny 1 kg
cukru x
i2
[w zł.] jest liniowa.
Załóżmy, że dysponujemy próbą
złożoną z n (n=8) obserwacji (dane
umowne) zapisanych w postaci
macierzy X i wektora y
METODY PROGNOZOWANIA Wykład3
15
Przykład 1
Gdy w modelu liniowym ilość
parametrów strukturalnych k =3, to
macierze X
T
X i X
T
y są odpowiednio
postaci:
METODY PROGNOZOWANIA Wykład3
16
,
2
,
1
13
1
4
,
1
12
1
2
,
1
11
1
4
,
1
10
1
4
,
1
9
1
0
,
1
8
1
0
,
1
7
1
2
,
1
6
1
X
.
3
,
4
8
,
3
0
,
4
1
,
3
1
,
3
7
2
6
2
3
2
,
,
,
y
Przykład 1
Uwzględniając dane liczbowe
otrzymujemy:
METODY PROGNOZOWANIA Wykład3
17
n
i
i
n
i
i
i
n
i
i
n
i
i
i
n
i
i
n
i
i
n
i
i
n
i
i
x
x
x
x
x
x
x
x
x
x
n
1
2
3
1
3
2
1
3
1
3
2
1
2
2
1
2
1
3
1
2
T
X
X
n
i
i
i
n
i
i
i
n
i
i
x
y
x
y
y
1
3
1
2
1
T
y
X
2
,
12
4
,
94
8
,
9
4
,
94
0
,
764
0
,
76
8
,
9
0
,
76
0
,
8
T
X
X
02
,
32
00
,
258
90
,
25
T
y
X
Przykład 1
Obliczamy wyznacznik det(X
T
X)=52
i wyznaczamy macierz odwrotną
(X
T
X)
-1
,
Korzystając ze wzoru
mamy:
METODY PROGNOZOWANIA Wykład3
18
00
,
336
40
,
10
80
,
312
40
,
10
56
,
1
08
.
2
80
,
312
08
,
2
44
,
409
52
1
1
T
X
X
y
X
X
X
a
T
1
T
MNK
50
,
0
30
,
0
00
,
1
a
Przykład 1
Oszacowany model jest postaci:
METODY PROGNOZOWANIA Wykład3
19
2
1
50
,
0
30
,
0
00
,
1
ˆ
i
i
i
x
x
y
Weryfikacja wyników
estymacji modelu
ekonometrycznego
METODY PROGNOZOWANIA Wykład3
20
Weryfikacja merytoryczna
modelu
Weryfikacja merytoryczna
oszacowanego modelu obejmuje:
•
badanie zgodności znaków ocen
parametrów z wiedzą ekonomiczną o
badanym zjawisku,
•
interpretację ocen parametrów
modelu i ich analizę.
METODY PROGNOZOWANIA Wykład3
21
Weryfikacja merytoryczna
modelu
Jeśli analiza ekonometryczna dotyczy zjawiska, na
temat którego teoria nie dostarcza wiedzy, wówczas
weryfikację merytoryczną należy oprzeć na
obliczaniu i interpretacji współczynników korelacji
zmiennych w modelu.
Niech r
j
będzie współczynnikiem korelacji pomiędzy
zmienną objaśnianą y i zmienną objaśniającą X
j
(j=2,...,k).
Mówimy, że model jest koincydentny, jeżeli dla
każdej zmiennej objaśniającej X
j
modelu spełniony
jest warunek
sgn r
j
= sgn , j=2,...,k.
Model jest pozytywnie zweryfikowany pod względem
merytorycznym, gdy jest modelem koincydentnym
METODY PROGNOZOWANIA Wykład3
22
Weryfikacja merytoryczna
modelu
Po oszacowaniu parametrów model przyjmuje
postać:
Gdzie: wartości teoretyczne zmiennej objaśnianej
Y
•
Wartość oceny a
i
informuje o ile jednostek zmieni
się zmienne Y ,jeśli zmienna X
i
wzrośnie o jednostkę,
przy założeniu ,że wartości pozostałych zmiennych
się nie zmienią (założenie ceteris paribus).
•
Ocenę a
0
można interpretować jako wartość
zmiennej y gdy wszystkie zmienne X
j
(j=2,...,k)
jednocześnie przyjmą wartość równą zero, o ile taka
interpretacja ma sens ekonomiczny
METODY PROGNOZOWANIA Wykład3
23
ik
k
i
i
i
x
a
x
a
x
a
a
y
2
2
1
1
0
i
y
Przykład 1 cd
Interpretacja ocen parametrów.
Jeżeli dochód konsumenta wzrośnie o 1
jednostkę (o 1 tys. zł.), a cena cukru
będzie stała, to przewiduje się, że średni
miesięczny popyt w roku na cukier
wzrośnie o 0,30 kg.
Jeśli cena cukru wzrośnie o 1 zł., przy
stałych dochodach konsumenta, to średni
miesięczny popyt w roku na cukier
zmaleje o 0,50 kg.
METODY PROGNOZOWANIA Wykład3
24
2
1
50
,
0
30
,
0
00
,
1
ˆ
i
i
i
x
x
y
Weryfikacja merytoryczna
uwagi
•
Merytoryczna interpretacja ocen
parametrów strukturalnych modelu, które
są efektem estymacji, jest ściśle związana z
wykorzystaniem modelu do analiz
ekonomicznych i budowania prognoz. Stąd
ekonomiczną interpretację efektów
modelowania można podjąć tylko w
przypadku, gdy model pozytywnie przejdzie
wszechstronną weryfikację.
•
Oceny parametrów strukturalnych w
modelach linearyzowanych interpretuje się
zależnie od postaci modelu
METODY PROGNOZOWANIA Wykład3
25
Weryfikacja statystyczna parametrów
strukturalnych modelu
W ramach tej weryfikacji
przeprowadza się
•
analizę reszt modelu i
•
analizę błędów ocen
parametrów.
METODY PROGNOZOWANIA Wykład3
26
Analiza reszt modelu
•
Wariancja resztowa
Gdzie: n-liczba obserwacji, k-liczba
szacowanych parametrów w modelu
UWAGA
wariancja jest miara pomocniczą i
nie ma intepretacji
METODY PROGNOZOWANIA Wykład3
27
k
n
y
y
k
n
n
i
i
i
1
2
T
2
e
ˆ
S
e
e
Analiza reszt modelu
•
odchylenie standardowe reszt (średni
(standardowym) błąd szacunku modelu)
•
INTERPRETACJA:
przeciętnie biorąc wartości empiryczne
zmiennej objaśnianej y różnią się od
wartości teoretycznych tej zmiennej o
S
e
jednostek.
METODY PROGNOZOWANIA Wykład3
28
2
e
e
s
s
Uwaga
Średni błąd szacunku modelu S
e
,
jako wielkość mianowana, nie może
być stosowany do porównań dobroci
dopasowania do danych
empirycznych różnych równań.
METODY PROGNOZOWANIA Wykład3
29
Analiza reszt modelu
Współczynnik determinacji R
2
Współczynnik determinacji R
2
jest
wielkością niemianowaną i przyjmuje
wartości z przedziału <0,1>.
Dopasowanie modelu do danych
empirycznych jest tym lepsze, im
wartość R
2
jest bliższa jedności.
METODY PROGNOZOWANIA Wykład3
30
n
i
i
n
i
i
y
y
y
y
1
2
1
2
2
ˆ
R
Uwaga
Interpretacja współczynnika determinacji w
kontekście pojęć zmienności objaśnionej
i nieobjaśnionej ma sens tylko wtedy, gdy:
•
rzeczywista relacja miedzy zmienną
objaśnianą i zmiennymi objaśniającymi jest
liniowa,
•
do estymacji parametrów zastosowano
metodę najmniejszych kwadratów,
•
model ma wyraz wolny.
METODY PROGNOZOWANIA Wykład3
31
Analiza reszt
•
skorygowany współczynnik determinacji
Współczynnik ten służy do oceny, czy
wprowadzenie do modelu nowej zmiennej
poprawia stopień objaśnienia zmiennej y.
Porównując dwa modele, jako lepszy wybiera
się ten, dla którego skorygowany współczynnik
determinacji jest bliższy jedności.
METODY PROGNOZOWANIA Wykład3
32
k
n
n
n
y
y
k
n
e
n
i
i
n
i
i
1
R
1
1
1
1
R
2
1
2
1
2
2
k
s
Analiza błędów ocen
parametrów
Macierz wariancji i kowariancji ocen
parametrów modelu szacuje się na podstawie
wzoru:
W macierzy tej na głównej przekątnej znajdują
się wariancje ocen parametrów
Wielkości
Są standardowymi błędami szacunku
parametrów.
s(a
j
) informuje , o ile jednostek wartość oceny a
j
różni się od rzeczywistej wartości parametru
j
METODY PROGNOZOWANIA Wykład3
33
1
T
2
e
MNK
2
)
(
S
)
(
S
X
X
a
)
(
j
a
V
)
(
j
j
a
V
a
s
Przykład 2
Przykład 2
Przeprowadzić analizę reszt i analizę
błędów ocen parametrów modelu
oszacowanego w Przykładzie 1.
Analiza reszt modelu
Wyznaczamy wariancję resztową . W
tym celu, wykorzystując dane
statystyczne obliczamy
METODY PROGNOZOWANIA Wykład3
34
2
1
50
,
0
30
,
0
00
,
1
ˆ
i
i
i
x
x
y
2
S
e
8
1
2
T
49
,
87
i
i
y
y
y
Przykład 2
Oraz
wariancja resztowa jest równa:
METODY PROGNOZOWANIA Wykład3
35
29
,
87
02
,
32
00
.
258
90
.
25
50
,
0
30
,
0
00
,
1
T
T
y
X
a
20
,
0
29
,
87
49
,
87
T
T
T
T
y
X
a
y
y
e
e
04
,
0
3
8
20
,
0
k
-
n
S
T
2
e
e
e
Przykład 2
Średni błąd szacunku modelu przyjmuje
wartość:
INTERPRETACJA
Wartości empiryczne zmiennej y
[średniego miesięcznego popytu na cukier
w roku] różnią się od wartości
teoretycznych tej zmiennej o 0,2 kg .
METODY PROGNOZOWANIA Wykład3
36
2
,
0
04
,
0
S
S
2
e
e
Przykład 2
współczynnik determinacji R
2:
ponieważ zatem
stąd
Model objaśnia 94,5% danych
empirycznych
METODY PROGNOZOWANIA Wykład3
37
n
i
i
n
i
i
y
n
y
e
1
2
2
1
2
2
)
(
1
R
n
y
y
n
i
i
1
2375
,
3
8
90
,
25
y
945
,
0
6387
,
3
20
,
0
1
)
2375
,
3
(
8
49
,
87
20
,
0
1
R
2
2
Przykład 2
Macierz wariancji i kowariancji jest
postaci:
Stąd średnie błędy szacunku
parametrów modelu są
odpowiednio równe:
METODY PROGNOZOWANIA Wykład3
38
00
,
336
40
,
10
80
,
312
40
,
10
56
,
1
08
,
2
80
,
312
08
,
2
44
,
409
52
1
04
,
0
)
(
S
MNK
2
a
56
,
0
52
44
,
409
04
,
0
)
S(
0
a
03
,
0
52
56
,
1
04
,
0
)
S(
1
a
51
,
0
52
00
,
336
04
,
0
)
S(
2
a
Przedziały ufności dla szacowanych
parametrów – estymacja
przedziałowa
dla ustalonego współczynnika 1 – α i
liczby t
α,,n-k
odczytanej z tablic
rozkładu t-Studenta. Przedział
nazywa się przedziałem ufności,
zaś prawdopodobieństwo 1-α
poziomem ufności
(współczynnikiem ufności).
METODY PROGNOZOWANIA Wykład3
39
)
S(
),
S(
,
,
j
k
n
j
j
k
n
j
a
t
a
a
t
a
Przykład 3
Dla modelu postaci:
Wyznaczyć przedział ufności dla
parametrów modelu.
Odczytujemy z tablic rozkładu t
-Studenta liczbę t
α,, n-k
dla α = 0,05 i
n - k = 8-3=5 stopni swobody t
0,05,
5
=2,571 .
METODY PROGNOZOWANIA Wykład3
40
)
51
,
0
(
)
03
,
0
(
)
56
,
0
(
)
S(
50
,
0
30
,
0
00
,
1
ˆ
3
2
j
i
i
i
a
x
x
y
Przykład 3
Dla parametrów α
1
,α
2
, α
3
modelu otrzymujemy
Z 95% ufnością możemy na podstawie próby twierdzić,
że:
przedział (-0,43976; 2,43976) zawiera wartość
parametru α
1,
przedział (0,22287; 0,37713) zawiera wartość
parametru α
2
,
natomiast przedział (-1,81121; 0,81121) zawiera
wartość parametru α
3
.
METODY PROGNOZOWANIA Wykład3
41
56
,
0
571
,
2
00
,
1
56
,
0
571
.
2
00
,
1
1
03
,
0
571
,
2
30
,
0
03
,
0
571
,
2
30
,
0
2
51
,
0
571
,
2
50
,
0
51
,
0
571
,
2
50
,
0
3
Istotność zmiennych
objaśniających
W estymowanym liniowym modelu
ekonometrycznym występują zmienne
objaśniające X
j
(j=2,3,...,k), których
wpływ na zmienną objaśnianą y może
być statystycznie istotny, bądź nieistotny.
Klasyczny model regresji liniowej pozwala
na weryfikowanie hipotez o istotności
związków zachodzących pomiędzy
zmiennymi za pomocą testu istotności.
METODY PROGNOZOWANIA Wykład3
42
Istotność zmiennych
objaśniających
Zmienna X
j
jest istotną zmienną
objaśniającą wtedy, gdy zmiany
wartości x
ij
tej zmiennej istotnie
wpływają na zmiany wartości
zmiennej objaśnianej y. tj wtedy,
gdy .
METODY PROGNOZOWANIA Wykład3
43
0
j
Test t-studenta
Weryfikujemy hipotezy:
Ustalamy poziom istotności
Sprawdzianem hipotezy H
0
jest statystyka
która ma rozkład t –Studenta o n - k stopniach
swobody,
Z tablic rozkładu t –Studenta odczytujemy
(dla przyjętego poziomu istotności α i n – k
stopni swobody) wartość krytyczną t
kryt
= t
α, n-k
,
która wyznacza granice obszaru Z
kryt
, zwanego
zbiorem krytycznym lub obszarem odrzucenia
METODY PROGNOZOWANIA Wykład3
44
0
:
H
0
:
H
1
0
j
j
)
S(
a
)
t(
j
j
j
a
a
Test t-studenta
Obszar krytyczny ma postać
Jeżeli , to odrzucamy hipotezę H
0
,
na poziomie istotności α , na rzecz hipotezy
H
1
; parametr α
j
różni się od zera w sposób
statystycznie istotny; zmienna X
j
jest
istotna.
Jeżeli , to nie ma podstaw do
odrzucenia hipotezy H
0
; nie można
stwierdzić, że parametr α
j
jest statystycznie
istotnie różny od zera; zmienna X
j
jest
nieistotna.
METODY PROGNOZOWANIA Wykład3
45
,
,
Z
kryt
kryt
kryt
t
t
kryt
Z
t
j
a
kryt
Z
t
j
a
Test F
Często weryfikuje się także hipotezę
dotyczącą istotności wszystkich
zmiennych objaśniających w modelu (1).
Wówczas hipoteza H
0
jest bardziej
złożona. Zakłada się, że żadna ze
zmiennych objaśniających nie wywiera
istotnego wpływu na zmienną objaśniającą
y, natomiast hipoteza alternatywna H
1
głosi, że co najmniej jedna zmienna X
j
(j=2,3,...,k) jest istotna.
METODY PROGNOZOWANIA Wykład3
46
Test F
Zatem:
Sprawdzianem hipotezy H
0
jest
statystyka
METODY PROGNOZOWANIA Wykład3
47
0
...
0
0
:
H
3
2
O
k
0
...
0
0
:
H
3
2
1
k
)
R
1
)(
1
(
R
)
(
F
2
2
k
k
n
Test F
Statystykę testową odczytujemy z rozkładu
Fishera – Snedecora ( rozkład F) o stopniach
swobody r
1
=k-1 i r
=n-k.
n-liczba obserwacji, k-liczba szacowanych
parametrów
Zbiór krytyczny Z
kryt
jest prawostronny, czyli
jest zbiorem postaci , gdzie jest wartością
krytyczną odczytaną z tablic rozkładu F dla
ustalonego α i ilości stopni swobody r
1
, r
.
METODY PROGNOZOWANIA Wykład3
48
Test F
•
Jeżeli wartość statystyki F danej wzorem
należy do zbioru Z
kryt
, to odrzucamy hipotezę
H
0
na poziomie istotności α na korzyść
hipotezy alternatywnej H
1
i stwierdzamy, co
najmniej jeden z parametrów modelu istotnie
różni się od zera.
•
Gdy wartość statystyki F nie należy do
zbioru Z
kryt
, to nie ma podstaw do odrzucenia
hipotezy H
0
mówiącej, że wszystkie
parametry α
j
(j=2,3,...,k) modelu są równe
zeru.
METODY PROGNOZOWANIA Wykład3
49