przykład szacowania modelu liniowego z dwiema zmiennymi objaśniającymi
dane do zadania
Oszacować KMNK parametry następującego modelu:
gdzie:
y - podaż pieniądza M2 [mld zł],
x1 - stopa dyskontowa banku centralnego,
x2 - Produkt Krajowy Brutto [mld zł].
Ponadto:
Zinterpretuj wpływ zmiennych objaśniających na zmienną objaśnianą.
Oblicz miary dopasowania modelu i zinterpretuj je.
Oszacuj średnie błędy ocen parametrów modelu.
Oceń istotność zmiennych objaśniających i wykonaj estymację przedziałową parametrów strukturalnych modelu.
Oceń istotność autokorelacji składnika losowego pierwszego rzędu testem DW.
Dane do zadania przedstawia poniższa tabela.
okres |
yt |
x1t |
x2t |
1 |
23 |
9,5 |
4,5 |
2 |
25 |
9,25 |
5,1 |
3 |
27 |
9,25 |
5,7 |
4 |
28 |
8,75 |
5,8 |
5 |
32 |
8 |
6,1 |
6 |
35 |
7,25 |
7 |
7 |
40 |
6 |
8,4 |
szacowanie parametrów strukturalnych modelu
Estymator KMNK dla potrzeb naszego zadania zapiszemy w postaci:
Konstruując macierz XTX zauważmy, że w modelu występują trzy parametry, co determinuje wymiary tej macierzy. Posługując się schematem konstrukcyjnym tej macierzy zapiszemy, że:
Natomiast macierz XTy przyjmie postać:
Posługując się poniższa tabelą wyznaczymy wielkości występujące w macierzach:
okres |
yt |
x1t |
x2t |
x1tx2t |
ytx1t |
ytx2t |
x1t2 |
x2t2 |
1 |
23 |
9,5 |
4,5 |
42,75 |
218,5 |
103,5 |
90,25 |
20,25 |
2 |
25 |
9,25 |
5,1 |
47,175 |
231,25 |
127,5 |
85,5625 |
26,01 |
3 |
27 |
9,25 |
5,7 |
52,725 |
249,75 |
153,9 |
85,5625 |
32,49 |
4 |
28 |
8,75 |
5,8 |
50,75 |
245 |
162,4 |
76,5625 |
33,64 |
5 |
32 |
8 |
6,1 |
48,8 |
256 |
195,2 |
64 |
37,21 |
6 |
35 |
7,25 |
7 |
50,75 |
253,75 |
245 |
52,5625 |
49 |
7 |
40 |
6 |
8,4 |
50,4 |
240 |
336 |
36 |
70,56 |
suma |
210 |
58 |
42,6 |
343,35 |
1694,25 |
1323,5 |
490,5 |
269,16 |
Możemy zatem zapisać interesujące nas macierze następująco:
Macierz XTX należy odwrócić, zgodnie z formułą:
Dopełnienia algebraiczne elementów macierzy XTX, które wchodzą w skład macierzy (XTX)D obliczamy następująco:
gdzie:
|Cij| - dopełnienie algebraiczne elementu macierzy XTX dla i-tego wiersza i j-tej kolumny,
|Mij| - minor elementu dla i-tego wiersza i j-tej kolumny,
i - numer wiersza,
j - numer kolumny.
Stąd np. dla elementu 7 (wiersz 1, kolumna 1) z macierzy (XTX) dopełnienie jest następujące:
Podobnie obliczamy dopełnienia dla pozostałych elementów i otrzymujemy macierz:
Następnie obliczamy wyznacznik macierzy XTX:
Stąd ostatecznie otrzymujemy macierz odwrotną:
Możemy zatem obliczyć oceny parametrów strukturalnych modelu:
Mając szacunki punktowe parametrów zapiszemy model w postaci teoretycznej:
interpretacja modelu
Na podstawie przedstawionego modelu możemy dokonać oceny wpływu zmiennych objaśniających (stopy dyskontowej oraz PKB) na wielkość podaży pieniądza:
Ceteris paribus, wzrost stopy dyskontowej o 1 punkt procentowy powodował w badanym okresie spadek podaży pieniądza średnio o 2,677 mld złotych (spadek stopy dyskontowej o 1 punkt procentowy powodował w badanym okresie wzrost podaży pieniądza średnio o 2,677 mld złotych),
Ceteris paribus, wzrost PKB o 1 mld złotych powodował w badanym okresie wzrost podaży pieniądza średnio o 1,993 mld złotych (spadek PKB o 1 mld złotych powodował w badanym okresie spadek podaży pieniądza średnio o 1,993 mld ).
reprezentacja graficzna uzyskanych wyników
Jeżeli obliczymy na podstawie powyższego modelu teoretyczne wartości zmiennej y to otrzymamy wartości
, jak przedstawiono w tabeli:
okres |
yt |
|
1 |
23 |
23,58968 |
2 |
25 |
25,45451 |
3 |
27 |
26,65012 |
4 |
28 |
28,18783 |
5 |
32 |
30,79329 |
6 |
35 |
34,59436 |
7 |
40 |
40,73021 |
Na podstawie tych danych możemy wykonać wykres przedstawiający dopasowanie danych teoretycznych zmiennej objaśnianej do danych rzeczywistych.
Jak widać dopasowanie punktów teoretycznych do rzeczywistych jest dość dobre. Aby ocenić dopasowanie bardziej precyzyjnie obliczamy statystyczne miary dopasowania:
miary dopasowania
1. Współczynnik zbieżności
Dane do powyższej formuły obliczamy w tabeli (średnia arytmetyczna
):
okres |
|
|
1 |
529 |
49 |
2 |
625 |
25 |
3 |
729 |
9 |
4 |
784 |
4 |
5 |
1024 |
4 |
6 |
1225 |
25 |
7 |
1600 |
100 |
suma |
6516 |
216 |
Interpretując współczynnik zbieżności powiemy, że 1,32 % całkowitej zmienności podaży pieniądza nie zostało wyjaśnione przez model, czyli przez zmienność stopy dyskontowej x1 oraz zmienność PKB x2.
2. Współczynnik determinacji
Współczynnik ten obliczymy korzystając ze wzoru:
Powiemy, że 98,68 % całkowitej zmienności podaży pieniądza zostało wyjaśnione przez model, czyli przez zmienność stopy dyskontowej oraz PKB.
Dodatkowo możnby było obliczyć tzw. skorygowany współczynnik determinacji, który jest dokładniejszą miarą wyjaśnionej części całkowitej wariancji zmiennej objaśnianej
, ale pominiemy te obliczenia.
3. Wariancja reszt modelu
4. Na postawie wariancji wyznaczamy średni błąd resztowy:
mld zł.
Wartość średniego błędu reszt wskazuje, że wartości teoretyczne
różnią się od wartości rzeczywistych yt średnio o 0,8471 mld zł.
Ponieważ błąd średni regresji jest miarą bezwzględną można dodatkowo obliczyć miernik pozwalający porównać go z wartościami zmiennej objaśnianej y. Na tej podstawie obliczamy współczynnik zmienności losowej:
Powyższa wartość oznacza, że reszty modelu stanowią przeciętnie około 2,82% wartości zmiennej objaśnianej y.
Średnie błędy ocen parametrów strukturalnych modelu
Aby oszacować średnie błędy ocen parametrów naszego modelu należy znać szacunki wariancji ocen parametrów. Dlatego należy wyznaczyć realizację macierzy wariancji-kowariancji ocen parametrów.
Pierwiastki elementów leżących na głównej przekątnej powyższej macierzy to właśnie średnie błędy ocen parametrów, a zatem:
Wobec tego możemy zapisać model w postaci uwzględniającej obliczone odchylenia standardowe ocen parametrów:
test istotności zmiennych objaśniających
Zakładając, że składnik losowy spełnia własności normalności rozkładu, stałości wariancji oraz braku istotnej autokorelacji możemy wykonać ocenę istotności zmiennych objaśniających modelu za pomocą testu t-Studenta.
Dla parametru b1 stawiamy zestaw hipotez: H0: b1 = 0, HA: b1 ≠ 0.
Dla parametru b2 stawiamy zestaw hipotez: H0: b2 = 0, HA: b2 ≠ 0.
Obliczmy statystyki próbkowe dla parametrów b1 oraz b2:
Przy założeniu prawdziwości hipotez zerowych powyższe statystyki mają rozkłady t-Studenta o n-(k+1) stopniach swobody, wobec tego, przy założonym poziomie istotności dla testu dwustronnego (α = 0,1), znajdujemy w tablicach statystycznych wartość krytyczną rozkładu t:
Porównując statystyki próbkowe z wartością krytyczną otrzymujemy:
zatem odrzucamy hipotezę H0 na korzyść hipotezy HA, czyli stwierdzamy, że parametr b1 istotnie różni się od 0, co oznacza, że zmienna x1 (stopa dyskontowa banku) istotnie wpływała w badanym okresie na podaż pieniądza,
zatem nie ma podstaw do odrzucenia H0, czyli uznajemy parametr b1 za nieistotnie różny od 0, co oznacza, że zmienna x2 (Produkt Krajowy Brutto) nieistotnie wpływała w badanym okresie na podaż pieniądza.
W takim wypadku należałoby usunąć zmienną x2 z modelu i dokonać ponownego oszacowania modelu tylko z jednym regresorem, czyli ze zmienną objaśniającą x1.
przedziały ufności parametrów strukturalnych
Estymacja punktowa pozwoliła dla warunków naszego zadania znaleźć liczbowe oceny parametrów modelu
(wartości oczekiwane tych estymatorów). Ponieważ, przy spełnieniu założeń regresji liniowej dla wielu zmiennych objaśniających, estymatory te mają rozkłady normalne to możemy także znaleźć ich charakterystyki przedziałowe. W tym celu skonstruujemy tzw. przedziały ufności dla parametrów analizowanego modelu, przy założonym poziomie ufności.
Załóżmy, że poziom ufności 1-α = 0,9, a zatem konstrukcja przedziału ufności dla parametru bi będzie następująca:
Stąd:
Powiemy zatem, że z prawdopodobieństwem 0,9 parametr b0 przyjmie wartość z przedziału między 6,37335, a 73,73256.
Nie jest to (w kontekście rachunku prawdopodobieństwa) całkowicie ścisła interpretacja wyniku, ale dla potrzeb naszego zadania zupełnie wystarczająca. Pamiętać też należy, że założone prawdopodobieństwo 0,9 nie rozkłada się równomiernie na całym przedziale ufności.
Powiemy zatem, że z prawdopodobieństwem 0,9 parametr b1 przyjmie wartość z przedziału między -5,03624, a -0,31752.
Powiemy zatem, że z prawdopodobieństwem 0,9 parametr b2 przyjmie wartość z przedziału między -0,36904, a 4,35440.
test istotności współczynnika determinacji
Posługując się uogólnionym testem Walda możemy z kolei zbadać istotność statystyczną współczynnika determinacji R2. Hipotezy w tym teście postawimy następująco:
H0: współczynnik determinacji nieistotnie różni się od 0,
HA: współczynnik determinacji istotnie różni się od 0.
Obliczmy statystykę próbkową o postaci:
Powyższa statystyka, przy założeniu prawdziwości hipotezy zerowej, ma rozkład F Fishera-Snedecora. Dlatego wartość F należy porównać ze znalezioną w tablicach statystycznych wartością krytyczną rozkładu F dla przyjętego poziomu istotności.
Zakładając poziom istotności α = 0,05 i mając stopnie swobody licznika k, oraz stopnie swobody mianownika n-(k+1) odczytujemy wartość następującą:
Ponieważ zachodzi zależność
to odrzucamy hipotezę zerową i stwierdzamy, że współczynnik determinacji R2 jest istotny statystycznie, czyli pokazuje faktyczną część całkowitej wariancji zmiennej y, która została objaśniona przez model.
test istotności autokorelacji składnika losowego
Aby ocenić istotność współczynnika autokorelacji rzędu I-ego wykonamy test Durbina-Watsona.
Stawiamy następujący zestaw hipotez:
H0: współczynnik autokorelacji ρ1 nieistotnie różni się od 0,
HA: współczynnik autokorelacji ρ1 istotnie różni się od 0.
Statystyka próbkowa testu zostanie policzona na podstawie wzoru:
Na podstawie oszacowanego modelu obliczamy wartości teoretyczne
, a następnie reszty modelu
.
okres |
yt |
|
|
|
|
|
1 |
23 |
23,5897 |
-0,58968 |
- |
- |
0,34772 |
2 |
25 |
25,4545 |
-0,45451 |
-0,58968 |
0,01827 |
0,20658 |
3 |
27 |
26,6501 |
0,34988 |
-0,45451 |
0,64704 |
0,12242 |
4 |
28 |
28,1878 |
-0,18783 |
0,34988 |
0,28913 |
0,03528 |
5 |
32 |
30,7933 |
1,20671 |
-0,18783 |
1,94474 |
1,45614 |
6 |
35 |
34,5944 |
0,40564 |
1,20671 |
0,64171 |
0,16454 |
7 |
40 |
40,7302 |
-0,73021 |
0,40564 |
1,29016 |
0,53321 |
|
|
|
|
suma |
4,83106 |
2,8659 |
Zatem statystyka DW wynosi:
Ponieważ statystyka DW < 2 to zakładamy badanie istotności autokorelacji dodatniej. Odnajdujemy w tablicach statystycznych wartości krytyczne rozkładu DW dla ustalonego poziomu istotności (α = 0,05) oraz stopni swobody n = 7 i k = 2:
dL = 0,467; dU = 1,897.
Ponieważ zachodzi zależność: dL < DW < dU to test Durbin-Watsona nie rozstrzyga o odrzuceniu lub nieodrzuceniu hipotezy H0 (test jest niekonkluzywny). W takim przypadku można posłużyć się innymi testeami na istotność autokorelacji, pamiętając o ograniczeniach tych testów i konieczności spełnienia odpowiednich założeń.
Mając obliczoną wartość DW możemy oszacować współczynnik autokorelacji I-ego rzędu
Ponieważ wartość współczynnika autokorelacji dodatniej może mieścić się w przedziale
to możemy uznać oszacowany współczynnik autokorelacji za niewielki.
szacowanie parametrów modelu po usunięciu nieistotnej zmiennej
Stwierdziliśmy poprzednio ,że zmienna objaśniająca x2 nieistotnie wpływa na zmienną y. Wobec tego usuniemy ją z modelu i oszacujemy postać zredukowaną:
Aby nie wykonywać obliczeń na piechotę posłużymy się programem komputerowym. Wyniki szacowania przedstawiono poniżej.
Ordinary Least Squares Estimation
*******************************************************************************
Dependent variable is Y
6 observations used for estimation from 1 to 6
*******************************************************************************
Regressor Coefficient Standard Error T-Ratio[Prob]
C 71.4783 4.6259 15.4519[.000]
X1 -4.9783 .53150 -9.3665[.001]
*******************************************************************************
R-Squared .95639 R-Bar-Squared .94549
S.E. of Regression 1.0406 F-stat. F( 1, 4) 87.7307[.001]
Mean of Dependent Variable 28.3333 S.D. of Dependent Variable 4.4572
Residual Sum of Squares 4.3315 Equation Log-likelihood -7.5361
Akaike Info. Criterion -9.5361 Schwarz Bayesian Criterion -9.3279
DW-statistic 1.7078
*******************************************************************************
Na podstawie uzyskanych wyników możemy zapisać nasz model w postaci teoretycznej:
Interpretując uzyskany model powiemy, że: ceteris paribus, wzrost stopy redyskontowej x1 o jeden punkt procentowy powodował spadek podaży pieniądza średnio o 4,9783 mld zł.
Współczynnik determinacji R2 wynosi 0,9564, co oznacza, że 95,64 procenta całkowitej zmienności zmiennej y zostało wyjaśnione przez model, czyli przez zmienność stopy redyskontowej x1.
Na tej podstawie można obliczyć współczynnik zbieżności, który przyjmuje wartość
. Powiemy zatem, że 4,36 procenta całkowitej wariancji zmiennej y nie zostało wyjaśnione przez model.
Średni błąd resztowy
, a więc powiemy, że wartości teoretyczne podaży pieniądza
odchylają się od wartości rzeczywistych yt średnio o 1,0406 mld zł.
Aby pokazać, czy odchylenie to jest duże, można policzyć współczynnik zmienności losowej v.
Statystyka DW = 1,7078. Jest to wartość mniejsza od 2, zatem zestaw hipotez dla tego przypadku postawimy następująco:
Znajdujemy w tablicach statystycznych wartości krytyczne rozkładu DW na poziomie istotności α = 0,05 i porównując te wartości ze statystyką DW podejmujemy decyzję dotyczącą odrzucenia lub nieodrzucenia hipotezy zerowej H0.
Mając wartość DW oszacujemy współczynnik autokorelacji I-ego rzędu:
Ponieważ wartość ta jest niewiele większa od 0 możemy powiedzieć, że siła autokorelacji jest w przypadku naszego zadania znikoma.
Czytelnikowi pozostawiam do samodzielnego zbadania istotność zmiennej objaśniającej (test t-Studenta), istotność współczynnika determinacji (test Walda) i dokończenie testu na istotność współczynnika autokorelacji rzędu I-ego (test Durbina-Watsona).
13