Model 6: Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: Y1
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
4818,53 |
167,811 |
28,7140 |
<0,00001 |
*** |
time |
327,524 |
12,9424 |
25,3063 |
<0,00001 |
*** |
Z |
-2060,58 |
209,004 |
-9,8590 |
<0,00001 |
*** |
Średn.aryt.zm.zależnej |
7948,450 |
|
Odch.stand.zm.zależnej |
2489,454 |
Suma kwadratów reszt |
1167512 |
|
Błąd standardowy reszt |
262,0633 |
Wsp. determ. R-kwadrat |
0,990085 |
|
Skorygowany R-kwadrat |
0,988918 |
F(2, 17) |
848,7734 |
|
Wartość p dla testu F |
9,30e-18 |
Logarytm wiarygodności |
-138,1253 |
|
Kryt. inform. Akaike'a |
282,2506 |
Kryt. bayes. Schwarza |
285,2378 |
|
Kryt. Hannana-Quinna |
282,8337 |
Autokorel.reszt - rho1 |
0,112843 |
|
Stat. Durbina-Watsona |
1,531944 |
WYNIKI ESTYMACJI KMNK
Z kwartału na kwartał liczba transakcji na rachunkach biur maklerskich rośnie o 327,524 mln. Dla 1. 3 kwartałów 1993 roku liczb atranskacji na rach. Była niża o 2060mln. W 1992 roku w czwartym kwartale liczba transakcji na rachunkach biur maklerskich wyniosła 2753 mln (4818-2060).
a) WARIANCJA RESZTOWA
Su^2= 262,0633^2= 68677,1732
Wariancja resztowa nie posiada interpretacji.
b) ODCHYLENIE RESZTOWE
Średnio rzecz biorąc wartości empiryczne (rzeczywiste) liczby transakcji przeprowadzonych na rachunkach domów maklerskich odchylają się od wartości teoretycznych wyliczonych na podstawie modelu +/- 262,0633 mln.
c) WSPÓŁCZYNNIK ZMIENNOŚĆI PRZYPADKOWEJ
V= 262,0633/7948,450 * 100% = 3,3%
Odchylenie resztowe stanowi 3,3% średniej liczby transakcji przeprowadzonych na rachunkach domów maklerskich. Jest to mniej niż 10% (powszechnie stosowane), model jest dopuszczalny.
d) WSPÓŁCZYNNIK ZBIEŻNOŚCI
φ^2= 1-0,990085= 0,009915
0,99% zmian zmiennej endogenicznej (liczby transakcji przeprowadzonych na rachunkach domów maklerskich) nie można wyjaśnić zmianami zmiennych egzogenicznych (zmienną czasową, czyli kwartalnymi zmianami czasu oraz zmienną zerojedynkową).
e) WSPÓŁCZYNNIK DETERMINACJI
99% wariancji zmiennej endogenicznej (liczby transakcji przeprowadzonych na rachunkach domów maklerskich) można wyjaśnić zmiennymi egzogenicznymi (zmienną czasową, czyli kwartalnymi zmianami czasu oraz zmienną zerojedynkową).
f) SKORYGOWANY WSPÓŁCZYNNIK DETERMINACJI
Korygując o liczbę zmiennych objaśniających (zmiennej czasowej, czyli kwartalnej zmiany czasu) użytych w modelu można stwierdzić, że 98,89% wariancji zmiennej endogenicznej (liczby transakcji przeprowadzonych na rachunkach domów maklerskich) można wyjaśnić zmiennymi egzogenicznymi (zmienną czasową, czyli kwartalnymi zmianami czasu).
g) BŁĘDY SZACUNKU PARAMETRÓW
Gdybyśmy wielokrotnie szacowali nasz model, ale zawsze na podstawie 20 elementowej próby to: w przypadku pierwszego parametru mylilibyśmy się średnio +/- 12,9424, w przypadku drugiego parametru o 209,004 i w przypadku wyrazu wolnego o +/- 167,811.
Weryfikacja czy zmienna time oraz zerojedynkowa istotnie kształtują zmiany liczby transakcji przeprowadzonych na rachunkach domów maklerskich?
Ho: αj=0
H1: αj≠0
0,0001<0,05 więc zmienna czasowa (kwartalne zmiany czasu) wpływają istotnie na liczbę transakcji przeprowadzonych na rachunkach domów maklerskich, ponieważ
odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej, co oznacza, że parametr α1 statystycznie różni się od zera.
0,0001<0,05 więc zmienna zerojedynkowa wpływa istotnie na liczbę transakcji przeprowadzonych na rachunkach domów maklerskich, ponieważ
odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej, co oznacza, że parametr α1 statystycznie różni się od zera.
Weryfikacja czy współczynnik korelacji wielorakiej jest statystycznie istotny.
Ho: Rw=0
H1: Rw>0
9,30e-18<0,05
9,30e-18<0,05 więc wartość współczynnika korelacji wielorakiej statystycznie różni się od zera lub też przynajmniej jeden z parametrów strukturalnych jest statystycznie istotny, ponieważ hipotezę zerową odrzucamy na korzyść hipotezy alternatywnej.
Weryfikacja czy występuje autokorelacja stopnia pierwszego.
Ho: ρ=0
H1: ρ>0
du= 1,5367
dl= 1,1004
d= 1,531944
dl<d<du więc nie jesteśmy w stanie podjąć decyzji czy występuje autokorelacja czy nie.
Przyczyny autokorelacji:
-błędy specyfikacji równania (pominięcie ważnej zmiennej objaśniającej lub właściwego opóźnienia zmiennej objaśniającej, a w szególności zmiennej objaśnianej, niewłaściwa postać funkcyjna równania)
-naturalna skłonność czynników zakłócających zjawiska ekonomiczne do wywierania wpływu przez okres dłuższy niż okres, w jakim są mierzone wartości zmiennych
-„autonomiczna” autokorelacja zakłóceń, pojawiająca się bez ekonomicznie uzasadnionych przesłanek
Konsekwencje autokorelacji:
Estymatory metody najmniejszych kwadratów tracą niektóre spośród swoich pożądanych właściwości statystycznych. Mianowicie estymatory, mimo ze pozostają nieobciążone, nie są estymatorami o najmniejszej wariancji. Diagonalne elementy macierzy φ^2 (XTX)−1 nie doszacowują prawdziwej wariancji estymatorów metody najmniejszych kwadratów. Ponadto rozkłady t Studenta i F, używane do wnioskowania statystycznego w modelu regresji liniowej, tracą swoje uzasadnienie.
PRZEDZIAŁY UFNOŚCI DLA PARAMETRÓW MODELU
t(17, 0,025) = 2,110
Zmienna |
Współczynnik |
95 przedział ufności |
|
const |
4818,53 |
(4464,48, 5172,58) |
|
time |
327,524 |
(300,218, 354,830) |
|
Z |
-2060,58 |
(-2501,54, -1619,62) |
|
Z 95% prawdopodobieństwem przedział o końcach (300,218;354,830) pokryje nieznaną, szacowaną wartość parametru α1.
Z 95% prawdopodobieństwem przedział o końcach (-2501,54;-1619,62) pokryje nieznaną, szacowaną wartość parametru α2.
Z 95% prawdopodobieństwem przedział o końcach (4464,48;5172,58) pokryje nieznaną, szacowaną wartość parametru α0.
TEST WHITE'A NA JEDNORODNOŚĆ WARIANCJI SKŁADNIKA LOSOWEGO
Test White'a na heteroskedastyczność reszt (zmienność wariancji resztowej)
Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: uhat^2
współczynnik błąd standardowy t-Studenta wartość p
---------------------------------------------------------------
const 41986,0 81078,8 0,5178 0,6121
time 2611,10 14911,0 0,1751 0,8633
Z 335761 114187 2,940 0,0101 **
sq_time -175,415 611,289 -0,2870 0,7781
X2_X3 -120730 40063,1 -3,014 0,0087 ***
Wsp. determ. R-kwadrat = 0,551491
Statystyka testu: TR^2 = 11,029822,
z wartością p = P(Chi-kwadrat(4) > 11,029822) = 0,026231
Ho: αk=0
H1: αk≠0
0,026231<0,05 więc wariancja jest niejednorodna, ponieważ odrzucamy hipotezę zerową na rzecz hipotezy alternatywnej.
Można zastosować KMNK, ale estymator nie jest najefektywniejszy.
TEST GOLDFELDA-QUANDTA NA JEDNORODNOŚĆ WARIANCJI SKŁADNIKA LOSOWEGO
Model 7: Estymacja KMNK, wykorzystane obserwacje 1993:1-1994:4 (N = 8)
Zmienna zależna: Y1
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
4866,8 |
588,309 |
8,2725 |
0,00042 |
*** |
time |
342,833 |
94,9379 |
3,6111 |
0,01536 |
** |
Z |
-2139,47 |
449,328 |
-4,7615 |
0,00505 |
*** |
Średn.aryt.zm.zależnej |
5607,250 |
|
Odch.stand.zm.zależnej |
1892,162 |
Suma kwadratów reszt |
540792,5 |
|
Błąd standardowy reszt |
328,8746 |
Wsp. determ. R-kwadrat |
0,978422 |
|
Skorygowany R-kwadrat |
0,969790 |
F(2, 5) |
113,3574 |
|
Wartość p dla testu F |
0,000068 |
Logarytm wiarygodności |
-55,83691 |
|
Kryt. inform. Akaike'a |
117,6738 |
Kryt. bayes. Schwarza |
117,9121 |
|
Kryt. Hannana-Quinna |
116,0664 |
Autokorel.reszt - rho1 |
-0,213541 |
|
Stat. Durbina-Watsona |
1,745992 |
Model 8: Estymacja KMNK, wykorzystane obserwacje 1996:1-1997:4 (N = 8)
Zmienna zależna: Y1
|
Współczynnik |
Błąd stand. |
t-Studenta |
wartość p |
|
const |
4339,57 |
461,904 |
9,3950 |
0,00008 |
*** |
time |
358,488 |
27,7281 |
12,9287 |
0,00001 |
*** |
Średn.aryt.zm.zależnej |
10254,63 |
|
Odch.stand.zm.zależnej |
893,7342 |
Suma kwadratów reszt |
193749,9 |
|
Błąd standardowy reszt |
179,6988 |
Wsp. determ. R-kwadrat |
0,965348 |
|
Skorygowany R-kwadrat |
0,959573 |
F(1, 6) |
167,1509 |
|
Wartość p dla testu F |
0,000013 |
Logarytm wiarygodności |
-51,73104 |
|
Kryt. inform. Akaike'a |
107,4621 |
Kryt. bayes. Schwarza |
107,6210 |
|
Kryt. Hannana-Quinna |
106,3905 |
Autokorel.reszt - rho1 |
-0,519808 |
|
Stat. Durbina-Watsona |
3,019544 |
Ho: σ1^2=σ2^2
H1: σ1^2<σ2^2
Su1^2=328,8746^2= 108158,50252516
Su2^2=179,6988^2= 32291,65872144
F= Su1^2 / Su2^2 =3,3494
F(5, 5): prawostronny obszar krytyczny dla 3,3494 = 0,105345
(lewostronny obszar krytyczny: 0,894655)
0,105345>0,05 więc wariancja jest jednorodna, co oznacza że wariancje z podrób istotnie nie różnią się od siebie, ponieważ nie ma podstaw do odrzucenia hipotezy zerowej.
Można zastosować KMNK, ale estymator nie jest najefektywniejszy.
NORMALNOŚĆ ROZKŁADU SKŁADNIKA LOSOWEGO
Rozkład częstości dla uhat9, obserwacje 1-20
liczba przedziałów = 7, średnia = -2,50111e-013, odch.std. = 262,063
Przedziały średnia liczba częstość skumlowana
< -448,66 -524,48 1 5,00% 5,00% *
-448,66 - -297,03 -372,84 2 10,00% 15,00% ***
-297,03 - -145,39 -221,21 2 10,00% 25,00% ***
-145,39 - 6,2401 -69,576 5 25,00% 50,00% ********
6,2401 - 157,87 82,057 4 20,00% 70,00% *******
157,87 - 309,51 233,69 3 15,00% 85,00% *****
>= 309,51 385,32 3 15,00% 100,00% *****
Hipoteza zerowa: dystrybuanta empiryczna posiada rozkład normalny. Test Doornika-Hansena (1994)- transformowana skośność i kurtoza:
Chi-kwadrat(2) = 0,381 z wartością p 0,82653
0,82653>0,05 więc dystrybuanta empiryczna ma rozkładu normalny, ponieważ nie ma podstaw do odrzucenia hipotezy zerowej.
Skutki: zarówno oszacowania parametrów jak i wnioski co do jakości modelu szacowanego KMNK oparte o wartości R^2, statystyki F oraz statystki t mogą być fałszywe.
LINIOWOŚĆ
Ho: αk=0
H1:αk≠0
Kwadraty
Pomocnicze równanie regresji dla testu nieliniowści (kwadraty zmiennych)
Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: uhat
współczynnik błąd standardowy t-Studenta wartość p
---------------------------------------------------------------
const 438,022 368,075 1,190 0,2514
time -88,1078 67,4666 -1,306 0,2100
Z -279,008 292,971 -0,9523 0,3551
sq_time 3,68614 2,77244 1,330 0,2023
Wsp. determ. R-kwadrat = 0,099492
Statystyka testu: TR^2 = 1,98983,
z wartością p = prob(Chi-kwadrat(1) > 1,98983) = 0,158358
0,158358<>0,05 więc model ma postać liniową, ponieważ nie ma podstaw do odrzucenia hipotezy zerowej.
Logarytmy
Liczba obserwacji (3) jest mniejsza od liczby parametrów (4)
Test specyfikacji RAMSEY RESET
Pomocnicze równanie regresji dla testu specyfikacji RESET
Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: Y1
współczynnik błąd standardowy t-Studenta wartość p
------------------------------------------------------------------
const 12091,1 2759,54 4,382 0,0005 ***
time 1303,05 419,490 3,106 0,0072 ***
Z -7300,11 2019,09 -3,616 0,0025 ***
yhat^2 -0,000398885 0,000155362 -2,567 0,0214 **
yhat^3 1,70632e-08 6,25244e-09 2,729 0,0155 **
Statystyka testu: F = 4,238798,
z wartością p = P(F(2,15) > 4,2388) = 0,0347
0,0347<0,05 więc model nie ma postaci liniowej, ponieważ odrzucamy hipotezę na rzecz hipotezy alternatywnej.
Oznacza to, że nie słusznie przyjęliśmy postać liniową.
OBSERWACJE WPŁYWOWE
reszty leverage influence DFFITS
u 0<=h<=1 u*h/(1-h)
1993:1 -524,48 0,336* -265,13 -2,109
1993:2 331 0,333* 165,5 1,145
1993:3 193,48 0,336* 97,803 0,640
1993:4 165,37 0,215 45,272 0,367
1994:1 123,85 0,178 26,88 0,238
1994:2 385,32 0,147 66,207 0,694
1994:3 131,8 0,120 17,938 0,194
1994:4 -105,73 0,098 -11,467 -0,136
1995:1 -360,25 0,081 -31,656 -0,440
1995:2 -74,775 0,069 -5,5056 -0,078
1995:3 -339,3 0,061 -22,143 -0,350
1995:4 -181,82 0,059 -11,364 -0,176
1996:1 -49,348 0,061 -3,2205 -0,048
1996:2 -164,87 0,069 -12,139 -0,174
1996:3 187,6 0,081 16,485 0,218
1996:4 -93,921 0,098 -10,187 -0,121
1997:1 -139,45 0,120 -18,979 -0,205
1997:2 370,03 0,147 63,579 0,662
1997:3 44,506 0,178 9,6596 0,085
1997:4 100,98 0,215 27,644 0,222
'*' oznacza dźwigniową obserwację (leverage point), h(i)>2(k+1)/n
2*(2+1)/20 = 6/20 = 0,3
h>0,3 więc obserwacje wpływowe występują w roku 1993 w kwartale pierwszym, w 1993 w kwartale drugim oraz w 1993 w kwartale trzecim. Oznacza to, że zmieniają wartość parametrów.
OBSERWACJE NIETYPOWE
Zakres estymowanego modelu: 1993:1 - 1997:4
Błąd standardowy reszt = 262,063
|
Y1 |
wyrównane |
reszty |
|
1993:1 |
2561,00 |
3085,48 |
-524,476 |
|
1993:2 |
3744,00 |
3413,00 |
331,000 |
|
1993:3 |
3934,00 |
3740,52 |
193,476 |
|
1993:4 |
6294,00 |
6128,63 |
165,372 |
|
1994:1 |
6580,00 |
6456,15 |
123,847 |
|
1994:2 |
7169,00 |
6783,68 |
385,323 |
|
1994:3 |
7243,00 |
7111,20 |
131,798 |
|
1994:4 |
7333,00 |
7438,73 |
-105,726 |
|
1995:1 |
7406,00 |
7766,25 |
-360,250 |
|
1995:2 |
8019,00 |
8093,77 |
-74,7747 |
|
1995:3 |
8082,00 |
8421,30 |
-339,299 |
|
1995:4 |
8567,00 |
8748,82 |
-181,824 |
|
1996:1 |
9027,00 |
9076,35 |
-49,3479 |
|
1996:2 |
9239,00 |
9403,87 |
-164,872 |
|
1996:3 |
9919,00 |
9731,40 |
187,603 |
|
1996:4 |
9965,00 |
10058,9 |
-93,9211 |
|
1997:1 |
10247,0 |
10386,4 |
-139,445 |
|
1997:2 |
11084,0 |
10714,0 |
370,030 |
|
1997:3 |
11086,0 |
11041,5 |
44,5057 |
|
1997:4 |
11470,0 |
11369,0 |
100,981 |
|
2,5*262,063= 655,1575
|ui|>49611,771169 więc nie występują obserwacje nietypowe.
WSPÓŁLINIOWOŚĆ
Ocena współliniowości VIF - czynnika powiększania wariancji
Minimalna możliwa wartość = 1.0
Wartości > 10.0 mogą wskazywać na problem współliniowości-rozdęcia wariancji
time 1,622
Z 1,622
VIF(j) = 1/(1 - R(j)^2), gdzie R(j) jest współczynnikiem korelacji wielorakiej
pomiędzy zmienną 'j' a pozostałymi zmiennymi niezależnymi modelu.
Własności macierzy X'X:
1-norm = 3086
Wyznacznik = 20910
Wskażnik uwarunkowania macierzy CN = 0,00032021557
1,622<10 więc nie ma oznak współliniowości. Oznacza to, że zmienne objaśniające (zmienna czasowa oraz zmienna zerojedynkowa) nie zakłócają jakości modelu.
TEST STABILNOŚCI PARAMETRÓW CHOWA
Ho: α1=α2=α
H1: α1≠α2≠α
Rok rozdzielenia próby to 1994:3
Pomocnicze równanie regresji dla testu Chowa
Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: Y1
współczynnik błąd standardowy t-Studenta wartość p
---------------------------------------------------------------
const 3871,00 539,158 7,180 3,18e-06 ***
time 562,000 105,066 5,349 8,11e-05 ***
Z -1582,00 358,869 -4,408 0,0005 ***
splitdum 614,769 573,775 1,071 0,3009
sd_time -213,396 105,986 -2,013 0,0624 *
Średn.aryt.zm.zależnej 7948,450 Odch.stand.zm.zależnej 2489,454
Suma kwadratów reszt 662333,8 Błąd standardowy reszt 210,1323
Wsp. determ. R-kwadrat 0,994375 Skorygowany R-kwadrat 0,992875
F(4, 15) 662,9278 Wartość p dla testu F 1,13e-16
Logarytm wiarygodności -132,4567 Kryt. inform. Akaike'a 274,9134
Kryt. bayes. Schwarza 279,8921 Kryt. Hannana-Quinna 275,8853
Autokorel.reszt - rho1 -0,354716 Stat. Durbina-Watsona 2,582075
Test Chowa na zmiany strukturalne przy podziale próby w obserwacji 1994:3
F(2, 15) = 5,72043 z wartością p 0,0142
0, 0142<0,05 więc więc hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej. Oznacza to, że parametry nie charakteryzują się stabilnością i nastąpiła zamiana w ich wartościach.
Rok rozdzielenia próby to 1996:4
Pomocnicze równanie regresji dla testu Chowa
Estymacja KMNK, wykorzystane obserwacje 1993:1-1997:4 (N = 20)
Zmienna zależna: Y1
współczynnik błąd standardowy t-Studenta wartość p
---------------------------------------------------------------
const 4974,09 208,476 23,86 2,41e-013 ***
time 309,076 19,5124 15,84 8,97e-011 ***
Z -2179,24 230,450 -9,456 1,04e-07 ***
splitdum -793,685 2203,68 -0,3602 0,7237
sd_time 58,0239 119,965 0,4837 0,6356
Średn.aryt.zm.zależnej 7948,450 Odch.stand.zm.zależnej 2489,454
Suma kwadratów reszt 1050821 Błąd standardowy reszt 264,6786
Wsp. determ. R-kwadrat 0,991076 Skorygowany R-kwadrat 0,988696
F(4, 15) 416,4578 Wartość p dla testu F 3,59e-15
Logarytm wiarygodności -137,0723 Kryt. inform. Akaike'a 284,1445
Kryt. bayes. Schwarza 289,1232 Kryt. Hannana-Quinna 285,1164
Autokorel.reszt - rho1 -0,025619 Stat. Durbina-Watsona 1,767981
Test Chowa na zmiany strukturalne przy podziale próby w obserwacji 1997:1
F(2, 15) = 0,832851 z wartością p 0,4539
0,4539>0,05 więc nie ma podstaw do odrzucenia hipotezy zerowej. Oznacza to, że parametry charakteryzują się stabilnością i nie nastąpiła zamiana w ich wartościach.