Ekonometria - ćwiczenia I.
Zadanie 1. Niech Yt = α0 + α1X1t + α2X2t + α3X3t + α4X4t + ξt, gdzie:
Yt - zmiany produkcji w przedsiębiorstwie [mld zł],
X1t - zatrudnienie [tys. osób],
X2t - wartość maszyn i urządzeń [mld zł],
X3t - czas przestoju maszyn [l. dni],
X4t - nakłady inwestycyjne [mln zł],
t € [1991 - 2000].
Lata |
Yt |
X1t |
X2t |
X3t |
X4t |
1991 |
10 |
6 |
8 |
14 |
12 |
1992 |
10 |
6 |
8 |
14 |
12 |
1993 |
16 |
10 |
12 |
18 |
12 |
1994 |
16 |
10 |
12 |
18 |
14 |
1995 |
12 |
8 |
8 |
18 |
10 |
1996 |
14 |
10 |
8 |
18 |
12 |
1997 |
20 |
12 |
14 |
24 |
14 |
1998 |
20 |
12 |
16 |
24 |
12 |
1999 |
20 |
12 |
16 |
26 |
12 |
2000 |
22 |
14 |
18 |
26 |
10 |
Które ze zmiennych X1t, X2t, X3t, X4t mają istotny wpływ na zmiany zmiennej Yt?
Eliminowanie zmiennych quasi - stałych
Niech νi oznacz poziom zmienności zmiennej, gdzie νi = Si/xi oraz (i = 1,2, … n),
xi - średnia arytmetyczna zmiennej Xit, xi = 1/n Σ Xit,
Si - odchylenie standardowe zmiennej Xit, Si = [ 1/n Σ ( Xit - xi )2 ]1/2,
Niech ν* oznacza wartość krytyczną poziomu zmienności.
H0 ={ νi ≤ ν*; zmienna Xi quasi - stała },
H1 ={ νi ≥ ν*; zmienna Xi istotnie opisuje zmiany Yt }.
Średnie arytmetyczne zmiennych Xi są równe: x1 = 10, x2 = 12, x3 = 20, x4 = 12.
Odchylenia standardowe potencjalnych zmiennych są równe: S1 = 2,51, S2 =3,688, S3 =4,382, S4 = 1,256.
Współczynnik poziomu zmienności: ν1 = 0,251, ν2 = 0,307, ν3 = 0,219, ν4 = 0,105. Wartość krytyczna współczynnika zmienności ustalmy na poziomie 15%. Zmienna X4 spełnia H0, co oznacza, iż nie ma ona wpływu na zmiany Yt.
Analiza macierzy współczynników korelacji.
Należy tu wybrać takie zmienne objaśniające, które są silnie skorelowane ze zmienną objaśnianą i jednocześnie słabo skorelowane pomiędzy sobą. Punktem wyjścia jest macierz U=[R0 ; R],
gdzie: R0 = [rY,Xi], R = [rxi,xj].
Dla zadanego poziomu istotności α oraz dla n-2 stopni swobody z tablic rozkładu Studenta odczytujemy wartość krytyczną statystyki I* a następnie wyznacza tzw. Wartość krytyczną współczynnika korelacji:
r* = [ (I*)2 / ((I*)2 + n-2) ].
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których zachodzi nierówność:
[ri] ≤ r*;
zmienne Xit są nieistotnie skorelowane ze zmienną objaśnianą.
Spośród pozostałych zmiennych jako zmienną objaśniającą wybiera się taką zmienną Xht, dla której:
[rh] =max {[ri]};
zmienna Xht jest nośnikiem największego zasobu informacji o zmiennej objaśnianej Yt.
Ze zbioru potencjalnych zmiennych objaśniających eliminuje się wszystkie zmienne, dla których:
[rhi] > r*;
są to zmienne zbyt silnie skorelowane ze zmienną objaśniającą Xht, a więc powielające dostarczone przez nią informacje.
Postępowanie przedstawione w punktach 1, 2, i 3 kontynuuje się aż do momentu wyczerpania zbioru potencjalnych zmiennych objaśniających.
W przykładzie macierz U jest równa:
1 |
0,979912 |
0,956612 |
0,957427 |
0,075378 |
0,979912 |
1 |
0,900368 |
0,938194 |
0,000000 |
0,956612 |
0,900368 |
1 |
0,915886 |
0,000000 |
0,957427 |
0,938194 |
0,915886 |
1 |
-0,07217 |
0,075378 |
0,000000 |
0,000000 |
-0,07217 |
1 |
Wartość statystyki I* odczytana z tablic testu t - Studenta jest równa /dla rozkładu (n-2,α); gdzie n = 8 , α = 0,02/ 2,896, stąd r* = 0,09.