BLOK 2
Dobór zmiennych do liniowego modelu ekonometrycznego
Zmienne objaśniające w liniowym modelu ekonometrycznym z formalnego punktu widzenia
powinny charakteryzować się następującymi własnościami:
" mieć odpowiednio wysoką zmienność,
" być silnie skorelowane ze zmienną objaśnianą,
" być słabo skorelowane między sobą.
Przykład 1.
Proszę na podstawie danych dobrać zmienne objaśniające do liniowego modelu
ekonometrycznego:
W stadium budowy modelu ekonometrycznego zespołowej wydajności pracy Wt (produkcja
w tys. zł na jednego zatrudnionego w pewnym przedsiębiorstwie przemysłowym) zaproponowano
wstępnie następujące zmienne objaśniające:
W(t-1) - zespołowa wydajność pracy w okresie poprzednim,
Xt - techniczne uzbrojenie pracy (w tys. zł na jednego zatrudnionego) w okresie t,
Zt - liczba zatrudnionych (w tys. osób w okresie t,
I(t-1) - wielkość nakładów inwestycyjnych na modernizację i automatyzację procesów
produkcyjnych w okresie poprzednim (w tys. zł).
wt wt-1 xt zt it-1
y x1 x2 x3 x4
14 6 0,4 15 70
17 14 0,6 13 40
14,5 17 0,4 15 80
20 14,5 0,7 11 50
21,6 20 1 10 40
23 21,6 1,2 10 50
24,5 23 1 7 80
28 24,5 1,5 6 100
26,4 28 1,5 8 110
29 26,4 1,7 5 80
RozwiÄ…zanie:
Badamy pierwszą własność zmienność.
Współczynniki zmienności dla poszczególnych zmiennych wynoszą:
V1=33%
V2=45%
V3=34%
V4=33%.
mgr Grzegorz Stolarczyk 1
Ekonometria 1
Ka\da z 4 potencjalnych zmiennych objaśniających ma odpowiednio wysoką zmienność,
więc przechodzimy do sprawdzania 2 i 3 własności na podstawie analizy korelacji.
Tworzymy macierz współczynników korelacji korzystając z funkcji Korelacja dostępnej w Excelu
w zakładce Narzędzia Analiza danych :
y x1 x2 x3 x4
Y 1
x1 0,893893 1
x2 0,972376 0,888381 1
x3 -0,9851 -0,85345 -0,92717 1
x4 0,470363 0,525071 0,481125 -0,43334 1
1. Metoda analizy współczynników korelacji
Wartość krytyczną współczynnika korelacji ustalamy przekształcając wzór na badanie istotności
rxy Å" n - 2
współczynnika korelacji - f = . Dzięki przekształceniom otrzymujemy:
1- rxy 2
2
f
rxy* =
2
f + n - 2
gdzie:
f - jest wartością statystyki odczytaną z tablic testu t-Studenta dla zadanego poziomu
istotności " oraz dla n-2 stopni swobody.
rxy* = 0,632, dla poziomu istotności " = 0,05
Ze zbioru potencjalnych zmiennych objaśniających eliminujemy zmienną X4 jako zmienną
nieistotnie skorelowaną ze zmienną objaśnianą.
Następnie jako zmienną objaśniającą wybieramy zmienną X3 jako zmienną najmocniej
skorelowaną ze zmienną objaśnianą, a następnie eliminujemy ze zbioru zmiennych objaśniających
zmienne X1 i X2, ze względu na zbyt du\ą korelację ze zmienną X3. Wartości bezwzględne
współczynników korelacji pomiędzy zmienną X3 i zmiennymi X1, X2 są większe od wartości
krytycznej r*.
Wykorzystując do doboru zmiennych metodę analizy współczynników korelacji do modelu
jako zmienna objaśniająca przechodzi jedynie zmienna X3.
mgr Grzegorz Stolarczyk 2
Ekonometria 1
2. Metoda grafowa
Macierz współczynników korelacji:
y x1 x2 x3 x4
Y 1
x1 0,893893 1
x2 0,972376 0,888381 1
x3 -0,9851 -0,85345 -0,92717 1
x4 0,470363 0,525071 0,481125 -0,43334 1
Macierz współczynników korelacji zamieniamy na macierz zerojedynkową, przyjmując wartość
krytyczną współczynnika korelacji rxy* = 0,632 obliczoną w metodzie wcześniejszej i uwzględniając
jedynie potencjalne zmienne objaśniające.
x1 x2 x3 x4
x1 1
x2 1 1
x3 1 1 1
x4 0 0 0 1
Rysujemy graf pokazujący powiązania pomiędzy zmiennymi objaśniającymi:
X1 X2
X3
X4
Do modelu wchodzi na pewno zmienna X4 jako zmienna nieistotnie skorelowana z pozostałymi
zmiennymi. Poniewa\ ka\da z pozostałych zmiennych X1, X2 i X3 ma tyle samo połączeń, do modelu
wybieramy tą, która jest najmocniej skorelowana ze zmienną objaśnianą. Jest to zmienna X3.
Wykorzystując przy doborze zmiennych metodę grafową wybieramy zmienne objaśniające X3 i X4.
mgr Grzegorz Stolarczyk 3
Ekonometria 1
3. Metoda wskazników pojemności informacji
Dla wszystkich potencjalnych zmiennych wyznaczamy indywidualne wskazniki pojemności
informacji wg wzoru:
rj 2
hl, j =
ml
rij
"
j=1
gdzie:
l numer kombinacji,
j numer potencjalnej zmiennej objaśniającej rozpatrywanej w danej kombinacji,
rj wartość współczynnika korelacji pomiędzy zmienną objaśnianą a j-tą potencjalną zmienną
objaśniającą rozpatrywaną w danej kombinacjiml liczba potencjalnych zmiennych
objaśniających w kombinacji,
rij wartość współczynnika korelacji pomiędzy i-tą i j-tą potencjalną zmienną objaśniającą
rozpatrywanÄ… w danej kombinacji.
Nr Kombinacja Wskaznik Wartość
kombinacji zmiennych pojemności wskaznika
1 {x1} h1,1
0,799045
2 {x2} h2,2
0,945515
3 {x3} h3,3
0,970427
4 {x4} h4,4
0,221242
h5,1
0,423138
5 {x1,x2}
h5,2
0,500701
h6,1
0,431112
6 {x1,x3}
h6,3
0,523579
h7,1
0,52394
7 {x1,x4}
h7,4
0,14507
h8,2
0,490623
8 {x2,x3}
h8,3
0,503549
h9,2
0,638376
9 {x2,x4}
h9,4
0,149374
h10,3
0,677038
10 {x3,x4}
h10,4
0,154354
h11,1
0,291428
11 {x1,x2,x3} h11,2
0,335818
h11,3
0,348996
mgr Grzegorz Stolarczyk 4
Ekonometria 1
h12,1
0,33108
12 {x1,x2,x4} h12,2
0,399034
h12,4
0,110279
h13,1
0,335942
13 {x1,x3,x4} h13,3
0,424362
h13,4
0,11297
h14,2
0,392607
14 {x2,x3,x4} h14,3
0,411108
h14,4
0,115563
h15,1
0,244588
h15,2
0,286808
15 {x1,x2,x3,x4}
h15,3
0,301941
h15,4
0,09069
Obliczamy integralne wskazniki pojemności informacji wg wzoru:
ml
HL =
"hl, j
j=1
Kombinacja Wartość
Wskaznik
zmiennych wskaznika
{x1} H1
0,799045
{x2} H2
0,945515
{x3} H3
0,970427
{x4} H4
0,221242
{x1,x2} H5
0,923839
H6
{x1,x3} 0,954691
H7
{x1,x4} 0,669009
H8
{x2,x3} 0,994172
H9
{x2,x4} 0,78775
H10
{x3,x4} 0,831392
H11
{x1,x2,x3} 0,976242
H12
{x1,x2,x4} 0,840393
H13
{x1,x3,x4} 0,873274
H14
{x2,x3.x4} 0,919278
H15
{x1,x2,x3,x4} 0,924027
Wskaznik H8 ma wartość największą. Jest to kombinacja zmiennych X2 i X3 i te właśnie zmienne
przechodzą do modelu jako zmienne objaśniające.
mgr Grzegorz Stolarczyk 5
Ekonometria 1
Spośród trzech metod doboru zmiennych objaśniających do modelu metoda wskazników
pojemności informacji jest metodą najbardziej obiektywną. Pozwala równocześnie na sprawdzenie
stopnia korelacji zmiennej objaśnianej ze zmiennymi objaśniającymi i pomiędzy samymi zmiennymi
objaśniającymi.
Przykład 2.
Proszę na podstawie danych dobrać zmienne objaśniające do liniowego modelu
ekonometrycznego:
W roli potencjalnych zmiennych objaśniających występują następujące zmienne:
Y wartość PKB w mld zł w cenach stałych z 2004r.
X1 - produkcja węgla kamiennego w mln ton
X2 - produkcja energii elektrycznej w mln ton
X3 - produkcja stali surowej w mln ton
X4 - zbiory 4 zbó\ w mln ton
Lata Y X1 X2 X3 X4
1980 3086,07 104 29,3 6,7 14,3
1981 3336,04 107 32,3 7,2 15,4
1982 3407,02 110 35,4 7,7 13,4
1983 3644,65 113 37 8 14,5
1984 3888,45 117 40,6 8,6 13,5
1985 4160,02 119 43,8 9,1 15,5
1986 4456,29 122 47,4 9,9 15,2
1987 4712,43 124 51,3 10,5 15,7
1988 5135,22 129 55,5 11 17,3
1989 5283,35 135 60,1 11,3 17,9
1990 5558,01 140 64,5 11,8 15,4
1991 6008,58 145 69,9 12,7 18,9
1992 6644,31 151 76,5 13,5 19,3
1993 7363,37 157 84,3 14,1 20,5
1994 8131,80 162 91,6 14,6 21,4
1995 8863,20 172 97,2 15 18
1996 9464,98 179 104 15,6 19
1997 9937,15 186 109 17,8 17,5
1998 10236,50 193 116 19,3 19,6
1999 10001,96 201 117 19,2 15,3
2000 9403,26 193 122 19,5 16,4
2001 8273,76 163 115 15,7 17,2
mgr Grzegorz Stolarczyk 6
Ekonometria 1
2002 7820,10 189 118 14,8 18,5
2003 8289,19 191 126 16,2 19,6
2004 8752,10 192 135 16,5 21,7
RozwiÄ…zanie:
Badamy pierwszą własność zmienność
Współczynniki zmienności dla poszczególnych zmiennych wynoszą:
V1=21%
V2=43%
V3=30%
V4=14%.
Ka\da z 4 potencjalnych zmiennych objaśniających ma odpowiednio wysoką zmienność,
więc przechodzimy do sprawdzania 2 i 3 własności na podstawie analizy korelacji.
Tworzymy macierz współczynników korelacji:
Y X1 X2 X3 X4
Y 1
X1 0,9695321 1
X2 0,9475196 0,980452 1
X3 0,9797102 0,970899 0,949374 1
X4 0,6448514 0,638923 0,672878 0,608729 1
1. Metoda analizy współczynników korelacji
Ustalamy wartość krytyczną współczynnika korelacji:
r*= 0,396, dla poziomu istotności " = 0,05
Ze zbioru potencjalnych zmiennych objaśniających nie eliminujemy \adnej zmiennej, poniewa\
ka\da ma współczynnik korelacji ze zmienną objaśnianą wy\szy od r*. Następnie jako zmienną
objaśniającą wybieramy zmienną X3 jako zmienną najmocniej skorelowaną ze zmienną objaśnianą,
a następnie eliminujemy ze zbioru zmiennych objaśniających zmienne X1, X2 i X4, ze względu na zbyt
du\ą korelację ze zmienną X3. Wartości bezwzględne współczynników korelacji pomiędzy zmienną X3
i zmiennymi X1, X2 i X4 są większe od wartości krytycznej r*.
Do modelu jako zmienna objaśniająca przechodzi jedynie zmienna X3.
mgr Grzegorz Stolarczyk 7
Ekonometria 1
2. Metoda grafowa
Macierz współczynników korelacji:
Y X1 X2 X3 X4
Y 1
X1 0,9695321 1
X2 0,9475196 0,980452 1
X3 0,9797102 0,970899 0,949374 1
X4 0,6448514 0,638923 0,672878 0,608729 1
Tworzymy macierz zerojedynkową, przyjmując wartość krytyczną współczynnika korelacji
r*= 0,396 obliczoną w metodzie wcześniejszej i uwzględniając jedynie potencjalne zmienne
objaśniające.
x1 x2 x3 x4
x1 1
x2 1 1
x3 1 1 1
x4 1 1 1 1
Rysujemy graf pokazujący powiązania pomiędzy zmiennymi objaśniającymi:
X1 X2
X3 X4
Poniewa\ ka\da zmienna ma tyle samo połączeń do modelu wybieramy tą, która jest najmocniej
skorelowana ze zmienną objaśnianą. Jest to zmienna X3.
mgr Grzegorz Stolarczyk 8
Ekonometria 1
3. Metoda wskazników pojemności informacji
Wyznaczamy indywidualne wskazniki pojemności informacji:
Nr Kombinacja Wskaznik Wartość
kombinacji zmiennych pojemności wskaznika
1 {x1} h1,1 0,939993
2 {x2} h2,2 0,897793
3 {x3} h3,3 0,959832
4 {x4} h4,4 0,415833
h5,1 0,474635
5 {x1,x2}
h5,2 0,453327
h6,1 0,476936
6 {x1,x3}
h6,3 0,487002
h7,1 0,573543
7 {x1,x4}
h7,4 0,253724
h8,2 0,460555
8 {x2,x3}
h8,3 0,49238
h9,2 0,536676
9 {x2,x4}
h9,4 0,248574
h10,3 0,59664
10 {x3,x4}
h10,4 0,258486
h11,1 0,318496
11 {x1,x2,x3} h11,2 0,306432
h11,3 0,328679
h12,1 0,358861
12 {x1,x2,x4} h12,2 0,338365
h12,4 0,179874
h13,1 0,360175
13 {x1,x3,x4} h13,3 0,372082
h13,4 0,185008
h14,2 0,342375
14 {x2,x3,x4} h14,3 0,375212
h14,4 0,182255
h15,1 0,261816
h15,2 0,2492
15 {x1,x2,x3,x4}
h15,3 0,271984
h15,4 0,142383
mgr Grzegorz Stolarczyk 9
Ekonometria 1
Obliczamy integralne wskazniki pojemności informacji:
Kombinacja Wartość
Wskaznik
zmiennych wskaznika
{x1} H1 0,939993
{x2} H2 0,897793
{x3} H3 0,959832
{x4} H4 0,415833
{x1,x2} H5 0,927963
H6 0,963938
{x1,x3}
H7 0,827267
{x1,x4}
H8 0,952934
{x2,x3}
H9 0,78525
{x2,x4}
H10 0,855126
{x3,x4}
H11 0,953607
{x1,x2,x3}
H12 0,8771
{x1,x2,x4}
H13 0,917265
{x1,x3,x4}
H14 0,899842
{x2,x3.x4}
H15 0,925383
{x1,x2,x3,x4}
Wskaznik H6 ma wartość największą. Jest to kombinacja zmiennych X1 i X3 i te właśnie zmienne
przechodzą do modelu jako zmienne objaśniające.
Zadanie 1.
Na podstawie danych dobierz zmienne objaśniające do modelu.
Zmienna objaśniana:
Y - przeciętna cena makaronu (zł /0,5kg),
Zmienne objaśniające:
X1 przeciętna cena detaliczna mąki (zł/1kg),
X2 przeciętna cena detaliczna jajek (zł/szt.),
X3 przeciętne roczne spo\ycie makaronu na 1 osobę w gospodarstwie domowym (kg)
X4 wielkość produkcji makaronu (tys. t),
X5 zbiory pszenicy w roku poprzednim (mln t).
mgr Grzegorz Stolarczyk 10
Ekonometria 1
Rok Y X1 X2 X3 X4
1990 0,52 0,34 0,11 1,56 65,5
1991 0,72 0,35 0,12 1,92 65,7
1992 1,07 0,68 0,13 2,04 69,5
1993 1,31 0,73 0,34 2,76 60
1994 1,81 0,85 0,28 2,88 67,6
1995 2,24 1,09 0,3 3,12 74
1996 1,4 1,49 0,31 3 105
1997 1,55 1,66 0,38 3,36 112
1998 1,7 1,6 0,3 3,72 119
1999 2,26 1,4 0,32 3,84 109
2000 3,46 1,77 0,36 4,32 102
2001 3,59 1,62 0,33 4,68 89
Zadanie 2.
Proszę na podstawie obliczonych współczynników korelacji dobrać zmienne objaśniające
do modelu liniowego metodą analizy współczynników korelacji oraz grafową. Współczynniki korelacji
wyznaczono na podstawie danych statystycznych pochodzących z 27 lat. Poziom istotności " = 0,05.
X1 X2 Y X3 X4 X5 X6
X1 1
X2 -0,7 1
Y 0,23 0,37 1
X3 -0,21 -0,4 -0,98 1
X4 0,25 -0,3 0,93 0,95 1
X5 0,89 0,68 0,29 -0,23 -0,34 1
X6 0,54 0,39 0,4 -0,4 -0,58 0,8 1
Zadanie 3.
Dany jest wektor współczynników korelacji R1 zmiennej objaśnianej z potencjalnymi zmiennymi
objaśniającymi x1, x2, x3 i x4 oraz macierz współczynników korelacji R2 pomiędzy potencjalnymi
zmiennymi objaśniającymi.
0,65
îÅ‚ Å‚Å‚
ïÅ‚- 0,71śł
ïÅ‚ śł
R1 =
ïÅ‚ - 0,8
śł
ïÅ‚ śł
0,65
ðÅ‚ ûÅ‚
mgr Grzegorz Stolarczyk 11
Ekonometria 1
1
îÅ‚ - 0,6 - 0,79 0,32
Å‚Å‚
ïÅ‚
1 0,52 - 0,2śł
ïÅ‚ śł
R2 =
ïÅ‚ śł
1 - 0,7
ïÅ‚ śł
1
ðÅ‚ ûÅ‚
Proszę sprawdzić, która z kombinacji zmiennych objaśniających jest lepsza w sensie pojemności
informacji: H1={x1,x2}, H2={x3} czy H3={x2, x3, x4}.
mgr Grzegorz Stolarczyk 12
Ekonometria 1
Wyszukiwarka
Podobne podstrony:
3 dobór zmiennych do liniowego modelu ekonometrycznego4 estymacja parametrów jednorównaniowego liniowego modelu ekonometrycznego4 ćwiczenia weryfikacja liniowych modeli ekonometrycznych47$2218 specjalista do spraw?dan spoleczno ekonomicznychCwiczenia nr 1 z l Zepoloych doZagadnienia do kolokwium z przedmiotu EkonomiaDobór bezpieczników do zabezpieczania przewodów i kabliĆwiczenie 2 1 Dobór przyrządu elektrycznegoDobór pieśni do uczestnictwa we Mszy świętejVII Dobór wentylatora do sieci wentylacyjnejdobor glosnikow do zestawu domowego8 wnioskowanie na podstawie modelu ekonometrycznego prognozowanie ekonometryczneCwiczenie 2 Numeryczne zagadnienia algebry liniowej3 ćwiczenia szacowanie parametrów modeli liniowych klasyczną metodą najmniejszych kwadratówZmienne do oceny poziomu pomiaruCwiczenia nr 2 z l Zepoloych dowięcej podobnych podstron