|
Ćwiczenie 01-02. Wybór zmiennych objaśniających na podstawie metody Helwiga i metody grafów. |
|
Tablica zawiera dane dla zmiennej Y w zależności od zmiennych X1, X2, ... Xk. |
|
Za pomocą metody Helwiga i metody grafów znaleźć zmienne objaśniające dla modelu ekonometrycznego Y=Y(X1, X2, ... Xm) + x. |
|
|
|
Metoda Helwiga. |
Plan rozwiązania zadania. |
|
1. Wybierz zmienne objaśniające (3 lub 4) i wprowadź w arkusz Excel'a (każda zmienna ma n obserwacji). |
|
2. Obliczyć współczynniki korelacji pomiędzy Y i zmiennymi objaśniającymi X1, X2, …, Xk. |
|
3. Obliczyć macierz współczynników korelacji {rij} dla zmiennych objaśniających. |
|
4. Obliczyć liczbę kombinacji K dla k zmiennych objaśniających. |
|
5. Obliczyć indywidualne pojemności informacji h dla zmiennych objaśniających w każdej kombinacji. |
|
6. Obliczyć integralne pojemności informacji H dla kombinacji zmiennych objaśniających.. |
|
7. Na podstawie H zrobić wniosek o wpływie zmiennych objaśniających na Y. |
|
|
|
|
Metoda grafów. |
1. Wybierz z pliku zadań k zmiennych objaśniających i wprowadź dane w arkusz Excel'a. |
|
2. Obliczyć r*, ta dla poziomu a (na przykład, a=0,01). |
|
3. Obliczyć macierz współczynników korelacji rxixj, i,j=1,2,...,k. |
|
4. Sprawdzić test |rij|<r* |
|
5. Obliczyć współczynniki korelacji ryxi, i=1,2,...,k. |
|
6. Narysować wykres (graf). |
|
7. Zrobić wnioski a) na podstawie liczby połączeń b) na podstawie współczynników korelacji ryxi. |
|
Na podstawie danych w arkuszu Wskaźniki zbadać zależność wskaźnika 4 (eksport) w roku 2007 od |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a) wskaźników 1, 5, 6, 7; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b) wskaźników 11, 12, 16; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a) |
|
|
Badanie pojemności informacji metodą Helwiga |
|
|
|
|
|
|
|
|
|
|
b) |
|
|
Badanie pojemności informacji metodą Helwiga |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Wprowadzamy dane i zaznaczamy zmienne X1, X2, X3, X4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Wprowadzamy dane i zaznaczamy zmienne X1, X2, X3. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
1 |
5 |
6 |
7 |
|
|
|
|
|
|
|
|
|
4 |
11 |
12 |
16 |
|
|
|
|
|
|
|
|
|
|
Y |
X1 |
X2 |
X3 |
X4 |
|
2. |
|
|
|
|
|
|
|
Y |
X1 |
X2 |
X3 |
|
|
2. |
|
|
|
|
|
|
2007 I |
29591,6 |
15,1 |
34425,0 |
387,87 |
298,37 |
|
|
|
|
|
|
|
|
2007 I |
29591,6 |
8118 |
907 |
27,0 |
|
|
|
|
|
|
|
|
|
2007 II |
29800,9 |
14,8 |
33553,3 |
389,58 |
298,05 |
|
|
-0,409 |
r01 |
|
|
|
|
2007 II |
29800,9 |
7555 |
860 |
27,2 |
|
|
|
0,503 |
r01 |
|
|
|
|
2007 III |
34261,5 |
14,3 |
40308,0 |
388,69 |
293,59 |
|
R0= |
0,910 |
r02 |
|
|
|
|
2007 III |
34261,5 |
8442 |
948 |
30,5 |
|
|
R0= |
0,027 |
r02 |
|
|
|
|
2007 IV |
30665,1 |
13,6 |
36233,8 |
381,92 |
282,79 |
|
|
-0,159 |
r03 |
|
|
|
|
2007 IV |
30665,1 |
7002 |
906 |
30,2 |
|
|
|
0,735 |
r03 |
|
|
|
|
2007 V |
32077,8 |
12,9 |
37771,0 |
378,24 |
279,97 |
|
|
-0,277 |
r04 |
|
|
|
|
2007 V |
32077,8 |
7289 |
957 |
31,1 |
|
|
|
|
|
|
|
|
|
2007 VI |
32169,4 |
12,3 |
38482,2 |
380,79 |
283,99 |
|
|
|
|
|
|
|
|
2007 VI |
32169,4 |
6733 |
967 |
31,0 |
|
|
|
|
|
|
|
|
|
2007 VII |
31487,5 |
12,1 |
38662,5 |
376,85 |
275,00 |
|
3. |
X1 |
X2 |
X3 |
X4 |
|
|
2007 VII |
31487,5 |
7040 |
872 |
31,1 |
|
|
3. |
X1 |
X2 |
X3 |
|
|
|
2007 VIII |
31682,3 |
11,9 |
35653,3 |
381,00 |
279,81 |
|
|
1 |
-0,596 |
0,833 |
0,875 |
X1 |
|
2007 VIII |
31682,3 |
7096 |
847 |
31,7 |
|
|
|
1 |
0,273 |
0,035 |
X1 |
|
|
2007 IX |
33712,0 |
11,6 |
39623,0 |
378,99 |
272,86 |
|
R= |
-0,596 |
1 |
-0,450 |
-0,540 |
X2 |
|
2007 IX |
33712,0 |
6821 |
859 |
30,8 |
|
|
R= |
0,273 |
1 |
0,144 |
X2 |
|
|
2007 X |
37949,7 |
11,3 |
43880,5 |
370,52 |
260,42 |
|
|
0,833 |
-0,450 |
1 |
0,983 |
X3 |
|
2007 X |
37949,7 |
8149 |
859 |
32,6 |
|
|
|
0,035 |
0,144 |
1 |
X3 |
|
|
2007 XI |
35139,0 |
11,2 |
41968,5 |
365,56 |
249,15 |
|
|
0,875 |
-0,540 |
0,983 |
1 |
X4 |
|
2007 XI |
35139,0 |
7480 |
829 |
30,4 |
|
|
|
|
|
|
|
|
|
2007 XII |
28018,8 |
11,4 |
36267,3 |
360,42 |
247,54 |
|
|
|
|
|
|
|
|
2007 XII |
28018,8 |
6071 |
819 |
28,0 |
|
|
|
|
|
|
|
|
|
4. |
Kombinacja |
Zmienne |
|
|
|
|
|
|
|
|
5. |
|
|
4. |
Kombinacja |
Zmienne |
|
|
|
|
|
|
|
|
5. |
|
|
|
K1 |
X1 |
h1,1= |
0,167 |
|
|
|
|
|
|
H1= |
0,167 |
|
|
K1 |
X1 |
h1,1= |
0,253 |
|
|
|
|
|
|
H1= |
0,253 |
|
|
K2 |
X2 |
h2,2= |
0,828 |
|
|
|
|
|
|
H2= |
0,828 |
X2 |
|
K2 |
X2 |
h2,2= |
0,001 |
|
|
|
|
|
|
H2= |
0,001 |
|
|
K3 |
X3 |
h3,3= |
0,025 |
|
|
|
|
|
|
H3= |
0,025 |
|
|
K3 |
X3 |
h3,3= |
0,540 |
|
|
|
|
|
|
H3= |
0,540 |
|
|
K4 |
X4 |
h4,4= |
0,077 |
|
|
|
|
|
|
H4= |
0,077 |
|
|
K4 |
X1,X2 |
h4,1= |
0,199 |
h4,2= |
0,001 |
|
|
|
|
H4= |
0,199 |
|
|
K5 |
X1,X2 |
h5,1= |
0,105 |
h5,2= |
0,519 |
|
|
|
|
H5= |
0,623 |
|
|
K5 |
X1,X3 |
h5,1= |
0,245 |
h5,3= |
0,522 |
|
|
|
|
H5= |
0,767 |
X1,X3 |
|
K6 |
X1,X3 |
h6,1= |
0,091 |
h6,3= |
0,014 |
|
|
|
|
H6= |
0,105 |
|
|
K6 |
X2,X3 |
h6,2= |
0,001 |
h6,3= |
0,472 |
|
|
|
|
H6= |
0,473 |
|
|
K7 |
X1,X4 |
h7,1= |
0,089 |
h7,4= |
0,041 |
|
|
|
|
H7= |
0,130 |
|
|
K7 |
X1,X2,X3 |
h7,1= |
0,194 |
h7,2= |
0,001 |
h7,3= |
0,458 |
|
|
H7= |
0,652 |
|
|
K8 |
X2,X3 |
h8,2= |
0,571 |
h8,3= |
0,017 |
|
|
|
|
H8= |
0,588 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K9 |
X2,X4 |
h9,2= |
0,538 |
h9,4= |
0,050 |
|
|
|
|
H9= |
0,588 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K10 |
X3,X4 |
h10,3= |
0,013 |
h10,4= |
0,039 |
|
|
|
|
H10= |
0,051 |
|
|
|
|
|
|
|
|
|
|
|
Największa wartość H: |
|
0,767 |
|
|
K11 |
X1,X2,X3 |
h11,1= |
0,069 |
h11,2= |
0,405 |
h11,3= |
0,011 |
|
|
H11= |
0,484 |
|
|
|
|
|
|
|
Wniosek: za zmienne objaśniające weźmiemy X1 (wsk.11), X3 (wsk.16) |
|
|
|
|
|
|
|
|
K12 |
X1,X2,X4 |
h12,1= |
0,068 |
h12,2= |
0,388 |
h12,4= |
0,032 |
|
|
H12= |
0,487 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
K13 |
X1,X3,X4 |
h13,1= |
0,062 |
h13,3= |
0,009 |
h13,4= |
0,027 |
|
|
H13= |
0,098 |
|
|
|
|
|
|
|
Model ekonometryczny z wybranych zmiennych możemy zapisać w takiej postaci: Y=f(X1,X3) + x |
|
|
|
|
|
|
|
|
K14 |
X2,X3,X4 |
h14,2= |
0,416 |
h14,3= |
0,010 |
h14,4= |
0,030 |
|
|
H14= |
0,457 |
|
|
|
|
|
|
|
Jeżeli wybrany model jest modelem liniowym, wtedy Y=a0 + a1*X1 + a3*X3 + x |
|
|
|
|
|
|
|
|
K15 |
X1,X2,X3,X4 |
h15,1= |
0,051 |
h15,2= |
0,320 |
h15,3= |
0,008 |
h15,4= |
0,023 |
H15= |
0,401 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Największa wartość H: |
|
0,828 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Wniosek: za zmienną objaśniającą weźmiemy X2 (wsk.5 - import) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Model ekonometryczny z wybranych zmiennych możemy zapisać w takiej postaci: Y=f(X2) + x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Jeżeli wybrany model jest modelem liniowym, wtedy Y=a0 + a2*X2 + x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Na podstawie danych w arkuszu Wskaźniki zbadać zależność wskaźnika 4 (eksport) w roku 2007 od |
|
|
|
|
|
|
|
|
wskaźników 1, 5, 6, 7,11,12,16. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1. Wprowadzamy dane i zaznaczamy zmienne X1, X2, X3, X4,X5,X6,X7. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
1 |
5 |
6 |
7 |
11 |
12 |
16 |
|
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
2007 I |
29591,6 |
15,1 |
34425,0 |
387,87 |
298,37 |
8118 |
907 |
27,0 |
2007 II |
29800,9 |
14,8 |
33553,3 |
389,58 |
298,05 |
7555 |
860 |
27,2 |
2007 III |
34261,5 |
14,3 |
40308,0 |
388,69 |
293,59 |
8442 |
948 |
30,5 |
2007 IV |
30665,1 |
13,6 |
36233,8 |
381,92 |
282,79 |
7002 |
906 |
30,2 |
2007 V |
32077,8 |
12,9 |
37771,0 |
378,24 |
279,97 |
7289 |
957 |
31,1 |
2007 VI |
32169,4 |
12,3 |
38482,2 |
380,79 |
283,99 |
6733 |
967 |
31,0 |
2007 VII |
31487,5 |
12,1 |
38662,5 |
376,85 |
275,00 |
7040 |
872 |
31,1 |
2007 VIII |
31682,3 |
11,9 |
35653,3 |
381,00 |
279,81 |
7096 |
847 |
31,7 |
2007 IX |
33712,0 |
11,6 |
39623,0 |
378,99 |
272,86 |
6821 |
859 |
30,8 |
2007 X |
37949,7 |
11,3 |
43880,5 |
370,52 |
260,42 |
8149 |
859 |
32,6 |
2007 XI |
35139,0 |
11,2 |
41968,5 |
365,56 |
249,15 |
7480 |
829 |
30,4 |
2007 XII |
28018,8 |
11,4 |
36267,3 |
360,42 |
247,54 |
6071 |
819 |
28,0 |
|
|
|
|
|
|
|
|
|
2. Obliczyć |
|
|
|
|
|
|
|
|
Liczba obserwacji: |
|
12 |
|
|
|
|
|
|
n= |
12 |
|
|
|
|
|
|
|
n-2= |
10 |
|
|
|
|
|
|
|
a= |
0,01 |
|
|
|
|
|
|
|
ta= |
3,1693 |
|
|
|
|
|
|
|
r*= |
0,7079 |
|
|
|
|
|
|
|
3. Obliczyć macierz |
|
|
|
|
|
|
|
|
|
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
|
|
1 |
-0,596 |
0,833 |
0,875 |
0,501 |
0,480 |
-0,611 |
X1 |
|
-0,596 |
1 |
-0,450 |
-0,540 |
0,271 |
-0,035 |
0,709 |
X2 |
|
0,833 |
-0,450 |
1 |
0,983 |
0,485 |
0,570 |
-0,215 |
X3 |
|
0,875 |
-0,540 |
0,983 |
1 |
0,433 |
0,619 |
-0,296 |
X4 |
|
0,501 |
0,271 |
0,485 |
0,433 |
1 |
0,273 |
0,035 |
X5 |
|
0,480 |
-0,035 |
0,570 |
0,619 |
0,273 |
1 |
0,144 |
X6 |
|
-0,611 |
0,709 |
-0,215 |
-0,296 |
0,035 |
0,144 |
1 |
X7 |
4. Sprawdzić test |rik|<r* |
|
|
|
|
|
|
|
|
|
X1 |
X2 |
X3 |
X4 |
X5 |
X6 |
X7 |
|
|
1 |
0 |
0,833 |
0,875 |
0 |
0 |
0 |
X1 |
|
0 |
1 |
0 |
0 |
0 |
0 |
0,709 |
X2 |
|
0,833 |
0 |
1 |
0,983 |
0 |
0 |
0 |
X3 |
|
0,875 |
0 |
0,983 |
1 |
0 |
0 |
0 |
X4 |
|
0 |
0 |
0 |
0 |
1 |
0 |
0 |
X5 |
|
0 |
0 |
0 |
0 |
0 |
1 |
0 |
X6 |
|
0 |
0,709 |
0 |
0 |
0 |
0 |
1 |
X7 |
|
|
|
|
|
|
|
|
|
5. Narysować graf |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6. Wnioskowanie. |
|
|
|
|
|
|
|
|
Z wykresu widać, że zmienne X5,X6 nie skorelowane z pozostałymi. Dla tego zostają w modelu. |
|
|
|
|
|
|
|
|
Zmienne X1,X3,X4 oraz X2,X7 tworzą dwie grupy połączonych zmiennych. Z każdej wybieramy po jednej zmiennej. |
|
|
|
|
|
|
|
|
a) stosujemy metodę wyboru na podstawie liczby połączeń. W grupie X1,X3,X4 każda zmienna ma po dwa |
|
|
|
|
|
|
|
|
połączenia. Dla tego nie możemy zdecydować którą wybrać. Dla grupy X2,X7 każda zmienna ma po jednemu połączeniu. |
|
|
|
|
|
|
|
|
Też nie możemy zdecydować którą zmienną wybrać. Oznacza to, że stosujemy metodą |
|
|
|
|
|
|
|
|
b) wyboru na podstawie współczynników korelacji. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6. Obliczyć współczynniki korelacji ryxi, i=1,2,3,4,7. |
|
|
|
|
|
|
|
|
|
ryx1 |
ryx3 |
ryx4 |
|
|
ryx2 |
ryx7 |
|
|
-0,409 |
-0,159 |
-0,277 |
|
|
0,910 |
0,735 |
|
|
|
|
|
|
|
|
|
|
Dla pierwszej grupy max(|ryxi|)=0,409, czyli wybieramy zmienną X1. |
|
|
|
|
|
|
|
|
Dla drugiej grupy max(|ryxi|)=0,910, czyli wybieramy zmienną X2. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Wniosek: za zmienne objaśniające weźmiemy X1 (wsk.1), X2 (wsk.5), X5 (wsk.11), X6 (wsk.12). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Model ekonometryczny z wybranych zmiennych możemy zapisać w takiej postaci: Y=f(X1,X2,X5,X6) + x |
|
|
|
|
|
|
|
|
Jeżeli wybrany model jest modelem liniowym, wtedy Y=a0 + a1*X1 + a2*X2 + a5*X5 + a6*X6 + x |
|
|
|
|
|
|
|
|