Dobór zmiennych do modelu
Formalne etapy doboru zmiennej do modelu można sformułować następująco:
Ustalenie listy potencjalnych zmiennych objaśniających.
Zebranie danych statystycznych będących realizacjami zmiennej objaśniającej i potencjalnych zmiennych objaśniających.
Eliminacja potencjalnych zmiennych objaśniających oznaczających się niskim poziomem zmienności.
Ustalenie miernika jakości modelu ekonomicznego.
Obliczenie współczynników korelacji między wszystkimi rozpatrywanymi zmiennymi.
Redukcja zbioru potencjalnych zmiennych objaśniających tzn. ustalenie kombinacji zmiennych objaśniających osiągających najkorzystniejszą wartość miernika jakości modelu.
Najczęściej stosowaną metodą jest metoda Z. Heelwiga.
Nośnikiem informacji o zmiennej endogenicznej jest potencjalna zmienna objaśniająca.
Y - zmienna objaśniana
X1, ..., Xk - zmienne objaśniające.
KROKI:
I. Tworzymy kombinacje wszystkich zmiennych objaśniających; wybieramy wszystkie podzbiory tego zbioru
X1, X2 ,..., Xk
K = 3 X1, X2, X3
K1 = X1 K2 = X2 K3 = X3
K4 = X1, X2 K5 = X1, X3 K6 = X2, X3
K7 = X1, X2, X3
L = 2K - 1 - ilość kombinacji
II. Obliczamy współczynnik korelacji Pearsona pomiędzy zmienną endogeniczną Y i zmiennymi X1, ..., Xk - oznaczamy je roj
roj = ry,xj j=1...k
r01
R0 = r02
...
r0k
III. Obliczamy wsp. korelacji
ri,j = rxi , xj i,j = 1...k
1 r12 ... r1k
R = r21 1 ... r2k
rk1 ... 1
UWAGA!!! ri,j = rj,i i ≠ j ri,i = 1
Następnie obliczamy pojemność indywidualną dla danej zmiennej i danej kombinacji.
Ta pojemność indywidualna ma postać:
r0j2
hi,j = ----pl-----------
1 + Σ rij
( l = 1,2,...L, l - numer kombinacji
j = 1,2,...p1 j = numer zmiennej wyst. w tej kombinacji)
i=1
r012
K1 = X1 h1,1 = -------
1+0
r022
K2 = X2 h2,2 = -------
1+0
r032
K3 = X3 h3,3 = -------
1+0
r012 r022
K4 = X1, X2 h4,1 = ------- h4,2 = -------
1+r12 1+r21
W mianowniku są współczynniki korelacji pomiędzy zmienną Xj , która występuje w liczniku, a pozostałymi zmiennymi występującymi w kombinacji Kl .
r012 r032
K5 = X1, X3 h5,1 = ------- h5,3 = -------
1+ r13 1+r31
r022 r032
h6,2 = ------- h6,3 = -------
1+ r23 1+ r32
r012 r022 r032
h7,1 = ---------------- h7,2 = --------------- h7,2 = ----------------
1+r12+ r13 1+r21+ r23 1+ r13+ r32
Na podstawie powyższych pojemności indywidualnych obliczamy pojemności integralne.
Pojemnością integralną kombinacji potencjalnych zmiennych objaśniających jest wyrażenie:
pl
Hl = Σ hl,j dla l = 1,2,...L
j=1
Hl - pojemność integralna dla kombinacji hl
l - numer kombinacji
Pojemność integralna stanowi kryterium wyboru odpowiedniego zestawu zmiennych objaśniających.
Wybiera się tę kombinację zmiennej objaśniającej dla której pojemność integralna jest maksymalna.
UWAGA!!! Indywidualne i integralne wskaźniki pojemności informacyjnej przyjmują wartości z przedziału obu stron domkniętych [0,1].
Pojemności te przyjmują tym większe wartości im zmienne objaśniające są silnie skorelowane zmienną objaśnianą (im większe r0j) oraz im słabiej są skorelowane między sobą (im mniejsze są wartości rij).