Przez analizę regresji rozumiemy metodę badania wpływu zmiennych uznanych za niezależne (objaśniające) na zmienną uznaną za zależną (objaśnianą). Z uwagi na bardziej skomplikowane procedury analizy regresji przy wielu zmiennych niezależnych, poprzestaniemy na analizie tzw. regresji prostej, w której uwzględnia się tylko jedną zmienną niezależną.
Empiryczna funkcja regresji jest to analityczny wyraz przyporządkowania średnich wartości zmiennej objaśnianej konkretnym wartościom zmiennej objaśniającej.
Funkcję regresji można przedstawić graficznie. W tym celu pary przyporządkowanych sobie wartości zmiennych X i Y traktujemy jako współrzędne punktów w' prostokątnym układzie współrzędnych. W zależności od zmienności obu badanych wielkości, funkcja regresji może być linią prostą lub dowolną krzywą. Kierując się znów stopniem trudności wyznaczania funkcji regresji, zajmiemy się wyłącznie funkcją liniową.
Funkcję regresji zmiennej zależnej Yprzy danych wartościach zmiennej niezależnej X, zapisujemy następująco:
y,=a + bxr (6.5)
gdzie:
y. - wartości teoretyczne (punkty leżące na prostej) zmiennej Y, x, - wartości empiryczne zmiennej X, b - współczynnik regresji (współczynnik kierunkowy), a - wyraz wolny,
/» 1,2,..., N.
Aby zapisać funkcję regresji należy wyznaczyć (oszacować) parametry strukturalne funkcji, czyli a i b. Najprostszą i najbardziej popularną metodą szacowania parametrów strukturalnych funkcji regresji jest klasyczna metoda najmniejszych kwadratów (KMNK).
Klasyczna metoda najmniejszych kwadratów polega na takim oszacowaniu parametrów' funkcji regresji, aby dla danych pochodzących z całej zbiorowości lub próby spełniony był w-arunck:
Z.(y,-yi) =>rnin* v J
gdzie:
y, - empiryczne (rzeczywiste) wartości zmiennej zależnej Y,
- teoretyczne (wyznaczone na podstawie równania regresji) wartości zmiennej zależnej Y.
Warunki te spełniają parametry wyznaczone według następujących wzorów:
(67)
(6.8)
l cov(x,y) __ tr b = ——=—;-
r=l
a = y-bx.
Bardzo duże znaczenie ma współczynnik regresji oznaczony tutaj przez b. Wskazuje on bowiem, o ile przeciętnie zmieni się wartość zmiennej zależnej, jeśli wartość zmiennej niezależnej wzrośnie o jednostkę. Współczynniki regresji mogą przyjmować dowolne wartości.
• Ujemny współczynnik regresji wskazuje na to, że pod wpływem wzrostu zmiennej niezależnej o jednostkę, zmienna zależna zmaleje średnio o b jednostek. Funkcja regresji jest więc malejąca.
• Dodatni współczynnik regresji oznacza, że wraz ze wzrostem zmiennej niezależnej o jednostkę, zmienna zależna wzrośnie średnio o b jednostek. Funkcja regresji jest rosnąca.
• Współczynnik regresji równy zero świadczy o tym, że zmienna niezależna nic wywiera żadnego wpływu na zmienną zależną. Funkcja regresji jest stała.
Z interpretacji tych wynika wyraźnie, że dodatni współczynnik regresji wskazuje na dodatnią korelację między zmiennymi, a ujemny - na ujemną zależność. Wynika z tego praktyczny wniosek: znak współczynnika regresji musi być taki sam jak znak współczynnika korelacji między analizowanymi wielkościami.
Sensowną interpretację ekonomiczną bardzo rzadko posiada wyraz wolny. Teoretycznie oznacza on poziom zmiennej zależnej przy zerowej wartości zmiennej niezależnej. Często jednak wyraz wolny przybiera wartości ujemne, co nieczęsto daje się merytorycznie zinterpretować. Na przykład ujemny wyraz wolny a w funkcji kosztów produkcji w zależności od zużycia surowców oznaczałby, że jeśli surowce nie byłyby używane, koszt produkcji byłby ujemny. Interpretacja taka nic ma wartości merytorycznej, w związku z czym przyjmuje się zwykle, że wyrazu wolnego nic interpretuje się.
Znaczenie poznawcze funkcji regresji jest tym większe, im silniejsza jest korelacja między badanymi zmiennymi. Silny związek oznacza bowiem, że zmienna niezależna determinuje w znacznym stopniu zmiany w poziomic zmiennej zależnej, niewielki natomiast jest wpływ indywidualnych odchyleń. Wskazuje na to kwadrat współczynnika korelacji liniowej Pearsona, czyli tzw. współczynnik determinacji R2 = i£. Szczegółowe omówienie tego miernika będzie miało miejsce w dalszej części rozdziału.
Między' współczynnikami regresji a współczynnikiem korelacji zachodzą pewne cenne związki. Współczynnik regresji można alternatywnie wyznaczyć wykorzystując formułę:
Przykład 6.2.
Opierając się na danych z przykładu 6.1. wyznacz równanie funkcji regresji. Rozwiązanie
Przypomnijmy, że obserwujemy dwie cechy: staż pracy i wydajność pracowników. Staż może być traktowany jako przyczyna kształtowania się wydajności na coraz to wyższym poziomie (stwierdziliśmy tu dodatnią korelacją). Zachodzi więc związek przyczynowo-skutkowy, a zatem można uzupełnić dotychczasową analizę o wyznaczenie funkcji regresji.
169