Analizę regresji rozpoczniemy od prezentacji graficznej funkcji regresji. Ponieważ zależ-ność między analizowanymi zmiennymi ma w przybliżeniu charakter liniowy, funkcja regresji jest linią prostą. Wykreślając w Excelu wykres korelacyjny można zadeklarować wyświetlanie .funkcji trendu’ wraz z jej parametrami (równaniem i współczynnikiem determinacji). W przy. padku jednej zmiennej niezależnej, funkcja ta jest tożsama z funkcją regresji. Aby więc wykreślić funkcję regresji wystarczy podświetlić (klikając dwukrotnie myszą) punkty rzeczywiste (wydajność pracy), a następnie prawym klawiszem myszy uaktywnić polecenie Dodaj linię tren-du. Mamy przy tym do wyboru funkcję liniową, potęgową, wykładnicząitd. Wybór danej funkcji zależy od układu punktów rzeczywistych (ponieważ w naszym przypadku układają się one mniej więcej w linię prostą, wybraliśmy funkcję liniową). Następnie w opcjach funkcji trendu deklarujemy wyświetlanie na wykresie jej równania oraz wartości R2 (por. wykres 6.2).
Wykres 6.2. Zależność wydajności pracy od stażu pracy pracowników
21 | |
19 | |
17 | |
1 |
15 |
1 |
13 ■ |
11 | |
r |
9 |
7 - | |
5 |
i i-1-1-1-t—1 i-r
123456789
10
staż pracy
Źródło: opracowanie własne na podstawie danych w tablicy 6.3.
Aby analitycznie wyznaczyć funkcję regresji musimy znać średnie dla obu zmiennych (x i y), a także kowariancję tych zmiennych cov (x,y) i ich odchylenia standardowe (S„ Sy). albo też bezpośrednio obliczyć wyrażenia użyte w liczniku i mianowniku poszczególnych formuł. Należy więc dokonać obliczeń zaprezentowanych w tablicy 6.3. Zatem, jeśli wcześniej badana była korelacja między zmiennymi, można wykorzystać dokonane obliczenia do oszacowania parametrów funkcji regresji.
Podstawiając do wzoru na parametry funkcji regresji mamy:
h
78
60
= 1,3
a = 15 -1.3 -5 =15-6.5 = 8,5.
Zatem funkcję regresji można zapisać następująco:
jV, = 8,5 + l,3x(.
Współczynnik b = 1.3 oznacza, że w firmie OLA z każdym kolejnym rokiem pracy pracownik zwiększa swoją wydajność średnio o 1.3 szt/h (jeśli więc staż pracy pracownika wzrośnie o 1 rok. to wyprodukuje w ciągu godziny c 1,3 sztuki wyrobu więcej).
Równanie wyspecyfikowane na wykresie jest więc poprawne. Oczywiście nie musimy tego każdorazowo sprawdzać, wystarczy wykorzystać powyższą procedurę lub wykres i jego elementy.
Wartość współczynnika regresji można także obliczyć wykorzystując funkcję statystyczną Excela pod nazwą REGLINP. Arkusz kalkulacyjny Excel umożliwia również wyznaczenie bardziej rozbudowanych funkcji regresji niż te z jedną zmienną niezależną. Należy w tym celu skorzystać z Dodatku pod nazwą Analiza danych. Nie jest on instalowany w standardowej wersji Exccla, ale w każdej chwili można go zainstalować. Należy w tym celu w poleceniu Narzędzia podświetlić (zaznaczyć) katalogi Anulysis ToolPak i Analysis Tool Pak - VBA.
Wśród funkcji statystycznych, jakie można wybrać w Analizie danych jest m.in. Regresja, pozwalająca na szacowanie funkcji regresji jednej lub wielu zmiennych. Po uaktywnieniu tego polecenia należy wpisać zakres wejściowy Y (zakres komórek zawierających realizacje zmiennej >0 oraz zakres wejściowy X (zakres komórek zawierających realizacje zmiennych X). Na wyjściu otrzymujemy następujący wydruk:
PODSUMOWANIE - WYJŚCIE
_Statystyki regresji_
Wielokrotność R 0,997054 4
R kwadrat 0,994118
Dopasowany R kwadrat 0,993382 Btv2 standardowy 0,273861
Obserwacje_10 4.
Objaśnienia
—'t—
A
N
ANALIZA WARIANCJI
4 |
ss |
MS |
F Istotność F | |
Regresja |
l |
101,4 |
101,4 |
1352 3.28E-10 |
Resztkowy |
8 |
0.6 |
0,075 | |
Razem |
9 |
102 |
Współczynniki Błąd standardowy tStat |
Wartoii-p |
Dolne 95% |
Górne 95% Dolne 95.0% |
Górne 95.0% | ||
Przecięcie 83 . Zmienna XI 13 \ |
0,19685 43,18094 0.035355 36.76955 |
9.13E-11 3.28E-10 |
8.046062 1.21847 |
8,953938 1,38153 |
8,046062 1,21847 |
8,953938 138153 |
\ |
Parametr b
Parametr a
Z wydruku tego łatwo można odczytać, źe funkcja regresji z przykładu ma postać y, =8,5+ 1,3 • xr Podana jest również wartość współczynnika korelacji oraz wybrane miary dopasowania funkcji regresji do danych empirycznych Potwierdza się wcześniejszy wynik r^ wynoszący 0,997054 (w naszych obliczeniach 0,997). Pozostałe elementy w wydrukach mogą być pominięte na tym poziomie analizy.