Zanim przystąpimy do właściwych obliczeń musimy wyznaczyć średnie arytmetyczne obu
1 0 50
u£*i=ir5la'zaSSrednia
zmiennych. Średni staż pracy pracowników wynosi: x =
_ 1 ^ 150 f_ _lt
wydajność wynosi: y - — 2^7, = = 15 szt/h.
W dalszej kolejności należy wyznaczyć kowariancję i wariancje zmiennych lub bezpo-średnio wyrażenia z licznika i mianownika wzoru na współczynnik korelacji. W obu przypad-kach w obliczeniach można wykorzystać pomocniczą tablicę (por. tablica 6.3).
N
W liczniku wzoru 6.1. mamy wyrażenie X(*. “ x){yt - y). Musimy zatem znaleźć sumę
następujących iloczynów: (jc, -x)(y, -y) dla wszystkich 10 pracowników. Wartość ta stanowi podsumowanie kolumny (7).
Aby obliczyć mianownik we wzorze 6.1. należy z kolei wyznaczyć wartości dwóch s N
wyrażeń: 2/*; -*)2 oraz ^(y, -y)2, a następnie obliczyć iloczyn ich pierwiastków
M 1*1
kwadratowych. Wartości tych sum znajdują się w pozycji .razem’ piątej i szóstej kolumny. Są to liczby 60 i 102.
Tablica 6.3. Obliczenia pomocnicze do wyznaczenia współczynnika korelacji wraz z wybranymi objaśnieniami
Współczynnik korelacji liniowej Pearsona obliczamy więc w następujący sposób:
_ J78_= 78
7,746 -10,1
78
78,235
= 0,997.
Wynik ten mówi, że wydajność pracy w bardzo silnym stopniu zależy od stażu pracy pracowników (współczynnik korelacji jest bliski 1, zatem siła tej zależności jest bardzo duża). Ponieważ współczynnik ma znak dodatni, oznacza to, że korelacja ta ma kierunek dodatni. Można zatem powiedzieć, że im dłużej pracownik pracuje w tej firmie, tym większa jest jego wydajność.
Uwaga! Na etapie obliczania współczynnika korelacji liniowej Pearsona bardzo częstym
•V N
błędem jest traktowanie licznika wyrażenia jako iloczynu sum - x) •£(>», -y).
.-i /-i
Jednak przy takim, przypomnijmy, błędnym podejściu współczynnik korelacji zawsze będzie równy zero. Wynika to z własności średniej arytmetycznej, która mówi. że suma odchyleń poszczególnych wartości cechy od średniej wynosi zero. Niezależnie od tego, jakie zjawiska badamy, suma kolumn (3) i (4) zawsze da zero, a zatem iloczyn tych sum też będzie równy zero.
Obliczanie współczynnika korelacji według omówionej powyżej procedury można przyspieszyć wykorzystując arkusz Exccl. Zastosowanie znajdą w tej sytuacji operatory' najprostszych funkcji matematycznych (dodawania, odejmowania, mnożenia i dzielenia). Szczególnie pomocna jest możliwość automatycznego kopiowania formuł na kolejne komórki, dzięki czemu formuła wprowadzana jest tylko dla pierwszej obserwacji, a dla pozostałych jest kopiowana. Excel stwarza jednak możliwość jeszcze szybszego wyznaczania współczynnika korelacji liniowej Pearsona. Wśród funkcji statystycznych znajdziemy bowiem funkcję Wsp.Korelacji. Po uaktywnieniu tego polecenia zaznaczamy jako „Tablice” obszary (kolumny) ze zmiennymi (w dowolnej kolejności, np. Tablicy 1 odpowiadają wartości zmiennej T, a tablicy 2 - wartości zmiennej X). Zanim jednak automatycznie obliczymy ten współczynnik, musimy sprawdzić, czy spełnione są założenia jego wyznaczania. Dość częstym błędem jest wyznaczanie tego miernika dla wielkości, które nie zależą od siebie w sposób liniowy, ale także dla wielkości, które nie są mierzalne (np. dokonywanej zwłaszcza w badaniach społecznych oceny zjawiska). Otrzymany w takiej sytuacji współczynnik może bowiem nie oddaw-ać prawdziwego charakteru zależności między zmiennymi.
Przy wyznaczaniu współczynnika korelacji liniowej Pearsona interesowało nas zagadnienie siły i kierunku zależności między cechami A' i Y. W wielu zależnościach warto scharakteryzować bardziej szczegółowo związek miedzy nimi i wskazać na tę cechę, która jest przyczyną kształtowania się drugiej (skutku). Mówimy wówczas o występowaniu związku przyczynow'o-skutkow'ego, do analizy którego posłużymy się metodą regresji.
167