76
Opisywana zależność korelacyjna jest mocna i dodatnia. Warto w tym miejscu porównać dwa następujące współczynniki korelacji; r13 = 0,8 oraz r^.2 = 0,76. Ponieważ różnica miedzy nimi jest niewielka, można sądzić, że wpływ cechy eliminowanej (wiek) jest nieznaczny.
c) Analizując relację w zbiorze badanych cech można również ocenić łączny wpływ dwóch z nich na jedną. W omawianym przypadku sensowne jest postawienie pytania: jak staż pracy i wiek robotników wpływają łącznie na wydajność ich pracy? Na powyższe pytanie można odpowiedzieć, wykorzystując współczynnik korelacji wielorakiej;
(wyznacznik macierzy R wynosi 0,27).
Łączny wpływ stażu i wieku robotników na ich wydajność jest mocny. Należy w tym miejscu zwrócić uwagę na fakt, że współczynnik korelacji wielorakiej dostarcza informacji jedynie o natężeniu zależności, a nie informuje o kierunku zależności. Obliczony współczynnik determinacji R2 ~ 0,67 wskazuje, że 67% zmienności wydajności mierzonej wariancją wynika ze zmienności stażu pracy i wieku badanych robotników.
2.2.4. Liniowa funkcja regresji wielorakiej
Przyjmując/że cecha X\ odgrywa rolę zmiennej objaśnianej, można przedstawić interesującą nas funkcję regresji w postaci:
(2.30)
Funkcję zmiennych objaśniających pełnią cechy X2 i X3 (i = 1, 2,..., n), (n - liczba jednostek statystycznych charakteryzowanych trzema cechami). W niniejszym zapisie przyjęto, że subskrypty parametrów odpowiadają numerom cech.
Parametry funkcji regresji danej wzorem (2.30) dopasowujemy do danych empirycznych przedstawionych w macierzy (2.21), stosując klasyczną metodę najmniejszych kwadratów, dla której funkcja kryterium ma postać:
n
/(a0,a2,a3) = j)(•*.■! ~*n)2
(2.31)
lub
n
f(a0,ci2,a3) = YJ(xl
2Xi2 a3Xi3) •
(2.32)
W charakterze wartości parametrów funkcji regresji (2.30) wybieramy takie wartości, dla których funkcja kryterium osiąga minimum. W tym celu obliczamy pochodne cząstkowe względem o0, a2 oraz a3, przyrównujemy je do zera i po odpowiednich przekształceniach otrzymujemy następujący układ równań normalnych:
Z = na0 + a2 Z */2 + a3 Z xa
n n n n
(2.33)
Z XilXli = Z *«2 + Z Xn + a3 Z */2*;3
n n n n
i=l
u=l
Rozwiązując powyższy układ równań (jeśli istnieje jego jednoznaczne rozwiązanie), otrzymuje się wartości- a0, a2, a3. Dla interpretacji zależności w zbiorze trzech cech najważniejsze są parametry a2 i a3, określane mianem współczynników regresji cząstkowej. Współczynnik a2 informuje, o ile średnio zmieni się (wzrośnie lub zmaleje) wartość cechy Xx, gdy cecha X2 wzrośnie o jednostkę, jeśli cecha X3 nie ulegnie zmianie. Współczynnik a3 podaje, o ile jednostek zmieni się średnio cecha X}, gdy cecha X3 wzrośnie o jednostkę, przy założeniu, że wartość cechy X2 pozostanie na stałym poziomie. Należy w tym miejscu zwrócić uwagę na zgodność znaków odpowiednich miar zależności cząstkowej: a2 oraz ri2.3 - obie te miary służą do opisu zależności cech X\ i x2, przy eliminacji wpływu cechy x3 (a2 i r12.3 - mają ten sam znak). To samo spostrzeżenie dotyczy współczynników a3 oraz n3.2.
Warto w tym miejscu zaprezentować inną metodę uzyskiwania wartości parametrów funkcji regresji (2.30). Punktem wyjścia w tym podejściu jest macierz kowariancji S o postaci (2.22). Wzory do obliczenia współczynników regresji cząstkowej są następujące:
gdzie S\2, 5i3, Sn są dopełnieniami algebraicznymi odpowiednich elementów macierzy kowariancji S.
Wyraz wolny obliczamy wykorzystując wzór:
a0=xx- a2x2 - a-ix3. (2.35)