Zadanie 1) W pewnej firmie zapytano 5 pracowników o wykształcenie (X) oraz zarobki
(Y - w tys. zł). Otrzymano następujące dane:
Wykształcenie (xi) |
Zarobki (yi) |
Rx |
Ry |
d2 = (Rx - Ry)2 |
wyższe lic. wyższe mgr. podstawowe gimnazjalne średnie |
6 4 3 2 4 |
4 5 1 2 3 |
5 3,5 2 1 3,5 |
(4 - 5)2 = 1 (5 - 3,5)2 = 2,25 (1 - 2)2 = 1 (2 - 1)2 = 1 (3 - 3,5)2 = 0,25 |
|
|
|
|
Σ= 5,5 |
Ustal czy między badanymi zmiennymi występuje korelacja. Jeśli tak to jaki ma kierunek i siłę?
ROZWIĄZANIE:
Należy posłużyć się współczynnikiem korelacji rang Spearmana (rs), ponieważ jedna z cech (wykształcenie) jest niemierzalna (tzn. wyrażona słownie, a nie liczbowo), ale jej warianty da się uporządkować (porangować) - kolumna 3 i 4. Rangi nadajemy od 1 do n (n - liczba obserwacji) w kolejności od najmniejszej wartości (pierwsza ranga czyli 1) do największej (ostatnia ranga czyli n), wpisując daną rangę obok obserwacji, której chcemy tą rangę przypisać - kolumna 3 i 4.
Uwaga 1: mimo, że zarobki są cechą mierzalną to ponieważ wykształcenie wyrażamy rangami, zarobki też muszą być zamienione na rangi.
Uwaga 2: jeżeli dana obserwacja się powtarza (tak jest w przypadku zarobków 4 tys. zł) to musimy przypisać jej rangę uśrednioną. Np. jeśli dla Y=4 ma przypaść 3 i 4 ranga wtedy obie wartości Y=4 dostaną rangę uśrednioną 3,5. Kolejna ranga to 5, bo wykorzystaliśmy juz rangę 3 i 4 (chociaż w postaci uśrednionej 3,5).
Następnie zgodnie ze wzorem potrzebujemy sumę d2 gdzie d oznacza różnicę między rangą X i rangą Y. Sumę d2 podstawiamy do wzoru w liczniku. Małe n oznacza z kolei liczbę obserwacji czyli 5 pracowników.
Otrzymany wynik potwierdza zaobserwowaną sytuację (patrz wykres poniżej). Korelacja jest dodatnia (rs>0) co znaczy że im wyższe wykształcenie tym zarobki też stają się wyższe. Siła tego związku jest duża, bo rs jest bliższy 1 niż 0.