Współczynnik korelacji
rangowej Spearmana
Dominika Kulejewska
Analiza danych
półilościowych-korelacja rang
analiza rang jest narzędziem przy opisie danych
półilościowych (porządkowych)
przydatna jest do oceny związków korelacyjnych
pomiędzy cechami, z których jedna ma charakter
ilościowy, a druga – porządkowy
Przygotowanie danych
Przetworzenie
danych
polega
na
nadaniu
poszczególnym elementom badanej próby numerów
porządkowych, zwanych dalej
rangami
rangami
.
Podstawą procesu rangowania są wartości cech,
których związek chcemy oszacować.
Gdy cecha, która ma zostać poddana rangowaniu jest
półilościowa,
rangowanie
polega
wyłącznie
na
uporządkowaniu elementów wg. rosnących (lub
malejących) wartości tej cechy.
Przygotowanie danych
cd.
W następnym kroku tak utworzonemu ciągowi nadaje
się rangi przyporządkowując kolejnym elementom
próby
wartości
kolejnych
liczb
całkowitych
(rozpoczynając od 1).
W ten sposób pierwszemu elementowi próby (ciągu)
przyporządkowuje się 1, kolejnemu 2, następnemu 3
itd. Przyporządkowane numery są rangami ze względu
na rozpatrywaną cechę.
Gdy badana cecha ma charakter ilościowy, rangowanie
polega na uporządkowaniu danych od najmniejszych
wartości do największych (lub odwrotnie). Rangami
będą wtedy numery porządkowe kolejnych wyrazów
utworzonego w ten sposób ciągu.
Współczynnik korelacji
rangowej Spearmana
Po nadaniu wszystkim elementom próby rang (ze
względu
na
obie
analizowane
cechy,
których
współzależność będziemy badać), możemy przystąpić
do oszacowania tej zależności
Istnieje kilka służących temu współczynników, ale
najczęściej używanym jest współczynnik
korelacji
korelacji
rangowej Spearmana.
rangowej Spearmana.
Współczynnik korelacji
rangowej Spearmana
Wzór:
Gdzie:
n - liczebność próby,
d
i
- różnice pomiędzy rangami
odpowiadających sobie wartości x
i
i y
i
Im większa wartość współczynnika,
tym większa jest zależność liniowa
między zmiennymi.
r
s
= 0 oznacza brak liniowej zależności
między cechami,
r
s
= 1 oznacza dokładną dodatnią
liniową zależność między cechami,
r
s
= - 1 oznacza dokładną ujemną
liniową zależność między cechami,
tzn. jeżeli zmienna x rośnie, to y
maleje i na odwrót.