Korelacja
Korelacja (współzależność cech) określa
wzajemne powiązania pomiędzy
wybranymi zmiennymi.
Rodzaje korelacji
Ze względu na sposób analizy oraz charakter
analizowanych zmiennych wyróżniamy:
_ korelację prostą - badającą związek
zachodzący pomiędzy dwoma cechami lub
zjawiskami
_ korelację cząstkową - informującą o związku
dwóch cech z wyłączeniem trzeciej zmiennej
_ korelację wieloraką - informującą o związku
jednej cechy z kilkoma ujętymi łącznie
Interpretacja wyników korelacji
współczynnik korelacji (r lub R), zawierający
się w przedziale [-1; 1].
_ korelacja dodatnia (wartość współczynnika
korelacji od 0 do 1) - informuje, że wzrostowi
wartości jednej cechy towarzyszy wzrost
średnich wartości drugiej cechy,
_ korelacja ujemna (wartość współczynnika
korelacji od -1 do 0) - informuje, że
wzrostowi wartości jednej cechy towarzyszy
spadek średnich wartości drugiej cechy.
Siła związków korelacyjnych
poniżej 0,2 - korelacja słaba (praktycznie
brak związku)
0,2 - 0,4 - korelacja niska (zależność
wyraźna)
0,4 - 0,6 - korelacja umiarkowana
(zależność istotna)
0,6 - 0,8 - korelacja wysoka (zależność
znaczna)
0,8 - 0,9 - korelacja bardzo wysoka
(zależność bardzo duża)
0,9 - 1,0 - zależność praktycznie pełna
NAJWAŻNIEJSZA JEST ISTOTNOŚĆ KORELACJI
Korelacyjne wykresy rozrzutu
zależność liniowa dodatnia (r>0)
zależność liniowa ujemna (r<0)
brak zależności (r=0)
Kwantyle dzielą zbiorowość określone części pod
względem liczby jednostek. Części te pozostają w
stosunku do siebie w określonych proporcjach.
Kwartyl pierwszy Q1 jest to wartość jednostki,
dzieląca zbiorowość w ten sposób, że ¼ (25%)
jednostek ma od niej wartości mniejsze, a ¾ (75%)
większe.
Kwartyl drugi (mediana, wartość środkowa, Me) to
wartość jednostki położonej w ten sposób, że dzieli
zbiorowość na dwie równe części.
Kwartyl trzeci Q3 to wartość jednostki dzieląca
zbiorowość w ten sposób, że ¾ (75%) jednostek ma
od niej wartości mniejsze, a ¼ (25%) większe
Miary asymetrii
Pozwala określić czy jednostki zbiorowości mają tendencje do skupiania się przy niskich wartościach cechy (asymetria prawostronna) czy przy wysokich wartościach cechy (asymetria lewostronna ) czy raczej skupia się przy wartości centralnej (rozkład symetryczny ).
x=Me=Mo - rozkład symetryczny
x>Me>Mo - rozkład o asymetrii prawostronnej
x<Me<Mo - rozkład o asymetrii lewostronnej
Interpretacja współczynnika asymetrii:
As = 0 rozkład symetryczny
As >0 asymetria prawostronna
As <0 asymetria lewostronna
Współczynnik skupienia (kurtoza) - jest
miarą skupienia poszczególnych obserwacji
wokół średniej.
Interpretacja współczynnika skupienia:
k <3 rozkład spłaszczony - koncentracja wokół średniej niższa
k =3 rozkład normalny
k >3 rozkład wysmukły - silniejsza koncentracja