Tablica 6.8. składa się z w rozkładów warunkowych cechy Y (dla każdego xt), z k rozkładów warunkowych cechy X (dla każdegoyj) oraz dwóch rozkładów brzegowych cechy X i cechy Y. Bardzo ważne w analizie korelacji są rozkłady warunkowe. Jeżeli między cechami nie ma zależności, to rozkłady warunkowe Y nie zależą od X i tym samym średnie warunkowe (grupowe) Y będą niezależne od X. Jeżeli średnic grupowe są równe, oznacza to brak zależności między cechami, jeżeli natomiast wraz ze wzrostem cechy X rosną średnie grupowe cechy Y, to mamy do czynienia z zależnością dodatnią. W przypadku przeciwnym istnieje zależność ujemna.
Obserwacja rozkładów warunkowych, a w szczególności średnich grupowych, to jedna z metod wykrywania zależności dwóch cech w' tablicy korelacyjnej. Do innych metod pozwalających na wykrycie zależności w tablicy korelacyjnej należą: analiza wykresów rozrzutu punktów empirycznych oraz analiza liczebności w tablicy korelacyjnej. Jeżeli w każdym polu tablicy są jednakowe liczebności nir to między cechami nie istnieje zależność. Gdy liczebności układają się wzdłuż przekątnej biegnącej od prawego górnego do lewego dolnego rogu tablicy, wówczas można przypuszczać, że zależność istnieje i jest prostoliniowa ujemna. Rozkład liczebności warunkowych wydłuż drugiej przekątnej oznacza korelację dodatnią.
Istnieje wrielc miar korelacji dwóch cech pogrupowanych w' tablicy korelacyjnej. Wybór miary właściwej, wdanej sytuacji, uzależniony jest m.in. od rodzaju cech statystycznych, kształtu zależności między badanymi cechami oraz od wielkości tablicy korelacyjnej (liczba wierszy i kolumn). W podręczniku ograniczymy się do omówienia tylko niektórych miar współzależności, znajdujących szerokie zastosowanie w praktyce. Będą to kolejno: stosunek korelacji eyx, współczynnik C-Pearsona C i współczynnik Q- Yule a Q.
Stosunek korelacji
Stosunek korelacji oparty jest na spostrzeżeniu, że przy braku korelacji wszystkie średnie grupowe y (xf) są jednakowa i równe średniej ogólnej y. Jest on relacją zróżnicowania średnich grupowych (czyli wyznaczonych dla poszczególnych podgrup zbiorowości, charakteryzujących się tym samym poziomem lub w-ariantem cechy X) w stosunku do ogólnego zróżnicowania wartości cechy Y.
Stosunek korelacji wyraża się wrzorem:
y - średnia ogólna zmiennej Y,
Sv - ogólne odchylenie standardowe cechy Y, y(x,) - średnie grupowe Y\
- odchylenie standardowe średnich grupowych Y.
(6.14)
gdzie:
Jak widać najważniejsze obliczenia dotyczą zmiennej Y, a zmienna X służy tylko do ustalenia grup zmiennej Y. Zatem X może być mierzalna lub niemierzalna. Formuły niezbędne do wyznaczenia stosunku korelacji zapisano poniżej:
k
W k
Z
(6.15)
N
S
y
(6.16)
(6.17)
Sylx) ~
N
(6.18)
Stosunek korelacji zawiera się w przedziale: 0 < e < 1. Przy braku korelacji eyx = 0. Im jego wartość jest bliższa jedności, tym korelacja silniejsza.
Stosunek korelacji nie jest miarą symetryczną. Jeśli obie cechy A' i Y są mierzalne, to można, analogicznie jak we wzorze 6.14., obliczyć średnie grupowe i ogólną dla cechy X. Porównując dwie wartości stosunku korelacji otrzymujemy:
Jeżeli dla tego samego przypadku obliczymy współczynnik korelacji liniowej Pearsona i stosunek korelacji, to zawsze zachodzi relacja:
a równość występuje jedynie w przypadku zależności liniowej.
Stosunek korelacji może być obliczany dla zależności prostoliniowej lub krzywoliniowej, ale cecha Y musi być mierzalna. Do zobrazowania tych zagadnień posłużą nam przykłady 6.7 i 6.8. Przykład 6.7. dotyczy sytuacji, w której obie cechy są mierzalne, zaś w przykładzie 6.8. jedna z cech AT jest niemierzalna.
181