Wzory 20

WZORY 20: wzory ważone i nieważone składników równości wariancyjnej cechy zależnej mierzalnej Y, ważony i nieważony wskaźnik korelacyjny

Dane indywidualne

(dane jednostkowe)

Tablica korelacyjna:

rozkłady punktowe

Tablica korelacyjna:

rozkłady przedziałowe

(xi, yi)

i = 1,..., k

j = 1,..., ni

(xi, yj)

i = 1,..., k

j = 1,..., l

0x01 graphic

i = 1,..., k

j = 1,..., l

(1)

(2)

(3)

Zróżnicowanie ogólne SST: wzory (20.1)

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

gdzie

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

Zróżnicowanie międzygrupowe SSB: wzory (20.2)

0x01 graphic

0x01 graphic

0x01 graphic

gdzie

0x01 graphic

0x01 graphic

0x01 graphic

Zróżnicowanie wewnątrzgrupowe SSE: wzory (20.3)

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

gdzie

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

Równość wariancyjna cechy zależnej mierzalnej Y: wzory (20.4)

SST = SSB + SSE

SST = SSB + SSE

SST = SSB + SSE

Kwadrat wskaźnika korelacyjnego 0x01 graphic
: wzory (20.5)

0x01 graphic

0x01 graphic

0x01 graphic

Wskaźnik korelacyjny eyx: wzory (20.6)

0x01 graphic

0x01 graphic

0x01 graphic

Związek kwadratu wskaźnika korelacyjnego 0x01 graphic
 ze współczynnikiem korelacji liniowej r: wzory (20.7) (dla 0x01 graphic
 > 0, na podstawie wzorów (20.1), (20.5) i zestawu 17 wzorów)

0x01 graphic

0x01 graphic

0x01 graphic

Związek kwadratu wskaźnika korelacyjnego 0x01 graphic
 ze współczynnikiem korelacji liniowej r oraz ze współczynnikiem regresji liniowej ay: wzory (20.8) (dla 0x01 graphic
 > 0, na podstawie wzoru (20.7) i zestawu 18 wzorów)

0x01 graphic

0x01 graphic

0x01 graphic

Związek kwadratu wskaźnika korelacyjnego 0x01 graphic
 ze współczynnikiem regresji liniowej ax: wzory (20.9) (dla 0x01 graphic
 > 0, na podstawie wzoru (20.8) i zestawu 18 wzorów)

0x01 graphic

0x01 graphic

0x01 graphic

Wyżej przytoczono, za literaturą przedmiotu, następujące oznaczenia (por. np. J. Jóźwiak, J. Podgórski: Statystyka od podstaw, PWE, Warszawa, 1998, rozdział 14: Analiza wariancji, s. 331):

SST jest angielskim skrótem określenia: ogólna suma kwadratów odchyleń wartości zmiennej zależnej od średniej arytmetycznej ogólnej tej zmiennej.

SSB jest angielskim skrótem określenia: suma kwadratów odchyleń średnich artymetycznych grupowych od średniej arytmetycznej ogólnej ważonych liczebnościami grup.

SSE jest angielskim skrótem określenia: zsumowana dla poszczególnych grup suma kwadratów odchyleń wartości zmiennej zależnej z danej grupy od średniej arytmetycznej tej grupy.

Ważony i nieważony wskaźnik korelacyjny cechy zależnej Y w formule wzoru najczęściej stosowanego do obliczeń

Dla danych pogrupowanych w tablicy korelacyjnej w rozkłady punktowe lub przedziałowe o wymiarach k x l (gdzie i = 1,..., k oraz j = 1,..., l) wzory wskaźników korelacyjnych z próby mierzących siłę wpływu cechy niezależnej X na cechę zależną Y są następujące:

(20.A)  0x01 graphic
gdzie 0x01 graphic

lub

(20.B)  0x01 graphic
gdzie 0x01 graphic

Dla danych indywidualnych yij dotyczących cechy zależnej Y analogiczny wzór dla i = 1,..., k oraz j = 1,..., 0x01 graphic
 można zapisać następująco:

(20.C)  0x01 graphic
gdzie 0x01 graphic

Oba wzory znajdują uzasadnie w równości wariancyjnej, w której ogólne zróżnicowanie (dyspersja, zmienność, rozrzut, rozproszenie) zależnej mierzalnej cechy Y jest przedstawione jako suma zróżnicowania międzygrupowego i wewnątrzgrupowego cechy Y.

Dla danych inywidualnych oraz dla danych pogrupowanych w tablicy korelacyjnej ogólny wzór wskaźnika korelacyjnego oparty na składnikach SST, SSB i SSE równości wariancyjnej jest taki sam:

(20.D)  0x01 graphic
gdzie 0x01 graphic
.

Kwadrat wskaźnika korelacyjnego 0x01 graphic
 umożliwia odpowiedź na pytanie, jaką część całkowitej zmienności cechy zależnej Y można przypisać wpływowi cechy niezależnej X. Wskaźnik korelacyjny eyx informuje o sile tego wpływu.

Ważona (20.A) i (20.B) lub nieważona (20.C) odmiana wzoru (20.D) zastosowana do obliczeń prowadzi do różnic w wynikach na skutek błędu grupowania. Jest to problem wspólny dla wszystkich miar ważonych, omawiany szeroko w literaturze przedmiotu na przykładzie średniej arytmetycznej, wariancji, współczynnika korelacji liniowej. Nie spotkałam natomiast podobnych do wyżej przedstawionych rozważań dotyczących wskaźnika korelacyjnego.

Źródło: Zestawienie własne na podstawie podręczników: J. Jóźwiak, J. Podgórski: Statystyka od podstaw, PWE, Warszawa 1998 oraz P. Kuszewski, J. Podgórski: Statystyka, wzory i tablice, Oficyna Wydawnicza SGH, Warszawa 1998.