Obserwacja średnich i wariancji rozkładów warunkowych pozwala określić rodzaj związku między badanymi zmiennymi.
1. Niezależność stochastyczna1 między, zmiennymi istnieje wtedy, gdy zmieniającym się wartościom jednej cechy towarzyszą takie same rozkłady warunkowe dmgicj cechy, co wyraża się równością parametrów rozkładów warunkowych cechy A-:
.V, = .v2 =...= .V, i ,v-(,v) = s;(x) =...= sf(x)
oraz równością parametrów rozkładów warunkowych cechy Y:
2. Związek stochastyczny między zmiennymi istnieje wtedy, gdy zmieniającym się wartościom jednej cechy towarzyszą istotnie różne rozkłady warunkowe drugiej cechy, co określają relacje:
.V, -a..* x, i s;(,v) a s-(x) a... a s;(.v),
3. Związek korelacyjny (statystyczny) między zmiennymi ogranicza pole obserwacji do porównywania średnich rozkładów warunkowych. A zatem mówimy, że istnieje związek korelacyjny, jeżeli zmieniającym się wartościom jednej cechy towarzyszą zmiany średnich warunkowych drugiej:
.Y, ax2 a... a x, ora/. 7i * J: *■ ■ ■ * 7*
Jeżeli zmiany te mają zgodny kierunek, tzn. rosnącym wartościom jednej cechy odpowiada wzrost średnich warunkowych drugiej cechy, mamy do czynienia z korelacją dodatnią, natomiast gdy rosnącym wartościom jednej cechy odpowiadają malejące średnie warunkowe drugiej cechy, mówimy o korelacji ujemnej.
Należ)' przy tym dodać, że może zdarzyć się sytuacja, iż zmienna Y jest zależna od zmiennej X, a jednocześnie stwierdza się niezależność zmiennej X od Y. W takim wypadku relacje średnich warunkowych będą następujące:
,vj = ,v2 =... = 7, oraz 7, * 7, *... £ yk
Chcąc ocenić, czy związek korelacyjny ma charakter liniowy, tzn. jednakowym zmianom jednej cechy towarzyszą zbliżone co do wielkości zmiany średnich warunkowych drugiej, czy jest on związkiem krzywoliniowym, tzn. jednakowym zmianom jednej cechy towarzyszą różne co do siły lub (i) kierunku zmiany średnich warunkowych drugiej, sporządzamy wykres empirycznych linii regresji. Empiryczne linie regresji wykreślamy w układzie współrzędnych prostokątnych. Linia, którą wyznaczają punkty o współrzędnych (x,\yl), pokazuje kształt zależności cechy Y od cechy A', natomiast linia o współrzędnych pokazuje zależność cechy X od cechy Y. Empiryczne linie regresji
przecinają się w punkcie o współrzędnych (7; y), a im bliżej siebie są położone, tym silniejszy jest związek między zmiennymi.
1*3.4. Analiza rodzaju związku między liczbą punktów na egzaminie z matematyki (.v,) i oceną na egzaminie ze statystyki (y,) zbiorowości studentów I roku Informatyki i Ekonometrii. Dane zawiera tablica w 1*3.3.
A. Obliczanie parametrów rozkładów warunkowych ocen ze statystyki odpowiadających poszczególnym klasom punktów z matematyki (r,) w zbiorowości studentów I roku Informatyki i Ekonometrii.
IJ)nU
Średnie warunkowe ocen ze statystyki: y, = -4=-
y, = (2 • 1 + 3 • 6 + 4 • 2):9 = 3,11 j7, =(2-2 + 3-12 + 4- 6):20 = 3,20 7, =(3-9 + 4-10 + 5- 2):21 = 3,67
131
Przymiotnik „stochastyczny” jest używany w odniesieniu do układu, w którym jest zawarty element przypadkowości, losowości. Por. MG. Kendall, W.R. Buck land, Słownik kominów statystycznych, Warszawa, PWE 1975, s. 191.