szeregów danych opisujących każdą z cech, stwierdzamy, /o wraz ze wzrostem realizacji cechy niezależnej maleje realizacja cechy zależnej, czyli współzależność ma kierunek ujemny.
b) Diagram rozrzutu korelacyjnego jest to przedstawienie w kartezjańskim układzie współrzędnych zbioru punktów reprezentujących obserwacje obydwu cech dla określonej jednostki statystycznej (tutaj gospodarstwa domowego). Przyjmując zatem oznaczenia par obserwacji jako (xj, yO, wprowadzamy je do układu współrzędnych i otrzymujemy odpowiednio:
Na podstawie diagramu korelacyjnego możemy stwierdzić, że pomiędzy wielkością dochodów netto, a poziomem wydatków na produkty zbożowe zachodzi ujemna współzależność liniowa o znacznej sile. Na taki wniosek pozwala kształt obwiedni, obejmującej wszystkie punkty diagramu, przypominający wąską elipsę skierowaną ku dołowi, c) Miernikiem pozwalającym na ocenę współzależności cech jest w tym przypadku współczynnik korelacji liniowej Pearsone’a postaci:
cov(x,y) rxy ~ S(x) - S(y)
gdzie odpowiednio:
cov (x,y) - oznacza kowariancję cech, czyli średnią arytmetyczną iloczynów odchyleń
realizacji cech od swoich wartości średnich wyrażoną wzorem:
cov(x,y) = -i(xi -xXyi -y) n i=i
S(x), S(y) - są to odchylenia standardowe cech X i Y.
Mli/rmy wykorzystać jedną z uproszczonych postaci wzoru na współczynnik korelacji i nlillczcnic przedstawia się w postaci tablicy roboczej. Przyjmijmy więc:
1 xy
ita— xXyi -y)
lub
I ithlica robocza
Hi |
yi |
Xj- X |
yi-y |
(xi-x)z |
(yi-y)2 |
(xi-x) (yi-y) |
0,6 |
95 |
-0,68 |
11,4 |
0,4624 |
129,96 |
-7,752 |
0,8 |
93 |
-0,48 |
9,4 |
0,2304 |
88,36 |
-4,512, |
|),9 |
90 |
-0,38 |
6,4 |
0,1444 |
40,96 |
-2,432 |
1,0 |
88 |
-0,28 |
4,4 |
0,0784 |
19,36 |
-1,23? |
1,1 |
85 |
-0,18 |
1,4 |
0,0324 |
1,96 |
-0,252 |
1,3 |
82 |
0,02 |
-1,6 |
0,0004 |
2,56 |
-0,032 |
1.6 |
79 |
0,22 |
-4,6 |
0,0484 |
21,16 |
-1,012 |
1,7 |
76 |
0,42 |
-7,6 |
0,1764 |
57,76 |
-3,192 |
1,9 |
75 |
0,62 |
-8,6 |
0,3844 |
73,96 |
-5,332 |
,»,() |
73 |
0,72 |
-10,6 |
0,5184 |
112,36 |
-7,632 |
.',8 |
836 |
X |
X |
2,0760 |
548,4 |
-33,38 |
I In podstawie tej tablicy wyznaczamy współczynnik korelacji rxy:
-33,38 _ -33,38
xy V2,07ó- 548,4 38,4784
33,38
33,74
-0,9893
stwierdzamy, że pomiędzy dochodem na osobę w rodzinie i wydatkami na produkty I lożowe zachodzi silna współzależność w kierunku ujemnym, co potwierdza wcześniejszy wniosek o tym, że wraz ze wzrostem dochodu maleje spożycie produktów zbożowych, dl 1’unkcyjna zależność między cechami statystycznymi przedstawiona jest w postaci Izw.
linii regresji II rodzaju, czyli w postaci teoretycznej linii regresji.
W przypadku zależności liniowej można ją wyznaczyć metodą bezpośrednią, czyli za pomocą klasycznej metody najmniejszych kwadratów lub pośrednią w oparciu o wyznaczone wartości .pólc/.ynnika korelacji liniowej Pearsone’a i odchylenia standardowe obydwu cech. Klasyczna metoda najmniejszych kwadratów pozwala określić parametry linii regresji w idwnaniu:
y = ax + b