Współzależność cech
WSFiZ
1. W pewnym badaniu ankietowym przeprowadzonym wśród 100 wybranych losowo gospodarstw zebrano informacje o wysokości rocznych wydatków na turystykę, przypadających na 1 osobę w gospodarstwie. Przebadano 25 gospodarstw wiejskich, 50 –
reprezentujących miasto do 100 tys. mieszkańców, pozostałe zaś – były to gospodarstwa domowe z miast liczących powyżej 100 tys. mieszkańców. Wyniki badań zestawiono w poniższej tablicy:
Miejsce zamieszkania/
wieś
Miasto do 100 tys. Miasto pow. 100 tys.
Razem
Roczne wydatki w zł
mieszkańców
mieszkańców
200 – 400
4
10
2
400 – 600
9
25
n23 = ?
600 – 800
10
n32 = ?
15
800 – 1000
2
3
5
Razem
50
25
a) Uzupełnić brakujące dane w tablicy.
b) Sformułować hipotezę dotyczącą zależności wybranej cechy od drugiej z badanych.
c) Wyznaczyć wartości miar współzależności pozwalających ocenić siłę, kierunek i kształt współzależności.
d) Zinterpretować wyniki obliczeń.
2. Dokonano 80 pomiarów zużycia benzyny w l/km (Y) przy różnej prędkości samochodu w km/h (X). Wyniki zestawiono w tablicy korelacyjnej. Na jej podstawie obliczono:
- wariancję zużycia benzyny: 1,96
- wariancję prędkości: 36,0
- kowariancję: 5,99
S 2
i ( y )
- średnią arytmetyczną wariancji warunkowych zmiennej
: 0,56.
a) Ocenić siłę zależności korelacyjnej obu cech.
b) Ocenić kształt zależności zużycia benzyny względem prędkości samochodu.
3. Zestawiono wyniki badań współzależności cech dla pewnych zbiorowości. Które z tych wyników są niewiarygodne? Odpowiedź uzasadnij.
a) exy = -0,8 rxy = -0,8
b) eyx = 1
ryx = -1,1
c) eyx = 0,75 ryx = 0,9
d) ryx = -0,85 eyx = 0,9.
4. Oceń, o ile to możliwe, kształt współzależności na podstawie poniższych informacji: A)
X – zatrudnienie (osoby)
Y – zysk brutto (zł)
ryx = 0,35
eyx = 0,85
exy = 0,45
B)
X – kurs dolara amerykańskiego (PLN/USD) Y – kurs marki niemieckiej (PLN/DEM) – zmienna zależna ryx = 0,25
eyx = 0,40
exy = 0,30
5. Na podstawie poniższych informacji zapisać równość wariancyjną i podać interpretację jej składników, w przypadku gdy:
X – powierzchnia gospodarstw rolnych (ha), Y – przeciętny miesięczny dochód na osobę w gospodarstwie (zł).
n = 100.
k
k
∑(y −
i
y)2
2
ni• = 3500 ∑Si (y)ni• = 700
i=1
i=1
Ustalić siłę zależności przeciętnego miesięcznego dochodu na osobę od powierzchni gospodarstwa rolnego.
6. Badanie współzależności między wysokością zarobków (zł) – Y a sektorem zatrudnienia –
X pewnej grupy liczącej 100 pracowników dostarczyło następujących informacji Sektor
Publiczny Prywatny
Średni zarobek
900
800
Liczebność 45
55
Zróżnicowanie wysokości wynagrodzeń w stosunku do ich średniej wielkości wynosiło w badanej grupie 50 zł. Oceń siłę korelacji związku omawianych zmiennych.
7. Na podstawie informacji: l
l
l
∑S2(x)n = ;
50
•
∑x2n = ;
575
•
∑x n = ;
200
n = 100
j
j
j
j
j • j
j 1
=
j 1
=
j 1
=
zapisać równość wariancyjną oraz podać pełną interpretację jej składników w przypadku, gdy: X – liczba reklamacji notowana w sklepach sieci PUT w ciągu dnia, Y – wysokość dziennego utargu w sklepach tej sieci. Sformułować odpowiednią hipotezę o współzależności cech i ustalić siłę związku korelacyjnego między zmiennymi.
8. Z badania wydajności pracy w pewnej grupie robotników wynika, że średnia wydajność pracy kobiet wynosi 22 szt./godz., a mężczyzn 26 szt./godz. Kobiety stanowiły 40% ogółu zbadanych. Zróżnicowanie wydajności pracy mierzone odchyleniem standardowym dla całej zbiorowości robotników stanowiło 10% średniej wydajności pracy. Ustalić siłę zależności między wydajnością pracy a płcią pracowników.