Statystyka - temat nr 3.
Analiza korelacji dwóch zmiennych
Ćwiczenie 3A
Proszę pobrać wśród 5 osób obecnych na zajęciach dane dotyczące:
odległości od uczelni (w km)
czasu dojazdu na uczelnię (w min)
czy jestem zadowolony z dojazdu na uczelnię? (bardzo zadowolony, raczej zadowolony, średnio zadowolony, raczej niezadowolony, bardzo niezadowolony)
Które cechy są cechami jakościowymi, a które ilościowymi?
Czy cecha jakościowa są mierzone na skali nominalnej, czy porządkowej?
Proszę przedstawić zależność czasu dojazdu na uczelnię od odległości od uczelni na wykresie.
Proszę ocenić siłę i kierunek zależności czasu dojazdu na uczelnię od odległości od uczelni.
Proszę ocenić siłę i kierunek zależności zadowolenia z dojazdu na uczelnię od czasu dojazdu.
UWAGA! ZADANIA ZAZNACZONE NA SZARO NA ZALICZENIE NIE OBOWIĄZUJĄ
Zadanie 3.1.
Pewien zakład produkcyjny zatrudnia 5 pracowników fizycznych. Ich wydajność pracy (Y - w szt./h) oraz miesięczne wynagrodzenie (X - w tys. zł) przedstawia poniższa tabela:
pracownik |
y |
x |
Wojciech Albatros |
12 |
0,9 |
Józef Chrzan |
14 |
1,1 |
Władysław Jelonek |
14 |
1 |
Jan Kowalski |
10 |
0,7 |
Dariusz Pingwin |
16 |
1,3 |
Proszę sporządzić wykres rozrzutu wynagrodzenia względem wydajności;
Proszę ocenić siłę i kierunek zależności badanych cech.
Zadanie 3.2.
Wśród 100 studentów WSZiNS liczba nieobecności na zajęciach ze statystyki (X - w razach) i wynik egzaminu z tego przedmiotu kształtują się następująco:
|
2-4 |
4-6 |
6-8 |
8-10 |
n i . |
0 |
|
|
20 |
10 |
|
1 |
|
30 |
20 |
|
|
2 |
10 |
10 |
|
|
|
n . j |
|
|
|
|
|
Jak silnie wynik egzaminu zależy od liczby nieobecności?
Zadanie 3.3.
Przeciętna wydajność pracy 100 pracowników zakładu M wynosi 10 szt./h, a przeciętny staż pracy kształtuje się na poziomie 20 miesięcy. Ponadto wiadomo, że klasyczne współczynniki zmienności obu cech są takie same i wynoszą 50%, a kowariancja między nimi jest równa 45. Proszę ocenić siłę i kierunek zależności obu cech .
Zadanie 3.4.
Na podstawie danych z zadania 10. w zestawie 2. (analiza zróżnicowania i asymetrii) oraz wiedząc, że kowariancja średniej ocen ze studiów i liczby egzaminów poprawkowych jest równa -0,752, proszę przeprowadzić pełną analizę korelacji między badanymi zmiennymi.
Zadanie 3.5.
Roczna liczba osób przekraczających granicę na przejściu w K. oraz roczna ilość skonfiskowanego tym osobom alkoholu przedstawiała się w latach 1994 - 2001 następująco:
rok |
1994 |
1995 |
1996 |
1997 |
1998 |
1999 |
2000 |
2001 |
liczba osób na przejściu (mln) |
6 |
4 |
5 |
8 |
10 |
4 |
4 |
7 |
ilość skonfiskowanego alkoholu (tys. l) |
21 |
16 |
17 |
23 |
26 |
16 |
19 |
22 |
Proszę sporządzić wykres rozrzutu ilości skonfiskowanego alkoholu względem liczby osób przekraczających granicę oraz ocenić siłę i kierunek zależności obu cech
Zadanie 3.6.
U 10 studentów WSZiNS odległość uczelni od miejsca zamieszkania oraz miesięczne wydatki na benzynę kształtują się następująco:
X |
10 |
50 |
2 |
5 |
40 |
20 |
20 |
30 |
8 |
5 |
Y |
150 |
350 |
150 |
120 |
260 |
200 |
180 |
250 |
200 |
180 |
Proszę przeprowadzić pełną analizę korelacji badanych zmiennych.
Zadanie 3.7.
W 25 rodzinach o różnej liczbie dzieci zbadano miesięczne wydatki na soki owocowe. Spośród 10 rodzin z jednym dzieckiem pięć wydaje na ten cel 0-50 zł, cztery 50-100 zł, a jedna 100-150 zł. Wśród 10 rodzin z dwójką dzieci dwie wydają 50-100 zł, sześć 100-150 zł, a dwie 150-200 zł. Natomiast wśród 5 rodzin z trójką dzieci dwie wydają na soki 100-150 zł, a trzy 150-200 zł.
Proszę utworzyć tablicę korelacyjną i ocenić siłę i kierunek wpływu liczby dzieci na wydatki na soki owocowe.
Zadanie 3.8.*
Studentów zaocznych II semestru specjalności Zarządzanie i Marketing (241 osób) zbadano pod względem liczby nieobecności na zajęciach ze statystyki i wyniku I terminu egzaminu (w punktach). Okazało się, że każdy student był nieobecny przeciętnie 1,6 razu, a zróżnicowanie nieobecności stanowiło 87,5% przeciętnego ich poziomu. Wyniki egzaminu przedstawiały się natomiast następująco:
wynik egzaminu (yi) |
0-10 |
10-20 |
20-30 |
30-40 |
liczba studentów (ni) |
10 |
45 |
121 |
65 |
Ponadto wiadomo, że kowariancja między omawianymi zmiennymi wynosi -10,72.
Jak silnie liczba nieobecności na zajęciach wpływa na wynik egzaminu?
Zadanie 3.9.
W pięciu tyskich restauracjach liczba sprzedanych placków po węgiersku (X), cena takiego placka (Y) oraz liczba gości (Z)w dniu 19.03.2004 kształtowała się jak niżej:
restau- racja |
liczba sprzedanych placków (X) |
cena placka w zł (Y) |
liczba gości (Z) |
R1 |
16 |
10 |
100 |
R2 |
18 |
11 |
90 |
R3 |
10 |
16 |
70 |
R4 |
12 |
16 |
70 |
R5 |
13 |
17 |
80 |
Jak silnie i w jakim kierunku liczba gości wpływa na liczbę sprzedanych placków?
Jak silnie i w jakim kierunku cena placka wpływa na liczbę sprzedanych placków?
Jak silnie liczba gości w restauracji wpływa na liczbę sprzedanych placków, jeśli wyeliminuje się wpływ ceny placka?
Jak silnie cena placka wpływa na liczbę sprzedanych placków, jeśli wyeliminuje się wpływ liczby gości w restauracji?
Jak silny jest łączny wpływ ceny placka i liczby gości na ilość sprzedanych porcji?
Zadanie 3.10.
49% wydatków na cele kulturalne jest wyjaśniane liczbą dzieci w rodzinie i jest to zależność o nachyleniu ujemnym. Z kolei 64% tych wydatków jest wyjaśniane dochodem w rodzinie na osobę i ta zależność ma charakter dodatni. Natomiast 36% dochodów na osobę jest wyjaśniane liczbą dzieci w rodzinie i jest to zależność o nachyleniu ujemnym.
Proszę ocenić siłę i kierunek wpływu liczby dzieci na wydatki na cele kulturalne, jeśli wyeliminuje się wpływ dochodów na osobę.
Proszę ocenić siłę i kierunek wpływu wpływ dochodów na osobę na wydatki na cele kulturalne, jeśli wyeliminuje się liczby dzieci.
Proszę ocenić siłę łącznego wpływu dochodu na osobę oraz liczby dzieci na wydatki na cele kulturalne.
Zadanie 3.11.
U 5 studentów WSZiNS całkowite koszty studiowania na I roku (w tys. zł), odległość miejsca zamieszkania od uczelni (w km) i liczba egzaminów poprawkowych kształtują się następująco:
student |
koszty studiów (X) |
odległość od uczelni (Y) |
liczba poprawek (Z) |
Ania |
3,2 |
50 |
0 |
Michał |
2,8 |
10 |
0 |
Wojtek |
3,6 |
20 |
2 |
Agnieszka |
2,9 |
0 |
1 |
Iza |
3 |
20 |
0 |
Jak silnie i w jakim kierunku odległość od uczelni wpływa na koszty studiowania?
Jak silnie i w jakim kierunku liczba poprawek wpływa na koszty studiowania?
Jak silnie liczba poprawek wpływa na koszty studiowania, jeśli wyeliminuje się wpływ odległości od uczelni?
Jak silnie odległość od uczelni wpływa na koszty studiowania, jeśli wyeliminuje się wpływ liczby poprawek??
Jak silny jest łączny wpływ odległości od uczelni i liczby poprawek na koszty studiowania?
Zadanie 3.12.
Proszę odpowiedzieć na następujące pytania:
Czy jest Pan(-i) zadowolony(-a) ze studiów we WSZiNS?
Bardzo zadowolony / raczej zadowolony / raczej niezadowolony / bardzo niezadowolony
Czy po ukończeniu WSZiNS oczekuje Pan(-i) awansu zawodowego?
tak / nie
Proszę zagregować odpowiedzi całej grupy w tablicę korelacyjną i ocenić stopień współzależności obu cech za pomocą odpowiedniej miary.
Zadanie 3.13.
5 klientek pewnego salonu kosmetycznego zapytano o zadowolenie ze świadczonych tam usług oraz zamiar ponownej wizyty. Odpowiedzi przedstawia poniższa tabela:
zadowolenie z usług |
bardzo zadowolona |
niezadowolona |
zadowolona |
zadowolona |
bardzo niezadowolona |
zamiar ponownej wizyty |
na pewno przyjdę |
raczej nie przyjdę |
na pewno przyjdę |
raczej przyjdę |
na pewno nie przyjdę |
W jakim stopniu zamiar ponownej wizyty zależy od zadowolenia z usług?
Zadanie 3.14.
200 pracowników pewnej tyskiej firmy zbadano ze względu na miejsce zamieszkania (Tychy czy inne miasto?) oraz częstotliwość spóźnień do pracy (rzadko czy często?). Okazało się, że spośród pracowników zamieszkałych w Tychach rzadko spóźnia się do pracy 110 osób, a często 10 osób. Natomiast wśród pracowników dojeżdżających z innych miast rzadko spóźnia się 30 osób, a często 50. Jak silnie częstotliwość spóźnień zależy od miejsca zamieszkania?
Zadanie 3.15.
W lipcu pewnego roku na studia zaoczne we WSZiNS złożyło dokumenty 180 osób. Spośród kandydatów, którzy złożyli dokumenty na Socjologię, 61 osób deklaruje się jako umysły humanistyczne, a 3 - jako ścisłe. Na pozostałych kierunkach proporcje te kształtują się następująco: Administracja: 50 umysłów humanistycznych i 4 ścisłe, Zarządzanie i Marketing: 20 humanistycznych i 25 ścisłych, Informatyka i Ekonometria: 16 ścisłych. Jak silnie predyspozycje studenta wpływają na wybór kierunku?
Zadanie 3.16.
Wśród 27 osób deklarujących lewicowe poglądy polityczne 12 było w 2004 r. zadowolonych z rządu premiera B., 10 niezadowolonych, a 5 osób nie miało zdania. Wśród 26 osób o poglądach prawicowych zadowolona była 1 osoba, niezadowolonych 23, a 2 nie miały zdania. Wśród 21 osób o poglądach centrowych zadowolonych było 15 osób, niezadowolonych 5, a 1 osoba nie miała zdania. Natomiast wśród 26 osób nieinteresujących się polityką zadowolona była1 osoba, niezadowolonych 5, a 20 nie miało zdania. Jak silnie preferencje polityczne wpływały na zadowolenie z rządu premiera B.?
Zadanie 3.17.
7 pracowników pewnej firmy zapytano o zadowolenie z zarobków (bardzo zadowolony, zadowolony, raczej zadowolony, raczej niezadowolony, niezadowolony, bardzo niezadowolony) oraz o zamiary zmiany zatrudnienia (na pewno zamierzam, raczej zamierzam, nie wiem, czy zamierzam, raczej nie zamierzam, na pewno nie zamierzam). Otrzymano następujące wyniki:
nr pracownika |
zadowolenie z zarobków |
zamiar zmiany zatrudnienia |
Andrzej |
b. zadowolony |
na pewno nie zamierzam |
Bonawentura |
zadowolony |
nie wiem, czy zamierzam |
Czesław |
raczej zadowolony |
raczej nie zamierzam |
Damian |
raczej zadowolony |
nie wiem, czy zamierzam |
Eustachy |
niezadowolony |
nie wiem, czy zamierzam |
Fiodor |
b. niezadowolony |
raczej zamierzam |
Grzegorz |
raczej niezadowolony |
na pewno zamierzam |
W jakim stopniu zamiary zmiany miejsca pracy zalezą do zadowolenia z zarobków?
3.18.
Wśród 20 badanych uczennic 3. klas gimnazjum 4 przyznały, że miały kontakt z marihuaną, a reszta, że nie miała, Natomiast wśród 30 badanych uczniów 3. klas gimnazjum, 12 przyznało się do kontaktu z marihuaną, a reszta nie. Jak silnie skłonność badanych uczniów do marihuany zalezy od ich płci?
Pytania:
O czym świadczy zerowy współczynnik korelacji Pearsona?
Na czym polega zależność funkcyjna cech?
Jak na podstawie wykresu rozrzutu można wstępnie ocenić kierunek i siłę zależności 2 cech?
O jakiej zależności świadczą poniższe wykresy rozrzutu?
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
Co można powiedzieć o współzależności dwóch zmiennych, jeśli iloczyn ich odchyleń standardowych stanowi czterokrotność ich kowariancji?
Odpowiedzi:
Zadanie 3. 1.
0,975;
Zadanie 3.2.
Zadanie 3.3.
Zadanie 3.4.
Zadanie 3.5.
Zadanie 3.6. rxy = 0,92; R2 = 0,85;
Zadanie 3.7. rxy = 0,7; R2 = 0,49;
Zad. 3.8. X - liczba nieobecności; Y - wynik egzaminu
Dla cechy X mamy dane:
, VZS(x) = 87,5%, stąd obliczamy: S(y) = 1,4
Dla cechy Y obliczamy z szeregu przedziałowego: y = 25, S(y) = 7,89.
Zatem: rxy = 0,97; R2 = 0,94;
Zad. 3.9.
rxy = -0,84, rxz = 0,85, ryz = -0,88, zatem:
a) rxz,y = 0,41, b) rxy,z = -0,37, c) Rx.yz = 0,87 , R2x.yz = 0,76
Zad. 3.10
a) rxy,z = -0,46, b) rxz,y = 0,67 c) Rx.yz = 0,85 , R2x.yz = 0,72
Zad. 3.11.
rxy = 0,42, rxz = 0,71, ryz = -0,3, zatem:
a) rxy,z = 0,94, b) rxz,y = 0,96 c) Rx.yz = 0,97 , R2x.yz = 0,94
Zad. 3.13. rs = 0,925 Zad. 3.14. rφ = rT = rC = 0,579
Zad. 3.15. χ2 = 89,81 rφ = 0,71 rT = 0,53 rC = 0,71
Zad. 3.16. χ2 = 75,51 rφ = rT = 0,56 rC = 0,61
Zad. 3.17. rs = 0,663
Y
X