Zadanie 1) Muzyczny konkurs Eurowizji od wielu lat w całej Europie cieszy się niezmienną popularnością. Wyniki jakie uzyskali przedstawiciele krajów-finalistów za lata 2012-2013 kształtowały się następująco:
Kraj | Wynik (w pkt.) w 2012 roku |
Wynik (w pkt.) w 2013 roku |
---|---|---|
Azerbejdżan Dania Estonia Francja Grecja Hiszpania Irlandia Islandia Litwa Malta Mołdawia Niemcy Norwegia Rosja Rumunia Szwecja Ukraina Węgry Wielka Brytania Włochy |
150 21 120 21 64 97 46 46 70 41 81 110 7 259 71 372 65 19 12 101 |
234 281 19 14 50 8 5 47 17 120 71 18 191 172 65 62 214 84 23 126 |
Źródło: www.eurovision.tv
Na podstawie współczynnika korelacji rang Spearmana oceń czy można udowodnić, że wynik jaki uzyskał artysta z danego kraju w 2012 roku koresponduje w jakiś sposób z tym z roku 2013?
Odpowiedź
Współczynnik korelacji rang Spearmana: rs= -0,01
Brak zależności między wynikiem z 2012 roku a tym z roku 2013. Np. Dania w 2012 roku uzyskała słaby wynik (tylko 21 punktów), a rok później wygrała konkurs (z wynikiem 281 pkt.) Z kolei zwycięzca z 2012 roku (Szwecja - 372 pkt.) rok później zdobyła tylko 62 punkty.
Zadanie 2) W Poznaniu działa kilku operatorów/dostawców Internetu. Wybrano cztery najbardziej znane firmy i porównano ich oferty pod kątem prędkości połączenia z Internetem (w Mb/s) oraz miesięcznej ceny abonamentu (w zł). Dane prezentuje poniższa tabela:
Dostawca | Prędkość (w Mb/s) |
Cena (w zł) |
---|---|---|
A | 1 10 60 100 |
24 49 69 119 |
B | 10 45 100 |
39 49 79 |
C | 5 50 250 |
49 69 119 |
D | 1 25 75 150 |
14 39 79 99 |
Źródło: Dane zaczerpnięte ze stron internetowych dostawców.
a) sporządź korelacyjny diagram rozrzutu
b) wykorzystując współczynnik korelacji liniowej Pearsona określ kierunek i siłę zależności pomiędzy prędkością dostępu do Internetu a ceną miesięcznego abonamentu
c) wyznacz funkcję regresji opisującą wpływ prędkości Internetu na cenę abonamentu
d) nanieś ją na sporządzony wykres
e) oceń jej dopasowanie
f) oszacuj cenę Internetu za połączenie o prędkości 200 Mb/s
Odpowiedzi
a i d)
b) współczynnik korelacji liniowej Pearsona: rxy = +0,87 (wyniki pomocnicze: = 63 Mb/s; = 64 zł; sx = 67,6 Mb/s; sy = 31,4 zł)
Między prędkością Internetu a ceną abonamentu zachodzi silna korelacja dodatnia
c) funkcja regresji: y’ = 38,61 + 0,40 x
e) współczynnik determinacji: d = 75,7%
współczynnik indeterminacji: ϕ2 = 24,3%
odchylenie standardowe reszt: Sy’ = 15,5 zł
współczynnik zmienności resztowej: Wy’ = 24,2%
f) ponieważ współczynnik zmienności resztowej przekracza 20%, nie powinno się wykonywać prognozy na podstawie liniowej funkcji regresji (jest ona niedopuszczalna)
Zadanie 3) Porównano 10 ofert pewnego serwisu ogłoszeniowego o tematyce motoryzacyjnej, dotyczących jednego, konkretnego, używanego modelu samochodu. Zwrócono uwagę na liczbę lat użytkowania oraz przebieg samochodu (w tys. km), a także jego cenę (w tys. zł):
Liczba lat użytkowania |
Przebieg (w tys. km) |
Cena samochodu (w tys. zł) |
---|---|---|
5 3 7 4 5 6 2 6 4 3 |
55 30 90 45 100 110 10 90 80 40 |
25 39 29 42 40 36 49 22 33 35 |
Źródło: www.otomoto.pl
a) określ jaką siłę ma zależność pomiędzy wszystkimi zmiennymi jednocześnie
b) czy na cenę samochodu bardziej wpływa liczba lat użytkowania czy jego przebieg?
c) wyznacz funkcję regresji opisującą wpływ liczby lat użytkowania i przebiegu samochodu na jego cenę
d) określ co przeciętnie bardziej obniża cenę samochodu: wzrost/spadek liczby lat użytkowania o 1 rok czy wzrost/spadek przebiegu samochodu o 1 tys. km
e) podaj w ilu procentach na cenę samochodu wpływają jeszcze inne czynniki niż te uwzględnione w badaniu
f) oszacuj cenę samochodu, który byłby już użytkowany 8 lat, a jego przebieg wyniósłby 120 tys. km
Odpowiedzi
zakładając, że X1 – liczba lat użytkowania, X2 – przebieg, a Y – cena:
a) współczynnik korelacji wielorakiej: Ryx1x2 = 0,70 (silna zależność)
wyniki pomocnicze:
całkowite współczynniki korelacji liniowej Pearsona: rx1y = -0,68; rx2y = -0,50; rx1x2 = +0,86
średnie arytmetyczne: = 4,5 lata; = 65 tys. km; = 35 tys. zł
odchylenia standardowe: sx1 = 1,5 lat; sx2 = 31,8 tys. km; sy = 7,7 tys. zł
b) współczynniki korelacji cząstkowej: rx1y.x2 = -0,57; rx2y.x1 = +0,23. Większy wpływ ma liczba lat użytkowania
c) funkcja regresji: y’ = 52,05 – 4,93 x1 + 0,08 x2
d) parametry beta: β1 = -0,96; β2 = +0,33. Średnio rzecz biorąc cenę bardziej obniża zwiększenie liczby lat użytkowania niż zmiany w przebiegu
e) współczynnik indeterminacji: ϕ2 = 51,0%
f) y(x1=8, x2=120) = 22,09 tys. zł ± 5,5 tys. zł (odchylenie standardowe reszt)