3. LISTA ZADAŃ ZE STATYSTYKI Z DEMOGRAFIĄ. WSB W OPOLU.
Zadanie 1. W ośmiu rodzinach zbadano zależność pomiędzy miesięczną opłatą za rachunek telefoniczny a liczbą osób korzystających z telefonu i otrzymano następujące wyniki:
liczba osób |
1 |
3 |
3 |
4 |
4 |
5 |
6 |
6 |
opłaty za telefon (w zł) |
120 |
125 |
130 |
140 |
145 |
150 |
150 |
160 |
a) zbadać, czy istnieje związek między badanymi cechami stosując:
- metodę porównywania szeregów statystycznych,
- metodę graficzną.
b) określić siłę i kierunek badanej zależności obliczając współczynnik korelacji liniowej oraz współczynnik korelacji rang.
c) opisać badaną zależność za pomocą funkcji regresji oraz podać jej interpretację.
d) oszacować miesięczną opłatę telefoniczną jeśli z telefonu korzystają:
- dwie osoby (interpolacja),
- siedem osób (ekstrapolacja).
e) zbadać dokładność dopasowania wyznaczonych linii regresji do punktów empirycznych obliczając współczynnik determinacji oraz współczynnik zbieżności.
Zadanie 2. W rezultacie badania ceny działek budowlanych (w zł za 1 m2) i odległości działek od centrum (w km) otrzymano następujące wyniki:
ceny działek |
1000 |
900 |
500 |
500 |
480 |
300 |
240 |
odległość od centrum |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
a) zbadać, czy istnieje związek między badanymi cechami stosując:
- metodę porównywania szeregów statystycznych,
- metodę graficzną;
b) określić siłę i kierunek badanej zależności obliczając współczynnik korelacji liniowej oraz współczynnik korelacji rang;
c) wyznaczyć równanie regresji opisujące ceny działek w zależności od odległości od centrum, d) określić jak zmieni się wartość zmiennej zależnej, jeśli zmienna niezależna wzrośnie o jednostkę?
e) oszacować:
- cenę działki znajdującej się 1,5 km od centrum,
- cenę działki znajdującej się 7 km od centrum,
- odległość od centrum działki, której cena wynosi 100 zł za 1 m2 ,
- odległość od centrum działki, której cena wynosi 800 zł za 1 m2 .
f) podać w ilu procentach na zmienność zmiennej zależnej wpływa zmienna niezależna, a w ilu inne czynniki nie uwzględnione w badaniu.
Zadanie 3. W celu zbadania zależności między wydatkami (Y) na czasopisma i wielkością dochodu (X) wybrano losowo 10 rodzin i otrzymano następujące wyniki:
średni dochód
tys. zł; średnie wydatki
zł oraz
;
.
a) ocenić siłę zależności liniowej między badanymi zmiennymi.
b) oszacować wielkość wydatków na czasopisma przy dochodzie rodziny wynoszącym 10 tys. zł.
c) czy gospodarstwa domowe są bardziej zróżnicowane pod względem wydatków, czy też dochodów?
Zadanie 4. Równania regresji kosztów produkcji Y (w tys. zł) i produkcji X (w sztukach) w zakładzie A są następujące: ŷ = 0,4 x + 3, = 2y + bx , przy czym
= 50 sztuk,
= 23 tys. zł.
a) podać interpretacje oraz miano współczynników regresji,
b) wyznaczyć parametr bx oraz podać jego miano,
c) obliczyć współczynnik determinacji oraz podać jego interpretację,
d) jakich kosztów produkcji należy oczekiwać przy wielkości produkcji równej 100 sztuk?
Zadanie 5. Analiza spożycia pewnego artykułu zależnie od dochodu dla 10 gospodarstw dała wyniki: średnie spożycie artykułu na 1 osobę wynosi 8 kg, średni miesięczny dochód na 1 osobę wynosi 1100 zł, współczynnik zmienności spożycia artykułu wynosi 20%, dochodu 10% a współczynnik korelacji wynosi 0,9.
a) wyznacz równanie regresji spożycia tego artykułu względem dochodu,
b) zinterpretuj oraz podaj miano parametru „a” w tym równaniu,
c) w ilu % o spożyciu tego artykułu decyduje dochód na 1 osobę a w ilu % inne czynniki, nie uwzględnione w badaniu?
Zadanie 6. Dla zmiennych:
Y - liczba odbiorców programów stacji telewizyjnej TV Alfa (w tys. osób),
X - wysokość abonamentu tej stacji (w dziesiątkach zł)
dokonywano obserwacji na koniec każdego roku. Uzyskano oszacowania następujących funkcji regresji:
ŷ = - 0,5 x + 12
= - 1,2 y + 16,8.
Zinterpretować współczynniki linii regresji oraz podać ich miana.
Zadanie 7. Badania działalności handlowej dostarczyły następujących informacji o powierzchni sklepu i wielkości utargu:
Powierzchnia (w m2) |
Dzienny utarg (w tys. zł) |
20 30 35 45 50 70 75 85 90 100 |
3,5 3,0 4,5 4,8 5,0 4,1 6,5 8,8 9,0 10,8 |
a) wyznaczyć parametry linii regresji utargu w zależności od powierzchni,
b) sklep ma powierzchnię 120 m2. Na podstawie wyznaczonego równania regresji oszacować możliwy utarg tego sklepu,
c) sklep osiągnął obroty w wysokości 7 tys. zł. Określić powierzchnię sklepu.
d) współczynnik korelacji między liczbą sprzedawców a utargiem wynosi 0,86. Która z cech w większym stopniu wyjaśnia wielkość utargu: liczba sprzedawców czy powierzchnia sklepu?
Zadanie 8. Badając zależność między miesięcznymi dochodami na osobę gospodarstwa domowego (w zł) a liczbą pracujących członków rodziny, otrzymano następujące równanie regresji:
ŷ = 500 x + 350. Wiadomo ponadto, że liczba pracujących członków rodziny w 81% determinuje miesięczne dochody na osobę gospodarstw domowych.
a) zinterpretować wyznaczoną linię regresji,
b) obliczyć i zinterpretować współczynnik zgodności.
Zadanie 9.
Dwa zakłady przedsiębiorstwa produkują identyczny wyrób. Linie regresji kosztów miesięcznych Y (w tys. zł) względem wielkości produkcji X (w tys. szt.) są następujące:
- dla zakładu I: ŷI = 0,4 x + 15,5;
- dla zakładu II: ŷII = 0,58 x + 15,5.
Który z tych zakładów produkuje oszczędniej?
Zadanie 10.
Na podstawie danych dotyczących wyników egzaminów końcowych (Y - w punktach) oraz ilorazu inteligencji (X) i liczby godzin tygodniowo poświęconych na naukę (Z) wybranej grupy młodzieży:
Numer |
X |
Y |
Z |
1 |
112 |
83 |
9 |
2 |
115 |
79 |
6 |
3 |
129 |
93 |
14 |
4 |
105 |
49 |
4 |
5 |
117 |
63 |
9 |
6 |
115 |
80 |
12 |
7 |
124 |
91 |
10 |
8 |
113 |
80 |
9 |
9 |
106 |
36 |
5 |
10 |
115 |
58 |
7 |
11 |
136 |
93 |
8 |
12 |
129 |
83 |
3 |
a) obliczyć współczynniki korelacji liniowej między cechami: X i Y, X i Z oraz Y i Z,
b) określić, która z cech wpływa silniej na wyniki egzaminu: iloraz inteligencji czy czas nauki,
c) obliczyć współczynniki korelacji rang między cechami: X i Y, X i Z oraz Y i Z,
d) wyznaczyć linię regresji zmiennej Y względem zmiennej X i oszacować przypuszczalny wynik
egzaminu ucznia o ilorazie inteligencji 110,
e) wyznaczyć linię regresji zmiennej Y względem zmiennej Z i oszacować przypuszczalny wynik
egzaminu ucznia, który tygodniowo poświęcał na naukę 15 godzin,
f) uporządkować uczniów pod względem wszystkich trzech cech łącznie.
Zadanie 11.
Stan ilościowy ludności Y (w mln) a powierzchnia X (w tys. km2) wybranych ośmiu polskich województw (stan na 31 XII 1999 r.)
Województwo |
Y |
X |
Dolnośląskie |
3 |
19,95 |
Kujawsko-Pomorskie |
2 |
17,97 |
Lubelskie |
2 |
25,11 |
Lubuskie |
1 |
13,98 |
Łódzkie |
3 |
18,22 |
Małopolskie |
3 |
15,14 |
Mazowieckie |
5 |
35,60 |
Opolskie |
1 |
9,41 |
Zbadać, obliczając współczynnik korelacji rang, czy istnieje związek między liczbą ludności a powierzchnią tych województw.
Zadanie 12.
Liczba urodzeń żywych Y (w tys.) w roku 1997 a stan ilościowy ludności X (w tys.) w wybranych powiatach ziemskich woj. wielkopolskiego (stan na 31 XII 1997 r.)
Powiat |
Y |
X |
Czarnkowsko-Trzcianecki |
1,1 |
87,4 |
Gnieźnieński |
1,7 |
140,8 |
Kaliski |
1,0 |
80,8 |
Kolski |
1,1 |
91,9 |
Koniński |
1,7 |
119,4 |
Ostrowski |
1,8 |
161,0 |
Pilski |
1,6 |
138,0 |
Poznański |
2,7 |
245,8 |
Szamotulski |
1,0 |
85,3 |
Turecki |
1,0 |
85,3 |
Zbadać, obliczając współczynnik korelacji rang, czy istnieje związek między liczbą ludności a liczbą urodzeń żywych w tych powiatach.
Zadanie 13.
Stan ilościowy pracujących Y (w tys.) a stopa rejestrowanego bezrobocia X (w %) wg województw (stan na 31 grudnia 2008 r.)
Województwo |
X |
Y |
Dolnośląskie |
10 |
1014,1 |
Kujawsko-Pomorskie |
13 |
707,8 |
Lubelskie |
11 |
768,4 |
Lubuskie |
12 |
323,2 |
Łódzkie |
9 |
975,5 |
Małopolskie |
8 |
1124,6 |
Mazowieckie |
7 |
2303,4 |
Opolskie |
10 |
321,2 |
Podkarpackie |
13 |
689,2 |
Podlaskie |
10 |
417,9 |
Pomorskie |
8 |
741,5 |
Śląskie |
7 |
1650,3 |
Świętokrzyskie |
14 |
466,8 |
Warmińsko-Mazurskie |
17 |
423,6 |
Wielkopolskie |
6 |
1341,6 |
Zachodnio-Pomorskie |
13 |
530,9 |
Źródło: MRS 2009, s. 647
Zbadać, obliczając współczynnik korelacji rang, czy istnieje związek między stopą rejestrowanego bezrobocia a liczbą pracujących w poszczególnych województwach.
Zadanie 14.
Liczba podmiotów sektora publicznego Y a liczba ludności X (w tys.) w zbiorowości powiatów ziemskich woj. pomorskiego wg stanu na 31 XII 1997 r.
Powiat |
Y |
X |
Bytowski |
164 |
76,0 |
Chojnicki |
182 |
90,3 |
Człuchowski |
124 |
58,6 |
Kartuski |
170 |
98,0 |
Kościerski |
136 |
65,0 |
Kwidzyński |
146 |
82,6 |
Lęborski |
199 |
65,2 |
Malborski |
234 |
108,8 |
Nowodworski |
86 |
36,5 |
Gdański |
128 |
74,7 |
Pucki |
142 |
69,9 |
Słupski |
154 |
93,7 |
Starogardzki |
232 |
121,0 |
Tczewski |
178 |
113,4 |
Wejherowski |
209 |
166,7 |
Źródło: Informator US 1998, Urząd Statystyczny w Gdańsku, s. 94-105
Zbadać, obliczając współczynnik korelacji rang, czy istnieje związek między liczbą podmiotów sektora publicznego a liczbą ludności tych powiatów.
Zadanie 15.
Powierzchnia użytkowa mieszkań Y (w m2 na 1 osobę) a wynagrodzenie brutto X (w % średniej krajowej) w wybranych ośmiu polskich województwach wg stanu na 31 XII 200 r.
Województwo |
Y |
X |
Dolnośląskie |
24 |
106 |
Kujawsko-Pomorskie |
22 |
92 |
Lubelskie |
25 |
94 |
Lubuskie |
24 |
92 |
Łódzkie |
25 |
94 |
Małopolskie |
24 |
100 |
Mazowieckie |
26 |
136 |
Opolskie |
25 |
99 |
Źródło: MRS 2009, s. 649
Zbadać, obliczając współczynnik korelacji rang, czy istnieje związek pomiędzy powierzchnią użytkową mieszkań a wynagrodzeniem brutto w tych województwach.