3. LISTA ZADAŃ ZE STATYSTYKI. WSB OPOLE. TRYB NIESTACJONARNY.
1. Poziom zatrudnienia (w tys. osób) oraz wielkość produkcji (w tys. ton) w ośmiu przedsiębiorstwach przemysłowych kształtowały się następująco:
zatrudnienie |
0,9 |
1,1 |
1,2 |
1,2 |
1,4 |
1,5 |
1,5 |
1,6 |
produkcja |
2,2 |
2,4 |
2,6 |
2,5 |
3,0 |
3,1 |
3,2 |
3,4 |
a) zbadać, czy istnieje związek między badanymi cechami stosując:
- metodę porównywania szeregów statystycznych,
- metodę graficzną.
b) określić siłę i kierunek badanej zależności.
c) opisać badaną zależność za pomocą funkcji regresji: Y względem X oraz X względem Y.
2. Dla 50 losowo wybranych rodzin obliczono, że średnie miesięczne spożycie mięsa w rodzinie wynosi 12 kg a współczynnik zmienności 10%; średni dochód rodziny 3 tys. zł a współczynnik zmienności 20%; kowariancja między spożyciem mięsa i dochodami wynosi 0,648.
a) obliczyć i zinterpretować współczynnik korelacji,
b) wyznaczyć parametry linii regresji spożycia mięsa względem dochodów oraz podać miano i interpretację obliczonego współczynnika regresji.
3. W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności między długością serii produkcji w tys. sztuk (X) a jednostkowym kosztem produkcji wyrobu w zł (Y). W rezultacie otrzymano następujące linie regresji:
= - 0,003y + 1,7,
= - 270x + 5160.
a) podać interpretacje współczynników regresji ax i ay.
b) co można powiedzieć o kierunku i sile zależności między badanymi cechami?
c) w ilu procentach zmienna X wyjaśnia zmienną Y.
d) jaki jest teoretyczny poziom kosztu jednostkowego przy serii produkcji o długości 10 tys. sztuk?
4. W celu zbadania zależności między wydatkami (Y) na czasopisma i wielkością dochodu (X) wybrano losowo 10 rodzin i otrzymano następujące wyniki:
średni dochód
tys. zł; średnie wydatki
zł oraz
;
.
a) czy gospodarstwa domowe są bardziej zróżnicowane pod względem wydatków, czy też dochodów?
b) ocenić siłę zależności liniowej między badanymi zmiennymi.
c) oszacować wielkość wydatków na czasopisma przy dochodzie rodziny wynoszącym 10 tys. zł.
5. Zbadano, jak kształtuje się średnia wydajność pracowników w zależności od czasu nieprzerwanej pracy:
Czas pracy (w godz.) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
Wydajność (w szt./godz.) |
19 |
22 |
19 |
17 |
15 |
13 |
14 |
określić rodzaj badanej zależności na podstawie korelacyjnego wykresu rozrzutu punktów i obliczyć współczynnik korelacji Pearsona,
oszacować, ile sztuk na godzinę może przeciętnie wyprodukować robotnik pracujący nieprzerwanie osiem godzin.
6. Zbadano zależność między liczbą reklam pewnego wyrobu emitowanych dziennie w TV a wysokością obrotów (w tys. zł):
Liczba reklam |
3 |
4 |
5 |
5 |
6 |
7 |
Wielkość obrotów (w tys. zł) |
115 |
142 |
134 |
150 |
148 |
151 |
czy informacje potwierdzają istnienie zależności pomiędzy liczbą reklam a wielkością obrotów? Jeśli tak, to jaka jest siła tej zależności?
przedsiębiorstwo planuje zwiększenie liczby reklam do ośmiu dziennie. Określić spodziewane obroty przy tej liczbie reklam,
wyznaczyć współczynnik korelacji rang.
7. Zatrudnionych w pewnym warsztacie mechaników zbadano pod względem stażu pracy oraz miesięcznych zarobków:
Miesięczny zarobek (w tys. zł) |
Staż pracy (w latach) |
1,40 1,40 1,48 1,57 1,60 1,65 1,75 |
10 11 10 12 13 13 15 |
I. Zbadać, czy istnieje związek między badanymi cechami stosując:
a) metodę porównywania szeregów statystycznych,
b) metodę graficzną.
II. Określić siłę i kierunek zależności między cechami wykorzystując współczynnik korelacji Pearsona.
III. Wyznaczyć linię regresji oraz oszacować wartość cechy Y, dla X = 8 oraz dla X = 17.
IV. Określić jak zmieni się wartość zmiennej zależnej, jeśli zmienna niezależna wzrośnie o jednostkę?
V. Zbadać, za pomocą współczynnika determinacji R2, dopasowanie wyznaczonej linii regresji do punktów empirycznych oraz podać w ilu procentach na zmienność zmiennej zależnej wpływa zmienna niezależna, a w ilu inne czynniki nie uwzględnione w badaniu.
8. Na podstawie poniższych danych oszacowano liniową funkcję regresji o postaci:
ŷ = 1,1 x - 1,7.
xi |
4 |
5 |
6 |
7 |
9 |
11 |
yi |
3 |
4 |
5 |
5 |
9 |
10 |
a) Zbadać dokładność dopasowania funkcji regresji do danych empirycznych oraz podać w ilu procentach zmienna X wyjaśnia zmienną Y.
b) Określić jak zmieni się wartość zmiennej zależnej, jeśli zmienna niezależna wzrośnie o jednostkę?
c) Uwzględniając średni błąd szacunku oszacować wartość cechy Y, dla X =10.
d) Wyznaczyć współczynnik zmienności resztowej oraz ocenić czy dokonany szacunek jest dopuszczalny.
9. Dwa zakłady przedsiębiorstwa produkują identyczny wyrób. Linie regresji kosztów miesięcznych Y (w tys. zł) względem wielkości produkcji X (w tys. zł) są następujące:
- dla zakładu I: ŷI = 0,4 x + 15,5;
- dla zakładu II: ŷII = 0,58 x + 15,5.
Który z tych zakładów produkuje oszczędniej?
10. W finale jazdy figurowej na lodzie brało udział dwunastu zawodników: z1, z2,…, z12. Jazdę oceniało trzech sędziów : I, II III, przy czym oprócz punktacji, każdy sędzia ustalał kolejność wszystkich zawodników:
Zawodnik |
z1 |
z2 |
z3 |
z4 |
z5 |
z6 |
z7 |
z8 |
z9 |
z10 |
z11 |
z12 |
|
Miejsce zawodnika wg oceny sędziego |
I |
3 |
4 |
5 |
6 |
1 |
12 |
2 |
9 |
8 |
10 |
11 |
7 |
|
II |
2 |
5 |
4 |
6 |
1 |
9 |
3 |
8 |
10 |
11 |
12 |
7 |
|
III |
5 |
6 |
1 |
3 |
4 |
2 |
7 |
10 |
8 |
12 |
11 |
9 |
wyznaczyć wartość współczynnika korelacji rang między ocenami sędziów: I i II; I i III oraz II i III,
na podstawie analizy otrzymanych wyników wytypować sędziego do odsunięcia od sędziowania zawodów za zbyt duże rozbieżności ze wskazaniami pozostałych sędziów.
11. Na podstawie danych dotyczących wyników egzaminów końcowych (Y - w punktach) oraz ilorazu inteligencji (X) i liczby godzin tygodniowo poświęconych na naukę (Z) wybranej grupy młodzieży:
Numer |
X |
Y |
Z |
1 |
112 |
83 |
9 |
2 |
115 |
79 |
6 |
3 |
129 |
93 |
14 |
4 |
105 |
49 |
4 |
5 |
117 |
63 |
9 |
6 |
115 |
80 |
12 |
7 |
124 |
91 |
10 |
8 |
113 |
80 |
9 |
9 |
106 |
36 |
5 |
10 |
115 |
58 |
7 |
11 |
136 |
93 |
8 |
12 |
129 |
83 |
3 |
obliczyć współczynniki korelacji liniowej między cechami: X i Y, X i Z oraz Y i Z,
określić, która z cech wpływa silniej na wyniki egzaminu: iloraz inteligencji czy czas nauki,
obliczyć współczynniki korelacji rang między cechami: X i Y, X i Z oraz Y i Z,
wyznaczyć linię regresji zmiennej Y względem zmiennej X i oszacować przypuszczalny wynik egzaminu ucznia o ilorazie inteligencji 110,
wyznaczyć linię regresji zmiennej Y względem zmiennej Z i oszacować przypuszczalny wynik egzaminu ucznia, który tygodniowo poświęcał na naukę 15 godzin.
12. Równania regresji kosztów produkcji Y (w tys. zł) i produkcji X (w sztukach) w zakładzie A są następujące: ŷ = 0,4 x + 3, = 2y + bx , przy czym
= 50 sztuk,
= 23 tys. zł.
a) podać interpretacje oraz miano współczynników regresji,
b) wyznaczyć parametr bx oraz podać jego miano,
c) obliczyć współczynnik determinacji oraz podać jego interpretację,
d) jakich kosztów produkcji należy oczekiwać przy wielkości produkcji równej 100 sztuk?
13. W celu zbadania zależności między stażem pracy X a wydajnością Y wybrano losowo 8 pracowników pewnego przedsiębiorstwa i otrzymano następujące wyniki: średni staż pracy 14 lat, wariancja wydajności 18 oraz
;
;
.
Ile wynosi współczynnik korelacji liniowej?
14. Analiza spożycia pewnego artykułu zależnie od dochodu dla 10 gospodarstw dała wyniki: średnie spożycie artykułu na 1 osobę wynosi 8 kg, średni miesięczny dochód na 1 osobę wynosi 1100 zł, współczynnik zmienności spożycia artykułu wynosi 20%, dochodu 10% a współczynnik korelacji wynosi 0,9.
a) wyznacz równanie regresji spożycia tego artykułu względem dochodu,
b) zinterpretuj oraz podaj miano parametru a w tym równaniu,
c) w ilu % o spożyciu tego artykułu decyduje dochód na 1 osobę a w ilu % inne czynniki, nie uwzględnione w badaniu?
15. Badania działalności handlowej dostarczyły następujących informacji o powierzchni sklepu i wielkości utargu:
Powierzchnia (w m2) |
Dzienny utarg (w tys. zł) |
20 30 35 40 45 65 75 80 90 100 |
3,5 4,8 4,5 3,0 5,0 4,1 6,5 8,8 9,0 10,8 |
a) wyznaczyć parametry linii regresji utargu w zależności od powierzchni oraz odchylenie standardowe reszt ,
b) sklep ma powierzchnię 120 m2. Na podstawie wyznaczonego równania regresji oszacować możliwy utarg tego sklepu,
c) sklep osiągnął obroty w wysokości 7 tys. zł. Określić powierzchnię sklepu.
d) współczynnik korelacji między liczbą sprzedawców a utargiem wynosi 0,7. Która z cech w większym stopniu wyjaśnia wielkość utargu: liczba sprzedawców czy powierzchnia sklepu?
16. Badając zależność między miesięcznymi dochodami na osobę gospodarstwa domowego w zł a liczbą pracujących członków rodziny, otrzymano następujące równanie regresji:
ŷ = 500 x + 350. Wiadomo ponadto, że liczba pracujących członków rodziny w 81% determinuje miesięczne dochody na osobę gospodarstw domowych. Oblicz i zinterpretuj współczynnik zgodności. Jeśli suma kwadratów odchyleń dochodów na osobę od średniej arytmetycznej badanych 50 gospodarstw domowych jest równa 1250, to ile wynosi odchylenie standardowe reszt oszacowanej funkcji regresji?
17. W rezultacie badania ceny działek budowlanych w zł za 1 m2 i odległości działek od centrum w km otrzymano następujące wyniki:
ceny działek |
1000 |
900 |
500 |
500 |
270 |
300 |
170 |
odległość od centrum |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
Wyznacz równanie regresji opisujące ceny działek w zależności od odległości od centrum. Zbadaj dokładność dopasowania tej funkcji do danych empirycznych.
18. Dla zmiennych:
Y - liczba odbiorców programów stacji telewizyjnej TV Alfa (w tys. osób),
X - wysokość abonamentu tej stacji (w dziesiątkach zł)
dokonywano obserwacji na koniec każdego roku. Uzyskano oszacowania następujących funkcji : y = - 0,5 x + 12 oraz x = - 1,2 y + 16,8. Czy funkcje te są liniami regresji? Jeśli tak, to wyznacz wartości średnich arytmetycznych obu zmiennych oraz zinterpretuj współczynniki linii regresji.
19. Na rysunku przedstawiono linie regresji Y względem X oraz X względem Y. Wskaż, które z poniższych odpowiedzi są poprawne:
a) Rxy > 0 b) Rxy < 0 c)
d)
e)
f)