Dr J. Podgórski - zadania do rozwiązywania przed 2-gim kolokwium (bez szeregów czasowych) Na podstawie: J.Podgórski - Statystyka dla studiów licencjackich. PWE 2001
Uwaga: W powyższym podręczniku wariancja i kowariancja obliczana jest z użyciem dzielnika n-1 i dlatego odpowiedzi w tym zakresie będą się różnić w pewnym stopniu od wyników uzyskiwanych na podstawie wzorów z zajęć. Inne rezultaty - również te, w których używa się wariancji i kowariancji - powinny być jednakowe.
ZADANIA - INDEKSY STATYSTYCZNE
1. Produkcja statków morskich przez polskie stocznie w latach 1990-1998 była następująca (Rocznik statystyczny przemysłu 1999, GUS 1999, s. XXXV):
Lata |
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
Statki w tys. DWT |
134 |
208 |
431 |
594 |
781 |
603 |
860 |
a) obliczyć indeksy jednopodstawowe wielkości produkcji statków przyjmując dane dla 1990 r. za podstawę porównań
b) obliczyć indeksy łańcuchowe wielkości produkcji statków
c) obliczyć średnioroczne tempo zmian wielkości produkcji statków w całym okresie
2. Dane są indeksy jednopodstawowe (rok 1990=1) charakteryzujące emisję przemysłowych zanieczyszczeń powietrza w tys. ton (na podstawie: Ochrona środowiska 1999, GUS 1999, s.41):
Lata |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
1998 |
Emisja: 1991=1 |
1 |
0,741 |
0,649 |
0,573 |
0,468 |
0,424 |
0,350 |
0,276 |
a) obliczyć indeksy jednopodstawowe emisji zanieczyszczeń przyjmując dane dla 1994 r. za podstawę porównań
b) obliczyć indeksy łańcuchowe wielkości emisji zanieczyszczeń
c) obliczyć średnioroczne tempo zmian wielkości emisji zanieczyszczeń
3. Indeksy łańcuchowe liczby lisów na terenie Polski według stanu na 31 III obliczone na podstawie danych dla lat 1990-1998 (na podstawie: Ochrona środowiska 1999, GUS 1999, s.41) są następujące:
Lata |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
1998 |
Liczba lisów (rok poprzedni =1) |
0,929 |
1,038 |
1,074 |
1,069 |
1,081 |
1,224 |
1,085 |
1,202 |
a) obliczyć indeksy jednopodstawowe liczby lisów przyjmując dane dla 1994 r. za podstawę porównań,
b) obliczyć średnioroczne tempo zmian liczby lisów: - w całym okresie lat 1990-1998, - w latach 1994-1996.
5. W okresie lat 1985-1998 następował systematyczny spadek umieralności niemowląt, od 22,0 zgonów na 1000 urodzeń w 1985 r. do 9,5 zgonów na 1000 urodzeń w 1998 r. Obliczyć dla tego okresu średnioroczne tempo zmian umieralności niemowląt.
6. Produkt Krajowy Brutto na 1 mieszkańca w pewnym kraju wzrastał w okresie lat 1993-1999 średnio rocznie o 3 %. O ile procent był on wyższy w 1999 r. w porównaniu z 1993 r? Ile wynosił w 1999 roku jeśli w 1993 roku jego wartość wynosiła 4200 $?
7. Dane o produkcji pewnego Zakładu Wyrobów Metalowych w latach 1998 i 1999 są następujące:
Wyroby |
Wielkość produkcji w tys szt. |
Jednostkowe ceny zbytu w zł |
||
|
1998 |
1999 |
1998 |
1999 |
Noże |
60 |
58 |
15 |
16 |
Łyżki |
120 |
100 |
3,2 |
4 |
Widelce |
100 |
90 |
4 |
5 |
Obliczyć i zinterpretować agregatowe indeksy wartości, cen i ilości produkcji zakładu w okresie 1998-1999.
8. Dysponujemy następującymi informacjami o zużyciu niektórych nośników energii w gospodarstwach domowych pewnego typu i o ich cenach jednostkowych:
Źródło energii (j.m.) |
Zużycie w 1998 r. |
Ceny jednostkowe w zł
|
|
|
|
1998 |
1999 |
Elektryczność (1 kWh) |
302 |
0,18 |
0,21 |
Gaz (1 m3) |
12 |
0,55 |
0,65 |
CO (za 1 m2 powierzchni) |
61,5 |
1,80 |
2,06 |
Ciepła woda (1 m3) ) |
7,0 |
4,60 |
5,10 |
Obliczyć i zinterpretować odpowiedni agregatowy indeks cen.
9. W 1997 r. przedsiębiorstwo "Las" skupiło grzyby i borówki wartości, odpowiednio, 7 mln zł i 5 mln zł. W 1998 r. wartość łącznego skupu grzybów i borówek wyniosła 18 mln zł. W 1998 r. w porównaniu z 1987 r. cena skupu grzybów była wyższa o 40%, zaś borówek - wyższa o 100%. Jaka była dynamika masy fizycznej skupu?
10. Dysponujemy następującymi danymi o imporcie trzech produktów w latach 1997 i 1998:
Produkt |
Wartość importu w mln zł w 1998 r |
Zmiany cen zakupu w okresie 1997-1998 |
Papier |
1800 |
Wzrost o 10% |
Karton |
300 |
Bez zmian |
Bibułka |
450 |
Wzrost o 20% |
Obliczyć agregatowy indeks masy fizycznej importu tej grupy towarowej, jeśli wiadomo, że łączna wartość eksportu w 1998 r. w porównaniu z 1997 r. wzrosła o 22%.
11. Zakład wytwarza dwa typy lodów. Wyprodukowane ilości lodów (w t.) w roku 1991 i 1992 oraz wartość sprzedaży w 1992 r. były następujące:
Typ lodów |
Wartościowa struktura sprzedaży w 1992 r. w % |
Ilości w tonach |
|
|
|
1991 |
1992 |
A |
40 |
50 |
40 |
B |
60 |
40 |
40 |
Jak zmieniła się masa fizyczna wyprodukowanych lodów w okresie 1991-1992?.
12. Łączna wartość sprzedaży dwóch gatunków żółtego sera w listopadzie 1997 r. wynosiła 600 tys. zł, a w grudniu tego samego roku 552 tys. zł. Czy prawdą jest, że spadek wartości sprzedaży obu gatunków sera w grudniu spowodowany został wyłącznie spadkiem ilości sprzedanego sera, jeżeli wiadomo, że ser sprzedany w grudniu wart był, w cenach z listopada, 540 tys. zł. Odpowiedź uzasadnić.
Rozwiązania zadań z indeksów
a) 1 ; 1,552 ; 3,216 ; 4,433 ; 5,828 ; 4,50 ; 6,418
b) - ; 1,552 ; 2,072 ; 1,378 ; 1,295 ; 0,772 ; 1,426
c)
;
a) 1,745 ; 1,293 ; 1,133 ; 1 ; 0,817 ; 0,740 ; 0,611 ; 0,482
b) - ; 0,741 ; 0,876 ; 0,883 ; 0,817 ; 0,906 ; 0,825 ; 0,789
c)
;
a) 0,903 ; 0,839 ; 0,871 ; 0,935 ; 1 ; 1,081 ; 1,323 ; 1,436 ; 1,726
b) )
;
;
;
;
$
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
; tak, ponieważ relacja indeksów wartości i ilości wskazuje na wzrost cen
ZADANIA - KORELACJA I REGRESJA
3. Rozkład liczby zatrudnionych (X) i wysokości tygodniowych obrotów w tys. zł (Y) dla 40 sklepów obuwniczych jest następujący:
Y X |
35-45 |
45-55 |
55-65 |
1 |
8 |
- |
- |
2 |
2 |
12 |
2 |
3 |
- |
8 |
8 |
Na podstawie tych danych wykreślić empiryczną krzywą regresji obrotów względem liczby zatrudnionych oraz obliczyć wskaźnik korelacyjny obrotów względem liczby zatrudnionych.
4. Dla 50 wylosowanych studentów pewnej Uczelni otrzymano następujące dane o wynikach w nauce i o nałogu palenia papierosów:
Przeciętna ocena |
Studenci |
|
|
Palący |
Niepalący |
2-3 |
12 |
8 |
3-4 |
6 |
14 |
4-5 |
2 |
8 |
Czy wyniki w nauce zależą od nałogu palenia? Obliczyć odpowiedni wskaźnik korelacyjny. Czy dla tych zmiennych możliwe jest obliczenie współczynnika korelacji?
5. Zanotowano ceny i wiek kilku oferowanych na giełdzie do sprzedaży Fiatów Uno. Dane są następujące:
Wiek (w latach) |
2 |
3 |
5 |
5 |
7 |
8 |
Cena (w tys. zł) |
22 |
18 |
20 |
16 |
15 |
11 |
Sporządzić wykres rozrzutu punktów empirycznych i ocenić na jego podstawie, czy uzasadnione jest przypuszczenie o liniowej regresji ceny używanego Fiata Uno względem jego wieku. Dopasować metodą najmniejszych kwadratów prostą regresji ceny względem wieku samochodu. Ocenić stopień dopasowania modelu regresji do danych empirycznych. Jaka jest przewidywana cena samochodu 6-letniego?
7. Dysponujemy następującymi danymi o miesięcznych dochodach (w tys. zł) i wydatkach na margarynę (w zł) siedmiu 4-osobowych gospodarstw domowych:
Dochody |
2,4 |
3 |
3,5 |
3,6 |
4 |
4,8 |
6 |
Wydatki |
18 |
12 |
16 |
14 |
8 |
9 |
7 |
Obliczyć kowariancję i współczynnik korelacji dla tych danych. Korzystając z uzyskanych wyników podać prostą regresji dopasowaną metodą najmniejszych kwadratów.
8. Dla losowo wybranych 10 klientów supermarketu zarejestrowano dane o liczbie pozycji na rachunku i czasie obsługi przy kasie (w min) otrzymując:
X |
5 |
8 |
10 |
12 |
15 |
21 |
25 |
36 |
40 |
46 |
Y |
2,5 |
3 |
3 |
5,5 |
4 |
6 |
6,5 |
7,5 |
6 |
8 |
Na podstawie tych danych uzyskano:
=0,12x+2,59.
a) obliczyć odchylenie standardowe reszt, b) dokonać podziału całkowitej zmienności czasu obsługi na część wyjaśnioną i niewyjaśnioną regresją liniową i obliczyć na tej podstawie współczynnik determinacji liniowej i współczynnik korelacji.
9. Pięciokrotnie rzucano dwoma kośćmi do gry (żółtą i zieloną), uzyskując wyniki:
Rzut |
Kostka żółta |
Kostka zielona |
1 |
1 |
2 |
2 |
4 |
6 |
3 |
5 |
4 |
4 |
6 |
4 |
5 |
2 |
2 |
Obliczyć współczynnik korelacji dla wyników rzutu dwoma kostkami. Jak sądzisz, czy wyniki rzutu kostką żółtą i zieloną mogą być zależne? Skąd zatem różny od zera współczynnik korelacji?
10. Na podstawie danych zadania 3 obliczyć kowariancję, a następnie współczynnik korelacji wysokości obrotów i liczby zatrudnionych. Podać oceny parametrów liniowego modelu regresji wysokości obrotów względem liczby zatrudnionych. Jaką część zmienności zmiennej zależnej wyjaśnia regresja liniowa? Korzystając z odpowiedzi do zadania 3 określić część zmienności zmiennej zależnej, którą można przypisać „niedopasowaniu” prostej do danych empirycznych.
Rozwiązania zadań z korelacji i regresji
3.
;
;
;
4.
;
;
;
; nie, ponieważ jedna cecha jest niemierzalna;
5. Wykres rozrzutu punktów nie zaprzecza przypuszczeniu, że regresja jest liniowa;
;
;
; 15,5 tys.zł; błąd standardowy prognozy 2,3 tys.zł.
7.
;
;
;
;
8. a)
;
; b) całkowita suma kwadratów odchyleń 34,6 ; resztowa suma kwadratów 7,63 ; wyjaśniona regresją suma kwadratów = 34,6 - 7,63 = 26,97 ;
;
;
9. r = 0,633 ; wyniki rzutów dwoma kośćmi są z natury niezależne (i nieskorelowane), tu wynik oparty jest na małej liczbie obserwacji i jest przypadkowy;
10.
;
;
;
;
;
;
; 57,2%;
.
ZADANIA - SZEREGI CZASOWE
2. Zbiory pszenicy na 1 mieszkańca w Polsce w latach 1990-1998 były następujące (Rocznik Statystyczny 1999, s. LIV):
Lata |
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
1998 |
Zbiory w kg |
237 |
242 |
192 |
214 |
199 |
225 |
222 |
212 |
247 |
Wyrównać szereg czasowy zbiorów pszenicy za pomocą średnich ruchomych: a)3-okresowych i b)5-okresowych. Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregów średnich ruchomych.
3. Liczba gości nowego pensjonatu w miejscowości nadmorskiej w trzech początkowych latach jego działania była następująca:
Rok |
Pora roku |
|||
|
Wiosna |
Lato |
Jesień |
Zima |
1 |
60 |
126 |
40 |
33 |
2 |
68 |
140 |
60 |
40 |
3 |
75 |
166 |
72 |
45 |
Wyrównać szereg czasowy frekwencji w pensjonacie za pomocą średnich ruchomych 4-okresowych scentrowanych. Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregu średnich ruchomych. Jakie składniki pierwotnego szeregu czasowego tkwią w szeregu obliczonych średnich ruchomych?
4. Produkcja nawozów potasowych (w tys. t.) w pewnym przedsiębiorstwie kształtowała się w latach 1994- 1998 następująco:
Lata |
1994 |
1995 |
1996 |
1997 |
1998 |
|||||
Półrocza |
I |
II |
I |
II |
I |
II |
I |
II |
I |
II |
Produkcja |
48 |
32 |
52 |
33 |
55 |
36 |
56 |
40 |
61 |
45 |
Wyrównać szereg czasowy produkcji nawozów potasowych za pomocą średnich ruchomych eliminujących wahania sezonowe. Jakie to są średnie? Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregu wygładzonego. Co można powiedzieć o trendzie produkcji nawozów potasowych w tym okresie?
5. Liczba nieobecnych w pracy pracowników pewnego przedsiębiorstwa w poszczególnych dniach roboczych trzech kolejnych tygodni była następująca:
Tydzień |
Dni tygodnia |
||||
|
Poniedziałek |
Wtorek |
Środa |
Czwartek |
Piątek |
1 |
26 |
16 |
20 |
8 |
10 |
2 |
30 |
20 |
18 |
6 |
12 |
3 |
25 |
19 |
16 |
11 |
9 |
Obliczyć średnie ruchome eliminujące z tego szeregu czasowego wahania sezonowe. Jakie to są średnie? Jakie są główne składniki pierwotnego szeregu czasowego?
8. Dane o liczbie nadanych telegramów na 100 mieszkańców Polski w latach 1990-1997 przedstawiają się następująco (na podstawie: Rocznik Statystyczny 1998, s. LV):
Lata |
1990 |
1991 |
1992 |
1993 |
1994 |
1995 |
1996 |
1997 |
Liczba telegramów |
31 |
26 |
21 |
18 |
16 |
14 |
12 |
11 |
Oszacować na podstawie powyższych danych parametry funkcji trendu liczby nadanych telegramów: a)liniowej, b)potęgowej, c)wykładniczej. Dla każdej z tych funkcji obliczyć współczynnik determinacji (na podstawie liniowej postaci szacowanych funkcji). Porównać jakość dopasowania wszystkich funkcji do danych empirycznych. Wykorzystując wyznaczone funkcje podać prognozy liczby telegramów na rok 1999. Która z nich jest najbardziej wiarygodna?
9. Kwartalna sprzedaż (w tys. zł) wyrobów pewnej firmy w latach 1996-1999 kształtowała się jak w poniższym zestawieniu:
Lata |
Kwartały |
|||
|
I |
II |
III |
IV |
1996 |
20 |
18 |
15 |
17 |
1997 |
22 |
19 |
17 |
20 |
1998 |
26 |
20 |
19 |
22 |
1999 |
27 |
23 |
21 |
25 |
Na podstawie tych danych należy obliczyć i zinterpretować: a)wskaźniki addytywnych wahań sezonowych, b)wskaźniki multyplikatywnych wahań sezonowych
10. Na podstawie danych zadania 3 obliczyć i zinterpretować wskaźniki addytywnych i multyplikatywnych wahań sezonowych liczby gości pensjonatu w różnych porach roku.
11. Na podstawie danych zadania 4 należy obliczyć i zinterpretować wskaźniki addytywnych i multyplikatywnych wahań sezonowych produkcji nawozów potasowych w pewnym przedsiębiorstwie w poszczególnych półroczach.
12. Na podstawie danych zadania 5 należy obliczyć i zinterpretować wskaźniki addytywnych wahań liczby nieobecnych w pracy w przedsiębiorstwie w poszczególnych dniach roboczych tygodnia.
14. Korzystając z danych zadania 4 i obliczeń (ewentualnie odpowiedzi) do zadania 11 wyeliminować z pierwotnych danych o produkcji nawozów potasowych addytywne wahania sezonowe, a następnie obliczyć reszty i oba syntetyczne mierniki wahań przypadkowych (błąd średniokwadratowy i średni błąd absolutny).
15. Z danych zadania 9 o wielkości kwartalnej sprzedaży wyrobów pewnej firmy wyeliminowano addytywne wahania sezonowe, a następnie oszacowano liniową funkcję trendu wartości kwartalnej sprzedaży otrzymując
Wyznaczyć prognozy sprzedaży uwzględniające wahania sezonowe dla wszystkich kwartałów 2000 roku.
16. Z danych zadania 9 wyeliminowano multyplikatywne wahania sezonowe, a następnie oszacowano na ich podstawie wykładniczą funkcję trendu kwartalnej sprzedaży otrzymując
. Podać prognozę sprzedaży uwzględniającą wahania sezonowe dla wszystkich kwartałów 2000 roku.
17. Na podstawie danych zadania 5 i odpowiedzi do zadania 12 obliczyć wyrównane sezonowo dane o absencji pracowników przedsiębiorstwa w okresie dwóch tygodni (wykorzystać odchylenia addytywne) i obliczyć na ich podstawie reszty. Podać wartości błędu średniokwadratowego i średniego błędu absolutnego.
18. Na podstawie rocznych danych Zakładów betonowych „Kormoran” o wielkości produkcji pustaków (tys. palet) w latach 1991-1997 otrzymano funkcję trendu
, gdzie t=1,2,..., oraz se=2,1. Podać prognozę produkcji dla 1999 roku oraz błąd standardowy prognozy.
19. Na podstawie miesięcznych danych o liczbie zachorowań (w tys.) w pewnym mieście w latach 1994-1997 otrzymano m. in. O5=1,08 oraz na podstawie danych sezonowo wyrównanych - liniową funkcję trendu postaci:
(t=1,2,...). Zinterpretować przytoczone wyniki. Podać prognozę zachorowań na grypę w tej miejscowości w maju 1999 r.
20. Na podstawie poniższych danych o wielkości sprzedaży pewnego środka ochrony roślin (w t.)
Półrocza |
Lata |
||||
|
1990 |
1991 |
1992 |
1993 |
1994 |
I |
60 |
56 |
50 |
53 |
50 |
II |
44 |
42 |
40 |
42 |
40 |
otrzymano wskaźniki wahań sezonowych wielkości sprzedaży S1=5,6, S2=-5,6 oraz O1=1,117, O2=0,883. Dokonać dekompozycji wartości y3=56 oraz y4 =42 dwukrotnie: raz zgodnie z modelem addytywnym i drugi raz - zgodnie z modelem multyplikatywnym.
Rozwiązania zadań z szeregów czasowych
a) - ; 223,7 ; 216 ; 201,7 ; 212;7 ; 215,3 ; 219,7 ; 227 ; -
b) - ; - ; 216,8 ; 214,4 ; 210,4 ; 214,4 ; 221 ; - ; -
- ; - ; 65,75 ; 68,5 ; 72,75 ; 76,125 ; 77,875 ; 82 ; 86,75 ; 88,875 ; - ; -
tylko trend
- ; 41 ; 42,25 ; 43,25 ; 44,75 ; 45,75 ; 47 ; 49,25 ; 51,75 ; -
średnie dwuokresowe scentrowane ; trend wzrostowy
- ; - ; 16 ; 16,8 ; 17,6 ; 17,2 ; 16,8 ; 17,2 ; 16,2 ; 16 ; 15,6 ; 16,6 ;16 ; - ; - ; średnie pięciookresowe zwykłe ; wahania sezonowe i przypadkowe.
a)
;
;
;
b)
;
;
;
c)
;
;
;
;
Współczynniki determinacji wskazują na najlepsze dopasowanie funkcji wykładniczej, w związku z czym najbardziej wiarygodna wydaje się prognoza otrzymana na jej podstawie.
a) średnie ruchome scentrowane: - ; - ;17,75 ; 18,125 ; 18,5 ; 19,125 ; 20 ; 20,625 ; 21 ; 21,5 ; 21,875 ; 22,375 ; 23 ; 23,625 ; - ; - ;
;
;
;
; b)
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
;
Szereg czasowy bez sezonowych wahań addytywnych: 38,44 ; 41,56 ; 42,44 ; 42,56; 46,44 ; 49,56 ; 51,44 ; 54,56 ; reszty: 0,56 ; 0,19 ; -0,69 ; 0,69 ; -0,19 ;
-0,56 ; 0,31 ; -0,31 ; - ; Błąd średniokwadratowy = 0,438 ; Średni błąd absolutny = 0,23
I -
; II -
III -
; IV -
I -
; II -
III -
; IV -
Szereg bez wahań sezonowych: 14,94 ; 13,24 ; 18,44 ; 17,54 ; 15,84 ; 18,94 ; 17,24 itd. ; reszty: - ; - ; 2,44 ; 0,74 ; -1,76 ; 1,74 ; 0,44 ; -0,76 ; -0,66 ; 1,84 ; -1,66 ; -0,36 ; -1,56 ; - ; - ; Błąd średniokwadratowy = 2,049 ; Średni błąd absolutny = 1,27
;
W maju liczba zachorowań jest o 8% wyższa od wielkości określonej wyłącznie przez tendencję rozwojową ; z miesiąca na miesiąc liczba zachorowań spadała w rozpatrywanym okresie o 0,16 tys przypadków ;
Model addytywny (kolejne składniki T, S, P):
;
Model multiplikatywny:
;
2
10