WSFiZ zad+rozw, ROZDZIAŁ 10


Dr J. Podgórski - zadania do rozwiązywania przed 2-gim kolokwium (bez szeregów czasowych) Na podstawie: J.Podgórski - Statystyka dla studiów licencjackich. PWE 2001

Uwaga: W powyższym podręczniku wariancja i kowariancja obliczana jest z użyciem dzielnika n-1 i dlatego odpowiedzi w tym zakresie będą się różnić w pewnym stopniu od wyników uzyskiwanych na podstawie wzorów z zajęć. Inne rezultaty - również te, w których używa się wariancji i kowariancji - powinny być jednakowe.

ZADANIA - INDEKSY STATYSTYCZNE

1. Produkcja statków morskich przez polskie stocznie w latach 1990-1998 była następująca (Rocznik statystyczny przemysłu 1999, GUS 1999, s. XXXV):

Lata

1990

1991

1992

1993

1994

1995

1996

Statki w tys. DWT

134

208

431

594

781

603

860

a) obliczyć indeksy jednopodstawowe wielkości produkcji statków przyjmując dane dla 1990 r. za podstawę porównań

b) obliczyć indeksy łańcuchowe wielkości produkcji statków

c) obliczyć średnioroczne tempo zmian wielkości produkcji statków w całym okresie

2. Dane są indeksy jednopodstawowe (rok 1990=1) charakteryzujące emisję przemysłowych zanieczyszczeń powietrza w tys. ton (na podstawie: Ochrona środowiska 1999, GUS 1999, s.41):

Lata

1991

1992

1993

1994

1995

1996

1997

1998

Emisja: 1991=1

1

0,741

0,649

0,573

0,468

0,424

0,350

0,276

a) obliczyć indeksy jednopodstawowe emisji zanieczyszczeń przyjmując dane dla 1994 r. za podstawę porównań

b) obliczyć indeksy łańcuchowe wielkości emisji zanieczyszczeń

c) obliczyć średnioroczne tempo zmian wielkości emisji zanieczyszczeń

3. Indeksy łańcuchowe liczby lisów na terenie Polski według stanu na 31 III obliczone na podstawie danych dla lat 1990-1998 (na podstawie: Ochrona środowiska 1999, GUS 1999, s.41) są następujące:

Lata

1991

1992

1993

1994

1995

1996

1997

1998

Liczba lisów (rok poprzedni =1)

0,929

1,038

1,074

1,069

1,081

1,224

1,085

1,202

a) obliczyć indeksy jednopodstawowe liczby lisów przyjmując dane dla 1994 r. za podstawę porównań,

b) obliczyć średnioroczne tempo zmian liczby lisów: - w całym okresie lat 1990-1998, - w latach 1994-1996.

5. W okresie lat 1985-1998 następował systematyczny spadek umieralności niemowląt, od 22,0 zgonów na 1000 urodzeń w 1985 r. do 9,5 zgonów na 1000 urodzeń w 1998 r. Obliczyć dla tego okresu średnioroczne tempo zmian umieralności niemowląt.

6. Produkt Krajowy Brutto na 1 mieszkańca w pewnym kraju wzrastał w okresie lat 1993-1999 średnio rocznie o 3 %. O ile procent był on wyższy w 1999 r. w porównaniu z 1993 r? Ile wynosił w 1999 roku jeśli w 1993 roku jego wartość wynosiła 4200 $?

7. Dane o produkcji pewnego Zakładu Wyrobów Metalowych w latach 1998 i 1999 są następujące:

Wyroby

Wielkość produkcji w tys szt.

Jednostkowe ceny zbytu w zł

1998

1999

1998

1999

Noże

60

58

15

16

Łyżki

120

100

3,2

4

Widelce

100

90

4

5

Obliczyć i zinterpretować agregatowe indeksy wartości, cen i ilości produkcji zakładu w okresie 1998-1999.

8. Dysponujemy następującymi informacjami o zużyciu niektórych nośników energii w gospodarstwach domowych pewnego typu i o ich cenach jednostkowych:

Źródło energii (j.m.)

Zużycie w 1998 r.

Ceny jednostkowe w zł

1998

1999

Elektryczność (1 kWh)

302

0,18

0,21

Gaz (1 m3)

12

0,55

0,65

CO (za 1 m2 powierzchni)

61,5

1,80

2,06

Ciepła woda (1 m3) )

7,0

4,60

5,10

Obliczyć i zinterpretować odpowiedni agregatowy indeks cen.

9. W 1997 r. przedsiębiorstwo "Las" skupiło grzyby i borówki wartości, odpowiednio, 7 mln zł i 5 mln zł. W 1998 r. wartość łącznego skupu grzybów i borówek wyniosła 18 mln zł. W 1998 r. w porównaniu z 1987 r. cena skupu grzybów była wyższa o 40%, zaś borówek - wyższa o 100%. Jaka była dynamika masy fizycznej skupu?

10. Dysponujemy następującymi danymi o imporcie trzech produktów w latach 1997 i 1998:

Produkt

Wartość importu w mln zł

w 1998 r

Zmiany cen zakupu w okresie 1997-1998

Papier

1800

Wzrost o 10%

Karton

300

Bez zmian

Bibułka

450

Wzrost o 20%

Obliczyć agregatowy indeks masy fizycznej importu tej grupy towarowej, jeśli wiadomo, że łączna wartość eksportu w 1998 r. w porównaniu z 1997 r. wzrosła o 22%.

11. Zakład wytwarza dwa typy lodów. Wyprodukowane ilości lodów (w t.) w roku 1991 i 1992 oraz wartość sprzedaży w 1992 r. były następujące:

Typ lodów

Wartościowa struktura sprzedaży w 1992 r. w %

Ilości w tonach

1991

1992

A

40

50

40

B

60

40

40

Jak zmieniła się masa fizyczna wyprodukowanych lodów w okresie 1991-1992?.

12. Łączna wartość sprzedaży dwóch gatunków żółtego sera w listopadzie 1997 r. wynosiła 600 tys. zł, a w grudniu tego samego roku 552 tys. zł. Czy prawdą jest, że spadek wartości sprzedaży obu gatunków sera w grudniu spowodowany został wyłącznie spadkiem ilości sprzedanego sera, jeżeli wiadomo, że ser sprzedany w grudniu wart był, w cenach z listopada, 540 tys. zł. Odpowiedź uzasadnić.

Rozwiązania zadań z indeksów

  1. a) 1 ; 1,552 ; 3,216 ; 4,433 ; 5,828 ; 4,50 ; 6,418
    b) - ; 1,552 ; 2,072 ; 1,378 ; 1,295 ; 0,772 ; 1,426
    c) 0x01 graphic
    ; 0x01 graphic

  2. a) 1,745 ; 1,293 ; 1,133 ; 1 ; 0,817 ; 0,740 ; 0,611 ; 0,482
    b) - ; 0,741 ; 0,876 ; 0,883 ; 0,817 ; 0,906 ; 0,825 ; 0,789
    c) 0x01 graphic
    ; 0x01 graphic

  3. a) 0,903 ; 0,839 ; 0,871 ; 0,935 ; 1 ; 1,081 ; 1,323 ; 1,436 ; 1,726
    b) ) 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  4. 0x01 graphic
    ; 0x01 graphic

  5. 0x01 graphic
    ; 0x01 graphic
    $

  6. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  7. 0x01 graphic

  8. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  9. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  10. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  11. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; tak, ponieważ relacja indeksów wartości i ilości wskazuje na wzrost cen 0x01 graphic

ZADANIA - KORELACJA I REGRESJA

3. Rozkład liczby zatrudnionych (X) i wysokości tygodniowych obrotów w tys. zł (Y) dla 40 sklepów obuwniczych jest następujący:

Y

X

35-45

45-55

55-65

1

8

-

-

2

2

12

2

3

-

8

8

Na podstawie tych danych wykreślić empiryczną krzywą regresji obrotów względem liczby zatrudnionych oraz obliczyć wskaźnik korelacyjny obrotów względem liczby zatrudnionych.

4. Dla 50 wylosowanych studentów pewnej Uczelni otrzymano następujące dane o wynikach w nauce i o nałogu palenia papierosów:

Przeciętna

ocena

Studenci

Palący

Niepalący

2-3

12

8

3-4

6

14

4-5

2

8

Czy wyniki w nauce zależą od nałogu palenia? Obliczyć odpowiedni wskaźnik korelacyjny. Czy dla tych zmiennych możliwe jest obliczenie współczynnika korelacji?

5. Zanotowano ceny i wiek kilku oferowanych na giełdzie do sprzedaży Fiatów Uno. Dane są następujące:

Wiek (w latach)

2

3

5

5

7

8

Cena (w tys. zł)

22

18

20

16

15

11

Sporządzić wykres rozrzutu punktów empirycznych i ocenić na jego podstawie, czy uzasadnione jest przypuszczenie o liniowej regresji ceny używanego Fiata Uno względem jego wieku. Dopasować metodą najmniejszych kwadratów prostą regresji ceny względem wieku samochodu. Ocenić stopień dopasowania modelu regresji do danych empirycznych. Jaka jest przewidywana cena samochodu 6-letniego?

7. Dysponujemy następującymi danymi o miesięcznych dochodach (w tys. zł) i wydatkach na margarynę (w zł) siedmiu 4-osobowych gospodarstw domowych:

Dochody

2,4

3

3,5

3,6

4

4,8

6

Wydatki

18

12

16

14

8

9

7

Obliczyć kowariancję i współczynnik korelacji dla tych danych. Korzystając z uzyskanych wyników podać prostą regresji dopasowaną metodą najmniejszych kwadratów.

8. Dla losowo wybranych 10 klientów supermarketu zarejestrowano dane o liczbie pozycji na rachunku i czasie obsługi przy kasie (w min) otrzymując:

X

5

8

10

12

15

21

25

36

40

46

Y

2,5

3

3

5,5

4

6

6,5

7,5

6

8

Na podstawie tych danych uzyskano: 0x01 graphic
0x01 graphic
0x01 graphic
=0,12x+2,59.

a) obliczyć odchylenie standardowe reszt, b) dokonać podziału całkowitej zmienności czasu obsługi na część wyjaśnioną i niewyjaśnioną regresją liniową i obliczyć na tej podstawie współczynnik determinacji liniowej i współczynnik korelacji.

9. Pięciokrotnie rzucano dwoma kośćmi do gry (żółtą i zieloną), uzyskując wyniki:

Rzut

Kostka żółta

Kostka zielona

1

1

2

2

4

6

3

5

4

4

6

4

5

2

2

Obliczyć współczynnik korelacji dla wyników rzutu dwoma kostkami. Jak sądzisz, czy wyniki rzutu kostką żółtą i zieloną mogą być zależne? Skąd zatem różny od zera współczynnik korelacji?

10. Na podstawie danych zadania 3 obliczyć kowariancję, a następnie współczynnik korelacji wysokości obrotów i liczby zatrudnionych. Podać oceny parametrów liniowego modelu regresji wysokości obrotów względem liczby zatrudnionych. Jaką część zmienności zmiennej zależnej wyjaśnia regresja liniowa? Korzystając z odpowiedzi do zadania 3 określić część zmienności zmiennej zależnej, którą można przypisać „niedopasowaniu” prostej do danych empirycznych.

Rozwiązania zadań z korelacji i regresji

3. 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic

4. 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; nie, ponieważ jedna cecha jest niemierzalna;

5. Wykres rozrzutu punktów nie zaprzecza przypuszczeniu, że regresja jest liniowa; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 15,5 tys.zł; błąd standardowy prognozy 2,3 tys.zł.

7. 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
0x01 graphic
;

8. a) 0x01 graphic
; 0x01 graphic
; b) całkowita suma kwadratów odchyleń 34,6 ; resztowa suma kwadratów 7,63 ; wyjaśniona regresją suma kwadratów = 34,6 - 7,63 = 26,97 ; 0x01 graphic
; 0x01 graphic
;

9. r = 0,633 ; wyniki rzutów dwoma kośćmi są z natury niezależne (i nieskorelowane), tu wynik oparty jest na małej liczbie obserwacji i jest przypadkowy;

10. 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 57,2%; 0x01 graphic
.

ZADANIA - SZEREGI CZASOWE

2. Zbiory pszenicy na 1 mieszkańca w Polsce w latach 1990-1998 były następujące (Rocznik Statystyczny 1999, s. LIV):

Lata

1990

1991

1992

1993

1994

1995

1996

1997

1998

Zbiory w kg

237

242

192

214

199

225

222

212

247

Wyrównać szereg czasowy zbiorów pszenicy za pomocą średnich ruchomych: a)3-okresowych i b)5-okresowych. Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregów średnich ruchomych.

3. Liczba gości nowego pensjonatu w miejscowości nadmorskiej w trzech początkowych latach jego działania była następująca:

Rok

Pora roku

Wiosna

Lato

Jesień

Zima

1

60

126

40

33

2

68

140

60

40

3

75

166

72

45

Wyrównać szereg czasowy frekwencji w pensjonacie za pomocą średnich ruchomych 4-okresowych scentrowanych. Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregu średnich ruchomych. Jakie składniki pierwotnego szeregu czasowego tkwią w szeregu obliczonych średnich ruchomych?

4. Produkcja nawozów potasowych (w tys. t.) w pewnym przedsiębiorstwie kształtowała się w latach 1994- 1998 następująco:

Lata

1994

1995

1996

1997

1998

Półrocza

I

II

I

II

I

II

I

II

I

II

Produkcja

48

32

52

33

55

36

56

40

61

45

Wyrównać szereg czasowy produkcji nawozów potasowych za pomocą średnich ruchomych eliminujących wahania sezonowe. Jakie to są średnie? Sporządzić, w jednym układzie współrzędnych, wykres szeregu pierwotnego i szeregu wygładzonego. Co można powiedzieć o trendzie produkcji nawozów potasowych w tym okresie?

5. Liczba nieobecnych w pracy pracowników pewnego przedsiębiorstwa w poszczególnych dniach roboczych trzech kolejnych tygodni była następująca:

Tydzień

Dni tygodnia

Poniedziałek

Wtorek

Środa

Czwartek

Piątek

1

26

16

20

8

10

2

30

20

18

6

12

3

25

19

16

11

9

Obliczyć średnie ruchome eliminujące z tego szeregu czasowego wahania sezonowe. Jakie to są średnie? Jakie są główne składniki pierwotnego szeregu czasowego?

8. Dane o liczbie nadanych telegramów na 100 mieszkańców Polski w latach 1990-1997 przedstawiają się następująco (na podstawie: Rocznik Statystyczny 1998, s. LV):

Lata

1990

1991

1992

1993

1994

1995

1996

1997

Liczba telegramów

31

26

21

18

16

14

12

11

Oszacować na podstawie powyższych danych parametry funkcji trendu liczby nadanych telegramów: a)liniowej, b)potęgowej, c)wykładniczej. Dla każdej z tych funkcji obliczyć współczynnik determinacji (na podstawie liniowej postaci szacowanych funkcji). Porównać jakość dopasowania wszystkich funkcji do danych empirycznych. Wykorzystując wyznaczone funkcje podać prognozy liczby telegramów na rok 1999. Która z nich jest najbardziej wiarygodna?

9. Kwartalna sprzedaż (w tys. zł) wyrobów pewnej firmy w latach 1996-1999 kształtowała się jak w poniższym zestawieniu:

Lata

Kwartały

I

II

III

IV

1996

20

18

15

17

1997

22

19

17

20

1998

26

20

19

22

1999

27

23

21

25

Na podstawie tych danych należy obliczyć i zinterpretować: a)wskaźniki addytywnych wahań sezonowych, b)wskaźniki multyplikatywnych wahań sezonowych

10. Na podstawie danych zadania 3 obliczyć i zinterpretować wskaźniki addytywnych i multyplikatywnych wahań sezonowych liczby gości pensjonatu w różnych porach roku.

11. Na podstawie danych zadania 4 należy obliczyć i zinterpretować wskaźniki addytywnych i multyplikatywnych wahań sezonowych produkcji nawozów potasowych w pewnym przedsiębiorstwie w poszczególnych półroczach.

12. Na podstawie danych zadania 5 należy obliczyć i zinterpretować wskaźniki addytywnych wahań liczby nieobecnych w pracy w przedsiębiorstwie w poszczególnych dniach roboczych tygodnia.

14. Korzystając z danych zadania 4 i obliczeń (ewentualnie odpowiedzi) do zadania 11 wyeliminować z pierwotnych danych o produkcji nawozów potasowych addytywne wahania sezonowe, a następnie obliczyć reszty i oba syntetyczne mierniki wahań przypadkowych (błąd średniokwadratowy i średni błąd absolutny).

15. Z danych zadania 9 o wielkości kwartalnej sprzedaży wyrobów pewnej firmy wyeliminowano addytywne wahania sezonowe, a następnie oszacowano liniową funkcję trendu wartości kwartalnej sprzedaży otrzymując 0x01 graphic
Wyznaczyć prognozy sprzedaży uwzględniające wahania sezonowe dla wszystkich kwartałów 2000 roku.

16. Z danych zadania 9 wyeliminowano multyplikatywne wahania sezonowe, a następnie oszacowano na ich podstawie wykładniczą funkcję trendu kwartalnej sprzedaży otrzymując 0x01 graphic
. Podać prognozę sprzedaży uwzględniającą wahania sezonowe dla wszystkich kwartałów 2000 roku.

17. Na podstawie danych zadania 5 i odpowiedzi do zadania 12 obliczyć wyrównane sezonowo dane o absencji pracowników przedsiębiorstwa w okresie dwóch tygodni (wykorzystać odchylenia addytywne) i obliczyć na ich podstawie reszty. Podać wartości błędu średniokwadratowego i średniego błędu absolutnego.

18. Na podstawie rocznych danych Zakładów betonowych „Kormoran” o wielkości produkcji pustaków (tys. palet) w latach 1991-1997 otrzymano funkcję trendu 0x01 graphic
, gdzie t=1,2,..., oraz se=2,1. Podać prognozę produkcji dla 1999 roku oraz błąd standardowy prognozy.

19. Na podstawie miesięcznych danych o liczbie zachorowań (w tys.) w pewnym mieście w latach 1994-1997 otrzymano m. in. O5=1,08 oraz na podstawie danych sezonowo wyrównanych - liniową funkcję trendu postaci: 0x01 graphic
(t=1,2,...). Zinterpretować przytoczone wyniki. Podać prognozę zachorowań na grypę w tej miejscowości w maju 1999 r.

20. Na podstawie poniższych danych o wielkości sprzedaży pewnego środka ochrony roślin (w t.)

Półrocza

Lata

1990

1991

1992

1993

1994

I

60

56

50

53

50

II

44

42

40

42

40

otrzymano wskaźniki wahań sezonowych wielkości sprzedaży S1=5,6, S2=-5,6 oraz O1=1,117, O2=0,883. Dokonać dekompozycji wartości y3=56 oraz y4 =42 dwukrotnie: raz zgodnie z modelem addytywnym i drugi raz - zgodnie z modelem multyplikatywnym.

Rozwiązania zadań z szeregów czasowych

  1. a) - ; 223,7 ; 216 ; 201,7 ; 212;7 ; 215,3 ; 219,7 ; 227 ; -
    b) - ; - ; 216,8 ; 214,4 ; 210,4 ; 214,4 ; 221 ; - ; -

  2. - ; - ; 65,75 ; 68,5 ; 72,75 ; 76,125 ; 77,875 ; 82 ; 86,75 ; 88,875 ; - ; -
    tylko trend

  3. - ; 41 ; 42,25 ; 43,25 ; 44,75 ; 45,75 ; 47 ; 49,25 ; 51,75 ; -
    średnie dwuokresowe scentrowane ; trend wzrostowy

  4. - ; - ; 16 ; 16,8 ; 17,6 ; 17,2 ; 16,8 ; 17,2 ; 16,2 ; 16 ; 15,6 ; 16,6 ;16 ; - ; - ; średnie pięciookresowe zwykłe ; wahania sezonowe i przypadkowe.

  5. a) 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

    b) 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

    c) 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

    Współczynniki determinacji wskazują na najlepsze dopasowanie funkcji wykładniczej, w związku z czym najbardziej wiarygodna wydaje się prognoza otrzymana na jej podstawie.

  6. a) średnie ruchome scentrowane: - ; - ;17,75 ; 18,125 ; 18,5 ; 19,125 ; 20 ; 20,625 ; 21 ; 21,5 ; 21,875 ; 22,375 ; 23 ; 23,625 ; - ; - ; 0x01 graphic
    ; 0x01 graphic
    ;

0x01 graphic
; 0x01 graphic
; b) 0x01 graphic
; 0x01 graphic
; 0x01 graphic
; 0x01 graphic

  1. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  2. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  3. 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic
    ; 0x01 graphic

  4. Szereg czasowy bez sezonowych wahań addytywnych: 38,44 ; 41,56 ; 42,44 ; 42,56; 46,44 ; 49,56 ; 51,44 ; 54,56 ; reszty: 0,56 ; 0,19 ; -0,69 ; 0,69 ; -0,19 ;

-0,56 ; 0,31 ; -0,31 ; - ; Błąd średniokwadratowy = 0,438 ; Średni błąd absolutny = 0,23

  1. I - 0x01 graphic
    ; II - 0x01 graphic

    III - 0x01 graphic
    ; IV - 0x01 graphic

  2. I - 0x01 graphic
    ; II - 0x01 graphic

    III - 0x01 graphic
    ; IV - 0x01 graphic

  3. Szereg bez wahań sezonowych: 14,94 ; 13,24 ; 18,44 ; 17,54 ; 15,84 ; 18,94 ; 17,24 itd. ; reszty: - ; - ; 2,44 ; 0,74 ; -1,76 ; 1,74 ; 0,44 ; -0,76 ; -0,66 ; 1,84 ; -1,66 ; -0,36 ; -1,56 ; - ; - ; Błąd średniokwadratowy = 2,049 ; Średni błąd absolutny = 1,27

  4. 0x01 graphic
    ; 0x01 graphic

  5. W maju liczba zachorowań jest o 8% wyższa od wielkości określonej wyłącznie przez tendencję rozwojową ; z miesiąca na miesiąc liczba zachorowań spadała w rozpatrywanym okresie o 0,16 tys przypadków ; 0x01 graphic

  6. Model addytywny (kolejne składniki T, S, P): 0x01 graphic
    ; 0x01 graphic

    Model multiplikatywny: 0x01 graphic
    ; 0x01 graphic

2

10



Wyszukiwarka