Maria Balcerowicz-Szkutnik
Podstawy statystyki w przykładach i zadaniach
Statystyka opisowa elementy wnioskowania statystycznego
Bytom 2004
Redakcja:
Magdalena Goik
Recenzent:
dr hab. Zygmunt Przybycin
Spis treści
ISBN 83-88587-86-2
Przedmowa .............
Rozdział I
Analiza struktury zjawisk........
Zadania do samodzielnego rozwiązywania
Rozdział III
Elementy teorii współzależności cech .... Zadania do samodzielnego rozwiązywania
Rozdział III
Analiza dynamiki zjawisk........
Zadania do samodzielnego rozwiązywania
Rozdział IV
Wybrane zagadnienia statystyki matematycznej Zadania do samodzielnego rozwiązywania
Rozdział V
Przykładowe zadania testowe ......
Bibliografia
36 55
65 85
92 102
108
126
Copyright by Wv7c
y sza Szkoła Ekonomii i Administracji w By
tomiu
Przedmowa
Przedstawiony skrypt stanowi opracowanie będące, w swoim zamierzeniu uzupełnieniem istniejącej szerokiej literatury przedmiotu o nową pozycję, kierowaną przede wszystkim do studentów uczelni ekonomicznych. Skrypt obejmuje zakres statystyki opisowej prezentowanej w ramach wykładu ze statystyki dla studiów licencjackich i magisterskich uczelni ekonomicznych, głównie studiujących w trybie zaocznym i wieczorowym.
W prezentowanej wersji skryptu pominięto treści teoretyczne, zwracając uwagę na techniki rozwiązywania zadań jako, że ten element wraz z umiejętnością aplikacji teoretycznych aspektów statystyki sprawia studentom najwięcej trudności. Z tego też względu szczególną uwagę skierowano na przedstawienie typowych i wariantowych sposobów rozważania problemów statystycznych w licznych rozwiązanych w skrypcie przykładach.
Opracowanie podzielono na cztery zasadnicze części (zgodnie z wymogami przedmiotu) i w każdej z nich przedstawiono kilkanaście zadań rozwiązanych w szczegółowy sposób z podaniem pełnej postaci wykorzystanych wzorów i warunkami ich zastosowania oraz od 25 do 30 zadań do samodzielnego rozwiązania.
Osobną część stanowi propozycja 50 zadań testowych (każde do rozwiązania w ciągu przeciętnie 3 minut) jako, że te formy sprawdzania wiedzy studentów cieszą się coraz większą popularnością.
Zdecydowana część zadań ma charakter autorski i tylko nieliczne są modyfikacjami zadań zamieszczonych w już istniejących podręcznikach. Jako podręczniki, uzupełniające wykłady o charakterze teoretycznym, student może wykorzystać dowolny podręcznik z zamieszczonego spisu literatury, a głównie z podręcznika Mieczysława Sobczyka.
Niniejszy skrypt stanowi tylko część tematów realizowanych w ramach przedmiotu statystyka. W zamierzeniu autora jest przygotowanie części II, w której zamieszczone będą podstawy teoretyczne wszystkich tematów objętych
gramem studiów ze statystyki wraz z zagadnieniami nie zamieszczonymi :m opracowaniu, a dotyczącymi tematów z zakresu rachunku prawdopodo-istwa, estymacji parametrów zbiorowości statystycznej i weryfikacji hipotez ystycznych.
Rozdział I
Analiza struktury zjawisk
3 Zadanie 1.
W sześcioosobowej grupie pracowników wpłaty do urzędów skarbowych z tytułu podatku dochodowego od osób fizycznych były za rok 1999 następujące: 2039,40 zł; 2699,40 zł; 3670,20 zł; 2236,80 zł; 1602,30 z; 2963,70 zł. Jaka była wartość przeciętna wpłaconego do urzędów skarbowych podatku? vr Rozwiązanie.
Dla ustalenia wartości przeciętnej w przypadku szeregu wyliczającego wykorz-stuje się wzór w następującej postaci:
X, +x-
'
J.J.
gdzie odpowiednio:
x - oznaczenie wartości przeciętnej (wartości średniej) x. - realizacja cechy statystycznej n - liczba realizacji cechy statystycznej W naszym przypadku
__ 2039,4 + 2699,4 + 3670,2 + 2236,8 + 1602,3 + 2963,7
[1]
co oznacza, że przeciętna wpłata podatku dochodowego od osób fizycznych do urzędu skarbowego w tej grupie pracowników była równo 2535,3 zł.
3 Zadanie 2.
Ustalić średni wzrost 10-letniego chłopca w szkołach podstawowych miasta Siemianowice dysponując danymi uzyskanymi z kart lekarskich pielęgniarek szkolnych.
7
Rozdział I
t Rozwiązanie.
Ze względu na postać szeregu statystycznego (szereg punktowy), w którym zaprezentowano dane do oceny poziomu przeciętnego wykorzystamy średnią ważoną zgodnie z wzorem:
Wzrost w cm 150 151 152 153 154 155 156 Razem
Liczba dzieci 25 35 40 45 40 30 20 235
Źródło: dane umowne
X =
x1n1 +x2n2
[2]
ni +n2
i-l
gdzie:
x
x. n.
oznaczenie wartości przeciętnej (przeciętnej);
realizacja cechy statystycznej;
liczebność cząstkowa realizacji x., czyli liczba jej powtórzeń;
liczba różnych realizacji cechy statystycznej.
W naszym przypadku otrzymujemy:
- 150-25+ 151-35+ 152-40 + 153-45+ 154-40 + 155-30+ 156-20 _ 35330 = 1J2 89 _ 153cm 25 + 35 + 40 + 45 + 40 + 30 + 20 35 ' Cm
O Zadanie 3.
Dla celów sprawozdawczości finansowej ustalić średnie wynagrodzenie w pierwszym kwartale 1999 r. pracowników spółki akcyjnej "Ania" w Białej Podlaskiej dysponując danymi.
Wynagrodzenie w zł (xid'x") Liczba pracowników ni
1000-1200 65
1200-1400 110
1400-1600 42
1600-1800 83
300 ,f
Zrodlo: dane umowne
Rozwiązanie.
Ze względu na postać szeregu statystycznego (szereg przedziałowy) w postaci,
8
którego przedstawiono dane źródłowe do wyznaczenia miary poziomu przeciętnego wykorzystamy średnią ważoną w postaci:
x2n
k
In,
i
2n2
xnn
n"k
n, +n2
[3]
Izie:
x
X
- oznaczenie miernika;
- środek przedziału klasowego wyznaczamy jako średnie arytmetyczne granic przedziału (x.d - dolna granica przedziału i x. górna granica
, . , > " Xid + Xig
przedziału) x =----------- ;
n. - liczebności cząstkowe, czyli liczba elementów przedziału o numerze "i"; k - liczba przedziałów klasowych szeregu.
W naszym przypadku wartość średnia jest równa:
1100-65+ 1300-110+ 1500-42+ 1700-83 418600
65 + 110 + 42 + 83
300
= 1395,33
co oznacza, że średnia płaca pracownika spółki akcyjnej "Ania" w pierwszym kwartale 1999 roku była równa 1395,33 zł.
O Zadanie 4.
Na podstawie informacji zamieszczonych w szeregu statystycznym, przedstawionym w postaci poniższej tablicy, ustalić poziom średni cechy, wskaźniki struktury oraz dokonać prezentacji graficznej przedstawionego materiału statystycznego.
Tablica
Zakłady usługowe w Gdańsku według obrotów osiągniętych w styczniu 1999 r.
i i
Obroty w zł (**-*,.) 10 000-14 000 14 000-18 000 18 000-22 000 22 000-26 000 26 000-30 000 Razem
Liczba Zakładów 306 408 629 272 85 1700
Rozdział I
Analiza struktury zjawisk.
1r Rozwiązanie.
Dla wyznaczenia wartości średniej wykorzystamy wzór na średnią ważoną
(patrz zad. 3), czyli otrzymamy:
_ 12000-306+ 16000-408+ 20000-629+ 24000-272+ 2800-85 3168800 ,"" ,
x =------------------------------------------------------------------------=----------= 18640 zł
1700 1700
co oznacza, że średni poziom obrotów w rozważanej grupie zakładów usługowych
jest równy 18 640 zł.
Wskaźniki struktury lub inaczej częstości wyznaczamy jako ilorazy liczebności cząstkowych i liczebności ogólnej przyjmując oznaczenie:
n
j = przy czym n
=1
Otrzymujemy odpowiednio:
306 406 n-,A 629 w, =^- = 0,18; w2= = 0,24; w3=--------
1700
1700
1700
1700
w5 =
1700
co oznacza, że 18% zakładów usługowych miało obroty w wysokości od 10 tys. do 14 tys. zł; 24% zakładów miało obroty w wysokości od 14 tys. zł do 18 i dalej interpretując 5% zakładów miało obroty od 26 tys. do 30 tys. zł.
Do prezentacji graficznej możemy wybrać dowolną postać wykresu statystycznego: wykres powierzchniowy (koło) lub słupkowy, czyli klasyczny histogram.
Wykres kołowy będzie miał postać:
Natomiast histogram przedstawiony w układzie współrzędnych
w( (100%) 40 -
30 -20 -
10 -
obroty w tys.
10 14 18 22 26 30
Rys. 1
Na podstawie histogramu możemy wyznaczyć diagram jako łamaną łączącą punkty o współrzędnych (x,n.) lub (x, w.). Wygładzona postać diagramu tworzy krzywą liczebności, której kształt pozwala na określenie rodzaju asymetrii rozkładu analizowanej cechy.
W przypadku analizowanej cechy stwierdzamy asymetrię lewostronną.
3 Zadanie 5.
Akcje Spółki Akcyjnej "Kant" w czasie kolejnych notowań giełdowych w roku 1999 osiągnęły następujące wartości (w zł):
26, 18, 30, 20, 23, 25, 19, 28, 20, 24, 18, 28, 21, 26, 25, 23, 21, 26, 20, 28, 25, 21, 26, 20, 19, 19, 20, 22, 23, 18, 19, 31, 23, 28, 25, 19, 21, 26, 26, 20, 25, 26, 20, 21, 2.6, 21, 20, 21, 26, 30, 21, 21, 20, 29, 28, 20, 21, 18, 20, 22, 21, 26, 19, 31, 25, 26, 26, 25, 20, 21, 26, 30, 28, 26, 30, 22, 28, 25, 23, 21, 20, 26, 20, 21, 26, 20, 21, 20, 21,29,21.
Wskaż dominującą cenę akcji Spółki "Kant" na giełdzie. ^ Rozwiązanie.
Wartość dominująca dla szeregu wyliczającego lub punktowego jest realizacją cechy statystycznej o największej liczbie powtórzeń lub największej liczebności cząstkowej. Zatem najważniejszym elementem pracy będzie uporządkowanie szeregu w sposób monotoniczny i określenie wartości dominującej.
Wybieramy najpierw najmniejszą (xmjn) i największą (xmax) realizację cechy
x_,_ = 18 i x_... = 31
10
11
Rozdział I
Analiza struktury zjawisk
i porządkujemy szereg monotonicznie:
18, 18, 18, 18, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 20, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 21, 22, 22, 22, 23, 23, 23, 23, 23, 24, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 30, 30, 30,
30,31,31.
Okazało się, że najczęściej w roku 1999 notowania akcji Spółki "Kant" osiągnęły cenę 21 zł i tę wartość uznajemy za dominantę.
O Zadanie 6.
Na podstawie informacji zawartej w tablicy określić dominujący wiek pracownika zatrudnionego na stanowisku kierowniczym w przedsiębiorstwach budowlanych w Nowym Sączu w lipcu 1999 roku.
Tablica
Pracownicy przedsiębiorstw budowlanych w Nowym Sączu w lipcu 1999 roku wg wieku
Źródło: dane umowne
4Ł Rozwiązanie.
Wyznaczenie dominanty dla szeregu przedziałowego wymaga zastosowania
wzoru interpolacyjnego postaci
~nD-i
nD-nD_!+nD-nD+1
ŚŚ AxT
[4]
gdzie odpowiednio:
D - oznaczenie miernika (dominanty, wartości najczęstszej lub mody); xD - początek przedziału miernika, czyli przedziału o największej liczebności
cząstkowej; nD, nD ,, nD+1 - liczebności cząstkowe przedziałów dominanty i sąsiednich, czyli
poprzedzającego i następującego po przedziale dominanty;
AxD - długość przedziału miernika, czyli różnica pomiędzy końcem i początkiem przedziału AxD = x. - x.d.
Konieczne jest przy stosowaniu tego wzoru założenie, że długości przedziałów klasowych w rozważanym szeregu są równe lub jego osłabiona postać, że równe co do długości są co najmniej trzy przedziały klasowe - dominanty
i sąsiednie.
W naszym przypadku otrzymujemy:
12
= 30 +
45-15
45-15 + 45-9
,10 = 30 + 4,545 = 34,55 34,5 lat
czyli najczęściej na stanowiskach kierowniczych w przedsiębiorstwach prywatnych zatrudniano pracowników w wieku około 34,5 lat.
Dominantę możemy wyznaczyć również metodą graficzną. Niezbędny jest do tego fragment histogramu (wykresu słupkowego) obejmujący przedział dominanty i dwa sąsiednie:
40 -f-30
20
Rys. 2
30 D
34,5
Łączymy odcinkami wierzchołki słupków histogramowych odpowiadających początkom przedziału dominanty i następującego po nim oraz końcowi przedziału dominanty i przedziału poprzedzającego ten przedział. Punkt przecięcia tych odcinków zrzutowany na oś realizacji cechy pozwala na wyznaczenie wartości dominanty. W naszym przypadku jest to wartość zbliżona do 34,5.
O Zadanie 7.
Dla następującego szeregu statystycznego wyznaczyć dominantę metodą analityczną i graficzną.
20-30 30-50 50-80 80-100
n. 10 40 45 20
Źródło: dane umowne
^r Rozwiązanie.
Przedstawiony szereg statystyczny nie spełnia założeń niezbędnych do wyznaczenia dominanty w oparciu o wzór przedstawiony w zadaniu 6., gdyż przedziały klasowe nie są równej długości. Konieczne jest zatem przeprowadzenie pewnego rodzaju procedur normalizujących przedstawiony szereg, czyli odniesienie liczebności cząstkowych do jednostki długości przedziału klasowego, co
13
Rozdział I
oznacza zastąpienie liczebności tzw. gęstościami przedziałów (oznaczającymi dokładnie natężenie liczebności na jednostkę długości przedziału klasowego). Gęstości oznaczamy symbolem g. i wyznaczamy jako ilorazy liczebności i długości poszczególnych przedziałów.
:- i = 1,2 ... k
[5]
Mamy zatem odpowiednio: Z\x, = 10 10 .
Ax2 = 20
40
4x3 = 30
Ax4 = 20
20
Warto przy tym zauważyć, że nastąpiło przesunięcie dominanty: z trzeciego o granicach 50-80 do drugiego o granicach 30-50 (przedział dominanty to przedział o największym natężeniu liczebności cechy na jednostkę długości przedziału klasowego - co w przypadku przedziałów o równych długościach pokrywa się z największą liczebnością cząstkową).
Wzór określający dominantę ma zatem postać:
gD-SD-1
gD-SD-1+gD-gD+l
gdzie oznaczenia są analogiczne jak w zadaniu 6. W naszym przypadku otrzymaliśmy:
Axr
D = 30 + -
Również w metodzie graficznej otrzymamy odpowiednio:
Analiza struktury zjawisk
Rys. 3
3 Zadanie 8.
Wydatki na zakup prasy w badanej grupie osób były następujące: 20,0; 25,0; 34,0; 28,8; 28,8; 47,0; 60,2; 20,0; 28,8; 20,0; 34,0; 28,8; 47,0; 20,0; 60,2; 20,0; 34,0; 60,2; 25,0; 25,0; 27,0; 28,8; 25,0; 20,0; 28,8; 60,2; 28,8; 28,8; 60,2; 34,0; 28,8; 28,8; 28,8.
Ustalić wartości kwartyli rzędu pierwszego, drugiego i trzeciego oraz zinterpretować je.
$ Rozwiązanie.
Wyznaczenie miar pozycyjnych w szeregu wyliczającym wymaga jego uporządkowanej w sposób monotoniczny postaci. Zatem pierwszy etap pracy polegać będzie na monotonicznym uporządkowaniu przedstawionych danych. Otrzymujemy szereg w postaci ciągu liczb:
20,0; 20,0; 20,0; 20,0; 20,0; 20,0; 25,0; 25,0; 25,0; 25,0; 27,0; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 28,8; 34,0; 34,0; 34,0; 34,0; 47,0; 47,0; 60,2; 60,2; 60,2; 60,2; 60,2.
Liczebność próby statystycznej jest równa 33 i kwartyle dla szeregu wyliczającego wyznaczamy zgodnie z następującymi zasadami.
Najprostszym do wyznaczenia kwartylem jest kwartyl drugiego rzędu, czyli mediana (Me) lub inaczej wartość środkowa. W przypadku szeregu o nieparzystej
n + 1 liczbie jednostek jest to realizacja cechy o numerze ~~i , czyli
u . par2ystej
wyrazów o numerze - i - + ] ,
[6]
14
czyli
15
Analiza struktury zjawisk
Me =
2 2
W przedstawionym powyżej szeregu jest odpowiednio:
Me = x33+i =xl7 =28,8 zł
co oznacza, że połowa spośród rozważanej grupy osób wydaje na prasę co najmniej 28,8 zł lub inaczej połowa spośród analizowanych osób wydaje na prasę nie więcej
niż 28,8 zł.
Kwartyl rzędu pierwszego (Q,) wyznaczamy w szeregu wyliczającym jako medianę pierwszej połowy realizacji cechy, czyli jest to w naszym przypadku wartość x8, a kwartyl rzędu trzeciego (0^,,) to mediana drugiej połowy realizacji cechy, czyli w przypadku rozważanego szeregu realizacja x25.
Wyznaczone wartości kwartyli interpretuje się następująco:
dla kwartyla Qj
25% ogółu osób w rozważanej grupie wydaje na zakup prasy co najwyżej 25 zł
oraz 75% osób wydaje na prasę na co najmniej 75%;
dla kwartyla Q,n
25% osób wydaje na prasę nie mniej niż 34 zł, a 75% osób z rozważanej grupy
wydaje co najwyżej 34 zł.
Dla ułatwienia interpretacji kwartyli posługujemy się również pomocniczym
rysunkiem.
Rvs. 4
Nadstawie następujących informacji ustalić przeciętny wiek kobiety zawierającej związek małżeński w Chełmie w 1999 roku.
Tablica
Kobiety zawierające związek małżeński w Chełmie w 1999 roku wg wieku
Wiek kobiety w latach do 20 20-29 30-39 40-49 ponad 50 Razem
Liczba kobiet 182 219 162 127 84 774
Źródło: dane umowne
4' Rozwiązanie.
Ze względu na tzw. niepełną informację statystyczną, czyli niedomknięte skrajne przedziały klasowe miarą poziomu średniego (przeciętnego) musi być w miejsce wartości średniej mediana.
Dla szeregu przedziałowego wyznaczamy ją zgodnie z zależnością:
Me = xM" +
0,5n-cumn.
Me
lMe
Me
[7]
gdzie odpowiednio: Me - oznaczenie miernika; xMe ~ początekprzedziału mediany, czyli przedziału, wktórym znajduje się wyraz
n o numerze ;
2
AxMe - długość przedziału mediany; cuma- skumulowane (zsumowane) liczebności przedziałów poprzedzających
przedział mediany; nMe - liczebność cząstkowa przedziału mediany.
Niezbędna jest zatem skumulowana (czyli zsumowana) postać szeregu przedziałowego - czyli szereg, w którym przedziałowi klasowemu przyporządkowana jest suma liczebności tego przedziału i wszystkich przedziałów poprzedzających. Ma on postać:
Wiek kobiety Liczba kobiet Skumulowana liczba kobiet
do 20 lat 20-29 30-39 40-49 ponad 50 182 219 162 127 84 182 401 563 690 774
Razem 774 X
Przedział mediany, czyli przedział zawierający element o numerze = 387, to
przedział o granicach 20-29 lat. Możemy zatem wyznaczyć wartość miernika zgodnie z przedstawionym powyżej wzorem:
16
17
Analiza struktury zjawisk
Me = 20+ -10 = 2936 lat
219
co oznacza, że przeciętny wiek kobiety zawierajęcej związek małżeński w Chełmie w 1999 r. to wiek około 29,5 lat, a dokładniej połowa kobiet zawierających związek małżeński w Chełmie w 1999 r. nie przekroczyła wieku 29,5 lat.
3 Zadanie 10.
Dokonać oceny poziomu wewnętrznego zróżnicowania oraz asymetrii na podstawie danych zamieszczonych w tablicy przedstawiających tygodniowe wydatki na zakup biletów MZK ponoszone przez jednoosobowe rodziny emeryckie w maju 2000 r.
Tablica
Wydatki na zakup biletów MZK ponoszone przez rodziny emeryckie jednoosobowe w V/02
' Wy?*tki^ł I - I o ,0 I ,,_,* I lń_20 I 20_24 I 24-28 I 28-32 (x ,,x. )
____________V id' ig'___________
Liczba emerytów
Źródto: dane umowne
r~ Rozwiązanie.
Absolutną miarą zróżnicowania jest odchylenie standardowe S(x) wyznaczane jako pierwiastek z wariancji S2(x), czyli średniej arytmetycznej sumy kwadratów odchyleń realizacji cechy od swojej wartości średniej.
W przypadku szeregu przedziałowego wariancję liczymy zgodnie z wzorem:
16-20 10
20-24 8
[8]
rii=i
Względnym miernikiem poziomu zróżnicowania jest współczynnik zmienności, czyli iloraz odchylenia standardowego i wartości średniej.
v>=1r
[9]
Miernikiem asymetrii może być natomiast zestandaryzowany moment centralny rzędu trzeciego postaci:
[10]
A =-
S3(x)
lub współczynnik asymetrii Pearsonea postaci:
Ap =
x-D
S(x)
[U]
W przypadku szeregu punktowego lub wyliczającego znaczne uproszczenie obliczeń uzyskuje się przez ich tabelaryczny zapis (przedstawiono go poniżej).
Tablica robocza do wyznaczania miar klasycznych położenia, rozproszenia i asymetrii
(*id.*J n. X. x.'ni x,-x (x,-x)2 (x-x)2n. (x.-x)3 n.
4-8 10 6 60 -9,02 81,3604 813,604 -7338,7080
8-12 20 10 200 -5,02 25,2004 504,008 -2530,1201
12-16 31 14 434 -1,02 1,0404 32,2524 -32,8974
16-18 10 18 180 2,98 8,8804 88,804 264,6359
18-22 8 22 176 6,98 48,7204 389,7632 2720,5471
22-26 7 26 182 10,98 120,5604 843,9228 9266,2723
26-32 4 30 120 14,98 224,4004 897,6016 13 446,071
Razem 90 X 1352 X X 3569,956 15795,8
Źródło: dane umowne
Wybierając odpowiednie sumy w tablicy roboczej otrzymujemy:
_ 1352
x =
90
= 15,02
3569,956 90
S(x) =
Vz=
f\
T5of
'100% =
15795,8 A. = 90_____
(6,298)3
= 0,7025
i możemy stwierdzić co następuje:
odchylenie standardowe równe 6,298 <*> 6,3 oznacza, że przeciętne wydatki na zakup biletów MZK różnią się od wydatków średnich równych 15,02 zł o ą 6,3 zł;
współczynnik zmienności równy 41,93% oznacza, że odchylenie standardowe
19
Analiza struktury zjawisk
stanowi około 42% wartości średniej, co świadczy o silnym wewnętrznym zróżnicowaniu jednoosobowych rodzin emeryckich ze względu na wielkość wydatków na bilety MZK;
współczynnik asymetrii równy 0,7 oznacza silną asymetrię prawostronną, czyli , że wydatki na zakup biletów w większej części rozważanej grupy rodzin nie przekraczają poziomu średniego równego 15,02 zł.
3 Zadanie 11.
Na postawie danych zamieszczonych w tablicy dotyczących struktury wieku bezrobotnych kobiet i mężczyzn w dniu 30 czerwca 1998 r. (w tys.) dokonać oceny podobieństwa tych struktur. ?r Rozwiązanie.
Wiek
Liczba kobiet Liczba mężczyzn
Źródto: dane umowne
Oceny stopnia podobieństwa struktur dokonujemy za pomocą względnego wskaźnika podobieństwa struktur postaci:
[12]
czyli ilorazu sum mniejszych wskaźników struktury i większych wskaźników struktury określonych dla każdego z przedziałów analizowanych szeregów (przy
czym W; = L ). n
Struktura bezrobotnych wg pici i wieku (w tys.]
Odpowiednie obliczenia przedstawimy w tablicy:
Z =
1,0385
= 0,9022
Ponieważ wartość miernika jest zbliżona do 1 (czyli do struktur identycznych) możemy stwierdzić, że struktura bezrobotnych kobiet i mężczyzn ze względu na wiek były podobne).
O Zadanie 12.
Czterech robotników wykonywało w czasie ośmiogodzinnego dnia pracy ten sam detal, przy czym czas poświęcony na wykonanie detalu był różny. Pierwszy robotnik wykonywał detal w ciągu 4 minut, drugi 3 minut, trzeci - 5 minut i czwarty również 4 minut. Obliczyć jaki był średni czas pracy robotnika nad jednym detalem. *r Rozwiązanie.
Ze względu na specyfikę mianowania analizowanej cechy (w min./szt.) poziom przeciętny ustalamy za pomocą zmodyfikowanej postaci średniej arytmetycznej, czyli średniej harmonicznej:
XH =Ś
[13]
X;
czyli
XH =
1+1+1+1
H 1 1 1 1 15 + 12 + 20 + 15
-+-+-+- ----------------
4 5 3 4 60
4-60 240
-------=-----= 3,87 min/ szt
62 62
Poprawność obliczeń możemy sprawdzić metodą bezpośredniego ustalenia zależności łącznego czasu poświęconego na wyprodukowanie określonego liczby detali.
Każdy z robotników pracował 480 min (razem 4 x 480 = 1920 min) i wytworzyli odpowiednio:
I 480 : 4 = l2 części
II 480 : 3 = l6 części
III 480 : 5 = 96 części
IV 480 : 4 = l^P części
Razem
496
części
21
Rozdział I
stanowi około 42% wartości średniej, co świadczy o silnym wewnętrznym zróżnicowaniu jednoosobowych rodzin emeryckich ze względu na wielkość wydatków na bilety MZK;
współczynnik asymetrii równy 0,7 oznacza silną asymetrię prawostronną, czyli że wydatki na zakup biletów w większej części rozważanej grupy rodzin nie przekraczają poziomu średniego równego 15,02 zł.
O Zadanie 11.
Na postawie danych zamieszczonych w tablicy dotyczących struktury wieku bezrobotnych kobiet i mężczyzn w dniu 30 czerwca 1998 r. (w tys.) dokonać oceny podobieństwa tych struktur. ' Rozwiązanie.
Tablica
Struktura bezrobotnych wg pici i wieku (w tys.)
Analiza struktury zjawisk
Wiek do 25 lat 25-34 35-44 45-54 Ponad 55 lat Razem
409,7 390,1 309,2 99,4 12,0 1220,4
Liczba mężczyzn 353,8 311,8 271,1 110,3 29,3 1076,3
Źródło: dane umowne
Oceny stopnia podobieństwa struktur dokonujemy za pomocą względnego wskaźnika podobieństwa struktur postaci:
k
Z =
[12]
czyli ilorazu sum mniejszych wskaźników struktury i większych wskaźników struktury określonych dla każdego z przedziałów analizowanych szeregów (przy
czym Wj = ). n
Odpowiednie obliczenia przedstawimy w tablicy:
Wiek w.k min(w.) max(w.)
do 25 25-34 35-44 45-54 pow. 55 0,3358 0,3196 0,2534 0,0814 0,0098 0,3287 0,2897 0,2519 0,1025 0,0272 0,3287 0,2897 0,2519 0,0814 0,0098 0,3358 0,3196 0,2534 0,1025 0,0272
Suma 1,0000 1,0000 0,9615 1,0385
20
Z =
1,0385
= 0,9022
Ponieważ wartość miernika jest zbliżona do 1 (czyli do struktur identycznych) możemy stwierdzić, że struktura bezrobotnych kobiet i mężczyzn ze względu na wiek były podobne).
S Zadanie 12.
Czterech robotników wykonywało w czasie ośmiogodzinnego dnia pracy ten sam detal, przy czym czas poświęcony na wykonanie detalu był różny. Pierwszy robotnik wykonywał detal w ciągu 4 minut, drugi 3 minut, trzeci - 5 minut i czwarty również 4 minut. Obliczyć jaki był średni czas pracy robotnika nad jednym detalem. *r Rozwiązanie.
Ze względu na specyfikę mianowania analizowanej cechy (w min./szt.) poziom przeciętny ustalamy za pomocą zmodyfikowanej postaci średniej arytmetycznej, czyli średniej harmonicznej:
x -
XH ~
[13]
czyli
x" =
1+1+1+1
4 60 240
1
4
1
-
4
15 + 12 + 20 + 15 60
62
62
= 3,87 min/szt
Poprawność obliczeń możemy sprawdzić metodą bezpośredniego ustalenia zależności łącznego czasu poświęconego na wyprodukowanie określonego liczby detali.
Każdy z robotników pracował 480 min (razem 4 x 480 = 1920 min) i wytworzyli odpowiednio:
I 480 : 4 = 120 części
II 480 : 3 = 160 części
III 480 : 5 = 96 części
IV 480 : 4 = 120 części Razem 496 części
21
Rozdział I
Analiza struktury zjawisk
_ 1920 min "__..,
x =-------------= 3,87 min/ szt
496 szt
zatem możemy stwierdzić, że przeciętny czas wykonania 1 detalu przez czterech robotników jest równy 3,87 minuty.
O Zadanie 13.
W ramach przeprowadzonego przez GUS w maju 1999 r. Badania Aktywności Ekonomicznej Ludności pytano również o wykonywanie pracy dodatkowej poza głównym miejscem pracy. Dla losowo wybranych 100 osób mających dodatkowe miejsce pracy otrzymano następujące parametry rozkładu wg wieku:
D = 38,7 lat; Vz = 25,64%; A = 0,04
Scharakteryzuj przeciętny wiek tych osób. Naszkicuj krzywą liczebności i zaznacz położenie miar tendencji centralnej.
łr Rozwiązanie.
Miarą poziomu przeciętnego jest wartość średnia i wyznaczymy ją z wzorów Pearsone'a określających współczynnik zmienności i współczynnik asymetrii.
S(x)
V, = ^-L x
oraz A" = P
x-D
-------
S(x)
[14]
S(x) = Vz-x i Ap- S(x) = x-38,7
dalej otrzymujemy
S(x) = 0,2564x i 0,04 S(x) = x- 38,7
0,04-0,2564-x = x-38,7
x-0,01026x = 38,7
x = 39,1 lat
co oznacza, że średni wiek osoby pracującej dodatkowo poza głównym miejscem
pracy to 39,1 lat.
Uzupełniającą miarą centralną jest mediana. Wyznaczymy ją z przybliżonej
równości Pearsone'a postaci:
x_D = 3(x-Me)
[15]
Skąd mamy:
22
2x + D 2-39,1 + 38,7
Wszystkie miary centralne mają zbliżone wartości, co oznacza, że rozkład analizowanej cechy jest niemal symetryczny. Potwierdza to również miernik asymetrii równy 0,04.
S Zadanie 14.
Czy na podstawie poniższych informacji można obliczyć wartość mediany?
a) ogólna liczebność zbiorowości: 150;
b) dolna granica przedziału mediany: 10;
c) rozpiętość przedziału mediany: 2;
d) suma liczebności przedziałów poprzedzających przedział mediany: 60;
e) suma liczebności przedziałów wraz z przedziałem mediany: 75. Wykonać niezbędne obliczenia.
t Rozwiązanie.
Zapiszmy podane informacje za pomocą symboliki statystycznej wykorzystywanej w prezentowanym uprzednio wzorze mediany: n = 150
v = io
cumn._, = 60 cum n. = 75 zatem po podstawieniu tych wartości liczbowych do wzoru
Me=x
Me
'Me
15
Otrzymujemy, że Me = 12.
O Zadanie 15.
Grupę 150 pracowników pewnego przedsiębiorstwa zbadano pod względem wysokości premii miesięcznej i otrzymano następujące informacje:
I wydział: xl = 400 zł; D, = 350 zł; A = 0,5;
II wydział: x" = 300 zł; DII = 330 zł; Ap = -0,5.
Ustalić współczynnik zmienności i typowy przedział zmienności dla ogółu pracowników przedsiębiorstwa wiedząc, że proporcje liczebnościowe zatrudnionych pracowników wydziałów I i II mają się jak 2:1. t Rozwiązanie.
Do ustalenia mierników rozproszenia zbiorowości podzielonej na rozłączne podgrupy wykorzystamy miary ogólne, czyli tzw. średnią ze średnich i wariancję
23
Analiza struktury zjawisk
ogólną jako sumę wariancji wewnątrzgrupowych i międzygrupowych. Konieczna jest przy tym znajomość mierników (średniej i wariancji) w każdej z podgrup. Odpowiednie wzory mają postać:
n
[16]
gdzie: x
X.
n. oraz
gdzie
średnia ogólna;
średnia w każdej podgrupie;
liczebność i-tej podgrupy.
S20g(x) =
[17]
oraz
przy czym
S2(x) - wariancja w i-tej grupie.
Często pierwszy składnik sumy nazywamy jest średnią z wariancji, a drugi wariancją ze średnich. W naszym przypadku konieczne jest wyznaczenie dla każdego wydziału odchylenia standardowego i potem wykorzystania proporcji Hczeb-
/ _2 ^ Ś
nosciowej , .
Przekształcając wzór A otrzymujemy: . .
a x"-D
S(x) =
x-D
[18]
czyli
x,-D, 400-350 50
xn-D" 300-330 ^
apii u';)
Dalej otrzymujemy zależność n, = 2n" i ze wzorów ogólnych:
= 400-2n[I+300-nII 800 + 300
x =------------Li-----------------=---------------= 366,67 zł
3n" 3
52(X) =------------(1002 2n" + 602 n") = - Ś (20000 + 3600)= - Ś 23600 = 7866,67
2nn+nn 3 3
S2(x) =------l-------((400-366,67)2 -2nn +(300-366,67)2nn) =
2nn+nnv
= - (2221,7778 + 4444,8889)= 2222,2222
S2(x) = 10088,888 skąd S (x) = 100,44
Ogólny współczynnik zmienności jako iloraz odchylenia standardowego i wartości średniej jest równy:
Sog(x) 100,44
\r _ p____
= 0,2739
x 366,67
Typowy przedział zmienności ustalamy jako przedział o granicach odpowied-
nio:
(x-S(x);x + s(x))
czyli w naszym przypadku dla ogółu pracowników granice przedziału typowego to:
(366,67 -100,44; 366,67 + 100,44) Xtype (266,23; 467,11)
25
24
Analiza struktury zjawisk
ogólną jako sumę wariancji wewnątrzgrupowych i międzygrupowych. Konieczna jest przy tym znajomość mierników (średniej i wariancji) w każdej z podgrup. Odpowiednie wzory mają postać:
[16]
gdzie: x
X.
n. oraz
gdzie
przy czym
- średnia ogólna;
- średnia w każdej podgrupie;
- liczebność i-tej podgrupy.
[17]
oraz
S2 (x) - wariancja w i-tej grupie.
Często pierwszy składnik sumy nazywamy jest średnią z wariancji, a drugi wariancją ze średnich. W naszym przypadku konieczne jest wyznaczenie dla każdego wydziału odchylenia standardowego i potem wykorzystania proporcji liczeb-
nosciowej 1
1
Przekształcając wzór A otrzymujemy:
A -^
p S(x)
S(x) =
x-D
[18]
czyli
400-350
0,5 0,5
= ^ = 100
24
n-Dn 300-330
= 60
Pn
Dalej otrzymujemy zależność nl = 2nn i ze wzorów ogólnych: = 400 2n" + 300 n" _ 800 + 300
X Ś
3nT
= 366,67 zł
S\x) =-----l------(1002 2n" + 602 n") = - (20000 + 3600)= - Ś 23600 = 7866,67
2nn + nn 3 3
S2(x) =-----l------((400-366,67)2 -2nn +(300-366,67)2nn) =
7ti _L n -^
2nn+nn
1
= - (2221,7778 + 4444,8889)= 2222,2222
S2(x) = 10088,888 skąd S (x) = 100,44
Ogólny współczynnik zmienności jako iloraz odchylenia standardowego i wartości średniej jest równy:
S^ 100,44 x 366,67
Typowy przedział zmienności ustalamy jako przedział o granicach odpowiednio:
(x-S(x);x + s(x)}
czyli w naszym przypadku dla ogółu pracowników granice przedziału typowego to:
(366,67 -100,44; 366,67 + 100,44) Xtype (266,23; 467,11)
25
Zadania do samodzielnego rozwiązywania
Zadania do samodzielnego rozwiązywania
Lj Zadanie 1.
Na podstawie danych zawartych w tablicy 1 przedstawić:
a). Strukturę pracowników pracujących na stanowiskach robotniczych ze względu na udział dochodów męża w ogólnych dochodach rodziny oraz zilustrować ten
szereg graficznie.
b). Strukturę rodzin ze względu na miesięczny dochód na osobę (wraz z interpretacją graficzną).
c). Zbudować tablicę przedstawiającą łącznie strukturę zbiorowości ze względu na
dwie cechy - wiek męża i wiek żony. d). Zbudować tablicę dwudzielną ze względu na ilość dzieci w rodzinie i ilość izb
w mieszkaniu, e). Wybrać cechę niemierzalną i dokonać klasyfikacji struktury ze względu na nią
oraz zilustrować podział graficznie.
Tablica 1
Miesięczny dochód na osobę (zł)
Udział doch.
męża w doch
rodź. w %
Lp. Udział doch. męża w doch. rodź. w % Liczba dzieci w rodź. Liczba izb w mieszkaniu Miesięczny dochód na osobę (zł) Posiada samochód Wiek męża Wiek żony
10. 64 1 2 860 tak 39 31
11. 67 1 3 880 tak 52 51
12. 68 3 4 830 nie 44 51
13. 70 1 3 1050 tak 38 33
14. 51 4 4 980 nie 60 49
15. 60 0 2 753 nie 56 51
16. 41 2 2 607 nie 46 38
17. 72 1 3 650 nie 43 38
18. 56 0 1 632 nie 26 24
19. 60 2 1 593 nie 42 39
20. 53 1 1 395 nie 30 28
21. 50 0 2 683 nie 25 22
22. 80 3 3 1020 tak 52 39
23. 100 2 4 700 nie 57 48
24. 63 I 2 680 nie 42 41
25. 50 0 2 950 nie 28 25
26. 63 1 2 1310 tak 37 36
27. 100 0 3 980 tak 33 30
28. 100 1 2 880 nie 39 35
29. 55 2 3 730 nie 40 41
30. 63 3 2 930 tak 62 58
31. 51 4 4 530 nie 61 53
32. 48 0 1 577 tak 40 30
33. 59 1 2 638 nie 70 65
34. 80 0 1 842 tak 29 26
35. 38 0 1 732 nie 31 35
36. 45 3 3 910 tak 48 45
37. 70 1 2 520 nie 57 55
38. 54 0 1 842 tak 45 47
39. 49 0 1 732 nie 42 40
40. 53 0 2 910 tak 35 30
41. 63 2 3 1000 tak 48 40
42. 67 1 2 1110 tak 26 25
43. 50 0 2 731 tak 29 30
44. 46 1 1 981 tak 48 47
26
27
Źródło: dane umowne
L> Zadanie 2.
W 20-osobowej grupie studentów obserwowano liczbę godzin nauki w bibliotece w ciągu dnia. Uzyskano dane: 2; 2; 2,5; 3; 1; 1; 2,5; 2; 2; 1; 6; 1; 1,5; 1; 5; 2; 2;
3; 2; 1.
Obliczyć średni dzienny czas poświęcony na naukę w bibliotece korzystając z odpowiedniej miary. Wybór miary uzasadnić. Jaki czas na naukę w bibliotece poświęcają studenci najczęściej? Ocenić poziom dyspersji i asymetrii.
L> Zadanie 3.
Ile wynosi dominanta wzrostu przedszkolaków, dla których dane indywidualne (w cm) są następujące: 120, 124, 124, 123, 120, 122, 124, 123, 124, 119? Ustalić środkową wartość wzrostu przedszkolaków.
L> Zadanie 4.
Narysuj histogram dla danych z poniższego szeregu, wyznacz medianę i dominantę.
20-30 1 30-50 I 50-80
iL> Zadanie 5.
Dzienne zużycie energii elektrycznej (w kWh) w pewnym bloku mieszkalnym
kształtowało się następująco:
Zużycie energii I 2^4 I 4^6 I 6^8 I iMu I 10-12 ! 12-14
40
10
Liczba mieszkań _____6_____I 10 30 ______________
Oblicz średnią arytmetyczną, medianę, dominantę, kwaryle, współczynnik zmienności oraz typowy obszar zmienności.
LŚ Zadanie 6.
Strukturę rodzin wg ilości członków rodziny w miejscowości L charakteryzuje
poniższy rozkład.
28
Zadania do samodzielnego rozwiązywania
Liczba członków rodziny 2 3 4 5 6 7 8
Odsetek rodzin 15 30 20 15 10 5 5
Za pomocą poznanych miar klasycznych i pozycyjnych dokonać analizy rozkładu rodzin wg liczby jej członków.
L Zadanie 7.
Czterech rowerzystów przebyło ten sam odcinek drogi. Pierwszy przyjechał z prędkością 6 km/h, drugi z prędkością 10 km/h, trzeci z prędkością 12 km/h, czwarty z prędkością 15 km/h. Jaka była średnia prędkość rowerzystów? Jakiej należy użyć miary przeciętnej?
4a Zadanie 8.
W 1999 r. u pewnego sadownika ceny 1 kg jabłek wynosiły: za I gatunek 3,5 zł, za II gatunek 2 zł, za III 1,5 z. Sadownik uzyskał ze sprzedaży 10 200 zł, w tym po 2100 zł za I i III i 6000 zł za II gatunek. Ile wynosiła średnia cena jabłek u sadownika?
L Zadanie 9.
W mieszance jest 20 kg składnika po 15 zł za kilogram, 15 kg składnika po 20 zł za kilogram i 5 kg składnika po 30 zł za kilogram. Obliczyć cenę 1 kg mieszanki.
Zadanie 10.
Na podstawie następujących danych oblicz średnią arytmetyczną i podaj jej interpretację
Tablica
Sklepy branży tekstylnej według obrotów osiągniętych w marcu 1998 r.
Obroty w zł (xi".xit) Liczba sklepów n,
8000-9000 23
9000-10000 45
10000-11000 67
11000-12000 55
12000-13000 10
Razem 200
Źródło: dane umowne
Dokonaj analizy wielkości obrotów za pomocą znanych miar centralnych.
* Zadanie 11.
Oblicz i podaj interpretację średniej arytmetycznej i wskaźników struktury,
29
Rozdziat I
Zadania do samodzielnego rozwiązywania
a także zaprezentuj graficznie (metoda powierzchniowa - koło) przedstawione w tablicy dane:
Pracownicy: "ABA" S.A. w Skawinie wedtug wieku w 1998 roku
Źródło: dane umowne
Ustal dominujący wiek pracownika zakładu "ABA". Jakiego wieku nie przekroczyła połowa pracowników?
Zadanie 12.
Czas rozwiązywania pewnego zadania przez grupę uczniów przedstawia tablica:
12
Czas rozwiązywania w min.
Liczba uczniów______|________________________
Przedstaw interpretację graficzną tego rozkładu i dokonaj analizy za pomocą miar centralnych.
L Zadanie 13.
W jednym z domów studenckich przeprowadzono badanie dotyczące miesięcznych wydatków na cele kulturalne. Wyniki badania przedstawia tablica:
Odsetek studentów_________10__________30 ~1 40 I 20
40-80 I 80-120
Wydatki miesięczne
120-160
160-200
Za pomocą klasycznych i pozycyjnych miar zmienności oceń zróżnicowanie badanej zbiorowości pod względem wydatków miesięcznych na cele kulturalne.
L Zadanie 14.
Oblicz średnią powierzchnię indywidualnego gospodarstwa rolnego w pewnym
województwie na podstawie poniższych danych.
Powierzchnia gosp. w ha Skumulowany odsetek gosp.
Największe obszarowo gospodarstwo miało w tym województwie 35 ha, a najmniejsze 1 ha. Dokonać następnie pełnej analizy struktury za pomocą poznanych miar klasycznych i pozycyjnych.
Lj Zadanie 15.
Zbadano dwie grupy na wydziałach Ekonomii i Administracji pod względem wzrostu. Uzyskano następujące wyniki:
Wydział Ekonomi Wydział Administracji
Mediana 170 cm Średnia arytmetyczna 170 cm
Średnia arytmetyczna 168 cm Odchylenie standardowe 10 cm
Wariancja 36 cm Współczynnik skośności 0,8
Dominanta 175 cm Mediana 164 cm
Na podstawie tych informacji przeprowadzić wszechstronną analizę badanych zbiorowości po uprzednim uzupełnieniu brakujących parametrów.
Li Zadanie 16.
Koszt produkcji telewizorów w zakładzie I wynosi 570 zł przy rocznej produkcji 15 tys. sztuk. W zakładzie II koszt wynosi 650 zł przy rocznej produkcji 10 tys. sztuk. Ile wynosi łączny koszt produkcji telewizora dla obu zakładów? Jak zmieni się ten koszt, gdy w obu zakładach wzrośnie on o 8%. Wiedząc dodatkowo, że odchylenie standardowe kosztów dla zakładu I wynosi 30 zł, a dla zakładu II S2(x) = 2025. Zbadać zróżnicowanie za pomocą miar absolutnych i względnych.
Średnia płaca kobiet w przedsiębiorstwie X wynosi 1050 zł, a średnia płaca mężczyzn 1350 zł. Ile wynosi średnia płaca dla całego przedsiębiorstwa, gdy kobiet jest czterokrotnie więcej niż mężczyzn? Jak zmieni się średnia płaca, gdy płace kobiet i mężczyzn wzrosną o 10%. Uzasadnić odpowiedź. Wiedząc dodatkowo, że odchylenie standardowe dla kobiet wynosi 85 zł, a dla mężczyzn S2 (x) = 10 000, oceń zróżnicowanie ogółu płac za pomocą miar absolutnych i względnych.
L* Zadanie 18.
Współczynnik skośności As obliczony dla stażu osób zatrudnionych w przedsiębiorstwie Z wynosi 0,025. Obliczyć najczęściej występującą wartość stażu pracy, jeśli S(x) wynosi 2 lata, a x = 7 lat. Następnie dokonać analizy tendencji centralnej, rozproszenia i asymetrii.
Zadanie 19.
Zbadać poziom asymetrii wiedząc, że O^ = 2,5; Q, = 7,5, VQ = 0,5.
30
31
Rozdział I
L> Zadanie 20.
a) Zapisz zależność pomiędzy x, M(x) i D(x) w przypadku dodatniej skośności
rozkładu empirycznego.
b) Narysuj schemat krzywej liczebności stażu pracy, gdy x = 11,5, a D(x) = 13,8. Wypowiedz się na temat asymetrii tego rozkładu.
Na podstawie komunikatów Giełdy Papierów Wartościowych w Warszawie o wysokości akcji BIG i Okocimia na 50 kolejnych sesjach począwszy od sesji 510, uzyskano dane (w zł) przedstawione w poniższej tabeli:
Cenyj ' ' i - - . , I , . , -,
Zadania do samodzielnego rozwiązywania
akcji i sesji
2-1,3 1
,4-1
1,5-1
1,6-1,
1,7-1
1,8-1
Ogóle
50
iczpa sesji | iv
Jednocześnie wiadomo, że wielkość pierwszego momentu zwykłego w rozkładzie akcji Okocimia wynosiła 55,71 zł, a drugi moment zwykły w tym rozkładzie
był równy 3180,48.
1) Dokonać pełnej analizy zróżnicowania cen akcji BIG stosując znane miary dyspersji i spłaszczenia.
2) Porównać zróżnicowanie cen akcji obu przedsiębiorstw.
Liczba wyjazdów
Odsetek pracowników_____I_____________________________________
Ocenić prawdziwość podanych poniżej stwierdzeń i skorygować sformułowania
błędne:
1. Gdyby wszyscy pracownicy wyjeżdżali równie często za granicę, to czyniliby
to przeciętnie 2 razy w roku.
2. Taki sam odsetek pracowników wyjeżdżał rzadziej niż jeden raz w roku, jak
i częściej niż raz w roku.
3. Przeciętne zróżnicowanie wyjazdów w stosunku do średniej wynosiło 1,20.
4. Typowymi pracownikami byli ci, którzy wyjeżdżali nie więcej niż 2 razy.
5. W badanym roku pracownicy centrali odwiedzili kraje Europy Zachodniej łącznie 105 razy.
L> Zadanie 23.
W dwóch regionach rolniczych przeprowadzono badanie mające na celu porównanie wielkości gospodarstw indywidualnych. Badanie wykazało, iż w regionie I najliczniej występują gospodarstwa o powierzchni 5,5 ha, połowa gospodarstw
32
miała powierzchnię mniejszą od 6 ha, średnia powierzchnia gospodarstwa wynosiła 6 ha. Współczynnik zmienności liczony w oparciu o odchylenie standardowe wyniósł 0,3. Dla regionu II opracowano następujący szereg liczbowy:
Wielkość gospodarstwa w ha 2-A 4-6 6-H 8-10 10-12
Odsetek gospodarstw 10 20 25 35 10
Porównać możliwie wszechstronnie powierzchnię gospodarstw w obydwóch regionach.
LŚ Zadanie 24.
W wybranym oddziale Banku Śląskiego liczba udzielanych tygodniowo kredytów długoterminowych kształtowała się następująco:
Kwota kredytu w tys. zł 0-10 10-20 20-30 30^0 40-50
Liczba kredytobiorców 7 12 19 8 4
Kierownik wydziału w swoim sprawozdaniu stwierdził, że najczęściej udzielanym kredytem jest kredyt w wysokości 25 tys. zł. Czy miał rację?
Dodatkowo stwierdzono, że 1/4 kredytów o najwyższej wartości powinno być oprocentowanych według odrębnych zasad (bardziej dogodnych dla klientów). Czy kredytobiorca pobierający kredyt w wysokości 32 tys. może liczyć na dogodną formę oprocentowania?
Określić poziom przeciętny wysokości udzielanego kredytu.
/LŚ Zadanie 25.
Najczęściej na targowisku osiedlowym sprzedawano w pierwszej dekadzie czerwca truskawki w cenie od 4,5 zł do 5 zł (około 30%). Dokładnie cena dominująca była równa 4,8 zł. Truskawek w cenie od 4,0 do 4,5 było 20%. Ile było truskawek w cenie 5,0 do 5,5 zł?
L> Zadanie 26.
Wyznaczyć poziom asymetrii mając dane: D = 5, Me = 6 oraz Vz = 0,4.
Li Zadanie 27.
Średnia płaca kobiet w przedsiębiorstwie X wynosi 850 zł, a średnia płaca mężczyzn 1050 zł. Ile wynosi średnia płaca dla całego przedsiębiorstwa, gdy kobiet jest trzykrotnie więcej niż mężczyzn? Jak zmieni się średnia płaca, gdy płace kobiet i mężczyzn wzrosną o 10%? Uzasadnić odpowiedź. Wiedząc dodatkowo, że odchylenie standardowe dla kobiet wynosi 100 zł, a dla mężczyzn S2(x) = 40 000. Oceń zróżnicowanie ogółu płaca za pomocą miar absolutnych i względnych.
LŚ Zadanie 28.
Dokonano pomiaru głębokości jednego z mazurskich jezior wybierając 100
33
Zadania do samodzielnego rozwiązywania
*a) Z^ztaSność pomiędzy *, M(x) i D(x) w przypadku dodatniej skośności rozkładu empirycznego. <- D(x\ = 138
b) Narysuj schemat krzywej liczebności stażu pracy, gdy x - 11,5, a D(x) Wypowiedz się na temat asymetrii tego rozkładu.
uzyskano dane (w zł) przedstawione^vpomzszej_tabelL
.-U I 1,3-1 10
1,4-1 13
1,5-1
1,6-1,
1,7-1,
1,8-1,
Ogóle 50
akcji
Liczba sesji | i | .^ , .. 1____________________________
Jednocześnie wiadomo, że wielkość pierwszego momentu zwykłego w rozkładzie akcji Okocimia wynosiła 55,71 zł, a drugi moment zwykły w tym rozkładzie
był równy 3180,48.
1) Dokonać pełnej analizy zróżnicowania cen akcji BIG stosując znane miary dyspersji i spłaszczenia.
2) Porównać zróżnicowanie cen akcji obu przedsiębiorstw.
Ocenić prawdziwość podanych poniżej stwierdzeń i skorygować sformułowania
błędne:
1. Gdyby wszyscy pracownicy wyjeżdżali równie często za granicę, to czyniliby
to przeciętnie 2 razy w roku.
2. Taki sam odsetek pracowników wyjeżdżał rzadziej niż jeden raz w roku, jak
i częściej niż raz w roku.
3. Przeciętne zróżnicowanie wyjazdów w stosunku do średniej wynosiło 1,20.
4. Typowymi pracownikami byli ci, którzy wyjeżdżali nie więcej niż 2 razy.
5. W badanym roku pracownicy centrali odwiedzili kraje Europy Zachodniej łącznie 105 razy.
L> Zadanie 23.
W dwóch regionach rolniczych przeprowadzono badanie mające na celu porównanie wielkości gospodarstw indywidualnych. Badanie wykazało, iż w regionie I najliczniej występują gospodarstwa o powierzchni 5,5 ha, połowa gospodarstw
32
miała powierzchnię mniejszą od 6 ha, średnia powierzchnia gospodarstwa wynosiła 6 ha. Współczynnik zmienności liczony w oparciu o odchylenie standardowe wyniósł 0,3. Dla regionu II opracowano następujący szereg liczbowy:
Wielkość gospodarstwa w ha 2-4 4-6 6-8 8-10 10-12
Odsetek gospodarstw 10 20 25 35 10
Porównać możliwie wszechstronnie powierzchnię gospodarstw w obydwóch regionach.
L Zadanie 24.
W wybranym oddziale Banku Śląskiego liczba udzielanych tygodniowo kredytów długoterminowych kształtowała się następująco:
Kwota kredytu w tys. zl 0-10 10-20 20-30 30-40 40-50
Liczba kredytobiorców 7 12 19 8 4
Kierownik wydziału w swoim sprawozdaniu stwierdził, że najczęściej udzielanym kredytem jest kredyt w wysokości 25 tys. zł. Czy miał rację?
Dodatkowo stwierdzono, że 1/4 kredytów o najwyższej wartości powinno być oprocentowanych według odrębnych zasad (bardziej dogodnych dla klientów). Czy kredytobiorca pobierający kredyt w wysokości 32 tys. może liczyć na dogodną formę oprocentowania?
Określić poziom przeciętny wysokości udzielanego kredytu.
Najczęściej na targowisku osiedlowym sprzedawano w pierwszej dekadzie czerwca truskawki w cenie od 4,5 zł do 5 zł (około 30%). Dokładnie cena dominująca była równa 4,8 zł. Truskawek w cenie od 4,0 do 4,5 było 20%. Ile było truskawek w cenie 5,0 do 5,5 zł?
L> Zadanie 26.
Wyznaczyć poziom asymetrii mając dane: D = 5, Me = 6 oraz V_ = 0,4.
LŚ Zadanie 27.
Średnia płaca kobiet w przedsiębiorstwie X wynosi 850 zł, a średnia płaca mężczyzn 1050 zł. Ile wynosi średnia płaca dla całego przedsiębiorstwa, gdy kobiet jest trzykrotnie więcej niż mężczyzn? Jak zmieni się średnia płaca, gdy płace kobiet i mężczyzn wzrosną o 10%? Uzasadnić odpowiedź. Wiedząc dodatkowo, że odchylenie standardowe dla kobiet wynosi 100 zł, a dla mężczyzn S2 (x) = 40 000. Oceń zróżnicowanie ogółu płaca za pomocą miar absolutnych i względnych.
L Zadanie 28.
Dokonano pomiaru głębokości jednego z mazurskich jezior wybierając 100
33
Zadania do samodzielnego rozwiązywania
punktów pomiarowych w odległości 70 m od brzegu. Uzyskano następujące dane: Głębokość dna w metrach 20-21 21-22 22-23 23-24 | 24-25 |
Liczba punktów pomiarowych 14 24 38 16
Czy prawdą jest, że najczęściej głębokość ta wynosiła 23 metry? Postanowiono, że 1/4 punktów o największej głębokości ustawione zostaną dodatkowe znaki ostrzegawcze. Czy można będzie ustawić taki w miejscu głębokim na 22,75 metra?
Oceń średnią głębokość jeziora w odległości 70 metrów od linii brzegu.
L> Zadanie 29.
Mając dane następujące miary statystyczne wyznacz pozostałe i podaj ich
interpretację:
As = -0,65; V =0,2;x = 50.
Lj Zadanie 30.
W dwóch wydziałach przedsiębiorstwa prowadzono badania kształtowania się premii obliczając średnią wysokość premii i współczynnik asymetrii. Dla 250 osób wydziału I otrzymano: x = 700 zł i współczynnik skośności As = -0,8 a dla 300 osób II wydziału x = 800 zł i współczynnik skośności As= -0,8. Odchylenie standardowe jest takie samo dla obydwóch wydziałów i wynosi 50 zł. Wyznaczyć współczynnik zmienności dla obydwóch wydziałów łącznie.
ODPOWIEDZI DO ZADAŃ
2. D = 2;
= 124; Me = 123;
?)= 8; Me = 8,2; D = 8,5; V = 0,2795; xt G (5,764; 10,236); x = 4,1; S(x) = 1,64; Vz = 0,4; D = 3; A$ = 0,67; Me,= 4; Q, = 3; Q2 = 5;
Xh ~ 2100 6000 2100 ~ ' Z 3,5 + 2 + 2
xH = 18,75 zł/kg; {
xH = 27,27 os/km; pow. 2750 km2; . x = 43,54; Me = 44,17; D = 45,44;
. x = 7 min; S(x) = 2; D = 6,97 min; A, = 0,0142; Vz = 0,2857; , S(x) = 25, 46; Vz = 0,1988; Q = 27,5;VQ = 0,2115.'
Po uwzględnieniu nierównej długości przedziałów klasowych okazuje się, że
rozkład cechy jest skrajnie asymetryczny, zatem można wykorzystać jedynie
miary pozycyjne.
7.
9. 10. 11.
12 13 14
Me = 9,7 ha; Q, = 6,03 ha; Q3 = 15,94 ha.
15. W. Ekonomii: x = 168 cm; Me = 170 cm; D = 174 cm; S(x) = 7 cm; Vz = 0,042; A = -0,86; W. Zarządzania: x = 170 cm; Me = 168 cm ; D = 164 cm; S(x) = 10 cm; V = 0,059; A = 0,6; x e (160; 180);
16. xog = 602 zł; Sog = 53,72 zł; V = 0,089;
17. xo = 1100 zł; Sog = 148,93 zł; V = 0,134;
18. DOS= 6,95. Miary tendencji centralnej x = 7; S(x) = 2; V = 0,28; x e (5; 9)
19. A^ = -0,33;
21. BIG: x = 1,442; S(x) = 0,1647; V = 0,1142; A, = 0,376;
1) Okocim: S(x) = 8,7678; V = 0,1576;
2) Ceny obligacji Okocimia są bardziej zróżnicowane od cen akcji BIG-u.
23. I obszar: x = 6,25; Me = 6; D = 5,5; V = 0,3; As = 0,4
II obszar: x = 7,3; Me = ; D = 8,57; V = 0,316; a] = -0,55
24. Kierownik nie miał racji, bo D = 23,89 tys. zł. Tak, klient pobierający kredyt w wysokości 32 tys. zł może liczyć na dogodną formę oprocentowania, bo Q3 = 29,74 tys. zł; x = 23.
25. Truskawek w cenie od 5 zł do 5,5 zł było 23,3%.
26. As = 0,577;
27. x! =900 zł; S = 158,11; V =0,1757;
2g og og zog
a) nie, bo = 22,39 m;
b) nie, bo Q3 = 22,94 m;
c) x = 22,3 m;
29. x = 50; S(x) = 10; D = 56,5; Me = 52,17;
30. x=og = 754,55 zł; Vc
= 0,118;
35
34
Elementy teorii współzależności cech
Rozdział II
Elementy teorii współzależności cech
3 Zadanie 1.
W ramach przeprowadzanych okresowo badań konsumenckich prześledzono zależności pomiędzy średnimi miesięcznymi dochodami netto (w tys. zł) na 1 osobę w gospodarstwie domowym i wydatkami na produkty zbożowe (w zł) w mieście X na podstawie danych z próby losowej obejmującej 10 gospodarstw domowych czteroosobowych. Uzyskano następujące szeregi danych:
1 | | I . . | ,
jest cechą niezależną oznaczaną przez x, a wydatki cechą zależną oznaczoną przez y. Porównując zmiany szeregów danych opisujących każdą z cech stwierdzamy, że wraz ze wzrostem realizacji cechy niezależnej maleje realizacja cechy zależnej, czyli współzależność ma kierunek ujemny.
b). Diagram rozrzutu korelacyjnego jest to przedstawienie w kartezjańskim układzie współrzędnych zbioru punktów reprezentujących obserwacje obydwu cech dla określonej jednostki statystycznej (tutaj gospodarstwa domowego). Przyjmując zatem oznaczenia par obserwacji jako (x., y.) wprowadzamy je do układu współrzędnych i otrzymujemy odpowiednio:
Na tej podstawie ustalić:
a). Czy pomiędzy wyróżnionymi zmiennymi zachodzi logiczny związek cech i jaki jest jego kierunek.
b). W oparciu o diagram rozrzutu korelacyjnego stwierdzić, czy pomiędzy zmiennymi zachodzi liniowa zależność, jaki jest jej kierunek i przybliżona siła.
c). Za pomocą odpowiedniego miernika statystycznego ocenić siłę i kierunek
współzależności cech. d). Wyznaczyć postać funkcyjną związku pomiędzy cechami i ocenić stopień ich
dopasowania.
e). Wyznaczyć prawdopodobny poziom wydatków na produkty zbożowe w rodzinie o przeciętnym miesięcznym dochodzie netto równym 2,1 tys. zł.
t Rozwiązanie.
a). Zgodnie z ekonomicznymi przesłankami popyt na określone dobro kształtowany jest między innymi przez poziom dochodów w rodzinie, więc można stwierdzić, że pomiędzy poziomem wydatków na określone produkty, a poziomem dochodów netto zachodzi logiczny związek cech, przyjmując jednocześnie, że dochód
0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 Rys. 5
Na podstawie diagramu korelacyjnego możemy stwierdzić, że pomiędzy wielkością dochodów netto a poziomem wydatków na produkty zbożowe zachodzi ujemna współzależność liniowa o znacznej sile. Na taki wniosek pozwala kształt .obwiedm obejmującej wszystkiej punkty diagramu przypominający wąską elipsę skierowaną ku dołowi.
c). Miernikiem pozwalającym na ocenę współzależności cech jest w tym przypadku współczynnik korelacji liniowej Pearsone'a postaci:
cov(x,y) S(x)-S(y)
[19]
gdzie odpowiednio:
cov(x,y) - oznacza kowariancję cech, czyli średnią arytmetyczną iloczynów odchyleń realizacji cech od swoich wartości średnich wyrażoną wzorem
1
cov(x, y) = -1 (xj - x)(y, - y) n
n m
S(x), S(y) - są to odchylenia standardowe cech X i Y.
[20]
37
Elementy teorii współzależności cech
Możemy wykorzystać jedną z uproszczonych postaci wzoru na współczynnik korelacji i obliczenie przedstawia się w postaci tablicy roboczej. Przyjmijmy więc:
Tablica robocza
y,
0,6 95
0,8 93
0,9 90
1,0 88
1,1 85
1,3 82
1,5 79
1,7 76
1,9 75
2,0 73
12,8 836
y-y
-0,68 11,4
-0,48 9,4
-0,38 6,4
-0,28 4,4
-0,18 1,4
0,02 -1,6
0,22 -4.6
0,42 -7,6
0,62 -8,6
0,72 -10,(
(x,-x)2 (y,-y)2 (x.-x) (yry)
0,4624 129,96 -7,752
0,2304 88,36 -4,512
0,1444 40,96 -2,432
0,0784 19,36 -1,232
0,0324 1,96 -0,252
0,0004 2,56 -0,032
0,0484 21,16 -1,012
0,1764 57,76 -3,192
0,3844 73,96 -5,332
0,5184 112,36 -7,632
2,0760 548,4 -33,38
Na podstawie tej tablicy wyznaczamy współczynnik korelacji rx :
rxy =
lub
rxy -
1=1
[21, 22]
i stwierdzamy, że pomiędzy dochodem na osobę w rodzinie i wydatkami na produkty zbożowe zachodzi silna współzależność w kierunku ujemnym, co potwierdza wcześniejszy wniosek o tym, że wraz ze wzrostem dochodu maleje spożycie
produktów zbożowych.
d) Funkcyjna zależność między cechami statystycznymi przedstawiona jest w postaci tzw. linii regresji II rodzaju, czyli w postaci teoretycznej linii regresji. W przypadku zależności liniowej można ją wyznaczyć metodą bezpośrednią, czyli za pomocą klasycznej metody najmniejszych kwadratów lub pośrednią w oparciu i wyznaczone wartości współczynnika korelacji liniowej Pearsone'a i odchylenia standardowe obydwu cech.
Klasyczna metoda najmniejszych kwadratów określa linię regresji jako równa-
nie: gdzie:
38
y = ax + b
b= J=!-----i=L
/=i V '=1 J 1=1 V /=i
Natomiast w metodzie pośredniej ustalamy linię regresji następująco:
y = ayx + by
[24]
gdzie:
f
S(y)
xy
S(x)
by= y-ayx Linia regresji wyznaczona metodą pośrednią ma postać:
y = -16,079x+ 104,1813 gdyż
|548,4 ay = -0,9893
= -0,9893- 16,253 = -16,079
by = 83,6 - (-16,079)- 1,28 = 104,1813 Natomiast linia regresji wyznaczona metodą bezpośrednią jest postaci:
y =-16,07899x + 104,1811 gdyż
10-1036,7-12,8-836 -333,8
[23]
b =
10-18,46-(12,8)2 " 20,76 836-18.46 = 12.8-1036,7 _ 2170,48
10-18,46- (12,8)2
= -16,07899
= 104,1811
20,76
39
Elementy teorii współzależności cech
postaci:
i(yi-y*)2
d = r;v
[25]
gdzie:
y* - oznacza wartość teoretyczną zmiennej zależnej wyznaczoną na podstawie teoretycznej linii regresji.
Współczynniki ę2 i d są miarami uzupełniającymi się wzajemnie i interpretowanymi w postaci wielkości procentowych lub stosunkowych.
Odpowiednie wartości teoretyczne y* są równe: yj = -16,079 0,6 + 104,1813 = 94,5339 y,; = 91,318 y; = 89,7102 ... i dalej y;o = 72,0233
Odpowiednio suma kwadratów odchyleń wartości empirycznych i teoretycznych jest równa:
-y*)2= 11,683
= 0,0213
i współczynnik zbieżności jest równy:
2 11,683
(D =--------------
548,4
S2 _
Q
i daiej Su = 1,2085
Vu = 4r = 0,1446
y
e) Spodziewany poziom zmiennej zależnej y wyznaczony na podstawie równania regresji dla hipotetycznej wielkości zmiennej x nazywamy prognozą statystyczną.
W naszym przypadku prognoza zmiennej y - wydatków na produkty zbożowe w rodzinie o dochodzie średnim 2,1 tys. zł na osobę jest równa
y', = -16,079 Ś 2,1 + 104,1813 = 70,4154 czyli 70 zł i 42 grosze.
Należy jednocześnie uwzględnić średni błąd prognozy, czyli przeciętną wielkość błędów losowych, jakie popełnia się, szacując y" na podstawie otrzymanej funkcji regresji.
Wyznaczamy go zgodnie z wzorem:
S . = Su
Jest on odpowiednio równy:
x)2
r^2
[26]
co oznacza w przeliczeniu na wartości procentowe, że 2,13% zmian zmiennej y zależy od przyczyn losowych, czyli innych czynników niż zmienna x. Natomiast współczynnik determinacji:
d = rx2y = (- 0,9893)? = 0,9787
w przeliczeniu na jednostki procentowe oznacza, że w 97,87% zmiany wielkości wydatków na produkty zbożowe zależą od zmian dochodów.
Oprócz tych miar wyznacza się również wartość odchylenia resztowego Su jako pierwiastek z wariancji resztowej S* i jego proporcję z poziomem przeciętnym
zmiennej y.
Miernik ten nazywany jest współczynnikiem zmienności przypadkowej.
Odpowiednio:
40
S . = 1,2085 Jl + + (2;1 1>28* = 1,2085 ^1,42389 = 1,442 yP V 10 2,076
Zatem wielkość prognozowana jest równa 70,42 ą 1,442, czyli możemy stwierdzić, że w rodzinie o dochodzie na osobę równym 2,1 tys. netto wydatki na produkty zbożowe będą się mieścić w przedziale (68,98; 71,86) zł.
O Zadanie 2.
Badanie rocznej stopy zwrotu dla pewnych akcji A oraz dla całego rynku papierów wartościowych w ciągu kolejnych 5 lat dało następujące wyniki:
Rok 1 2 3 4 5
Akcje A 38,6% -24,7 12,7 8,2 40,1
Rynek 23,8% -7,2 6,6 20,5 30,6
Żródto: dane umowne
41
Dokonać analizy współzależności wartości stopy zwrotu akcji A i całego rynku papierów wartościowych ustalając linię regresji, współczynnik korelacji liniowej, współczynnik determinacji oraz ocenić poziom stopy zwrotu akcji dla znanej stopy zwrotu na rynku papierów wartościowych równej 10%.
t Rozwiązanie.
Konstruujemy pomocniczą tablicę roboczą i na jej podstawie ustalamy niezbędne parametry statystyczne pozwalające na ocenę współzależności cech.
-----,-----------------1----------; -----1-----
Elementy teorii współzależności cech
Czas remontu (w dniach) 10-20 20-30 30-40 40-50 50-60
Liczba obrabiarek 10 30 50 40 20
-7,2
-24,7
51,84
43,56
420,25
-20,464
1,658
23,941
Linia regresji ma zatem postać y = l,6x - 8,92.
Interpretując współczynnik regresji a, = 1,6 możemy stwierdzić, że wzrost stopy zwrotu wszystkich akcji o 1% spowoduje wzrost stopy zwrotu akcji A przeciętnie o 1,6%. Współczynnik korelacji liniowej Pearsone'a wyznaczony jako iloraz kowariancji i iloczynu odchyleń standardowych będzie równy.
Średni wiek remontowanych obrabiarek jest równy 16 lat, a jego względna dyspersja wynosi 30%.
Pomiędzy wiekiem obrabiarek a czasem remontu zachodzi zależność liniowa, przy czym wydłużenie czasu eksploatacji o rok powoduje przedłużenie czasu remontu przeciętnie o 2 dni.
W oparciu o powyższe dane należy:
a) określić siłę i kierunek zależności korelacyjnej;
b) oszacować czas remontu obrabiarek dziesięcioletnich;
c) ustalić czy czas remontu obrabiarek w większym stopniu zależy od ich wieku niż od innych przyczyn.
ty Rozwiązanie.
Aby odpowiedzieć na pytanie sformułowane w zadaniu należy określić logiczny związek cech przedstawionych w zadaniu i zapisać podane parametry symbolicznie. Przyjmując zależność, że czas remontu obrabiarki zależy od jej wieku oznaczamy przez y - czas remontu urządzenia a przez x - wiek obrabiarki.
Na podstawie danych przedstawionych w tablicy wyznaczamy niezbędne parametry do ustalenia zależności korelacyjnej.
5550 150
= 37
293,15
13,52-23,73
= 0,913
S(y) =
bo
dodatkowo wiadomo, że
x = 16 ay = 2; Vz(x) = 30%
co oznacza, że zależność między stopą zwrotu wszystkich a ccji na ry < ^ WSp5jCZynnj]c koreiacjj wyznaczamy ze współczynnika regresji
7wrotu akcii A jest silna i ma dodatni kierunek. mQlW =
""plliynńik dominacji d-I- r"" iest odpowiedn.o rony^ = 1 - (MB)
tość stopy zwrotu akcji A przy zadanym poz.om.e stopy zwrotu na rynku c = 10% stopa zwrotu będzie równa 7,08%.
i dalej
O Zadanie 3.
Empiryczny rozkład czasu remontu 150 obrabiarek w zakładzie remontowym
przedstawia tablica:
42
rxy ~ay
x-V.
z(x)
S(y)
11,075
= 0,8668
43
zmienne) y. Zatem:
czyli gdzie
i dalej
y = ayx
y = 2X
= 37 _ 2 16 = 5
= 2X + 5
1rhvlenia standardowego reszt
A mianowicie
S "=S(y)-Jl-rxy
czyli
Su = 11,075
-Jl - (0,8668^ =11,075-0,2486 = 5,526
co oznacza, że rzeczywisty czas remontu obrabiarek róż wyznaczonego na podstawie linii regresji o ą 5,5 dnia. Wzając współczynnik zmienności przypadkowej
obrabiarek różnił się od teoretycznego
znaczonego na p Wyznaczając współczynnik
Vw - V 37
0,1493
okreto,
ł r^.
jako
Elementy teorii współzależności cech
Uwzględniając błąd prognozy Sf Su stwierdzamy, że czas remontu obrabiarek dziesięcioletnich może trwać od 20 do 30 dni.
c) Siłą wzajemnej współzależności cech ustalamy za pomocą współczynnika determinacji d, a siłą zależności losowych za pomocą współczynnika indetermina-cji (zbieżności) cp2. Obliczając
d=rx2v = 0,86672 =0,7513
oraz
Stwierdzamy, że czas remontu obrabiarki w 75% zależy od jej wieku a tylko w 25% od innych przyczyn, zatem silniejszy jest związek pomiędzy czasem remontu obrabiarki a jej wiekiem niż czasem remontu a innymi przyczynami.
O Zadanie 4.
Badając zależność pomiędzy powierzchnią użytkową mieszkań w m2 a liczbą osób w rodzinie wspólnie zamieszkujących mieszkanie dla losowej próby 50 mieszkań uzyskano następujące informacje:
a) Średnio liczba osób w rodzinie przy odchyleniu standardowym 1,4 osoby wynosi 3,6 osoby.
b) Średnio powierzchnia mieszkania to 50,7 m2 przy względnym poziomie zmienności 20,9%.
c) Kowariancja powierzchni mieszkania i liczby osób wynosi 11,21.
Określić jaką powierzchnię powinno mieć mieszkanie, które zamieszkują cztery osoby i czy powierzchnię mieszkania w silniejszym stopniu określa liczba osób zamieszkujących je czy inne czynniki. ł Rozwiązanie.
Przyjmując logiczny związek, w którym powierzchnia mieszkania zależy od liczby zamieszkujących je osób oznaczamy przez: y - powierzchnię w m2; x - liczba osób w rodzinie.
Zatem z treści zadania możemy zapisać:
y = 50,7; X = 3,6
S(y) = V v y = 0,209 Ś 50,7 = 10,6 S(x) = 1,4
oraz
cov (x,y) = 11,21
Celem ustalenia prognozy wielkości mieszkania dla czteroosobowej rodziny wyznaczamy teoretyczną linię regresji
45
44
Rozdział II
Elementy teorii współzależności cech
gdzie
y = a + b
J V v
czvli
_______________x,y) _ 11,21
5(x) S(>>)-S(x)'s(x)~ S\x) " 1,96
by= y-ayx = 50,7-5,719-3,6 = 30,ll y = 5,719x + 30,11
Ustalamy odchylenie standardowe reszt Su i współczynnik zbieżności przypadkowej, aby na ich podstawie ocenić czy równanie regresji jest przydatne w prognozowaniu
Su = S(y) yl - rx2y = 10,6 Ś Vl-0,7552 = 6,95058 __SU_ 6,95068
co oznacza, że tylko w 13,71% wartość przeciętna zmiennej zależnej obarczona jest błędem losowym, czyli przedstawione równanie może być wykorzystane w celach prognostycznych.
Zatem rodzina czteroosobowa powinna zamieszkiwać w mieszkaniu o powierzchni 53 m2, ponieważ
y* = 5,719 4 + 30,11 = 52,986 53 m2
Wyznaczamy następnie współczynniki determinacji i zbieżności i na ich podstawie oceniamy siłę zależności zmiennej y od różnych czynników.
d = r2y; cp2=l-r2y d = (0,755)2 = 0,57; (p2 = 1 - (0,755)2 = 0,43
i możemy stwierdzić, że powierzchnia mieszkania w silniejszym stopniu zależy od /. ilości ząrrueszkujących je osób niż od innych czynników.
U) >*-"......~--N.
Q ( O Zadanie^
ffwnym przedsiębiorstwie zbadano zależność pomiędzy zarobkami pracowników (y) a wydajnością ich pracy (x) i utrzymano następujące równania regresji
y = 0,05x + 3,4; x = 5y + 2 OL y ex u,
46 O'
Ocenić siłę zależności pomiędzy poziomem wynagrodzenia a wydajnością pracy pracowników rozważanego przedsiębiorstwa.
ł Rozwiązanie.
Konieczne jest ustalenie współczynnika korelacji liniowej Pearsone'a, co w przypadku dwustronnego logicznego związku cech (z którym w przypadku tych zmiennych mamy do czynienia), możliwe jest w oparciu o wielkość iloczynu współczynników regresji liniowej obydwu równań.
Wykorzystując równoważność
~ r
xy
S(y) r
S(x) xy S(x)
= r.
xy
otrzymujemy
przy czym znak + lub - wybieramy zgodnie ze znakiem współczynników regresji ponieważ kierunek regresji i korelacji jest ten sam. Zatem
co pozwala na stwierdzenie, że pomiędzy wielkością zarobków a wydajnością pracy pracownika zachodzi umiarkowana współzależność o kierunku dodatnim, czyli wzrost jednego z czynników powoduje równoczesny wzrost drugiego z nich.
Z> Zadanie 6.
W procesie produkcyjnym wyrobu A zastosowano zmiany technologiczne wpływające na jakość wyrobu. Celem zbadania czy zmiany te mają istotny wpływ na zmiany jakości pobrano próbę liczącą 150 jednostek i sklasyfikowano ją wg gatunków otrzymując:
^^^-^^ Gatunek Tech. produkcji-~--~^ I II III
Przed zmianą 50 10 20
Po zmianie 4(1 20 10
Ustalić czy zastosowanie zmian technologicznych w procesie produkcji wpływa na jakość produkowanych wyrobów. 4' Rozwiązanie.
Ze względu na specyfikę zmiennych opisujących badane zjawisko (zmienne
47
Rozdział II
jakościowe) konieczne jest zastosowanie odpowiedniego miernika pozwalającego na wykrycie istnienia współzależności. Najbardziej odpowiedni będzie współczynnik Czuprowa Tx lub współczynnik kontyngencji cx. Miary te mają postać:
Txy=.
oraz cxy =
[27, 28]
gdzie odpowiednio:
s - liczba wierszy w tablicy wielodzielczej; k - liczba kolumn w tablicy wielodzielczej; n - liczba elementów próby statystycznej; X2 - statystyka chi kwadrat liczona zgodnie z wzorem X = .
Przy czym: n.. - liczebność cząstkowa (liczba jednostek umieszczona na przecięciu i-tego
wiersza i j-tej kolumny w tablicy obserwacji) r.'. - teoretyczna liczebność cząstkowa wyznaczona zgodnie z wzorem
n. - liczebność brzegowa wiersza "i", czyli suma liczebności cząstkowych
w wierszu "i" n. - liczebność brzegowa kolumny "j", czyli suma liczebności cząstkowych
w kolumnie "j"
Liczebności teoretyczne i wartość statystyki %2 można wyliczyć w pomocniczej tablicy
gdzie odpowiednio:
n, = 80, n2 = 70, n, = 90, n2 = 30, n3 = 30.
48
n. n.'. (n.. - n .'.)2 * ii i|' ("ii-nij)2
<] '1 nU
1,1 50 48 2 4 0,0833
1,2 10 16 -6 36 2,25
1.3 20 16 4 16 1,000
2,1 40 42 -2 4 0,0952
2.2 20 14 6 36 2,5714
2,3 10 14 -4 16 1,1429
Elementy teorii współzależności cech
80-90 .o . 80-30 ., Ś 80-30 ,^ n,, =--------= 48 n,, =------ = 16 n13 = = 16
n21 =
150
70-90 150
= 42
150 70-30
150 70-30
150 =14 ^ 150
= 14
i dalej
X2= 7,143
Współczynnik Czuprowa przyjmuje wartość
Txy= ;7'143
xy i 150^(2 -0(3-1)
=0,1833
zatem możemy stwierdzić, że współzależność między rodzajem technologii produkcji wyrobu, a jego jakością jest nieznaczna.
3 Zadanie 7.
W grupie 400 absolwentów Akademii Ekonomicznej przeprowadzono analizę zgodności kierunku wykształcenia (finanse lub marketing) z łatwością znalezienia atrakcyjnej pracy.
Wśród 200 absolwentów specjalności finanse pracę bez zbytnich problemów uzyskało 80 osób, a wśród absolwentów specjalności zarządzanie problemy ze znalezieniem atrakcyjnej pracy miało 50 osób. Czy na podstawie wyników tej ankiety możemy twierdzić, że istnieje statystycznie istotna zależność pomiędzy kierunkiem ukończonych studiów ekonomicznych a możliwością znalezienia atrakcyjnej pracy? & Rozwiązanie.
Analizie podlegają dwie różne cechy statystyczne i charakterze dychotomicz-nym (czyli przyjmujące tylko dwie realizacje) dające się przedstawić w postaci tzw. tablicy czteropolowej.
Zachodzi Nie zachodzi
Zachodzi a b
Nie zachodzi c d
Na podstawie tej tablicy współzależności badamy za pomocą współczynnika asocjacji Yulle'a Y wyznaczonego jako:
ad-bcj
[29]
49
Rozdział II
W naszym przypadku otrzymujemy tablicę postaci
_______^ Praca Wydział ~ __^ Bez problemów Z problemami
Finanse 80 120 200
Zarządzanie 150 50 200
230 170 400
i współczynnik asocjacji
80-50-120-150
a/230-170-200-200 160^23-17-20-20
Współczynnik przyjmuje wartości z przedziału (0,1) i wartość bliska zeru oznacza brak statystycznie istotnej zależności. W przypadku analizowanej próby możemy stwierdzić, że kierunek ukończonych studiów w niezbyt silnym stopniu wpływa na możliwości znalezienia atrakcyjnej pracy.
O Zadanie 8.
W wybranej dekadzie miesiąca lipca przeprowadzono w nadmorskiej miejscowości wypoczynkowej analizę zależności średniej temperatury dziennej (mierzonej w C w godzinach południowych) oraz stopnie zachmurzenia nieba. Uzyskano następujący ciąg danych empirycznych.
Data 3.07 4.07 5.07 6.07 7.07 8.07 9.07 10.07 11.07 12.07
Temp. w C 23 25 28 28 30 27 25 23 20 21
Stopień zachmurzenia stabe bez chmur bez chmur stabe bez chmur stabe umiark. umiark. silne zachm. silne zachm.
W oparciu o odpowiednią miarę statystyczną ocenić, czy zachodzi statystycznie istotna współzależność pomiędzy stopniem zachmurzenia nieba a temperaturą dzienną, Śr Rozwiązanie.
Ze względu na specyfikę zmiennych (jedna mierzalna, a druga niemierzalna) i małą próbę statystyczną na podstawie, której należy sformułować wniosek najbardziej odpowiednim miernikiem korelacji będzie współczynnik korelacji rang Spe-armana, w którym podstawą miernika są rangi, czyli numery nadane realizacjom cech w ich wewnętrznym, monotonicznym uporządkowaniu. Współczynnik Spe-armana ma postać:
6-Id,2
[30]
gdzie:
50
Elementy teorii współzależności cech
d. = t.-t.;
i xi vi
txj, ty. oznaczają rangi realizacji cech x oraz y.
W przypadku, gdy w monotonicznym uporządkowaniu pojawiają się obok siebie dwie (lub więcej) te same realizacje cechy, to aby nie wyróżniać żadnej z nich nadajemy tym realizacjom rangę równą średniej arytmetycznej rang, które im odpowiadają.
Procedurę rangowania i jej dalsze etapy przedstawimy w przypadku analizowanego zagadnienia w tablicy roboczej.
X. y, *Ś* d, d2.
23 stabe 3,5 6 -2,5 6,25
25 bez chmur 5,5 9 -3,5 12,25
28 bez chmur 8,5 9 -0,5 0,25
28 stabe 8,5 6 2,5 6,25
30 bez chmur 10 9 1 1
27 stabe 7 6 I 1
25 umiarkowane 5,5 3,5 2 4
23 umiarkowane 3,5 3,5 0 0
20 silne 1 1,5 -0,5 0,25
21 silne 2 1,5 0,5 0,25
Zatem współczynnik rs jest równy
6-31,5
r.=1-
10(100-l)
= 1-0,1909 = 0,8091
Ponieważ miernik Spearmana zachowuje własność współczynnika Pearsona, czyli należy do przedziału (-1,1) i badana zależność jest tym silniejsza im miernik jest bliższy ą 1, możemy stwierdzić, że zależność pomiędzy temperaturą powietrza i stopniem zachmurzenia nieba jest statystycznie istotna i odznacza się znaczną siłą.
3 Zadanie 9.
Współczynniki korelacji liniowej Pearsone'a miedzy produkcją dóbr trwałego użytkowania (x), podażą tych dóbr (y) oraz ich importem (z) są równe odpowiednio:
r*y = 0.3; rxz = -0,5; rxz = 0,5
Obliczyć wszystkie logicznie uzasadnione związki miedzy badanymi zmiennymi wykorzystując w tym celu współczynniki korelacji cząstkowej. Czy prawdą jest,
51
Rozdziaf II
że ok. 4% zmian podaży dóbr trwałego użytkowania zależą od innych czynników niż produkcja i import tych dóbr. 41 Rozwiązanie.
Ze względu na wielokierunkowe współzależności mogące zachodzić pomiędzy dwiema lub trzema zmiennymi należy wybrać te powiązania, które są ekonomicznie logicznie uzasadnione i dla nich wyznaczyć mierniki korelacji cząstkowej i wielorakiej.
Współczynniki korelacji cząstkowej określają współzależność pomiędzy dwiema wybranymi cechami z pominięciem pozostałych, a współczynniki korelacji wielorakiej pozwalają na ocenę zależności pomiędzy wybraną zmienną a wszystkimi pozostałymi równocześnie. Oznaczamy je odpowiednio:
r, 2 3 k - zależność pomiędzy zmiennymi x,, x2 z pominięciem pozostałych; R| 23 k równoczesna zależność zmiennej x, od wszystkich pozostałych.
W naszym przypadku logiczne jest rozpatrywanie zależności pomiędzy produkcją i podażą z pominięciem importu (rx z) pomiędzy produkcją i importem z pominięciem podaży (rx ) i pomiędzy podażą i importem z pominięciem produkcji (rvzx).
Natomiast do oceny w jakim stopniu zmiany podaży zależą od zmian innych czynników niż produkcja i import tych dóbr wykorzystamy współczynnik korelacji wielorakiej Rvzx, którego kwadrat daje współczynnik determinacji i w konsekwencji współczynnik zbieżności cp2.
Współczynniki korelacji cząstkowej mają postać następującą:
rxy- 'yz
xyz ^(l _ r^ -rv2?)
rxz- rxy rzy
*xzy >/(l-r- 2 Vi ;y/V 1 'zy/
r = ryZ- fxy rzx
-4)
a współczynnik korelacji wielorakiej określamy wzorem
Ryzx -
yz
gdzie:
52
Elementy teorii współzależności cech
rxy, rK, ryz - współczynniki korelacji liniowej Pearsonea pomiędzy rozważany-
mi zmiennymi. Wartości liczbowe mierników są równe odpowiednio:
xyz
0,3-(-0,5) 0,5 _ 0,3 + 0,25 _ 0,55 " A/(l-(-0,5)2)(l-(0,5)2) ~ V0J5-0,75 ~ 0,75
-0,5-0,3-0,5 -0,5-0,15 _-0,65
V(l-(0,3)2)(l-(0,5)2) ~ a/0,9 1-0,75 ~~0J5~
0,5-(-0,5>0,3 _ 0,65 V(l-(-0,5)2)(l-(0,3)2)~V0,75-0,91
= 0,733
'yzx
= -0,7868
= 0,7868
0,32+0,32-2-0,3-0,5-(-0,5) _ 10,25+ 0,09+ 0,15 _ |0,49
1-0,25
Ryzx -
Interpretując wartości mierników możemy stwierdzić, że:
a) nie uwzględniając importu wybranego dobra pomiędzy jego podażą a produkcją zachodzi silna współzależność;
b) również silna współzależność zachodzi pomiędzy importem i produkcją z pominięciem podaży oraz podażą a importem z pominięciem produkcji;
c) nie jest prawdą, że w około 4% zmiany podaży zależy od innych czynników niż wielkość importu i produkcji określonego dobra, gdyż współczynnik ep- jest równy
q>2=l-R2 =03467
O Zadanie 9.
W grupie 100 uczniów gimnazjum badano zależność pomiędzy wynikami testu semestralnego z matematyki (x), czasem poświęcanym na naukę przedmiotu (y) i ilorazem inteligencji (z). Otrzymano następujące współczynniki korelacji liniowej określające związki pomiędzy poszczególnymi zmiennymi:
rxy = 0,8;
= 0,6.
Nauczyciel przedmiotu twierdzi, że wyniki testu w dwóch trzecich zależą od ilorazu inteligencji i czasu poświęconego na naukę przedmiotu. Czy ma rację?
53
Rozdział II
?r* Rozwiązanie.
Aby zweryfikować stwierdzenie nauczyciela należy wyznaczyć współczynnik determinacji w oparciu o współczynnik korelacji wielorakiej Rx , czyli
gdzie
Jr2 4-r2 lx r łxy ~ ixz Zllxy xyz i 3
1-r,
yz
odpowiednio
T> __
Ivxyz ~
0,82+0,62-2-0,8-0,3-0,6 (0,64 + 0,3-0,288 10,712
- (- 0,3)2 \ 1-0,09
d = (0,8845)2 = 0,7824
= 0,8845
co oznacza, że wyniki testu semestralnego w około 78% zależą od czasu poświęcanego na naukę i ilorazu inteligencji, zatem nauczyciel nie miał racji.
54
Zadania do samodzielnego rozwiązywania
L Zadanie 1.
Zmierzono dwie zmienne w dwóch kolejnych doświadczeniach. Uzyskano następuje wartości obserwacji:
X 2 3 4 5 6
y 3 5 5 5 7
Zakładając, że między zmiennymi istnieje dodatnia liniowa zależność korelacyjna ocenić siłę tego związku.
Lj Zadanie 2.
Przeprowadzono w wybranej grupie studenckiej badania statystyczne dotyczące wyniku egzaminu końcowego ze statystyki (y - w punktach), ilorazu inteligencji (x - jednostkach IQ) i liczby godzin poświęconych na naukę przedmiotu (z -w godzinach). Uzyskane dane prezentuje tablica.
Nr studenta X y z Nr studenta X y z
I 83 1 12 9 7 91 124 10
2 77 115 6 8 79 113 9
3 95 129 14 9 36 106 5
4 49 103 4 10 58 1 14 7
5 63 1 17 8 I 1 93 136 8
6 80 115 12 12 84 127 3
Źródło: dane umowne
a) Ustalić, które z cech wykazują największą wewnętrzną zmienność.
b) Obliczyć współczynniki korelacji liniowej Pearsone'a między cechami: x i y, x
i z oraz y i z.
55
Rozdział II
c) Określić, które z cech silniej wpływa na wyniki egzaminu - iloraz inteligencji czy czas poświęcony na naukę.
d) Zbadać współzależność cech za pomocą współczynnika Spearmana.
43 Zadanie 3.
W fabryce zbadano jak kształtuje się średnia wydajność pracowników w zależności od nieprzerwanej pracy. Otrzymano tablicę:
Czas pracy I 2 3 4 5 6 7
Wydajność w szt./h 19 22 19 17 15 13 14
Określić rodzaj badanej zależności korelacyjnej na podstawie wykresu rozrzutu i obliczyć współczynnik korelacji.
Jakiej wydajności możemy się spodziewać u pracownika pracującego nieprzerwanie 9 godz.?
W jakim stopniu wydajność pracownika zależy od czasu nieprzerwanej pracy a w jakim od innych czynników?
43 Zadanie 3.
Zbadano zależność między ilością reklam pewnego wyrobu emitowanych dziennie w TV, a wysokością obrotu w tys. zł uzyskanych ze sprzedaży rozważanego wyrobu. Dane przedstawia tablica.
Ilość reklam 3 5 4 5 6 7
Wielkość obrotu 15 133 142 150 148 151
Źródto: dane umowne
a) Sporządzić wykres rozrzutu korelacyjnego i na jego podstawie ustalić kształt, silę i kierunek zależność cech.
b) Wyznaczyć i zinterpretować współczynnik korelacji Pearsonea.
c) Jaki obrót może osiągnąć ze sprzedaży firma, gdy dziennie będzie emitowanych 8 reklam?
d) W jakim stopniu liczba reklam kształtuje poziom obrotu firmy?
e) Jak zmieni się obrót, gdy liczba emitowanych reklam wzrośnie o jedną dziennie?
43 Zadanie 5.
Producent napojów chłodzących zgromadził dane o ilości zamówień (w tys. 1) i średniej temperaturze dobowej (w C) w ciągu wybranych 10 dni. Dane te przedstawia tablica
Średnie temperatury dobowe 18 24 29 20 35 18 14 27 30 22
Wielkość zamówienia 50 93 119 60 160 52 35 105 120 71
Źródło: dane umowne
56
Zadania do samodzielnego rozwiązywania
a) Czy istnieje zależność między ilością zamówień i temperaturą dobową. Jeśli tak określić jej sil i kierunek?
b) Zbudować odpowiedni model regresji liniowej.
c) Określić w jakim stopniu ilość zamówienia zależy od temperatury.
d) W jakim stopniu wzrośnie ilość zamówień, gdy temperatura wzrośnie o 1C?
43 Zadanie 6.
Analityk kosztów usług szpitalnych chce oszacować liniowy związek między liczbą dni hospitalizacji pacjenta ( jakiej będzie on wymagał w ocenie lekarza przyjmującego ) i całkowitym kosztem pobytu pacjenta w szpitalu. Wyniki badania mają być wykorzystane do prognozowania kosztów pobytu pacjenta w szpitalu na podstawie wstępnej oceny długości jego pobytu. Wybrano następującą losową grupę 11 przypadków zachorowań:
Ilość dni 5 6 2 7 1 4 8 3 2 5 9
Koszt pobytu 2 845 3 030 2 568 3 288 2 327 2 966 3 760 2 580 2 772 3 199 3 520
Źródło: dane umowne
Oszacuj parametry liniowego modelu regresji i oceń jego dokładność.
43 Zadanie 7.
Analiza spożycia artykułu C zależnie od dochodu w losowej próbie gospodarstw domowych dostarczyła następujących informacji:
średnie spożycie artykułu C na 1 osobę wynosi 2,5 kg,
średni miesięczny dochód na 1 osobę wynosi 540 zł,
współczynnik zmienności dochodu wynosi 15%, a spożycia 20%,
poziom kowariancji równa się 27.
Wypowiedzieć się na temat siły i kierunku zależności. Oszacować parametry funkcji regresji spożycia względem wielkości dochodów oraz obliczyć poziom spożycia dla rodzin o dochodach średnich wynoszących 600 zł.
Czy wysokość dochodu wpływa na poziom spożycia silniej niż inne czynniki?
4a Zadanie 8.
Z badania zależności między wielkością opłat za zużycie energii elektrycznej a wielkością gospodarstw domowych dla 80 wylosowanych wynika, że kowariancja tych zmiennych wynosi 32, średnia wielkość gospodarstwa domowego 4 osobowego z odchyleniem standardowym 0,8, a średnia wysokość miesięcznych opłat 300 zł, przy średnim zróżnicowaniu tych opłat 150 zł.
Oszacować parametry liniowej funkcji regresji wysokości opłat za zużycie energii elektrycznej względem wielkości gospodarstw domowych. Jaka jest siła tej zależności?
57
Rozdział II
W jakim stopniu wielkość gospodarstwa domowego wpływa na zużycie energii elektrycznej?
Zadanie 9.
Kierownik działu marketingowego sugeruje dyrektorowi pewnej firmy zwiększenie wydatków na reklamę w celu zwiększenia zysku firmy. Dyrektor nie chce się zgodzić i twierdzi, że związek pomiędzy tymi cechami jest bardzo słaby. Czy stanowisko dyrektora jest słuszne, jeśli wyniki w ciągu ostatnich 6 miesięcy były następujące:
Wydatki na reklamę 1 3 4 8 6 9
Zysk w tys. zł 40 50 60 90 80 120
W jakim stopniu wydatki na reklamę wpływają na zysk firmy? Jaki zysk może osiągnąć firma, gdy wydatki na reklamę będą wynosić 7 j.p. (jednostek pieniężnych)?
Jak zmieni się poziom zysku, gdy wydatki wzrosną o 1 j.p.?
*LŚ Zadanie 10.
W pewnym zakładzie pracy przeprowadzono badanie zależności pomiędzy stażem pracy (x) i odsetkiem braków w produkcji (y) wykonywanej przez 135 robotników i otrzymano następujące wyniki:
a) średni staż pracy równy 8 lat, średni odsetek braków równy 10%,
b) zróżnicowanie mierzone współczynnikiem zmienności wynosi: dla stażu - 30%, dla odsetka braków - 25%,
c) współczynnik regresji odsetka braków względem stażu pracy wynosi -0,62. Co można powiedzieć o kierunku i sile korelacji między tymi zmiennymi:*
Właściciel zakład badał zależność między pkcą (x), a liczbą braków (y). W styczniu na podstawie losowo wybranej próby 20 pracowników, u których zaobserwowano liczbę elementów wadliwych od 20 do 60 i zarobki od 1,5 tys. do 4,2 tys. zł. Wyznaczono równania regresji:
y = -12,79x + 62,19 i x = -0,059y + 4,28
a) Wykreślić przedstawione linie regresji.
b) Obliczyć i zinterpretować współczynnik korelacji oraz określić jakiego poziomu braków można się spodziewać u pracowników mających wynagrodzenie na poziomie 4,5 tys. zł.
c) W jakim stopniu liczba braków jest zależna od wysokości wynagrodzenia?
d) Jak zmieni się wynagrodzenie jeśli liczba braków wzrośnie o 1?
e) Jak zmieni się liczba braków, gdy wynagrodzenia wzrosną o 1 tys. zł.
58
Zadania do samodzielnego rozwiązywania
L> Zadanie 12.
W zakładach odzieżowych przeprowadzono badania w celu ustalenia zależności miedzy długością serii produkcji w tys. sztuk (x) a jednostkowym kosztem produkcji wyrobu w tys. zł (y). W rezultacie otrzymano następujące równania regresji:
x = -0,003y +1,7 i y = -270x + 5160
a) Podać interpretację współczynników regresji a i ax.
b) Co można powiedzieć o kierunku i sile zależności pomiędzy tymi cechami?
c) Jaki jest teoretyczny poziom kosztu jednostkowego przy długości serii 10 tys sztuk?
d) Jak zmieni się koszt jednostkowy jeśli długość serii wydłużymy o 1 tys. sztuk?
Zadanie 13.
Dane wyjściowe są następujące: , x = 10, y = 12, S(x) = 3, V =03 oraz
ao= 2,5.
Ustalić siłę i kierunek współzależności oraz ocenić w jakim stopniu jedna cecha wyjaśnia drugą. Ustalić poziom cechy y, gdy x = 12.
LŚ Zadanie 14.
Mamy dane: ax = 1,6, sx = 10, sv = 6. Obliczyć współczynnik determinacji.
Zadanie 15.
Wypowiedzieć się, które wyniki obliczeń są niewiarygodne i dlaczego?
a) a, = -0,2 i 08
b) a, = 0,75
c) rxv = -0,75
, = 0,2 i r = 0,8
b, = 2,5 b, = -0,23
L3 Zadanie 16.
W wybranej grupie studenckiej przeprowadzono badania dotyczące zależności pomiędzy płcią i paleniem papierosów. Wśród 50 kobiet 12 paliło papierosy a wśród 50 mężczyzn do palenia papierosów przyznało się 42. Ułożyć tablicę asocjacji i na podstawie odpowiedniego miernika stwierdzić czy istnieje zależność pomiędzy tymi cechami.
L> Zadanie 17.
Dla wybranej grupy osób opracowano test zręcznościowy. Wyniki tego testu określano jako pozytywne i negatywne. Wśród 220 kobiet objętych badaniem 2/5 uzyskało wynik negatywny a wśród 200 mężczyzn dla 65% określono wyniki również jako negatywny. Czy prawdą jest stwierdzenie, że wynik testu zależał od płci badanej osoby?
59
Rozdział II
Lj Zadanie 18.
Dla pewnej grupy gospodarstw domowych zbadano roczne spożycie na osobę dwóch artykułów spożywczych: mąki (A) i tłuszczów (B) w kg i otrzymano następujące wyniki:
Spożycie A 10 20 25 30 40 45 60
Spożycie B 20 25 35 30 45 50 60
a) Wyznaczyć proste regresji spożycia wymienionych artykułów metodą najmniejszych kwadratów.
b) Obliczyć współczynnik korelacji między tymi zmiennymi.
Na podstawie informacji dotyczących absencji chorobowej pracowników i ich wieku przedstawionych w postaci następujących miar:
współczynnik korelacji równy 0,53;
odchylenie standardowe równe 15 lat;
kowariancja badanych cech równa 53,65;
wariancja absencji chorobowej wynosiła 12,24. Ocenić czy przedstawia sytuacja jest możliwa?
Dane wyjściowe są następujące: x - koszt produkcji detalu w tys. zł; y - liczba produkowanych detali w tys. sztuk; n = 30 liczba analizowanych zakładów; x = 0, S(x) = 3, y = 12, V , = 30%, a, = 720 szt./tys. zł.
Na podstawie tych danych należy:
a) Ustalić siłę i kierunek współzależności cech.
b) Określić w jakim stopniu zmiany wielkości produkcji zależą od zmian kosztów produkcji.
c) Oszacować koszt przy produkcji równej 10 tys. sztuk.
d) Jak dużej produkcji należy oczekiwać przy założonym poziomie kosztów równym 12 tys. zł.
L> Zadanie 21.
Badając zależność pomiędzy stażem pracy (y) w latach a wydajnością pracownika (x) w sztukach dla grupy 50 wylosowanych pracowników wynagradzanych w systemie akordowym otrzymano następujące informacje: y = 0,3x + 3y = 18 lat, r2 = 0,81.
XV
Na podstawie tych informacji:
a) Ustalić i zinterpretować parametry brakującego równania regresji.
b) Ocenić siłę i kierunek współzależnych cech.
60
Zadania do samodzielnego rozwiązywania
c) Określić jaka będzie wydajność pracownika z dwudziestoletnim stażem pracy.
d) Ocenić w jakim stopniu wydajność pracownika zależy od jego stażu pracy.
e) Jak zmieni się wydajność pracownika, gdy jego staż wzrośnie o rok.
W liniowym modelu regresji zadłużenia (y - w tys. zł) podmiotów gospodarczych z tytułu kredytów łącznie z odsetkami względem wartości produkcji sprzedanej (x - w min zł) dla 80 podmiotów gospodarczych z sektora produkcyjnego otrzymano: cov(x,y) = -2,88; x = 5,5; S(x) = 0,6; y = 183; S(y) = 8,0.
Podać wartość zadłużenia dla podmiotów gospodarczych, które mają wartość produkcji odpowiednio równą 5 min, 6 min i 9 min zł. Określić poziom niedopasowania zmiennych. Jak zmieni się poziom zadłużenia, gdy wartość produkcji sprzedanej wzrośnie o 1 min zł?
A Zadanie 23.
Na podstawie danych uzyskanych w pewnej miejscowości letniskowej obliczono współczynniki korelacji między trzema zmiennymi: tygodniową sprzedażą napojów chłodzących (x), tygodniową liczbą turystów przebywających w tej miejscowości (y) oraz przeciętną dzienną temperaturą (z). Otrzymano następujące wyniki: r = -0,30; ro = -0,70; r z = 0,80. Jaka jest siła zależności pomiędzy zmiennymi x i y, gdy zostanie wyeliminowany wpływ temperatury?
L Zadanie 24.
W pewnym badaniu uzyskano następujące wyniki: r|2 = 0,49; rI3 = 0,78; r23 = 0,25.
Czy prawdą jest, że jedynie 10% zmian zmiennej zależnej od innych nie uwzględnionych w modelu zmiennych?
L Zadanie 25.
W grupie 100 robotników zbadano zależność pomiędzy trzema zmiennymi: wydajnością pracy (x), stażem pracy (y) i poziomem wykształcenia (z). Otrzymano następujące rezultaty: rx = 0,4, ryz = 0,2, r = 0,5. Kierownik jednego z wydziałów przedsiębiorstwa twierdzi, że różnice w stażu pracy i w wykształceniu tylko w 1/3 decydują o zróżnicowaniu wydajności pracy. Czy ma on rację?
Lj Zadanie 26.
Wśród członków klubu "Fitness Klub" przeprowadzono ankietę dotycząca stosowania diety oraz zmiany wagi ciała. Otrzymano następujące wyniki:
61
Rozdział II
Nie stosują diety Stosują dietę nieregularnie Stosują dietę systematycznie
Brak zmian wagi 80 120 20
Nieznaczne zmiany 100 60 60
Utrata wagi ciała 20 70 120
Na podstawie tych informacji ustalić czy stosowanie diety wpływa w istotny sposób na zmiany wagi ciała.
LŚ Zadanie 27.
W liceum miasta N zbadano zależność pomiędzy pochodzeniem społecznym uczniów a ich zainteresowaniami dotyczącymi kierunku studiów w wybranych typach uczelni wyższej. Wyniki badania przedstawia tablica:
Pochodź. Kandydata Rodzaj uczelni wyższej
Uniwersytet Politechnika Akademia medyczna
Chłopskie 5 10 5
Robotnicze 10 5 25
Inteligenckie 25 5 10
Ustalić stopień współzależności pomiędzy pochodzeniem społecznym ucznia a rodzajem wybieranej uczelni wyższej.
L Zadanie 28.
Ustalić stopień współzależności między opiniami dyrektora i wizytatora o nauczycielach pracujących w gimnazjum na podstawie kontroli całokształtu pracy zawodowej podsumowanej w systemie punktowym przedstawionym w tablicy:
Opinia A B C D E F G H I J
Dyrekt 41 27 35 33 25 47 38 53 43 35
Wizyt. 38 24 34 29 27 47 43 52 39 31
L> Zadanie 29.
W mikroregionie centralnej Polski na podstawie danych dotyczących wydatków na edukację w gminach ( X ), liczby mieszkańców gmin ( Y ) oraz dochodów gmin (Z) obliczono współczynniki korelacji liniowej Pearsonea równe odpowiednio: r = 0,5774; rxz = 0,6805; r" = 0,4236.
Obliczyć właściwe w sensie logicznym współczynniki korelacji cząstkowej oraz współczynnik korelacji wielorakiej.
62
Zadania do samodzielnego rozwiązywania
L3 Zadanie 30.
Liczba kopalń, wydobycie oraz poziom zatrudnienia w kopalniach węgla brunatnego w kolejnych latach 1970-1974 przedstawia tablica:
Rok Liczba kopalń Wydobycie w min ton Zatrudnienie w tyś
1970 8 32,8 13,1
1971 9 34,5 13,7
1972 8 38,2 14,5
1973 8 39,2 13,7
1974 6 38,8 12,7
ODPOWIEDZI DO ZADAŃ
1. r = 0,8944;
2. af V, = 0,24; V, . = 0,078; V . . = 0,387;
b) rxy = 0,794; rx? = 0, ry/ = 0,34;
c) dj = 0,631; d" = 0,323; dy, = 0,115;
3. r^ =7-0,888; d ='0,789; cp2 = 0,34; = 10,4 szt.
4. /y = 0,7949; y*8) = 163,23 tys. zł; d = 0,632; wzrośnie o ok. 7,8 tys. zł;
5. Zależność między zmiennymi ma charakter liniowy rxv = 0,8755; y = 5, 387; x - 35,78; d = 0,76 - w 76,66% wielkość zamówień zależ}' od temperatury; gdy temperatura wzrośnie o 1C to zamówienie wzrośnie o 5,39 tys. litrów;
6. Linia regresji dla kosztów pobytu w zależności od czasu pobytu w szpitalu y = 153,5958 x + 2260,73; ę2 = 0,1364;
7. rxy = 0,667, funkcje regresji: y = 0,004x + 0,34; y(;o()) = 2,74 kg; d = 44,5% 8. rxy = 0,667; y = 125x - 200d = 44,4%;
9. d = 0,9396, czyli w 93,96% wydatki na reklamę kształtują zysk firmy y'7] = 90,427; przy wzroście wydatków na reklamę o 1 j.p. zysk firmy wzrośnie o 9,32 tys. zł.
10. rxy = -0,5952;
U. r ' = -0,869; y"45 = 4,63 szt.; d = 75,46%; wynagrodzenie zmniejszy się o 59 zł; liczba braków zmaleje o około 13 sztuk;
12. rx = -0,9; y'45 =2 460; koszt jednostkowy ulegnie zmniejszeniu o 0,003 zł;
13. rxy = 0,7916; d = 62,66%; y'l2 = 13,9;
14. dX'V= 92,16%;
15. a) nie jest prawdziwe, bo znaki współczynników korelacji i regresji są takie same;
b) nie jest prawdziwe bo a, b, = r2v e (0,1);
c) zależność właściwa;
63
Rozdział II
16. Współczynnik asocjacji = 0,6019, czyli zależność jest statystycznie istotna;
17. *P =0,2499; zależność ma statystycznie istotny charakter;
18. Linie regresji y = 0,8376x + 10,337; x = l,1408y - 10,337; rxv = 0,9775;
19. Sytuacja nie jest możliwa, bo wyznaczony współczynnik korelacji na podstawie podanej kowariancji i odchyleń standardowych jest równy 1,0223, czyli przekracza wartość 1;
20. a) rxv = -0,6; b) dy= 36%;
c)y;o=n;
d)y;2 = 9,36;
21. a) x = 2,7y + 1,4;
b) rs = 0,9 silna korelacja dodatnia;
c) x-(" = 55,4;
d) d = 81%;
e) wydajność wzrośnie o 2,7 sztuki;
22. Prognozy y* = 187, y* = 179, y* = 155, d = 36%;
23. rxyz = 0,619;
24. Ponieważ nie ustalono wyraźnie zmiennej zależnej należy prześledzić wartość miernika cp2 dla przypadku, gdy kolejne zmienne byłyby zmiennymi zależnymi: dla zmiennej zależnej "1" R2v = 0,7012; dla zmiennej zależnej "2" R2v = 0,6313; dla zmiennej zależnej "3" R2v = 0,2847, czyli w żadnym z przypadków stwierdzenie nie jest prawdziwe.
25. Tak, bo R2. = 0,34;
26. Txv = 0,3376; T2v = 0,114, czyli zależność pomiędzy cechami istnieje, ale w słabym stopniu;
27. Txv = 0,4437; 28. rs = 0,948; silna współzależność;
29. r* = 0,4356; rx7v = 0,5894; Rw = 0,7516;
30. r"' = -0,80; r ""= 0,7326; R = 0,8079.
xyz ' ' xzv ' w
64
Rozdział III
Analiza dynamiki zjawisk
3 Zadanie 1.
Akcje Banku Rozwoju Eksportu na kolejnych dziewięciu sesjach giełdowych począwszy od 06.10.1992 r. kształtowały się następująco: 203, 196, 177, 180, 198, 217, 220, 211, 211. Dokonać analizy dynamiki zmian wartości akcji BRE za pomocą odpowiednich mierników statystycznych. Ocenić za pomocą średniej geometrycznej przeciętny poziom zmian wartości akcji i zakładając nie zmienione tempo zmian wyznaczyć prognozę ceny akcji na dwie kolejne sesje giełdowe. t Rozwiązanie.
Ze względu na specyfikę przedstawionych zmiennych (szereg czasowy) analizę zmian ich wartości przeprowadzamy w oparciu o mierniki zwane przyrostami i indeksami. Przyrosty absolutne są to różnice pomiędzy wartością cechy w analizowanym momencie i wartością cechy uznaną za wzorzec. Ze względu na postać wzorca wyróżniamy przyrosty o podstawie stałej i zmiennej. Mierniki mają następującą postać: a) przyrosty o podstawie stałej
b) przyrosty o podstawie zmiennej
Ay,/t-i=y,-yt-i
[31]
[32]
Oprócz przyrostów absolutnych zmiany dynamiki ocenia się za pomocą przyrostów względnych będących ilorazami przyrostów absolutnych i wartości cechy uznanej za wzorzec. Oznaczamy je jako: a) przyrosty o stałej podstawie
Av , = ł^ ----- r^i
65
Rozdziat III
b) przyrosty o podstawie zmiennej Ayt/t-i ="
[34]
Swoistą konsekwencją przyrostów względnych są indeksy odpowiednio jed-nopodstawowe i łańcuchowe (o podstawie zmiennej), czyli ilorazy wartości cechy w analizowanych momencie i momencie wzorcowym oznaczane jako
1t/o =
yt
i 1
t/t1
_ yt yt-i
[35, 36]
Indeksy lub wskaźnik dynamiki służyć mogą do oceny przeciętnego tempa zmian się całym analizowanym przedziale czasu. Wykorzystuje się w tym celu średnią geometryczną z indeksów łańcuchowych lub ostatniego indeksu o podstawie stałej. Oznaczamy tą średnią jako:
[37]
Jej wartość pomniejszona o 1 określa poziom przeciętnych zmian wartości cechy pomiędzy kolejnymi momentami czasowymi (w przeliczeniu na punkty procentowe).
Przykładowa tablica robocza będzie miała postać:
t yt y< ~ y,) y, y, ~ 5V~' y,
y" y" yi-i yt-i
1 203 0,0 0,0 1,0 - - -
2 196 -7,0 -3,45 0,9655 -7,0 -3,45 0,9655
3 177 -26,0 -12,81 0,8719 -19,0 -9,69 0,9031
4 180 -23,0 -11,33 0,8867 3,0 1,69 1,0169
5 198 -5,0 -2,46 0,9754 18,0 10,0 1,1000
6 217 14,0 6,9 1,0690 19,0 9,6 1,0969
7 220 17,0 8,37 1,0837 3,0 1,38 1,0138
8 211 8,0 3,94 1,0394 -9,0 -4,09 0,9591
9 211 8,0 3,94 1,0394 0,0 0,00 1,0000
Interpretując kolejne wartości kolumn tablicy możemy stwierdzić, że: a) przyjmując jako wzorcową cenę akcji z 06.10.92 r. największy spadek cen nastąpił na trzeciej i czwartej sesji po rozważanych terminie, natomiast zdecydowany wzrost wartości akcji przypadł na szóstą i siódmą sesję po 06.10;
66
Analiza dynamiki zjawisk
b) w porównaniu z pierwszym notowaniem na trzecim i czwartym spadek cen był dość znaczny, bo sięgał 13% i 12%, natomiast wzrost na sesji szóstej i siódmej wahał się około 7% i 8,5%;
c) analizując dynamikę zmian w kolejnych momentach w stosunku do momentów bezpośrednio poprzedzających, stwierdzamy, że największy wzrost ceny akcji BRE nastąpił pomiędzy sesją czwartą i piątą (o 10%), a równie dynamiczny spadek ceny (o około 9,5% nastąpił pomiędzy sesją drugą i trzecią;
d) dwie ostatnie sesje (ósma i dziewiąta) charakteryzowały się stabilnością ceny akcji BRE.
Przeciętny poziom wyznaczony za pomocą średniej geometrycznej
iG = s/0,9655 0,9031 1,0169 1,1 1,0916 1,0138 0,9591 = ^1,0394 = 1,0048
oznacza, że średnio z sesji na sesję ceny akcji rosły o około 0,48%.
Jeśli na tej podstawie chcemy wyznaczyć prognozę ceny akcji BRE na dwie kolejne sesje, to wykorzystamy zależność
gdzie:
czyli
y*n+k = yn Go)k
- wartość prognozowana;
- ostatnia obserwacja empiryczna;
- ilość kroków prognozy (horyzont prognozy);
- średnia geometryczna indeksów łańcuchowych.
lo-y,-(i0 )= 211 (1,048)= 212,02
[38]
yi =
= 211 (l,048)2 = 213,05
Wyznaczanie prognoz statystycznych na podstawie średniego tempa zmian i ostatniej obserwacji empirycznej w szeregu czasowym, którym wstępnie dysponujemy jest celowe jedynie dla bliskich ostatniej obserwacji momentów czasowych, gdyż wymaga bardzo silnego założenia o nie podlegającym zmianom średnim tempie zmian zjawiska w kolejnych momentach czasowych, co nie zawsze może być prawdziwe.
O Zadanie 2.
W ostatnim kwartale roku 1999 sprzedano w salonach firmowych samochodów Fiat Poland 100 samochodów określonej marki. W kolejnych kwartałach w 2000 r. i 2001 r. sprzedaż wzrastała w stosunku do ostatniego kwartału 1999 r.
67
Rozdział III
odpowiednio o 5%, 10%, 12%, 18%, 20%, 25%, 40% i 60%. Określić dynamikę zmian z kwartału na kwartał w analizowanych latach oraz ocenić jakie był średni kwartalny wzrost sprzedaży samochodów określonej marki i jakiej ilości sprzedanych samochodów można się spodziewać w II i III kwartale 2002 roku.
Jak można określić poziom zmian liczby sprzedanych samochodów w kolejnych kwartałach 2001 roku w stosunku do IV kwartału roku 2000? Śr Rozwiązanie.
Wygodne do dalszej analizy będzie przedstawienie tabelaryczne podanych wartości indeksowych i wyznaczenie odpowiednich indeksów jednopodstawowych przy nowej podstawie (IV 2000):
Kwartał t Vi V-. it
IV/99 1 1,00 - 0,85 100
1/00 2 1,05 1,05 0,89 105
11/00 3 1,10 1,05 0,93 1 10
111/00 4 1,12 1,02 0,95 112
IV/00 5 1,18 1,05 1,00 118
1/01 6 1,20 1,02 1,02 120
11/01 7 1,25 1,04 1,06 125
in/oi 8 1,40 1,12 1,19 140
IV/() 1 9 1,60 1,14 1,36 160
Wyznaczając wartości indeksów o podstawie łańcuchowej wykorzystujemy zależność:
M/t-I
't/o
t-i/o
[39]
natomiast zmieniając podstawę o numerze "1" na podstawę o numerze "c" zależność:
M/l
'c/l
[40]
Brakujące wartości empiryczne zmiennej wyznaczamy w oparciu o równość:
Indeksy łańcuchowe wskazując na najbardziej gwałtowny wzrost sprzedaży samochodów w dwóch ostatnich kwartałach roku 2001 w stosunku do kwartałów roku 2000 wzrost był równie dynamiczny i w IV kwartale 2001 sięgał 36%.
68
Analiza dynamiki zjawisk
Średniookresowe tempo wzrostu wyznaczone w oparciu o średnią geometryczną:
iG = 8Vl6 = 1,0605
wskazuje na przeciętnie 6% wzrost sprzedaży samochodów z kwartału na kwartał.
Przy założeniu nie zmienionego tempa wzrostu sprzedaży w II i III kwartału 2002 powinno ono wynosić:
Yn/2002 = yii/2001 -(io)2 -160 (l,0605)2 = 179,9 180
yiii/2002 =yiv/2ooi -Og)3 = 190,84 191 około 180 i 191 samochodów.
O Zadanie 3.
Średniookresowe tempo wzrostu konsumpcji mleka i jego przetworów przez przeciętną czteroosobową rodzinę konsumencką w ciągu kolejnych sześciu miesięcy (od marca do sierpnia) wynosiło 3,5%. Jak może się ono kształtować w listopadzie, jeśli w sierpniu spożycie mleka wynosiło łącznie za cały miesiąc 36 litrów. vr Rozwiązanie.
Przyjmując oznaczenia yn = 36; iG = 1,035; y' + 3 = ?; wykorzystujemy wzór:
y*"+3 = yn Ś iG = 36 (l,035)3 = 36 Ś 1,1087 = 39,91 40
co oznacza, że rodzina w ciągu miesiąca listopada spożyje prawdopodobnie 40 litrów mleka.
S Zadanie 4.
W hurtowni owoców tropikalnych przeprowadzono analizę zmian sprzedaży łącznie trzech wybranych gatunków owoców: cytryn, pomarańczy i bananów w dwóch wybranych miesiącach marcu i czerwcu. Wyniki badań empirycznych przedstawia tablica.
Owoce Marzec Maj
ilość (w kg) cena ilość (w kg) cena
Cytryny Pomarańcze Banany 400 900 700 4,5 3,8 2,7 400 500 850 4,8 6,5 3,3
69
Rozdziai
Ocenić zmiany wartości cen i ilości sprzedawanych owoców. Stwierdzić co w silniejszym stopniu wpływa na zmiany wartości sprzedaży - zmiana cen czy zmiana ilości. vr Rozwiązanie.
Ze względu na potrzebę rozpatrywanie łącznie zmian wszystkich (tzn. trzech) gatunków owoców w zakresie wartości, cen i ilości w miejsce indywidualnych mierników dynamiki wykorzystujemy mierniki agregatowe.
Mają one postać: Agregatowy indeks wartości:
I. =
2>jn
H___
k
2>jo H
[42]
gdzie:
w.o - wartość "j"-tego elementu agregatu (zespołu elementów podlegających zmianom) w momencie bazowym (wcześniejszym w sensie chronologicznym);
wjn - wartość "j "-tego elementu agregatu w momencie badania (chronologicznie późniejszym).
Agregatowy indeks cen:
a) Laspeyeresa
TL_
lp
IPjoljo
b) Paaschego
Agregatowy indeks ilości: a) Laspeyeresa
b) Paaschego
70
IPjoljn
[43]
[44]
TP_ lp
[45]
[46]
jo
Analiza dynamiki zjawisk
gdzie odpowiednio:
PjO> Pjn ~ ceny -)"- teSo eIem- agregatu w momencie wzorcowym i badania;
q|O' % ~ ilości "i"- teg elem- agregatu w momencie wzorcowym i badania.
Indeksy agregatowe wartości, cen i ilości Laspeyeresa i Paaschego pozwalają na ocenę zmian wartości z uwzględnieniem przyczyny tych zmian lub bez podania przyczyn. .
Łączne zmiany cen i ilości ustalamy za pomocą indeksów Fischera (odpowiednio cen i ilości) czyli średnich geometrycznych indeksów agregatowych Laspeyeresa i Paaschego.
Ip=Vlp-Ip Ip^aAp'1? [47.48]
W naszym przypadku obliczanie warto przeprowadzić w pomocniczej tablicy:
Artykuł Pi. % Pn % P. q Pi"-q"
Cytryny Pomarańcze Banany 4,5 3,8 2,7 400 900 700 4,8 6,5 3,3 400 500 850 1800 3420 1890 1920 3250 2805 1 800 1900 2295 1920 5850 2310
X X X X 71 10 7975 5995 10080
Wykorzystując do obliczenia mierników wartości z ostatniego wiersza tablicy (wiersza sumacyjnego) otrzymujemy:
ip =
7110 10080
7110 5995 7110
= 1,4177
= o,8432
5995
= 13303
10080
= 0,7912
lF = 71,4177-13303 = 1,3733
1^=70,8432-0,7912=0,8168
71
Rozdział III
Ocenić zmiany wartości cen i ilości sprzedawanych owoców. Stwierdzić co w silniejszym stopniu wpływa na zmiany wartości sprzedaży - zmiana cen czy zmiana ilości. V Rozwiązanie.
Ze względu na potrzebę rozpatrywanie łącznie zmian wszystkich (tzn. trzech) gatunków owoców w zakresie wartości, cen i ilości w miejsce indywidualnych mierników dynamiki wykorzystujemy mierniki agregatowe.
Mają one postać: Agregatowy indeks wartości:
k
Iw
[42]
JO
gdzie:
wjo - wartość "j"-tego elementu agregatu (zespołu elementów podlegających zmianom) w momencie bazowym (wcześniejszym w sensie chronologicznym);
w - wartość "j"-tego elementu agregatu w momencie badania (chronologicznie późniejszym).
Agregatowy indeks cen:
a) Laspeyeresa
b) Paaschego
Agregatowy indeks ilości: a) Laspeyeresa
b) Paaschego
70
I? =
Ipi
[43]
[44]
=Ś
[45]
[46]
Analiza dynamiki zjawisk
gdzie odpowiednio:
po, p.n - ceny "j"- tego elem. agregatu w momencie wzorcowym i badania;
q o, q.n - ilości "j"- tego elem. agregatu w momencie wzorcowym i badania.
Indeksy agregatowe wartości, cen i ilości Laspeyeresa i Paasche'go pozwalają na ocenę zmian wartości z uwzględnieniem przyczyny tych zmian lub bez podania przyczyn. .
Łączne zmiany cen i ilości ustalamy za pomocą indeksów Fischera (odpowiednio cen i ilości) czyli średnich geometrycznych indeksów agregatowych Laspeyeresa i Paaschego.
^ ~ " ^ ~ [47,48]
W naszym przypadku obliczanie warto przeprowadzić w pomocniczej tablicy:
Artykuł Pio p. Mn % P. q |O 1,1.
Cytryny Pomarańcze Banany 4,5 3,8 2,7 400 900 700 4,8 6,5 3,3 400 500 850 1800 3420 1890 1920 3250 2805 1800 1900 2295 1920 5850 2310
X X X X 7110 7975 5995 10080
Wykorzystując do obliczenia mierników wartości z ostatniego wiersza tablicy (wiersza sumacyjnego) otrzymujemy:
w 7110 1^=^ = 1,4177
7110 5995 7110
= 0,8432
5995
10080
= 0,7912
IqF =
= Vl,4177-13303 = 1,3733 ' =0,8168
71
Rozdział III
Interpretując wartości mierników stwierdzamy, że:
pomiędzy marcem a majem nastąpił wzrost wartości sprzedawanych owoców cytrusowych o 12,17% (Iw = 112,17%);
gdyby ilość sprzedanych owoców była w maju taka sama jak w marcu, to zmiany cen owoców spowodowałby wzrost łącznych obrotów ze sprzedaży o 41,77% (IL = 141,77%);
gdyby ilość sprzedawanych owoców była w marcu taka sama jak w maju to zmiany cen spowodowałby wzrost łącznych obrotów ze sprzedaży o 33,03% (Ip =133,03%);
zmiana cen owoców spowodowała wzrost łącznych obrotów z ich sprzedaży o 37,33% (F =137,33%);
gdyby ceny owoców w maju były takie same jak w marcu to zmiany wielkości sprzedaży spowodowałyby spadek obrotów o 20,88% (Ip =79,12%);
zmiana ilości sprzedawanych owoców spowodowała spadek obrotów z ich sprzedaży o 18,32% (P =81,68%).
Odpowiadając na pytanie co w większym stopniu kształtuje wielkości obrotów zmiany cen czy zmianę wielkości masy fizycznej sprzedawanych owoców stwierdzamy silniejszy wpływ zmiany cen pomiędzy rozważanymi miesiącami. Spowodowały one wzrost obrotów o 37,33%, podczas gdy zmiany wielkości sprzedaży tylko w 18,32% wpłynęły na wielkość obrotów.
S Zadanie 5.
Biuro turystyczne "Ramzes" oferowało w swojej ofercie "Lato 2002" wyjazdy do Egiptu, Kenii i Maroko. W związku z doskonale przeprowadzoną kampanią reklamową sprzedano wczasy do Egiptu za 40 000 euro, do Kenii za 33 000 euro i do Maroka za 25 000 euro. Okazało się przy tym, że z wczasów do Egiptu zysk był większy o 1/3 niż w roku 2001, z wyjazdów do Kenii o 10% a z wyjazdów do Maroka niższy o 20%. Ocenić łącznie zmiany obrotów biura turystyki "Ramzes" w dwóch kolejnych latach. Co w silniejszym stopniu wpłynęło na ewentualne zmiany wielkości obrotów - zmiany cen czy ilości sprzedanych wycieczek, gdy wiadomo, że wycieczki do Egiptu potaniały przeciętnie o 10%, do Kenii ceny nie uległy zmianie a do Maroka zdrożały o 10%. T Rozwiązanie.
Aby odpowiedzieć na pytanie sformułowana w treści zadania należy wyznaczyć indeksy agregatowe wartości oraz cen i ilości Fischera.
Ze względu na tzw. ograniczoną informację statystyczną zamiast pełnej postaci mierników wykorzystamy ich zmodyfikowaną formę opartą o równości:
Pjn
wj0 1P=Pjo-qjo = pjn -qjo
Pjo
72
Analiza dynamiki zjawisk
ip Pin.
ljn
Zmodyfikowana postać indeksów Laspeyeresa i Paaschego są następujące:
I,L=-
IPP=:
Warto przy tym zauważyć, że pomiędzy miernikami zachodzą pewne zależności zwane równościami indeksowymi i ich wykorzystanie, zdecydowanie przyspiesza proces obliczania wskaźników.
Równości te mają postać:
I =ILIP
I =IL -T
[49, 50]
Tablica robocza do wyznaczania wartości mierników w naszym przypadku będzie miała postać:
Impreza w. zmiany cen io w. i PO D w. : i
Egipt Kenia Maroko 30.000 30.000 31.250 40.000 33.000 25.000 0,9 1,0 1,1 27.000 30.000 34.375 44.444 33.000 22.727
91.250 98.000 X 91.375 100.172
Odpowiednio wartości mierników będą równe:
98000
L, =
91250
= 1,074
1^^75=1,001
p 91250
Ipp =0,978
73
Rozdział III
ij, =0,990
^ = il074 = q fp 0,978
f =hL = h91ą = io73 q IL 0,001
IqF =1,085
Możemy zatem stwierdzić, że ogólnie obroty firmy turystycznej "Ramzes" wzrosły w roku 2002 o 7,4% w porównaniu do roku 2001, przy czym zdecydowany wpływ na zysk firmy miały zmiany ilości sprzedanych wycieczek, a nie zmiany
cen.
S Zadanie 6.
Ilościowe spożycie kawy w latach 1995-2001 wzrosło o 10%, natomiast herbaty pozostało bez zmian. Ustalić dynamikę spożycia obydwu używek łącznie jeśli wiadomo, że obrót wartościowy kawą w roku 2001 był trzykrotnie wyższy niż herbatę, r Rozwiązanie.
Dysponując ograniczoną informację statystyczną możemy wyznaczyć jedynie jeden z mierników ilościowych i na jego podstawie formułować wnioski odnośnie dynamiki spożycia.
Wyznaczymy agregatowy indeks ilości Paaschego:
3x
w
Jn
3x x
----1
1,1 1
4x
3,72x
-1,073
W liczniku wskaźnika wprowadzona została niewiadoma x jako, że nie były znane wartości spożycie używek a jedynie zależność między nimi.
Możemy zatem stwierdzić, że ogólnie poziom spożycie kawy i herbaty wzrósł o 7,3%.
3 Zadanie 7.
Na 12 kolejnych sesjach giełdowych ceny akcji pewnej spółki kształtowały się następująco: 5, 7, 7, 9, 8, 10, 13, 14, 12, 15, 15, 17. Wyznaczyć postać teoretycznej linii trendu cen akcji tej spółki i ocenić dobroć jej do dopasowania do danych empirycznych.
74
Analiza dynamiki zjawisk
& Rozwiązanie.
Teoretyczna linia trendu może być wyznaczona na podobnych zasadach, jak teoretyczna linia regresji, czyli za pomocą klasycznej metody najmniejszych kwadratów, przy czym rolę zmiennej niezależnej pełni zmienna czasowa.
Zatem yt = at + b, gdzie w rozwinięciu macierzowym wektor szacowanych parametrów ma postać:
Lt Zt Ś [51]
[52]
lub w przekształconej postaci (z układu równań normalnych)
a =
b = y - at
[53]
Natomiast dokładność oszacowania oceniamy za pomocą współczynnika zbież-
ności qr postaci:
2=
-\2
I(yt-y)
[54]
gdzie:
yt - oznacza empiryczną wartość zjawiska;
y' - oznacza wartość teoretyczną wyznaczoną w oparciu o linię trendu. Dla celów naszego zadania zbudujemy pomocniczą tablicę roboczą.
t y, t2 yt y,' y.-y," (y.-y.T y,-y (y,-y)2
1 5 1 5 5,3075 0,3075 0,0946 -16 36
2 7 4 14 6,3425 -0,6575 0,4323 -4 16
3 7 9 21 7,38 0,38 0,1444 -4 16
4 9 16 36 8,415 -0,585 0,3422 -2 4
5 8 25 40 9,45 1,45 2,1025 -3 9
6 10 36 60 10,485 0,485 0,2352 -1 I
7 13 49 91 11,52 -1,48 2,1904 2 4
8 14 64 112 12,555 -1,445 2,0880 3 9
9 12 81 108 13,59 1,59 2,5281 I 1
10 15 100 150 14,625 0,375 0,1406 4 16
11 15 121 165 15,66 0,66 0,4356 4 16
12 17 144 204 16,695 0,305 0,0930 6 36
78 132 650 1 006 X X 10 827 X 164
75
Rozdział III
Wartości parametrów są następujące:
12-1006-78-132 12072-10296
1776
12-650-C78)2 7800-6084 1716 b = 11 - 1,035 Ś 6,5 = 11 - 6,7275 = 4.2725
= 1,035
a linia trendu ma postać:
yt = l,035t + 4,2725
Na jej podstawie wyznaczamy wartości teoretyczne yt' i odpowiednio współczynnik zbieżności cp2.
2 10,827
o =---------= 0,066
164
Możemy zatem stwierdzić, że z sesji na sesję przeciętna cena akcji spółki wzrasta o 1,03 zł.
Współczynnik zbieżności świadczy o dobrym dopasowaniu linii teoretycznej do danych empirycznych, gdyż tylko 6,6% zmian zmiennej y nie zostało wyjaśniona przez linię trendu.
3 Zadanie 8.
Średnie liczba wypłaconych odszkodowań z tytułu uszczerbku na zdrowiu przez klasy KRUS w województwie nowosądeckim w poszczególnych kwartałach lat 1996-1999 przedstawiała się następująco:
^^^^^^ Lata Kwartał --^_ 1996 1997 1998 1999
I 8 9 10 1 1
II 12 16 79 28
III 11 14 1S 20
IV 10 11 12 14
Wyodrębnić trend metodą mechaniczną stosując średnie ruchome 3-okresowe i 4-okresowe. ?r Rozwiązanie.
Trendem nazywamy powolne, regularne i systematyczne zmiany określonego zjawiska obserwowane w dostatecznie długim przedziale czasowym będące rezultatem działania tzw. przyczyn głównych. Najprostszą metodą pozwalającą na wyznaczenie trendu, czyli ustalenie kierunku zmian analizowanego zjawiska jest metoda mechaniczna, czyli metoda średnich ruchomych, polegająca na zastąpieniu warto-
76
Analiza dynamiki zjawisk
ści empirycznej uśrednieniami uzyskanymi z danej wartości i wartości sąsiednich. Należą przy tym określić długość cyklu uśrednień. Przy parzystej długości cyklu stosujemy tzw. średnią scentrowaną, a przy nieparzystej średnią prostą. Dla k = 3 średnia zastępująca wartość empiryczną ma postać
-
[55]
a dla k = 4 średnie scentrowane wyznaczamy zgodnie z wzorem ]_ 1_
yt-2 + yt-l+yt+yt+1+-yt+2 [56]
Interpretując graficznie szereg empiryczny i szeregi wartości uśrednionych możemy zauważyć, że empiryczna linia trendu ulega zdecydowanemu wygładzeniu.
W przypadku zaprezentowanego szeregu obrazującego liczbę wypłaconych wartości wygładzone możemy przedstawić w tablicy roboczej:
t y, y t (3 okr> y ( (4 okr)
1/96 8 _
11/96 12 10,33 _
111/96 11 11,00 10,375
IV/96 10 10,00 11,0
1/97 9 11,66 11,875
11/97 16 13,00 12,375
111/97 14 13,66 12,625
IV/97 1 1 11,66 13,5
1/98 10 14,33 14,75
11/98 22 16,67 15,375
111/98 18 17,33 15,625
IV/98 12 13,67 16,5
1/99 11 17,00 17,5
11/99 28 19,67 18,0
111/99 20 20,66 -
IV/99 14 - -
W tablicy widoczna jest wada metody mechanicznej, a mianowicie skrócenie szeregu obserwacji o wartości skrajnej. Zaletą natomiast jest zdecydowanie prostota obliczeń i możliwość wykrycia metodą "wzrokową" tendencji zmian zjawiska.
W naszym przypadku na podstawie analizy wzrokowej ostatniej kolumny możemy stwierdzić, że liczba wypłaconych odszkodowań, wykazuje tendencję wzrostową.
Jest to widoczne również na wykresie.
77
Rozdział III
30 25
20
Ś dane empiryczne
' Ś średnie 3 okresowe "
A średnie 4 okresowe
1/96 11/96 111/96 IV/96 1/97 11/97 111/97 IV/97 1/98 11/98 111/98 IV/98 1/99 11/99 01/99 IV/99
O Zadanie 9.
Poniższe tabela przedstawia kwartalne dochody z akcji akcjonariuszy koncernu Coca-Cola w latach 1995-1996. Ustalić czy wysokość uzyskiwanej dywidendy wykazuje zmiany sezonowe. Ocenić względne i bezwzględne poziomy wahań sezonowych i zinterpretować je.
"~~~~--^.^^ Lata Kwarta! " ^____ I II III IV
1995 0,26 0,36 0,46 0,26
1996 0,32 0,42 0,52 0,34
1997 0,35 0,47 0,59 0,36
1998 0,38 0,51 0,66 0,38
1999 0,43 0,57 0,75 0.48
*r Rozwiązanie.
Sezonowość jest swoistą nierównomiernością, którą charakteryzują się szeregi czasowe, polegająca na występowaniu cyklicznych odchyleń powtarzających się w tych samych jednostkach kalendarzowych jeśli zostanie zachowana określona długość cyklu podstawowego (np. rok, miesiąc, tydzień).
Ustalamy sezonowość za pomocą względnych i absolutnych mierników wahań. Najprostszym sposobem wyodrębnienia wahań sezonowych jest metoda oparta na średnich jednoimiennych podokresów. Wskaźniki sezonowości mają wtedy postać:
[57]
78
Analiza dynamiki zjawisk
gdzie:
S. - wskaźnik sezonowości dla i-tego podokresu; yj - średnia asymetryczna empirycznych wielkości zjawisk w jednoimiennych
podokresach; d - liczba podokresów (np. 4 dla kwartałów, 12 dla miesięcy).
Suma wskaźników sezonowości Si powinna być równa liczbie podokresów, czyli:
Wtedy wskaźniki S. nazywamy oczyszczonymi wskaźnikami sezonowości, a w przypadku gdy relacja równości nie jest spełniona wskaźniki noszą miano surowych wskaźników sezonowości.
Wskaźniki surowe poddawane są tzw. oczyszczaniu przez wprowadzenie poprawki korygującej postaci:
k =
[58]
i dalej
S. = k s.
gdzie dla oczyszczonych (skorygowanych) wskaźników żądana równość zachodzi. Absolutne poziomy wahań sezonowych dla poszczególnych podokresów wyznaczamy z równości:
[59]
gdzie:
g. - oznaczenie miernika absolutnego; S. - oczyszczone wskaźniki sezonowości; y. - średni poziom badanego zjawiska.
Przy czym suma absolutnych poziomów wahań jest równa 0 tzn.
W naszym przykładzie obliczenie przedstawiamy w tablicy:
79
Rozdział III
Kwartał Lata S ly, i=i y s,
1995 1996 1997 1998 1999
I II III IV 0,26 0,36 0,46 0,26 0,32 0,42 0,52 0,34 0,35 0,47 0,59 0,36 0,38 0,51 0,66 0,38 0,43 0,57 0,75 0,48 1,74 2,33 2,98 1,82 0,348 0,466 0,596 0,364 0,785 1,051 1,344 0,821
1,774 4,001
Suma wskaźników sezonowości przedstawionych w ostatniej kolumnie tablicy nie jest równa 4, zatem zachodzi współczynnik korekty równy:
k =
4.001
= 0,99975
i dalej
0S, = 0,99975 0,785 = 0,7848; oS" = 0,99975 1,051 = 1,0507;
oSIU = 0,99975 Ś 1,344 = 1,3436; oSlv = 0,99975 Ś 0,821 = 0,8208 Natomiast absolutne poziomy wahań dla kolejnych kwartałów są równe: g, = 0,4435(0,785 - 1) = -0,0953; g" = 0,4435(0,051 - 1) = 0,0226; gIM = 0,4435(1,344 - 1) = 0,1526; g|V = 0,4435(0,821 - 1) = -0,0794
Interpretując wskaźniki sezonowości możemy stwierdzić, że:
w pierwszych kwartałach badanego okresu na skutek działania czynników sezonowych następował spadek wartości akcji o 21,5%, w drugich wzrost o 5,1%, w trzecich zdecydowany wzrost o 34,4% i w czwartych spadek o 17,9% w stosunku do przeciętnej wartości akcji w całym okresie;
w jednostkach naturalnych (czyli w $) spadek wartości w pierwszych kwartałach był równy około 0,1$, w drugich wzrost byl przeciętnie równy 0,02$, w trzecich około 0,15$, a w czwartych spadek utrzymywał się na poziomie około 0,08$ w stosunku do poziomu przeciętnego z okresu 1995-1999 wynoszącego 0,44$.
3 Zadanie 10.
Według danych działu socjalnego kopalni "Piast" liczba spóźnień do pracy przekraczających 30 minut w kolejnych półroczach lat 1992-1999 liczona w tys. przedstawiała się następująco:
80
Analiza dynamiki zjawisk
"-~----^_____^ Rok Półrocze ^~~~~~-^^ 1992 1993 1994 1995 1996 1997 1998 1999
I 59 40 37 39 42 47 43 57
II 36 37 36 39 43 46 45 49
Źródło: dane umowne
Ustalić prognozę liczby spóźnień na kolejne półrocze roku 2000 i 2001 uwzględniając sezonowość zjawiska i błąd prognozy. rr Rozwiązanie.
Prognozę wartości zjawiska opracowaną na podstawie wyznaczonej metody najmniejszych kwadratów linii trendu uzyskujemy przez podstawienie do linii teoretycznej bieżącego numeru momentu czasowego (oznaczamy je przez y'y).
Należy dodatkowo uzupełnić prognozę o wielkość absolutnego poziomu wahań charakterystycznego dla momentu czasowego na który wyznaczana jest prognoza. Jednocześnie zakładając możliwość występowania wahań przypadkowych w szeregu czasowym dokonujemy ich eliminacji uwzględniając odchylenie standardowe reszt i błąd prognozy zależny od tego odchylenia standardowego.
Zapisując kolejne etapy analizy symbolicznie otrzymujemy:
wyznaczamy wartości teoretyczne szeregu y*
yt" = a + b
wyznaczamy składniki resztowe dla poszczególnych podokresów
z, = y,-y,"-g" [60]
ustalamy wariancję resztową i na jej podstawie odchylenie standardowe reszt
[61]
wyznaczamy prognozę a podstawie linii trendu
[62]
uzupełniamy prognozę błędami średnimi prognozy i absolutnym wskaźnikiem wahań sezonowych
s-.8w.Ll*.*-*
n l(T-t)2
[63]
81
Rozdział III
Kwartał Lata ty, i=l y s,
1995 1996 1997 1998 1999
I II III IV 0,26 0,36 0,46 0,26 0,32 0,42 0,52 0,34 0,35 0,47 0,59 0,36 0,38 0,51 0,66 0,38 0,43 0,57 0,75 0,48 1,74 2,33 2,98 1,82 0,348 0,466 0,596 0,364 0,785 1,051 1,344 0,821
1,774 4,001
Suma wskaźników sezonowości przedstawionych w ostatniej kolumnie tablicy nie jest równa 4, zatem zachodzi współczynnik korekty równy:
k =
4.001
= 0,99975
i dalej
0S, = 0,99975 0,785 = 0,7848; oS" = 0,99975 Ś 1,051 = 1,0507;
oSm = 0,99975 Ś 1,344 = 1,3436; oSIV = 0,99975 Ś 0,821 = 0,8208 Natomiast absolutne poziomy wahań dla kolejnych kwartałów są równe: g, = 0,4435(0,785 - 1) = -0,0953; g" = 0,4435(0,051 - 1) = 0,0226; g," = 0,4435(1,344 - 1) = 0,1526; g|V = 0,4435(0,821 - 1) = -0,0794
Interpretując wskaźniki sezonowości możemy stwierdzić, że:
w pierwszych kwartałach badanego okresu na skutek działania czynników sezonowych następował spadek wartości akcji o 21,5%, w drugich wzrost o 5,1%, w trzecich zdecydowany wzrost o 34,4% i w czwartych spadek o 17,9% w stosunku do przeciętnej wartości akcji w całym okresie;
w jednostkach naturalnych (czyli w $) spadek wartości w pierwszych kwartałach był równy około 0,1$, w drugich wzrost był przeciętnie równy 0,02$, w trzecich około 0,15$, a w czwartych spadek utrzymywał się na poziomie około 0,08$ w stosunku do poziomu przeciętnego z okresu 1995-1999 wynoszącego 0,44$.
O Zadanie 10.
Według danych działu socjalnego kopalni "Piast" liczba spóźnień do pracy przekraczających 30 minut w kolejnych półroczach lat 1992-1999 liczona w tys. przedstawiała się następująco:
80
Analiza dynamiki zjawisk
~"-~--~-^^^ Rok Półrocze - 1992 1993 1994 1995 1996 1997 1998 1999
I 59 40 37 39 42 47 43 57
II 36 37 36 39 43 46 45 49
Źródło: dane umowne
Ustalić prognozę liczby spóźnień na kolejne półrocze roku 2000 i 2001 uwzględniając sezonowość zjawiska i błąd prognozy. ri' Rozwiązanie.
Prognozę wartości zjawiska opracowaną na podstawie wyznaczonej metody najmniejszych kwadratów linii trendu uzyskujemy przez podstawienie do linii teoretycznej bieżącego numeru momentu czasowego (oznaczamy je przez y^.).
Należy dodatkowo uzupełnić prognozę o wielkość absolutnego poziomu wahań charakterystycznego dla momentu czasowego na który wyznaczana jest prognoza. Jednocześnie zakładając możliwość występowania wahań przypadkowych w szeregu czasowym dokonujemy ich eliminacji uwzględniając odchylenie standardowe reszt i błąd prognozy zależny od tego odchylenia standardowego.
Zapisując kolejne etapy analizy symbolicznie otrzymujemy:
wyznaczamy wartości teoretyczne szeregu y*
y; = a + b
wyznaczamy składniki resztowe dla poszczególnych podokresów
z, = y,-y,'-git [60]
ustalamy wariancję resztową i na jej podstawie odchylenie standardowe reszt
[61]
wyznaczamy prognozę a podstawie linii trendu
[62]
uzupełniamy prognozę błędami średnimi prognozy i absolutnym wskaźnikiem wahań sezonowych
1\2
[63]
81
Rozdział III
lub
i wtedy
Jt t
J_ 3(2T-n-l)2 n n3 -n
[64]
W naszym przykładzie część obliczeń przedstawiamy w tablicy roboczej:
t yt t2 ty, y[ & zl z.
1 59 1 59 38,382 2,093 18,525 344,175
2 36 4 72 39,139 -2,093 -1,046 1,094
3 40 9 120 39,897 2,093 -1,99 3,9601
4 37 16 148 40,654 -2,093 -1,561 2,4367
5 37 25 185 41,412 2,093 -6,505 42,3150
6 36 36 216 42,169 -2,093 -4,076 16,6137
7 39 49 273 42,926 2,093 -6,019 36,228
8 39 64 312 43,684 -2,093 -2,591 6,7133
9 42 81 378 44,441 2,093 -4,534 20,5572
10 43 100 430 45,199 -2,093 -0,106 0,0112
1 1 47 121 517 45,956 2,093 -1,049 1,1004
12 46 144 552 46,713 -2,093 1,38 1,9044
13 43 169 559 47,471 2,093 -6,564 43,087
14 45 196 630 48,228 -2,093 -1,135 1,2882
15 57 225 855 48,986 2,093 5,921 35,058
16 59 256 944 49,743 -2,093 11,35 128,825
136 705 1496 6250 X X X 684,365
t= 8,5
y = 44,0625
b = 44,0625 - 0,7574 Ś 8,5 = 37,6246
16-6250-136-705 100000-95880
a =
16-1496-(l36y 23936-18496
yt = 0,7574 Ś t + 37,6246
4120 5440
= 0,7574
Wskaźniki względne sezonowości wyznaczamy w oparciu o jednoimienne średnie podokresów.'
1 Sobczyk: Statystyka. Podstawy teoretyczne. Przykłady - zadania. Wyd. UMCS, Lublin 18, s. 325.
82
Analiza dynamiki zjawisk
S, =Ś
Ś 2 _ 45,5 Ś 2 ~ 86,875
= 1,0475
86,875
S, + S" = 1,0475 + 0,9525 = 2
czyli wskaźniki S, i S" nie wymagają korekty i na ich podstawie możemy wyznaczyć absolutne poziomu wahań g
g, = y(S, - 4) = 44,0625(1,0475 - 1) = 2,0930 g" = y(S" - 4) = 44,0625(0,9525 - 1) = -2,0930
i dalej
684,365 16,2
= 48,883 S(zt) = 6,99
Sprawdzając współczynnik zmienności przypadkowej stwierdzamy, że
odchylenia przypadkowe stanowią ok. 15,87% przeciętnego poziomu zaobserwowanej zmiennej.
Prognozy liczby spóźnień na kolejne półrocze (z uwzględnieniem błędu średniego) będą równe odpowiednio: I półrocze 2000 r. T= 17
yf7 a 0,7574 17 + 37,6246 + 2,093 ą Sf7 = 52,593 ą 7,893
gdzie:
Sf7=6,99-1/l + ^ + -
340
= 6,99
= 7,893
II półrocze 2000 r. T= 18
83
Rozdział III
yfg =0,7574 -18 + 37,6246 -2,093 ąS,P8 = 53,350 ą 8,055
gdzie:
ST,-
I półrocze 2001 r. T= 19
gdzie:
yf9 = 54,108 ą8,231
II półrocze 2001 r. T = 20
=54,865 + 8,421
gdzie:
84
Zadania do samodzielnego rozwiązywania
Zadanie 1.
Maksymalny poziom wody na Wiśle pod Krakowem 1977-1987 przedstawia szereg czasowy:
Rok 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
Max poziom (cm) 110 178 185 224 348 221 124 124 220 158 115
Źródło: dane umowne
Obliczyć średni maksymalny poziom wody w Wiśle oraz jego zróżnicowania w latach 1977-1987.
L> Zadanie 2.
Wielkość produkcji wody mineralnej w wybranej rozlewni wód gazowanych przedstawia tablica.
Rok 1991 1992 1993 1994 1995
Produkcja w tys. litrów 14,2 16,0 16,2 16,6 15,0
Źródło: dane umowne
a) wykorzystując odpowiednie miary dynamiki ustalić jej poziom w kolejnych latach;
b) o ile wzrasta produkcja wody mineralnej w 1995r. porównaniu z 1991, a o ile w porównaniu z 1993 r.?
c) jakie było średnioroczne tempo wzrostu produkcji w wyróżnionym okresie 1991-1995, a jakie w okresie 1992-1995?
d) Zakładając takie same tempo zmian, określić spodziewany poziom produkcji wody mineralnej w 1996 roku biorąc za podstawę odpowiednio okres 1991-1995 i 1992-1995.
85
Rozdział III
Zadanie 3.
Kolejno dla lat 1986-1990 liczba kin w Polsce przedstawiała się następująco:
Lata 1986 1987 1988 1989 1990
Liczba kin 2 041 2010 1 878 I 792 1 589
Źródło: dane umowne
Oblicz i skomentuj średnie roczne tempo spadku tego zjawiska w badanych latach. Zakładając niezmienniczy charakter tego zjawiska oblicz przewidywaną liczbę kin w Polsce w 1992 roku.
L* Zadanie 4.
Na podstawie danych z tabeli ustalić średnioookresowe tempo zmian liczby zarejestrowanych samochodów w latach 1986-1990.
Lata 1986 1987 1988 1989 1990
Liczba samochodów 3900 4168 4452 4767 5186
Źródło: dane umowne
Zakładając niezmienny poziom zjawiska w latach następnych obliczyć przewidywaną liczbą samochodów w roku 1993.
L* Zadanie 5.
Dynamika dostaw do sklepów w mieście X ekspresów do kawy w latach 1987-1990 mierzona indeksami jednopodstawowymi (rok 1986 = 100%) kształtowała się następująco: 104%, 117%, 135%, 154%. Obliczyć indeksy łańcuchowe dostaw oraz wyznaczyć średniookresowe tempo zmian sprzedaży ekspresów do kawy w badanym okresie.
L> Zadanie 6.
Średnioroczne tempo produkcji lodówek w pewnym zakładzie wynosiło w latach 1989-1991 4%. Wyznaczyć wielkość produkcji lodówek w roku 1992, jeżeli wiadomo, że w 1990 roku zakład produkował 10 tys. sztuk lodówek.
Zadanie 7.
Biuro turystyki promowej zaproponowało w ofercie świąteczno-noworocznej 2001 rejsy do Helsinek, Kopenhagi i Oslo. Zyski ze sprzedaży ofert za wyjazdy świąteczne wynosiły odpowiednio: do Oslo 20 tyś zł., do Kopenhagi 30 tys. zł a do Helsinek 40 tys. zł . Wyjazdy noworoczne przyniosły wzrost obrotów za wyjazd do Helsinek o 15% i do Oslo o 10% oraz spadek za wyjazdy do Kopenhagi o 8%. Jednocześnie ceny rejsów do Oslo pozostały bez zmian, do Kopenhagi wzrosły o 20% a do Helsinek zmalały o 10%. Jak możemy ocenić zyski za rejsy noworocz-
86
Zadania do samodzielnego rozwiązywania
ne w porównaniu z rejsami świątecznymi i co w silniejszym stopniu wpływa na ich zmiany cena czy ilość sprzedanych wycieczek
W hurtowni artykułów spożywczych w miesiącu lutym masła EKSTRA po 1,38 zł wynosiły 5 000 kostek. Natomiast w kolejnym miesiącu (marcu) cena spadła o 10% i zapasy spadły do 4 000 kostek. Drugi gatunek masła - ROYAL kosztował 1,55 zł w lutym i wtedy hurtownia zgromadziła go 3 000 kostek, a po marcowej podwyżce cen o 15% zgromadzono 2 000 kostek. W oparciu o odpowiedni miernik agregatowy ocenić poziom zmiany cen masła.
Co można powiedzieć o zmianach wartości sprzedaży, jeśli indeks agregatowy cen Laspeyeresa wynosi 1,25, a indeks agregatowy ilości Paaschego wynosi 1,1?
i^ Zadanie 10.
Na pewnym targowisku ustalono, że wartość sprzedaży jaj wzrosła z 250 min w 1989 roku do 500 min zł w 1990, sera białego z 80 min do 120 min zł, natomiast wartość sprzedaży śmietany zmalała z 60 min zł w roku 1989 do 30 min w 1990. Wiadomo, że ilościowo sprzedaż jaj wzrosła o 30%, sera o 10%, natomiast sprzedaż śmietany zmalała dwukrotnie. Co można powiedzieć o zmianach cen artykułów nabiałowych na tym targowisku okresie 1989-1990? Zapisz odpowiednie równości indeksowe i podaj ich komentarz.
W pewnym przedsiębiorstwie produkowano w 1989 roku trzy wyroby A, B, C w ilościach: po 100 wyrobu A i B oraz 200 sztuk wyrobu C. Poziom cen tych wyrobów kształtował się następująco: 5 tys. za sztukę wyrobu A, 10 tys. za sztukę wyrobu B i 20 tys. za sztukę wyrobu C. Przedsiębiorstwo dokonało zmian w strukturze i w 1990 roku produkowało te wyroby w ilościach 20 sztuk A, 100 sztuk B, 400 sztuk C. Poziom cen wyrobów w 1990 r. przedstawiał się następująco: 20 tys. za sztukę A, 10 tys. za sztukę B i 6 tys. za sztukę C. Wykorzystując agregatowe indeksy dokonać analizy zmian jakie nastąpiły w strukturze cen i ilości.
L> Zadanie 12.
W 1989 roku sprzedano w pewnym mieście M jabłek za 120 min zł i gruszek za 60 min zł, a w 1991 roku sprzedano jabłek za 160 min zł oraz gruszek za 70 min zł. Wiadomo, że ceny jabłek wzrosły o 30%, a ceny gruszek spadły o 10% w roku 1991 w stosunku do roku 1989.
Scharakteryzować średni ruch cen badanych owoców oraz zmiany masy fizycznej ich spożycia w mieście M, stosując do tego celu możliwie wszechstronnie formuły standaryzacyjne indeksów agreagatowych.
87
Rozdział III
Który czynnik - cena czy ilość - silniej wpłynął na łączną dynamikę wartości sprzedaży tych owoców?
Zadanie 13.
Wartość produkcji i zmiany cen dwóch artykułów przedstawia tablica.
Artykuły Wartość produkcyjni w tys. zł (ceny bieżące) Zmiany cen rowu 1971 do roku 1970
1971 1971
A B 200 400 190 450 spadek o 5% spadek o 10%
Źródło: dane umowne
Przeprowadzić możliwie najszerszą analizę indeksów cen, ilości i wartości.
L* Zadanie 14.
Badając dynamikę sprzedaży nowej hurtowni w I i II kwartale 1993r. ustalono, że indeks ilości formuły Paaschego wynosił 110% wartość sprzedaży w I kwartale 121 min zł, a pozostałe informacje były następujące:
Artykuł loPn V
A B C 25 55 ? 1,25 1,10 1,00
Jaki był wzrost wartości sprzedaży w II kwartale w porównaniu z I kwartałem oraz wpływ dynamiki ilości i cen na zmianę wartości sprzedaży?
4a Zadanie 15.
Produkcja piwa w jednym z browarów kształtowała się w kolejnych kwartałach lat 1993-1995 następująco:
Lata Kwartały
I II III IV
1993 2 4 8 6
1994 3 5 I 1 7
1995 5 7 12 8
Źródło: dane umowne
Na podstawie danych wyznaczyć linię trendu oraz zbadać sezonowość zjawiska.
Zadanie 16.
W zakładach przetwórstwa mięsno-wędliniarskiego prowadzono badanie po-
88
Zadania do samodzielnego rozwiązywania
pytu na oferowane nowe gatunki wędlin. Badaniem objęto okres od 01.01.1993 do 31.12.1997 r. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,85t + 1,27. Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów:
c, = 0,76; c2 = 0,94; c3 = 1,20; c4 = 1,23.
Wykorzystując te informacje określić spodziewany poziom popytu na wędliny III kwartale 1998 roku i w I kwartale 1999 roku.
LŚ Zadanie 17.
W zakładach przetwórstwa owocowo-warzywnego przeprowadzono badanie popytu na oferowane dżemy owocowe. Badaniem objęto okres od 01.01.1993 do 31.12.1997. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,96t + 1,43. Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów:
c, = 0,76; c2 = 0,94: c3 = 1,35; c4 = 1,11.
Wykorzystując te informacje określić spodziewany poziom popytu na dżemy III kwartale 1998 i w I kwartale 1999 roku.
Lj Zadanie 18.
Dysponując danymi dotyczącymi całkowitych aktywów pewnego banku komercyjnego za osiem miesięcy ustalić na podstawie linii trendu prognozę ich poziomu na dwa kolejne miesiące i dokonać oceny jakości tej prognozy. Szereg empiryczny ma następującą postać: 276, 284, 334, 352, 386, 441, 386, 440.
Zadanie 19.
Spożycie masła w statystycznej 4-ro osobowej rodzinie konsumenckiej w ciągu wybranych 10 tygodni było równe: 2, 3, 4, 3, 2, 5, 3, 4, 6, 4. Wyznaczyć linię trendu spożycia masła w rodzinach czteroosobowych oraz ocenić dokładność oszacowania. Jaki poziom spożycia osiągnie rodzina za dwa następne tygodnie? Czy będzie on się różnił od spodziewanego poziomu wyznaczonego na podstawie dziewięciu ostatnich tygodni przeprowadzonego badania?
iLj Zadanie 20.
Poniższe dane opisują liczbę czytelników regionalnej gazety (w tys.) za okres ostatnich dwunastu lat:
Rok 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Liczba czyt. 53 65 74 85 92 105 120 128 144 158 179 195
Źródło: dane umowne.
Przeprowadzić analizę trendu i wyznaczyć prognozę liczby czytelników na lata 2003 i 2004.
89
Rozdział III
Który czynnik - cena czy ilość - silniej wpłynął na łączną dynamikę wartości sprzedaży tych owoców?
LŚ Zadanie 13.
Wartość produkcji i zmiany cen dwóch artykułów przedstawia tablica.
Artykuły Wartość produkcyjni w tys. zł (ceny bieżące) Zmiany cen rowu 1971 do roku 1970
1971 1971
A B 200 400 190 450 spadek o 5% spadek o 10%
Źródło: dane umowne
Przeprowadzić możliwie najszerszą analizę indeksów cen, ilości i wartości.
L> Zadanie 14.
Badając dynamikę sprzedaży nowej hurtowni w I i II kwartale 1993r. ustalono, że indeks ilości formuły Paaschego wynosił 110% wartość sprzedaży w I kwartale 121 min zł, a pozostałe informacje były następujące:
Artykuł <ŁP" V
A B C 25 55 ? 1,25 1,10 1,00
Jaki był wzrost wartości sprzedaży w II kwartale w porównaniu z I kwartałem oraz wpływ dynamiki ilości i cen na zmianę wartości sprzedaży?
L> Zadanie 15.
Produkcja piwa w jednym z browarów kształtowała się w kolejnych kwartałach lat 1993-1995 następująco:
Lata Kwartały
I II III IV
1993 2 4 8 6
1994 3 5 11 :,' 7
1995 5 7 12 8
Źródło: dane umowne
Na podstawie danych wyznaczyć linię trendu oraz zbadać sezonowość zjawiska.
Zadanie 16.
W zakładach przetwórstwa mięsno-wędliniarskiego prowadzono badanie po-
88
Zadania do samodzielnego rozwiązywania
pytu na oferowane nowe gatunki wędlin. Badaniem objęto okres od 01.01.1993 do 31.12.1997 r. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,85t + 1,27, Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów:
c, = 0,76; c2 = 0,94; c3 = 1,20; c, = 1,23.
Wykorzystując te informacje określić spodziewany poziom popytu na wędliny III kwartale 1998 roku i w I kwartale 1999 roku.
W zakładach przetwórstwa owocowo-warzywnego przeprowadzono badanie popytu na oferowane dżemy owocowe. Badaniem objęto okres od 01.01.1993 do 31.12.1997. Okazało się, że popyt kształtował się zgodnie z równaniem: y = 0,96t + 1,43. Jednocześnie wyznaczono surowe wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów:
c, = 0,76; c
= 0,94: c3 = 1,35; c, =
1,11.
Wykorzystując te informacje określić spodziewany poziom popytu na dżemy III kwartale 1998 i w I kwartale 1999 roku.
La Zadanie 18.
Dysponując danymi dotyczącymi całkowitych aktywów pewnego banku komercyjnego za osiem miesięcy ustalić na podstawie linii trendu prognozę ich poziomu na dwa kolejne miesiące i dokonać oceny jakości tej prognozy. Szereg empiryczny ma następującą postać: 276, 284, 334, 352, 386, 441, 386, 440.
La Zadanie 19.
Spożycie masła w statystycznej 4-ro osobowej rodzinie konsumenckiej w ciągu wybranych 10 tygodni było równe: 2, 3, 4, 3, 2, 5, 3, 4, 6, 4. Wyznaczyć linię trendu spożycia masła w rodzinach czteroosobowych oraz ocenić dokładność oszacowania. Jaki poziom spożycia osiągnie rodzina za dwa następne tygodnie? Czy będzie on się różnił od spodziewanego poziomu wyznaczonego na podstawie dziewięciu ostatnich tygodni przeprowadzonego badania?
& Zadanie 20.
Poniższe dane opisują liczbę czytelników regionalnej gazety (w tys.) za okres ostatnich dwunastu lat:
Rok 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Liczba czyt. 53 65 74 85 92 105 120 128 144 158 179 195
Źródło: dane umowne.
Przeprowadzić analizę trendu i wyznaczyć prognozę liczby czytelników na lata 2003 i 2004.
89
Rozdział 111
ODPOWIEDZI DO ZADAŃ
L. ych = 189,45 cm. Zróżnicowanie mierzymy indeksami o podstawie stałej i zmiennej.
Rok 1977 1978 1979 1980 1981 1982 1983 1984 1985 1986 1987
' 1,00 1,618 1,682 2,036 3,164 2,01 1,127 1,127 2,0 1,436 1,045
l/t1 - 1,618 1,039 1,211 1,554 0,635 0,561 1 1,774 0,718 0,728
2. a)
t 1 2 3 4 5
't/l 1 1,127 1,141 1,169 1,056
srt-l 1,127 1,012 1,025 0,904
b) i1995/199, = 1,056; i199J/1991 = 0,926;
c)T(. = 4-^- =l,0138;T., = 3^ =0,9787; 1/14,2 <- V16
d) y;9% = 15 1,0138 = 15,57; y'm6 = 15 Ś 0,9787 = 14,68;
3. i c = 4J----- = 0,9393; co oznacza przeciętny spadek liczby kin o 6,07% rocznie;
prognoza y'm2 =1589 0,8823 = 1402;
5. Indeksy łańcuchowe: iH?m = 1,04; i88/87 = 1,125; i89/88 = 1,154; i[)()/89 = 1,141;
iG= 1,114;
6. 10816 lodówek;
7. Iw = 1,0622; IJ = 1,022; I* = 0,995; 1^ = 1,0083; IqL = 1,0675; F = 1,03933; F = 1,0535;
8. Ip = 0,8807; co oznacza spadek cen masła o 11,93%;
9. Ivv = 1,375; nastąpił wzrost wartości o 37,5%;
10. Ij; = 1,419; IJ = 1,467; lYp = 1,443;
11. Iw = 0,691; lL? = 0,764; 1^ = 0,418; lpp = 0,564; IL = 1,64; Ip = 0,905; IF = 1,222;
12. f = 1,2778; \Lp = 1,1667; I* = 1,1557; IL = 1,116; F = 1,952; F = 1,1055;
13. f = 1,066; lLp = 0,917; I] = 0,9;
14. \l = 0,916; F = 1,116; F = 1,163; F = 1,1645;
15. Linia trendu:
y = 0,5035t + 3,2273; S, = 0,513; S" = 0,821; S,,, = 1,589; S|v = 1,077;
90
Zadania do samodzielnego rozwiązywania
16. y", = 7,5018;
y m/98 = ^->.19;
/,/,, = 16,59; 17 yiii/9S = !-298 (0.96 Ś 23 + 1,43) = 30,5159;
y,"/99 = 0,7307 (0,96 25 + 1,43) =18,5817; 18. yt = 23,964t + 254,5367; cp2 = 0,1336; y\ - 470,2127; y;o = 494,1767.
91
Rozdział IV
Wybrane zagadnienia statystyki matematycznej
0 Zadanie 1.
Towarzystwo ubezpieczeniowe Al-Impo zamierza oszacować przeciętny wiek wychowawczyni w przedszkolach społecznych zainteresowanych nabyciem dodatkowej polisy ubezpieczeniowej OC zabezpieczające przed odpowiedzialnością za wypadki spowodowane przez dzieci grupy wiekowej 3-6 lat pozostawione pod ich opieką. Wybrano losowo 81 kobiet spełniających warunki pracy w przedszkolu
1 zainteresowanych nabyciem polisy i ustalono ich średni wiek 27 lat z odchyleniem standardowym 5 lat.
Zakładając, że rozkład wieku jest normalny N(m,a) określić z prawdopodobieństwem 0,95 przedział ufności przeciętnego wieku wychowawczyni przedszkoli zainteresowanych dodatkową polisę OC. Czy ulegnie on zmianie, gdy zakładane prawdopodobieństwo zwiększymy do 0,98? Określić względny błąd oszacowania w każdym z przypadków. *r Rozwiązanie.
Rozwiązanie zadania wymaga zastosowania metod obliczeniowych z zakresu teorii wnioskowania statystycznego, a dokładniej z zakresu teorii estymacji. Polega ono na wyznaczeniu z zakładanym prawdopodobieństwem przedziału do którego należy analizowany parametr. Konstrukcja takiego parametrów do szacowania przedziałów dla całej populacji i założeniu o normalności lub zbieżności do normalności rozkładów analizowanych parametrów. Jednocześnie dla potrzeb tego skryptu będziemy korzystać z założenia, że próba losowa wybrana z populacji ma liczebność n > 30 i uważana jest za tzw. "dużą próbę losową", co upoważnia do korzystania w rozważaniach z teorii wnioskowania z wartości dystrybuant rozkładu normalnego.
Przedział ufności, który interesuje nas dla potrzeb tego zadania ma postać:
1 Szersze rozważania teoretyczne z zakresu rachunku prawdopodobieństwa pomijamy, odsyłając czytelnika np. do podręcznika M. Sobczyka.
92
Wybrane zagadnienia statystyki matematycznej
[65]
gdzie oznaczenia są następujące: x, S - wartość średnia i odchylenie standardowe wyznaczone z n-elementowej
próby losowej wybranej z populacji;
ua - wartość krytyczna (dokładniej dystrybuanta zmiennej losowej) wybrana z tablic rozkładu normalnego N(0,l) w naszym przypadku jedna z wartości; y - poziom ufności parametru, czyli założony poziom prawdopodobieństwa
(np. 0,9; 0,95;, 0,98; 0,99); a = 1 - y - poziom istotności, czyli możliwość popełnienia błędu statystycznego
I rodzaju w przypadku weryfikacji pewnych hipotez statystycznych; n - liczebność losowej próby statystycznej wybranej z populacji; m - nieznane (szacowane) wartość średnia.
Odpowiednie wartości liczbowe niezbędne do ustalenia poszukiwanego przedziału ufności dla wieku są równe: x = 27; n = 81; a = 0,05; S = 5; y = 0,95; ua = 1,96.
Stąd przedział ma postać
27 - 1,96-L < m < 27 + 1,9
V81
= 0,95
i dalej
P{27 - 1,09 < m < 27 + 1,09} = 0,95 P {25,91 < m < 28,09} = 0,95
czyli interpretując powyższy wynik możemy stwierdzić, że z prawdopodobieństwem równym 0m95 nieznana wartość średnia wieku wychowawczyń przedszkoli zainteresowanych nabyciem dodatkowej polisy OC mieści się w przedziale (25,91; 28,09) lat.
Zmiana zakładanego prawdopodobieństwa z 0,95 na 0,98 spowoduje zmiany granic przedziału ufności, gdyż ulegnie zmianie wartość krytyczna ua z 1,96 na 2,33.
Nowa postać przedziału jest następująca:
?\ 27 - 2,3 3 -y= < m< 27 + 2,3 3 -p= 781 781
= 0,98
i dalej
93
Rozdział IV
P{27 - 1,3 < m < 27 + 1,3} = 0,98 P{25,7 < m < 28,3} = 0,98
czyli z prawdopodobieństwem 0,98 nieznana wartość średnia wieku przedszkolanek należy do przedziału (25,7; 28,3) lat.
Warto dodatkowo ustalić błąd szacunku, który jest ilorazem błędu absolutnego i wartości parametru.
Oznaczamy go:
^4
xvn
[66]
lub inaczej
B(x) = -^ x
gdzie licznik nazywany jest błędem absolutnym oszacowań. W przypadku y = 0,05 błąd jest równy:
oraz dla y = 0,98
100% = 0,040329 Ś 100% = 4,03%
B(x) = 2'33 ił 100% = 4,79%
27-78Y
W obydwu przypadkach błąd względny nie przekracza 5%, co oznacza dobrą precyzję oszacowania.
S Zadanie 2.
Władze uczelni ekonomicznej rozważały zainteresowanie studentów możliwością podjęcia studiów na drugim kierunku, w ramach tej samej uczelni. Aby ocenić odsetek studentów zainteresowanych możliwością uzyskania drugiego dyplomu przeprowadzono badanie, w trakcie którego zapytano 300 losowo wybranych osób o zainteresowanie dodatkowymi studiami. 120 osób podało odpowiedź twierdzącą.
Ocenić z prawdopodobieństwem 0,9 odsetek studentów pragnących studiować dwa kierunki w ramach jednej uczelni.
Ocenić błąd względny oszacowania.
94
Wybrane zagadnienia statystyki matematycznej
*r Rozwiązanie.
Postać przedziału ufności, który mamy w poleceniu zadania oszacować jest inna niż w poprzednim przypadku, gdyż szacowanym parametrem jest nie wartość średnia, lecz wskaźnik struktury. Możemy ją zapisać następująco:
m
m( m
n V n
m -----u"
|mf m
ni n
= Y
[67]
gdzie odpowiednio: n - liczebność próby losowej;
m - liczba jednostek statystycznych w próbie spełniającej żądany warunek; y - poziom ufności;
ua - wartość krytyczna (jak w zadaniu poprzednim); p - nieznana wartość wskaźnika struktury. Błąd względny oblicza się zgodnie z wzorem
B(p) =
lub w wersji przekształconej
mfl_m
ni n
m n
Ś100%
[68]
B(p) = ua
100%-u.
m
100%
W naszym przypadku otrzymujemy dla n = 300, m = 120 i y = 0,90 przedział postaci:
1120f 120
120 irJ300^ 300 J 120
-------1,641----------------300 | 300 300
120f 120
300 T 300
300
, = 0,90
i dalej
P {0,4 - 1,64 0,02828 < n < 0,4 + 1,64 0,02828} = 0,90
95
Rozdział IV
P { 0,3536 < n < 0,4464} = 0,90 przy czym biąd względny jest równy:
B(p) =
_ 1,64-0,02828
0,4
100% = 11,596%
Wynik obliczeń zinterpretujemy następująco - z prawdopodobieństwem 0,90 nieznany odsetek studentów zainteresowanych studiowaniem na drugim kierunku jest wartością z przedziału (35,36%; 44,64%) przy czym biąd względny przekracza dopuszczalny poziom 10% zatem uzyskany przedział traktujemy jako wyznaczony niezbyt dokładnie i ponownie przeprowadzamy badanie statystyczne zwiększając próbę statystyczna do np. 500 osób. Wówczas przy takim samym wskaźniku struktury uzyskanym z próby błąd względny ulega zmniejszeniu do 8,98%.
O Zadanie 3.
Ustalić jak duża powinna być próba statystyczna, aby na jej podstawie można było przy współczynniku ufności 0,95 oszacować wzrost noworodka płci żeńskiej, jeśli błąd szacunku nie może przekroczyć 1 cm, a rozkład wzrostu noworodków jest zmienna losową o rozkładzie normalnym i wariancji 9. t Rozwiązanie.
W badaniach statystycznych w wielu przypadkach nie ma możliwości przeprowadzenia dużej liczby prób statystycznych gwarantujących żądaną dokładność wyniku dlatego istotna jest znajomość minimalnej liczebności próby gwarantującej tę dokładność. Przy szacowaniu poziomu średniego próba nie może być mniejsza niż:
n>
[69]
gdzie odpowiednio: ua - wartość krytyczna; - wariancja;
a S2
d - poziom dopuszczalnego błędu Zapisujemy to formalnie następująco-
n>
Ś = 34,57 35
Zaokrąglenie do wartości całkowitej nodaip ci*
du na cyfry znaczące po przecinku w^wTznaTzońtmT' ^f bez ^
wyznaczonym ilorazie. Interpretując wynik
96
Wybrane zagadnienia statystyki matematycznej
stwierdzimy, że aby ocenić średni wzrost noworodka płci żeńskiej z dokładnością do 1 cm przyjmując poziom ufności 0,95 wystarczy dysponować próbą losową złożoną z 35 dziewczynek.
0 Zadanie 4.
Jak liczną próbę losową należy przyjąć w badaniu poparcie dla kandydata A w wyborach na członka Rady Osiedlowej, jeśli w prawyborach poparło go 35% mieszkańców osiedla. Zakładany przy tym poziom ufności jest równy 0,90
1 dopuszczalny błąd statystyczny to 3%. sr Rozwiązanie.
Zależność określająca minimalną liczebność próby przy szacowaniu wskaźnika struktury jest następująca:
n>
[70]
gdzie odpowiednio:
p - zakładany na podstawie próby wstępnej poziom wskaźnika struktury; ua - wartość krytyczna;
- dopuszczalny poziom błędu.
Mamy zat. m liczebność próby równą:
n>
1,642-0,35-0,65
= 679,87*680 osób
czyli stwierdzamy, że próba powinna być dosyć liczna i liczyć 680 osób.
O Zadanie 5.
Ilu szóstoklasistów należy wylosować do próby, aby z błędem nie przekraczającym 10% oszacować odsetek dzieci, które zdadzą końcowy test egzaminacyjny w szkole podstawowej z wynikiem co najmniej dobrym (czyli uzyskają powyżej 75% ogólnej liczby punktów) przy założonym poziomie ufności 0,95).
$" Rozwiązanie.
Nie znamy wstępnej oceny wskaźnika struktury, zatem przy szacowaniu liczebności próby wykorzystujemy uproszczoną postać zależności podanej w zadaniu
poprzednim zakładając, że wskaźnik p = .
Zależność ma postać:
4d2
[71]
97
Rozdział IV
Dla naszych potrzeb, gdy ua = 1,96 i d = 0,1 mamy
n>
1,962 3,8416
= 96,04 97 dzieci
4(0,l)2 4-0,01 oznacza to, że do próby należy wylosować 97 dzieci.
O Zadanie 6.
Wśród pacjentów leczonych na pewną chorobę wylosowano w sposób niezależny próbę 49 osób i ustalono ich średnie ciśnienie tętnicze krwi równe 135 mmHg przy odchyleniu standardowym równym 45 mmHg. Na poziomie istotności a = 0,05 zweryfikować hipotezy, że:
a) pacjenci leczeni na określoną chorobę pochodzą z populacji osób o ciśnieniu tętniczym równym 120 mmHg,
b) ciśnienie pacjentów leczonych na określoną chorobę nie przekracza 140 mmHg,
c) ciśnienie pacjentów jest co najmniej równe 120 mmHg. W Rozwiązanie.
Rozwiązanie zadania polega na zweryfikowaniu przy przyjętym poziomie istotności2 hipotezy parametrycznej o równej pewnemu założeniu poziomowi wartości wybranego parametru statystycznego (tutaj jest nim wartość średnia m).
Formalnie weryfikacja hipotezy statystycznej polega na określeniu hipotezy zerowej Ho (zawsze zakładającej, że parametr przyjmuje określoną wartość) i hipotezy alternatywnej Hl - zakładającej przeciwnie do założeń w Ho zachowanie badanego parametru. Postać hipotezy H, określa się precyzyjnie w powiązaniu z treścią zadania. Niezbędna jest przy tym znajomość poziomu dopuszczalnego błędu statystycznego (poziomu istotności a) i związanego z nim obszaru krytycznego. W naszych uproszczonych rozważaniach obszar krytyczny będą wyznaczać dys-trybuanty zmiennej losowej o rozkładzie normalnym N (0,1) i wybrano na ich podstawie wartości krytyczne. Będą to przedziały postaci: (-oo, ua)u(ua, + oo) lub (u2a, + c0) lub (rco,-u2a) Do obszarów krytycznych będziemy odnosić (w pewnym sensie przymierzać) wartości tzw. statystyk empirycznych wyznaczonych dla potrzeb weryfikacji konkretnej hipotezy. Przynależność statystyki empirycznej tcm do obszaru krytycznego upoważnia do odrzucenia hipotezy zerowej Ho na korzyść hipotezy alternatywnej, natomiast sytuacja przeciwna - gdy temp jest poza obszarem krytycznym oznacza brak podstaw do odrzucenia Ho.
W przypadku naszego zadania w kolejnych podpunktach mamy odpowiednio: a) hipoteza zerowa Ho zakłada, że średnie ciśnienie jest równa 135, czyli
H() : m = m() = 120
przy alternatywnej H, : m * m0 = 120
SobczvkM. (1998).
98
Wybrane zagadnienia statystyki matematycznej
obszar krytyczny dla a = 0,05 jest postaci (- oo, -1,96) u (1,96, + oo) a statystyka empiryczna wyznaczana jest zgodnie z wzorem
t =------
emp s
[72]
gdzie odpowiednio:
x, S - średnia i odchylenie wyznaczone z próby; m0 - sprawdzony poziom parametru; n - liczebność próby wstępnej.
Zatem otrzymujemy statystykę empiryczną równą:
emp
135-120 45
V49= -7 = 2,33 45
Porównując wartość tem z obszarem krytycznym możemy stwierdzić, że 2,33 (-oo,-l,96)u(l.96, + oo), czyli przyjmując poziom dopuszczalnego błędu statystycznego 5% (zakładając, że możemy pomylić się 5 razy na 100 wniosków odrzucamy hipotezę Ho zakładającą, że rozważana grupa chorych pochodzi z populacji osób o ciśnieniu tętniczym równym 120 mmHg.
b) formułujemy odpowiednio hipotezy H(), H, obszar krytyczny i statystykę empiryczną oraz weryfikujemy hipotezę:
Ho : m = 140,
H, : m < 140 (gdyż pytanie w zadaniu dotyczyło poziomu parametru m mniejszego niż 140),
obszar krytyczny (tzw. lewostronny przy H, z nierównością typu "<" ma postać (-oo,-u2a) = (-00,-1,64) a statystyka empiryczna jest równa
135-140 140
V49 = 7 = -0,7777
45
i nie należy do obszaru krytycznego, czyli nie mamy podstaw do odrzucenia hipotezy Ho. W odpowiedzi na pytanie zadania musimy stwierdzić, że średnie ciśnienie pacjentów nie przekracza 140 mmHg przy założonym poziomie istotności nie jest prawdziwe, c) Odpowiednio analogicznie jak poprzednio:
Ho : m = 120,
H, : m > 120 (prawostronny obszar krytyczny, bo pytanie w zadaniu możemy zapisać za pomocą nierówności ">"),
obszar krytyczny (u2cc, + oo)=(l,64;+oo) i statystyka empiryczna
99
Rozdział IV
Wniosek z obliczeń można sformułować następująco - odrzucając hipotezę Ho przy poziomie istotności 0,05 stwierdzamy, że pacjenci leczeni na określoną chorobę należą do populacji osób których ciśnienie tętnicze przekracza 120 mmHg.
3 Zadanie 7
Badając wiek czytelników wypożyczających książki w bibliotece miejskiej wysunięto hipotezę, że osoby w wieku ponad 50 lat stanowią ponad 40% ogółu czytelników. Dla zweryfikowania tej hipotezy wybrano próbę losową złożoną ze 150 osób i zasięgnięto informacji o ich wieku. Wyniki badania były następujące:
Wiek w latach poniżej 15 lat 15-20 20-30 30-40 40-50 50-60 60-70 powyżej 70 lat
Ilość czytelników 20 30 20 10 20 30 14 6
Źródto: dane umowne
a) Na poziomie istotności a = 0,01 zweryfikować prawdziwość sformułowanej hipotezy,
b) Zweryfikować hipotezę, że połowa osób nie przekroczyła 30 lat przyjmując poziom istotności a = 0,02,
c) Czy myląc się nie więcej niż 5 razy na lOOwnioskówmożemystwierdzić, że dzieci i młodzież (poniżej 20 lat) stanowią mniej niż 1/3 ogółu czytelników?
r Rozwiązanie.
Zadanie wymaga zweryfikowania trzech odrębnych hipotez statystycznych dla wskaźnika struktury. W każdym przypadku hipoteza zerowa Ho przyjmować będzie postać równości, a hipotezy alternatywne H, nierówności typu większości lub mniejszości lub zaprzeczenia. Testowa statystyka empiryczna wyznaczana będzie zgodnie z równością
'emp
m
7~Po
V
PoO-Po)
[73]
gdzie odpowiednio: p() - zakładany poziom wskaźnika; n - liczebność próby; m - liczba jednostek próby spełniających żądany warunek.
Zależność statystyki empirycznej temp od obszaru krytycznego wpływa na odrzucenie lub przyjęcie hipotezy Ho
a) z treści zadania wynika, że n = 150, m = 50, a = 0,01, p = 0,4. Zatem Ho : P = Po = 0,4; H, : p > 0,4
100
Wybrane zagadnienia statystyki matematycznej
obszar krytyczny jest obszarem prawostronnym postaci (u2a, + oo)=(2,33; a statystyka testowa jest równa
m
-----Po
-*-0,4 -i5O-------1,666
statystyka testowa nie wpada do obszaru krytycznego, czyli stwierdzamy brak podstaw do odrzucenia hipotezy zerowej, zatem twierdzenie, że ponad 40% czytelników to osoby które przekroczyły 50 lat życia nie jest słuszna.
b) Mamy dane informacje, że n = 150, m = 70, a = 0,02, p() = 0,5. Przeprowadzamy kolejne etapy wnioskowania statystycznego:
Ho : p = Po = 0,5,
H, :p*po = O,5,
obszar krytyczny ma postać ^-oo,-ua/u(ua, + ooj,
czyli (-oo,-2,33)u(-2,33, + o)
m
____n_
-Po
70 150
-0,5
Pofl-Po)
= -0,816
t ^ do obszaru krytycznego, czyli stwierdzamy brak podstaw do odrzucenia hipotezy zerowej. Zatem przyjmując możliwość popełnienia 2% błędu statystycznego możemy twierdzić, że połowa czytelników nie przekroczyła 30 roku życia, c) Mamy odpowiednio: n = 150, m = 50, p() = 1/3, a = 0,05.
Ho : p = 1/3,
H, : p < 1/3,
obszar lewostronny postaci (- o, - ua) = (- co, -1,64},
statystyka empiryczna jest równa
50 1
150
Stwierdzamy, że t nie należy do obszaru krytycznego, czyli brak podstaw do odrzucenia hipotezy zerowej, więc stwierdzenie, że mniej niż 1/3 czytelników to dzieci i młodzież nie jest prawdziwe.
101
Zadania do samodzielnego rozwiązywania
L3 Zadanie 1.
W pewnym eksperymencie chemicznych bada się czas zakończenia pewnej reakcji. Dokonano 100 niezależnych prób i otrzymano na tej podstawie średnią czasu trwania eksperymentu = 50 sekund oraz odchylenie standardowe s = 15 sekund. Przyjmując współczynnik ufności 0,99 oszacować metodą przedziałową średni czas potrzebny w tym doświadczeniu na całkowite zakończenie reakcji. Ocenić precyzję oszacowania.
Ls Zadanie 2.
Dla wylosowanej próby 80 klientów sklepu mięsno-wędliniarskiego otrzymano następujący rozkład wg wartości dokonanych zakupów.
Wartość zakupów 0-15 15-30 30-45 45-60 60-75 75-90
Ilość klientów 5 10 32 20 8 5
Źródło: dane umowne
Ustalić metodą przedziałową średni poziom wydatków na artykuły mięsno-wędliniarskie w wybranym sklepie mięsno-wędliniarskim przyjmując poziom ufności 0,9. Ocenić precyzję oszacowania.
L Zadanie 3.
Okresowe badania lekarskie przeprowadzone wśród dziennikarzy dwóch regionalnych gazet dotyczyły między innymi ilości wypalonych przez nich dziennie papierosów. Dla dziennikarzy gazety "G. W." dane przedstawia tablica:
Ilość papierosów 0-10 10-20 20-30 30-40 40-50
Ilość dziennikarzy 15 35 70 20 10
Źródło: dane umowne
102
Zadania do samodzielnego rozwiązywania
Natomiast dla 100 dziennikarzy gazety "W.Z." ustalono, że średnia liczba wypalonych przez nich papierosów wynosi 28 przy odchyleniu standardowym 7 sztuk. Ustalić przedziały ufności dla średniej liczby wypalonych dzienne papierosów przez dziennikarzy każdej z gazet odrębnie oraz przedział ufności dla średniej liczby wypalonych papierosów dla dziennikarzy obydwu gazet łącznie. Porównać uzyskane wyniki przyjmując w prowadzonych analizach poziom ufności 0,95.
;L> Zadanie 4.
Spośród studentów akademii ekonomicznych wylosowano niezależne do próby 300 osób i zapytano ich, czy palą papierosy. Do systematycznego palenia papierosów przyznało się 228 osób. Na tej podstawie przyjmując poziom ufności 0,90 ocenić metodą przedziałową odsetek studentów uczelni ekonomicznych palących papierosy.
/Li Zadanie 5.
Spośród skrzynek magazynowanej broni strzeleckiej wylosowano do kontroli niezależnie 300 skrzynek. Po ich otwarciu okazało się, że 18 skrzynek zawiera broń z obecnością rdzy na sprzęcie. Przyjmując współczynnik ufności 0,99 oszacować odsetek magazynowanych skrzynek z bronią dotkniętą procesem korozyjnym.
L Zadanie 6.
Należy oszacować odsetek zakładów produkcyjnych pewnego resortu, które w 2002 roku zapłaciły kary umowne za nieprzestrzeganie rygorów ochrony środowiska. W tym celu wylosowano 400 zakładów i okazało się, że 320 spośród nich zapłaciło w 2002 roku stosowane kary umowne za zanieczyszczanie środowiska. Na tej podstawie ocenić metodą przedziałową frakcję zakładów w analizowanym resorcie płacących stosowne kary umowne.
L* Zadanie 7.
W wyniku badania religijności Polaków przeprowadzonego przez GUS w 1991 roku na losowo wybranej próbie 5032 dorosłych osób, 2637 respondentów stwierdziło, że systematycznie uczestniczy w praktykach religijnych. Przyjmując poziom ufności 0,98 oszacować odsetek dorosłych Polaków uczestniczących w praktykach religijnych okazjonalnie (czyli niesystematycznie) lub nie uczestniczących w ogóle. Zbadać precyzję oszacowania. Ocenić przy poziomie ufności 0,95 odsetek dorosłych Polaków uczestniczących systematycznie w praktykach religijnych i podać błąd względny szacunku.
Zadanie 8.
Ile mieszkań na osiedlu "Zaspa" w Krakowie należy wylosować niezależnie do próby, aby oszacować średnie dobowe zużycie gazu ziemnego przypadające na jedno mieszkanie jeśli na podstawie 50 elementowej próby następnej wariancja
103
Zadania do samodzielnego rozwiązywania
/L> Zadanie 1.
W pewnym eksperymencie chemicznych bada się czas zakończenia pewnej reakcji. Dokonano 100 niezależnych prób i otrzymano na tej podstawie średnią czasu trwania eksperymentu = 50 sekund oraz odchylenie standardowe s = 15 sekund. Przyjmując współczynnik ufności 0,99 oszacować metodą przedziałową średni czas potrzebny w tym doświadczeniu na całkowite zakończenie reakcji. Ocenić precyzję oszacowania.
& Zadanie 2.
Dla wylosowanej próby 80 klientów sklepu mięsno-wędliniarskiego otrzymano następujący rozkład wg wartości dokonanych zakupów.
Wartość zakupów 0-15 15-30 30-45 45-60 60-75 75-90
Ilość klientów 5 10 32 20 8 5
Źródło: dane umowne
Ustalić metodą przedziałową średni poziom wydatków na artykuły mięsno-wędliniarskie w wybranym sklepie mięsno-wędliniarskim przyjmując poziom ufności 0,9. Ocenić precyzję oszacowania.
L-1
Zadanie 3.
Okresowe badania lekarskie przeprowadzone wśród dziennikarzy dwóch regionalnych gazet dotyczyły między innymi ilości wypalonych przez nich dziennie papierosów. Dla dziennikarzy gazety "G. W." dane przedstawia tablica:
Ilość papierosów 0-10 10-20 20-30 30-40 40-50
Ilość dziennikarzy 15 35 70 20 10
Źródto: dane umowne
102
Zadania do samodzielnego rozwiązywania
Natomiast dla 100 dziennikarzy gazety "W.Z." ustalono, że średnia liczba wypalonych przez nich papierosów wynosi 28 przy odchyleniu standardowym 7 sztuk. Ustalić przedziały ufności dla średniej liczby wypalonych dzienne papierosów przez dziennikarzy każdej z gazet odrębnie oraz przedział ufności dla średniej liczby wypalonych papierosów dla dziennikarzy obydwu gazet łącznie. Porównać uzyskane wyniki przyjmując w prowadzonych analizach poziom ufności 0,95.
LŚ Zadanie 4.
Spośród studentów akademii ekonomicznych wylosowano niezależne do próby 300 osób i zapytano ich, czy palą papierosy. Do systematycznego palenia papierosów przyznało się 228 osób. Na tej podstawie przyjmując poziom ufności 0,90 ocenić metodą przedziałową odsetek studentów uczelni ekonomicznych palących papierosy.
LŚ Zadanie 5.
Spośród skrzynek magazynowanej broni strzeleckiej wylosowano do kontroli niezależnie 300 skrzynek. Po ich otwarciu okazało się, że 18 skrzynek zawiera broń z obecnością rdzy na sprzęcie. Przyjmując współczynnik ufności 0,99 oszacować odsetek magazynowanych skrzynek z bronią dotkniętą procesem korozyjnym.
& Zadanie 6.
Należy oszacować odsetek zakładów produkcyjnych pewnego resortu, które w 2002 roku zapłaciły kary umowne za nieprzestrzeganie rygorów ochrony środowiska. W tym celu wylosowano 400 zakładów i okazało się, że 320 spośród nich zapłaciło w 2002 roku stosowane kary umowne za zanieczyszczanie środowiska. Na tej podstawie ocenić metodą przedziałową frakcję zakładów w analizowanym resorcie płacących stosowne kary umowne.
L* Zadanie 7.
W wyniku badania religijności Polaków przeprowadzonego przez GUS w 1991 roku na losowo wybranej próbie 5032 dorosłych osób, 2637 respondentów stwierdziło, że systematycznie uczestniczy w praktykach religijnych. Przyjmując poziom ufności 0,98 oszacować odsetek dorosłych Polaków uczestniczących w praktykach religijnych okazjonalnie (czyli niesystematycznie) lub nie uczestniczących w ogóle. Zbadać precyzję oszacowania. Ocenić przy poziomie ufności 0,95 odsetek dorosłych Polaków uczestniczących systematycznie w praktykach religijnych i podać błąd względny szacunku.
Li Zadanie 8.
Ile mieszkań na osiedlu "Zaspa" w Krakowie należy wylosować niezależnie do próby, aby oszacować średnie dobowe zużycie gazu ziemnego przypadające na jedno mieszkanie jeśli na podstawie 50 elementowej próby następnej wariancja
103
Rozdział IV
zużycie wynosi 0,49 (m3)2 a błąd szacunku nie może przekracza wartości 0,2 m3 przy poziomie ufności 0,98.
L Zadanie 9.
Ile tabliczek czekolady należy wylosować niezależnie do próby, aby ocenić średnią wagę tabliczki czekolady z dokładnością do 5 gramów, jeśli średnia waga i odchylenie standardowe określone na podstawie 120 elementowej próby wstępnej wynosi odpowiednio x = 95 gram i S(x) = 10 gram.
Zadanie 10.
Ile osób należy wylosować do próby, aby oszacować średnie wynagrodzenie w przemyśle odzieżowym w 2002 roku jeśli próba wstępna licząca 70 osób dostarczyła informacji, że odchylenie standardowe wynagrodzenia było równe 155 PLN a dopuszczalny maksymalny błąd szacunku nie może przekroczyć 50 PLN. (poziom ufności 1 - a = 0,90). Jak zmieni się minimalna liczebność próby, gdy poziom ufności zwiększymy o 0,95 lub do 0,98.
Zadanie 11.
Badając w 2001 roku w pewnym dużym zakładzie włókienniczym absencję pracujących tam kobiet stwierdzono, że w wylosowanej próbie 100 osób przeciętna liczba dni w roku kiedy przebywają one na zwolnieniu lekarskim jest równa 35 dni przy odchyleniu standardowym S = 16 dni. Czy przyjmując poziom istotności 0,01 na podstawie tych danych można twierdzić, że przeciętny czas przybywania na zwolnieniach w ciągu roku przekracza miesiąc (umowne 31 dni).
Zadanie 12.
W celu oszacowania średniego wzrostu stających do poboru wojskowego młodych mężczyzn pochodzących ze wsi wylosowano niezależnie 1250 kart zdrowia i otrzymano następujące informacje:
Wzrost w cm 160-162 162-164 164-166 166-168 168-170 170-172 172-174 174-176 X 178-180 180-182 182-184
Liczba poborowych 15 27 44 103 211 303 230 162 95 30 18 12
Źródło: dane umowne
Na poziomie istotności 0,05 zweryfikować hipotezę, że średni wzrost poborowych jest równy 171 cm.
Miesięczne wydatki na żywność w przeliczeniu na 1 osobę w gospodarstwach
104
Zadania do samodzielnego rozwiązywania
pracowniczych (w PLN) mają rozkład normalny. Na podstawie badania 500 losów wybranych gospodarstw w tej grupie wynoszą 250 zł ze współczynnikiem zmienności równym 40%.
Czy na podstawie tych danych zakładając poziom istotności 0,05, że średnie wydatki na żywność nie przekraczają 240 zł?
Przy jakim poziomie istotności podjęta decyzja weryfikacyjna ulegnie zmianie.
L Zadanie 14.
Pobrano próbę losową złożoną ze 100 kobiet w wieku 40 lat kardiologicznej i zbadano im skurczowe ciśnienie tętnicze krwi otrzymując x = 130 i odchylenie standardowe S = 10. Przyjmuje się, że ciśnienie jest zgodne z normą jeśli wynosi 100 plus liczba lat życia. Przyjmując poziom istotności 0,02 zweryfikować hipotezę, że ciśnienie tętnicze kobiet w wieku 40 lat jest zgodne z normą.
L* Zadanie 15.
W sezonie wakacyjnym "Lato 2003" przeprowadzono w wybranym dniu miesiąca lipca ankietę wśród turystów w Szczawnicy na temat miejsca zakwaterowania. W grupie 360 ankietowanych turystów 195 osób mieszkało w sanatoriach lub pensjonatach, 100 osób na kwaterach prywatnych a pozostali turyści byli w Szczawnicy przejazdem. Przyjmując poziom istotności a = 0,01 zweryfikować hipotezę, że ponad połowa turystów zamieszkała w pensjonatach lub sanatoriach.
<& Zadanie 16.
Firma marketingowo-reklamowa PLUS zamierza sprawdzić skuteczność reklamy radiowej w promowaniu wybranego produktu. Wśród 500 ankietowanych osób 120 stwierdziło, że do zakupu skłoniła ich reklama radiowa. Czy na tej podstawie możemy twierdzić, że 25% potencjalnych klientów dokonuje zakupów sugerując się reklamą radiową (poziom istotności a = 0,05).
>L> Zadanie 17
Z raportu CBOS (strona internetowa www.cbos.org.pl/spiskom.pol/2000 wynika, że w styczniu 2000 108 osób na 675 ankietowanych nie było zdecydowanych na jaką partię będzie głosować. Zakładając poziom istotności a = 0,01 zweryfikować hipotezę, że mniej niż 20% Polaków nie było zdecydowanych co do swoich preferencji wyborczych.
L1 Zadanie 18.
W hurtowni owoców cytrusowych na 120 wylosowanych niezależnie skrzynek z cytrynami w 16 znaleziono zepsute cytryny. Na poziomie istotności a = 0,01 zweryfikować hipotezę, że przechowywana partia owoców zawiera ponad 5% zepsutych owoców.
105
Rozdział IV
/L Zadanie 19.
W celu oszacowania struktury procentowej rodzaju kontraktacji w indywidualnych gospodarstwach rolnych pewnego powiatu, wylosowano niezależnie 360 gospodarstw wśród tych, które prowadzę kontraktację. Otrzymano następujące dane:
Rodzaj kontraktacji Liczba gospodarstw
Zboże i ziemniaki Buraki i rośliny przemysłowe Bydło Trzoda chlewna 21 123 50 166
Źródło: dane umowne
Sprawdzić hipotezę, że 50% gospodarstw rolnych badanego powiatu prowadzi kontraktację trzody chlewnej. Przyjąć poziom istotności a = 0,02.
ODPOWIEDZI DO ZADAŃ
1. Przedział ufności (46,13; 53,87) o długości 7,74 względna precyzja oszacowania B(X) = 0,0774 = 7,74%;
2. Przedział ufności (40,01; 46,61), długość przedziału 6,6, błąd precyzji B(X) = 7,62%;
3. "G.W." - przedział ufności (21,72; 24,94), długość 3,22; błąd względny B(X) = 6,9%. "W.Z." - przedział ufności (26,63; 29,37), długość 2,74; błąd względny B(X) = 4,9%. Obydwie gazety razem: przedział ufności (24,06; 26,34), długość 2,28; błąd względny B(X) = 4,53%;
4. Przedział ufności dla wskaźnika struktury (71,96%;80,04%);
5. Przedział ufności dla wskaźnika struktury (2,46%; 9,54%);
6. Przedział ufności dla wskaźnika struktury (75,34%; 84,66%);
7. Przedział ufności dla wskaźnika struktury (45,96%; 49,24%); precyzja oszacowania B(p) = 3,45% lub (51,03%; 53,77%); precyzja oszacowania B(p) = 2,62% ; 8. 67 mieszkań;
9. 16 tabliczek czekolady przy 1 - a = 0,95; 27 tabliczek czekolady przy 1 - a = 0,99;
10. Dla 1 - a = 0,9 26 osób; dla 1 - a = 0,95 37 osób; dla 1 - a = 0,98 53 osoby;
11. Odrzucamy Ho, czyli z prawdopodobieństwem 0,99 przeciętny czas przebywania na zwolnieniu lekarskim przekracza 1 miesiąc;
12. Odrzucamy HO, czyli średni wzrost poborowych nie jest równy 171 cm.;
13. Dla a = 0,05 odrzucamy Ho, czyli wydatki na żywność nie przekraczają 240 zł.;
14. Odrzucamy Ho, czyli ciśnienie tętnicze kobiet w wieku 40 lat w wybranej grupie chorobowej, nie jest zgodne z normą;
15. Brak podstaw do odrzucenia Ho, czyli nie jest prawdą, że ponad połowa osób mieszkała w sanatoriach lub pensjonatach.
106
Zadania do samodzielnego rozwiązywania
16. Brak podstaw do odrzucenia Ho, czyli myląc się 5 razy na 100 może twierdzić, że 25% osób sugeruje się reklamą radiową dokonując zakupów.
17. Odrzucamy hipotezę Ho na korzyść H,, czyli mniej niż 20% wyborców nie było zdecydowanych co do swoich preferencji wyborczych.
18. Odrzucamy hipotezę Ho na korzyść H,.
107
Przykładowe zadania testowe
pkt odp
Współczynnik asymetrii wagi noworodka jest równy - 0,65. Czy na tej podstawie można twierdzić, że:
a) najczęściej rodzą się dzieci z wagą niższą niż średnia waga 1
b) liczba dzieci z wagą wyższą niż średnia jest większa niż liczba dzieci z wagą niższą niż średnia 1
c) najczęściej rodzą się dzieci z wagą równą średniej wadze I
d) nie da się określić zależności pomiędzy wagą średnią i najczęstszą 1
L> Zadanie 2.
pkt odp
Na podstawie badań przeprowadzonych na grupie 50 przedszkolaków ustalono, że średni wzrost dziecka jest równy 119 cm przy względnym poziomie zmienności 4,2%, a największa liczba dzieci to dzieci o wzroście równym 122 cm. Czy możliwe jest, że:
a) polowa dzieci ma wzrost powyżej 120 cm 1
b) odchylenie standardowe wzrostu dzieci jest równe 10 cm 1
c) dzieci niższych niż wzrost średni jest więcej niż dzieci wyższych niż wzrost średni 1
d) asymetria rozkładu wzrostu jest ujemna 1
108
Przykładowe zadania testowe
4a Zadanie 3.
pkt odp
W zakładzie X 25% pracowników ma wynagrodzenie nie przekraczające 1200 zt, polowa pracowników nie przekraczające 1500 zt i 25% pracowników co najmniej równe 1750 zt . Czy prawdą jest, że:
a) asymetria rozkładu ptac w tym przedsiębiorstwie jest lewostronna 1
b) odchylenie standardowe ptac jest równe 275 zt 1
c) średnia płaca przewyższa 1500 zt I
d) ptaca średnia jest równa 1600 1
pkt odp
Współczynnik zmienności stażu pracy pewnej grupy pracowników mierzony zależnością pomiędzy odchyleniem standardowym i wartością średnią jest równy 0,25. Czy typowy przedział zmienności stażu pracy może mieć postać:
a) < 9;15 > 1
b) <10;16 > 1
c) < 12;18 > 1
d) < 7;13 > 1
pkt odp
Dysponując ciągiem obserwacji empirycznych określających liczbę błędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu: 10, 12, 8, 7,4, 12, 11, 10, 10, 8 ustal czy:
a)) potowa studentów popełnia co najmniej 10 btędów 1
b) najczęściej popełniano 12 btędów I
c) względny poziom zmienności można ocenić na 10% 1
d)) średnia liczba popełnionych btędów równa jest 10 1
L> Zadanie 6.
pkt odp
Mając dane Vz = 0,18, \ = 0,75, X = 100 ustal czy:
a) D = 85 1
b) Me = 95,5 1
109
Przykładowe zadania testowe
Zadanie 1.
pkt odp
Współczynnik asymetrii wagi noworodka jest równy - 0,65. Czy na tej podstawie można twierdzić, że:
a) najczęściej rodzą się dzieci z wagą niższą niż średnia waga 1
b) liczba dzieci z wagą wyższą niż średnia jest większa niż liczba dzieci z wagą niższą niż średnia 1
c) najczęściej rodzą się dzieci z wagą równą średniej wadze 1
d) nie da się określić zależności pomiędzy wagą średnią i najczęstszą 1
L Zadanie 2.
pkt odp
Na podstawie badań przeprowadzonych na grupie 50 przedszkolaków ustalono, że średni wzrost dziecka jest równy 1 19 cm przy względnym poziomie zmienności 4,2%, a największa liczba dzieci to dzieci o wzroście równym 122 cm. Czy możliwe jest, że:
a) połowa dzieci ma wzrost powyżej 120 cm 1
b) odchylenie standardowe wzrostu dzieci jest równe 10 cm 1
c) dzieci niższych niż wzrost średni jest więcej niż dzieci wyższych niż wzrost średni 1
d) asymetria rozkładu wzrostu jest ujemna 1
108
Przykładowe zadania testowe
L> Zadanie 3.
pkt odp
W zakładzie X 25% pracowników ma wynagrodzenie nie przekraczające 1200 zł, potowa pracowników nie przekraczające 1500 zł i 25% pracowników co najmniej równe 1750 zł . Czy prawdą jest, że:
a) asymetria rozkładu płac w tym przedsiębiorstwie jest lewostronna 1
b) odchylenie standardowe płac jest równe 275 zł 1
c) średnia płaca przewyższa 1500 zł 1
d) płaca średnia jest równa 1600 1
b Zadanie 4.
pkt odp
Współczynnik zmienności stażu pracy pewnej grupy pracowników mierzony zależnością pomiędzy odchyleniem standardowym i wartością średnią jest równy 0,25. Czy typowy przedział zmienności stażu pracy może mieć postać:
a) < 9;15 > 1
b) <10;16 > 1
c) < 12;18 > 1
d) < 7;13 > 1
L Zadanie 5.
pkt odp
Dysponując ciągiem obserwacji empirycznych określających liczbę błędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu: 10, 12, 8, 7,4, 12, 11, 10, 10, 8 ustal czy:
a)) połowa studentów popełnia co najmniej 10 błędów 1
b) najczęściej popełniano 12 błędów 1
c) względny poziom zmienności można ocenić na 10% 1
d)) średnia liczba popełnionych błędów równa jest 10 1
L Zadanie 6.
pkt odp
Mając dane Vz = 0,18, As = 0,75, X = 100 ustal czy:
a) D = 85 !
b) Me = 95,5 1
109
Rozdział V
c) D = 113,5 I
d) większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza poziomu średniego I
Zadanie 7.
pkt odp
Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala miejskiego X 0-6 6-12 12-18 18-24 24-30 n. 10 12 18 8 2 ocenić czy prawdą jest, że
a) średnia liczba wypalanych papierosów jest równa 15 1
b) największa liczba pracowników wypalała dziennie 15 papierosów 1
c) połowa pracowników wypala nie więcej niż 13 papierosów 1
d) 25% pracowników wypala nie więcej niż 7,5 papierosa 1
Zadanie 8.
pkt odp
W dwóch zakładach przeprowadzono ocenę skośności rozkładu premii kwartalnej przyznawanej pracownikom, ustalając m.in., że: średnie arytmetyczne są identyczne (600 zł) dominanty są różne i wynoszą odpowiednio 500 zł i 550 zł. współczynniki skośności są różne: + 0,50 i + 0,33. Czy:
a) względne zróżnicowanie wysokości premii w pierwszym i drugim zakładzie wy-nosi:33% i 25% 1
b) odchylenie standardowe premii w pierwszym zakładzie przewyższa odchylenie standardowe premii w drugim zakładzie 1
c) mediany są równe 1
d) typowe obszary zmienności są takie same 1
Zadanie 9.
pkt odp
Dla 150 losowo wybranych spółek z o.o. w Polsce oszacowano kwartyle (pierwszy, drugi i trzeci) zysku netto na poziomach: 2,4%, 7,6% i 10,9%. Czy względna zmienność zysków netto w badanych bankach wynosi: a) 36,9% b) 102,3% c) 55,9% d) 12,4%
a) względna zmienność zysków netto w badanych bankach wynosi 55,9% 1
b) przekracza 80% 1
110
Przykładowe zadania testowe
c) asymetria rozkładu zysków netto jest lewostronna 1
d) dominanta zysków jest równa 7% 1
Zadanie 10.
pkt odp
Stosunkowo najczęściej widzimy na ulicach Katowic, młode kobiety o wzroście 168 cm. Kiedy jednak ustalono na losowej próbie średni wzrost kobiety okazało się, że wynosi on 164 cm, przy 5,0 procentowej względnej zmienności. Czy prawdą jest, że:
a) współczynnik asymetrii wzrostu kobiet jest równy 0,5 1
b) odchylenie standardowe wzrostu wynosi około 8 cm 1
c) potowa kobiet nie przekracza wzrostu 165,3 cm 1
d) asymetria wzrostu kobiet ma lewostronny kierunek 1
Zadanie 11?
pkt odp
W losowo wybranej grupie lekkoatletów okazało się, że co czwarty skacze w dal bliżej niż 7,2 m, co czwarty skacze dalej niż 7,8 m, a mediana skoków w dal w badanej grupie wynosi 7,4 m. Ustalić, czy:
a) D=7,5 m 1
b) asymetria rozkładu skoków jest dodatnia 1
c) względny poziom zmienności można określić na 25% 1
d) współczynnik skośności jest równy 0,33 1
pkt odp
Na prostej próbie losowej 50 mieszkańców Domu Dziecka w Polsce ustalono, że średnia wieku mieszkańców wynosi 14 lat przy współczynniku zmienności 13% i dominancie wieku 11 lat. Określić czy;
a) odchylenie standardowe wieku dzieci jest równe 3 lata 1
b) asymetria rozkładu wieku jest dodatnia 1
c) połowa dzieci nie przekroczyła wieku 13 lat 1
d) typowy przedział zmienności ma granicę dolną ok. 10 lat i górną ok. 16 lat 1
111
Rozdział V
c) D = 113,5 1
d) większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza poziomu średniego 1
Zadanie 7.
pkt odp
Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala miejskiego X 0-6 6-12 12-18 18-24 24-30 a 10 12 18 8 2 ocenić czy prawdą jest, że
a) średnia liczba wypalanych papierosów jest równa 15 1
b) największa liczba pracowników wypalała dziennie 15 papierosów 1
c) połowa pracowników wypala nie więcej niż 13 papierosów 1
d) 25% pracowników wypala nie więcej niż 7,5 papierosa 1
Zadanie 8.
pkt odp
W dwóch zakładach przeprowadzono ocenę skośności rozkładu premii kwartalnej przyznawanej pracownikom, ustalając m.in., że: średnie arytmetyczne są identyczne (600 zł) dominanty są różne i wynoszą odpowiednio 500 zł i 550 zł. współczynniki skośności są różne: + 0,50 i + 0,33. Czy:
a) względne zróżnicowanie wysokości premii w pierwszym i drugim zakładzie wy-nosi:33% i 25% 1
b) odchylenie standardowe premii w pierwszym zakładzie przewyższa odchylenie standardowe premii w drugim zakładzie I
c) mediany są równe 1
d) typowe obszary zmienności są takie same 1
Zadanie 9.
pkt odp
Dla 150 losowo wybranych spółek z o.o. w Polsce oszacowano kwartyle (pierwszy, drugi i trzeci) zysku netto na poziomach: 2,4%, 7,6% i 10,9%. Czy względna zmienność zysków netto w badanych bankach wynosi: a) 36,9% b) 102,3% c) 55,9% d) 12,4%
a) względna zmienność zysków netto w badanych bankach wynosi 55,9% 1
b) przekracza 80% 1
110
Przykładowe zadania testowe
c) asymetria rozkładu zysków netto jest lewostronna 1
d) dominanta zysków jest równa 7% 1
Zadanie 10.
pkt odp
Stosunkowo najczęściej widzimy na ulicach Katowic, młode kobiety o wzroście 168 cm. Kiedy jednak ustalono na losowej próbie średni wzrost kobiety okazało się, że wynosi on 164 cm, przy 5,0 procentowej względnej zmienności. Czy prawdą jest, że:
a) współczynnik asymetrii wzrostu kobiet jest równy 0,5 1
b) odchylenie standardowe wzrostu wynosi około 8 cm 1
c) połowa kobiet nie przekracza wzrostu 165,3 cm 1
d) asymetria wzrostu kobiet ma lewostronny kierunek 1
Zadanie 11.
pkt odp
W losowo wybranej grupie lekkoatletów okazało się, że co czwarty skacze w dal bliżej niż 7,2 m, co czwarty skacze dalej niż 7,8 m, a mediana skoków w dal w badanej grupie wynosi 7,4 m. Ustalić, czy:
a) D=7,5m 1
b) asymetria rozkładu skoków jest dodatnia 1
c) względny poziom zmienności można określić na 25% 1
d) współczynnik skośności jest równy 0,33 1
Zadanie 12.
pkt odp
Na prostej próbie losowej 50 mieszkańców Domu Dziecka w Polsce ustalono, że średnia wieku mieszkańców wynosi 14 lat przy współczynniku zmienności 13% i dominancie wieku 11 lat. Określić czy;
a) odchylenie standardowe wieku dzieci jest równe 3 lata 1
b) asymetria rozkładu wieku jest dodatnia 1
c) połowa dzieci nie przekroczyła wieku 13 lat 1
d) typowy przedział zmienności ma granicę dolną ok. 10 lat i górną ok. 16 lat 1
111
Rozdział V
Zadanie 13.
pkt odp
Realizacjom cechy: liczba błędów [0;l; 2; 3; 4] popełnianych w teście egzaminacyjnym odpowiada następujący ciąg częstości: [ 0,1; 0,6; 0,2; 0,05; 0,05]. Czy:
a) dominująca liczba popełnianych błędów to 2 1
b) asymetria rozkładu błędów jest dodatnia 1
c) względny poziom zmienności można określić na 25% 1
d) połowa egzaminowanych osób popełniła nie mniej niż 2 błędy 1
Zadanie 14.
pkt odp
W czerwcu tego roku przeprowadzono badanie statystyczne w grupie 250 losowo wybranych bezrobotnych osób dotyczące czasu pozostawania bez pracy. Okazało się, że wśród 95 kobiet średni czas pozostawania bez pracy był równy 16 miesięcy a w grupie mężczyzn czas bezrobocia obejmował 12 miesięcy. Odchylenie standardowe czasu bezrobocia dla kobiet to 7 miesięcy a dla mężczyzn 5 miesięcy. Ustalić czv:
a) przeciętny czas pozostawania bez pracy w całej grupie osób jest równy 14 miesięcy 2
b) grupa kobiet jest bardziej zróżnicowana ze względu na analizowaną cechę niż grupa mężczyzn 1
c) odchylenie standardowe czasu pozostawania bez pracy ogółu bezrobotnych jest równe 6,2 miesięcy 3
d) asymetria rozkładu cechy jest prawostronna 1
Zadanie 15.
pkt odp
Rozkład wieku 100 losowo wybranych postów ostatniej kadencji przedstawiał się następująco: poniżej 29 lat miało 2 posłów, od 30 do 39 lat miało 20 posłów, od 40 do 49 to wiek 46 posłów, od 50 do 59 to 26 posłów i wiek 60 lat przekroczyło 6 po-sfów. Czv:
a) średni wiek posła to 45 lat 2
b) połowa posłów nie przekroczyła wieku 46 lat 2
c) najliczniejszą grupę stanowią posłowie w wieku około 44 lat 2
d) rozkład wieku postów jest umiarkowanie lewostronnie asymetryczny 1
112
Przykładowe zadania testowe
Zadanie 16.
pkt odp
Jeśli wiadomo, że 90% kobiet i 70% mężczyzn przechodzi na emeryturę w wieku 60 lat (przy takim samym wspótczynniku zmienności równym 20%) oraz, że kobiety stanowią około 45% osób aktywnych zawodowo to:
a) procent siły roboczej kończącej aktywność zawodową w wieku 60 lat jest równy 80% 2
b) grupa kobiet jest bardziej zróżnicowana ze względu na analizowaną cechę niż grupa mężczyzn 1
c) odchylenie standardowe dla kobiet i mężczyzn jest takie samo 1
d) odchylenie standardowe ogółu osób odchodzących na emeryturę w wieku 60 lat jest równe 18,8% 3
L> Zadanie 17.
pkt odp
Badanie 20 par nowożeńców w chwili zawierania związku małżeńskiego ze względu na wiek (oddzielnie dla kobiet i dla mężczyzn) dostarczyło następujących informacji: Mężczyźni x = 29,55, D = 26, \ = 0,3; Kobiety x = 22, D = 24, Vz = 0,3. Ocenić czy:
a) zbiorowość kobiet jest bardziej zróżnicowana ze względu na wiek w chwili zawierania związku małżeńskiego niż zbiorowość mężczyzn I
bt średni wiek małżonka jest równy 26 lat 2
c) asymetria wieku kobiet i mężczyzn wstępujących w związek małżeński ma przeciwny kierunek I
d) dominanta wieku małżonków to 25 lat I
Zadanie 18.
pkt odp
W celu ustalenia przeciętnej płacy księgowych w prywatnych firmach wybrano losowo grupę 10 osób i zebrano informacje o ich przeciętnej rocznej ptacy (w tys. zł): 40. 50, 37, 52, 64, 75, 48, 62, 72, i 7O.Czy można na tej podstawie stwierdzić, że:
al średnia płaca księgowego jest równa 56 tys. zł 1
bl płaca połowy badanych osób nie przekracza 64 tys. z) 2
ci rozkład płac jest symetryczny 1
dl względna dyspersja rozkładu jest równa 22,4% 1
113
Rozdziai V
Zadanie 19.
pkt odp
Wiedząc, że współczynnik korelacji liniowej Pearsone'a jest równy 0,68 stwierdź czy prawdą jest, że:
a) wzajemny wptyw zmiennych na siebie jest równy 68% 1
b) stopień niedopasowania wynosi 54% 1
c) korelacja ma dodatni kierunek 1
d) rozważanie teoretycznej linii regresji ma sens 1
Zadanie 20.
pkt odp
Dla zależności pomiędzy stopniem zaawansowania znajomości języka obcego (mierzoną liczbą błędów popełnianych w teście kontrolnym) i czasem poświęcanym na naukę języka ustalono współczynnik regresji równy -5,25. Czy prawdą jest, że czas poświęcany na naukę wpływa na poziom znajomości języka w:
a) 52,5% 1
b) 47,5% 1
c) 27,5625% 1
d) nie da się tego stwierdzić jednoznacznie I
Zadanie 21.
pkt odp
Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6 zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano następujące dane: Wielkość produkcji (w tys. szt.) - cecha X: 1; 4; 5; 6; 7; 9. Liczba braków (w sztukach) - cecha Y: 10; 30; 40; 50; 50; 60. Czy na tej podstawie można stwierdzić, że
a) korelacji pomiędzy wielkością produkcji a liczbą braków jest duża i wynosi 0,9819 2
b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji 1
c) w zakładzie produkującym 10 tys. sztuk poziom braków będzie równy 70 sztuk 2
d) gdy produkcja wzrośnie w wybranym zakładzie o 1 tys. szt to poziom braków wzrośnie o 10 sztuk 1
114
Przykładowe zadania testowe
Zadanie 22.
pkt odp
Które z zależności są prawdziwe:
a) rw = 0,75, a, = -025 1
b) a = 0,40, b, = 3,5 2
c) a, = -0,4, b, = 2,4 1
d) rw = 0,60, b, = 2,5 1
ŚŚs.
LŚ Zadanie 23.
pkt odp
Współczynniki regresji pomiędzy stażem pracy i wynagrodzeniem są odpowiednio równe a, = 0,45, b, = 1,8. Czy prawdą jest, że:
a) współczynnik korelacji jest równy 0,9 1
b) wynagrodzenie w 70% zależ)' od stażu 1
c) współczynnik korelacji jest równy 0,81 1
d) w 19% wynagrodzenie zależv od innych czynników niż staż 1
pkt odp
W grupie 50 rodzin konsumenckich przeprowadzono badanie statystyczne dotyczące średnich miesięcznych wydatków na przybory szkolne i liczby dzieci w rodzinie. Ustalono, że kowariancja pomiędzy zmiennymi jest równa 1,3, wariancja wydatków jest równa 4 i wariancja liczby dzieci w rodzinie równa 1, a wartości średnie wydatków na przybory szkolne(w umownych jednostkach pieniężnych) i liczby dzieci są odpowiednio równe 10 i 2. Czv:
a) liniowa determinacja zmienności wydatków na artykuły szkolne względem zróżnicowania liczby dzieci jest równa 65,0% 2
b) względny poziom zróżnicowania wydatków na przybory szkolne jest większy niż liczby dzieci w rodzinie 1
c) korelacja pomiędzy wydatkami i liczbą dzieci ma dodatni kierunek 1
d) współczynnik regresji jest równy 0,52 2
Zadanie 25.
pkt odp
Prosta regresji opisująca zależność wydatków na żywność przeciętnej rodziny czteroosobowej (Y w tys. PLN) i dochodu w tej rodzinie (X w tys. PLN) ma postać y = 0,1 lx + 0,708. Czy prawda jest, że:
115
Rozdział V
a) jeśli dochody wzrosną o 1 tys. PLN, to wydatki na żywność wzrosną o 110 PLN 1 T
b) jeśli dochody wzrosną o 1 tys. PLN to wydatki wzrosną o 11% 1 N
c) przy dochodach równych 5 tys. PLN wydatki będą równe, 1,258 tys. PLN 2 T
d) wydatki na żywność w 11% zależą od dochodów w rodzinie 2
Zadanie 26.
pkt odp
Przeprowadzono badanie zależności pomiędzy piacą pracowników (Y) a stażem pracy w latach (X,) i wydajnością pracy w sztukach (X2) dla losowo dobranej grupy 50 pracowników . Otrzymano następujące informacje dotyczące siły zależności pomiędzy poszczególnymi zmiennymi: - płacą i stażem pracy 0,32, - płacą i wydajnością 0,74, - wydajnością i stażem pracy 0,60. Czy na tej podstawie można twierdzić, że::
a) zależność pomiędzy płacą i wydajnością z pominięciem stażu pracy jest równa 0,7233 3
b) zależność pomiędzy płacą i stażem pracy z pominięciem wydajności jest równa 0,7233 3
c) płaca w 57% zależy od innych czynników niż wydajność i staż pracy 3
d) piaca w 57% zależy od stażu pracy i wydajności rozważanej łącznie 3
pkt odp
Badanie rocznej stopy zwrotu dla pewnej akcji A oraz dla całego rynku papierów wartościowych w ciągu 5 lat dało następujące wyniki: Dla akcji A 38,6%; -24,7%; 12,7%, 8,2%; 40,1%. Dla rynku papierów wart. 23,8%; -7,2%; 6,6%; 20,5%; 30,8%. Czy prawdą jest, że:
a) wzrost stopy zwrotu wszystkich akcji o 1% spowoduje wzrost stopy zwrotu wszystkich akcji o przeciętnie 1,6% 3
b) korelacja pomiędzy wyróżnionymi cechami jest silna i ma dodatni kierunek 3
c) gdy stopa zwrotu akcji dla całego rvnku papierów wartościowych wyniesie -10% to stopa zwrotu akcji A będzie równa 20% 3
d) stopa zwrotu akcji A tylko w nieznacznym stopniu zależy od zmian na rynku papierów wartościowych 3
116
Przykładowe zadania testowe
Zadanie 28.
pkt odp
Na podstawie danych dotyczących przeciętnego dziennego utargu sklepów (cecha Y w tys. zt.) oraz ich powierzchni (cecha X w m2) uzyskanych dla 5 sklepów branży galanteryjnej w Katowicach ustalono co następuje: _ 5 5 5 x = 40;y = 5;]T(*( -x)(yi -y) = 120;L(x, -x)2 = 1000;^(y; -yf = 18; Czy po zaokrągleniu wyników można twierdzić, że:
a) jeśli powierzchnia sklepu wzrośnie o I m2 to dzienny obrót wzrośnie średnio o 0,12 tys. zł. 2
b) jeśli powierzchnia sklepu wzrośnie o 1 m2 to dzienny obrót wzrośnie średnio o 12%. 2
c) dzienny obrót w 80% zależy od powierzchni sklepu 2
d) sklep o powierzchni 45 m2 powinien mieć dzienny obrót równy 6 tys. zł. 2
Zadanie 29.
pkt odp
W roku akademickim 1999/2000 na II roku Wydziału Zarządzania AE w Katowicach było 500 studentów w tym 220 mężczyzn. Letnią sesję egzaminacyjna w pierwszym terminie zaliczyło 280 osób w tym 100 mężczyzn. Czy:
a) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie istotna 1
b) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie nieistotna 1
c) współczynnik korelacji pomiędzy analizowanymi cechami jest równy 0.55 2
d) wynik sesji w 4% zależy od płci 1
Zadanie 30.
pkt odp
Długość cyklu produkcyjnego (X) oraz odpowiadające im koszty wytworzenia (Y) pewnego wyrobu przedstawiają się następująco X ={135; 130; 125; 110; 140; 180; 120; 150 165 } i Y ={30; 29; ; 35; 28; 34; 30; 33; 36} Czy na tej podstawie można twierdzić, że::
a) zależność pomiędzy cechami ma charakter liniowy 2
b) sita korelacji jest znaczna 2
c) siła korelacji mierzona miernikiem rangowym jest nieznaczna 1
d) funkcja regresji II rodzaju ma postać: y = 0,75x + 1,25 I
117
Rozdział V
Zadanie 31.
pkt odp
Badanie zależności pomiędzy dostawami twarogu (Y) i skupem mleka (X) w pewnej spółdzielni mleczarskiej za lata 1990-1999 dało następujące wyniki: średnie dostawy twarogu to 9 ton przy względnej dyspersji 25% średni skup mleka 51 tys. litrów odchylenie standardowe składnika resztowego liniowej funkcji regresji dostaw twarogu względem skupu mleka wynosi 1,1 ton Ponadto wiadomo, że przeciętnie wzrost skupu mleka o 1 tys. litrów powoduje wzrost dostaw twarogu o 200 kg. Mając powyższe dane określ:
a) czy korelacja pomiędzy wielkością skupu mleka a wielkością dostaw twarogu jest równa 0,748 3
b) dostawy twarogu w 50% zależą od skupu mleka 2
c) przy planowanym skupie mleka na poziomie 70 tys. litrów dostawy twarogu będą równe 15,2 ton 3
d) poziom dostaw twarogu w 44% kształtują inne czynniki niż skup mleka 2
Zadanie 32.
Dla losowo wybranej próby 30 zakładów produkujących te same wyroby przeprowadzono badanie wydajności pracy 1 pracownika (Y), ilości zużytej energii na jednego pracownika (X,) i płynności kadr (X,).Ustalono, że: r , = 0,95, ryx2 = -0,8, rxll3 = -0,7.
a) czy jest możliwe, że zmienne X( i X2 w 90% wyjaśniają zmienność wydajności pracy 3
b) czy wydajność pracy w 75% zależy od ilości zużytej energii na 1 robotnika 3
c) czy korelacja pomiędzy wydajnością a poziomem zużycia energii z pominięciem płynności kadr ma ujemny kierunek 3
d) czy na zmiany wydajności silniej wpływa ilość zużytej energii niż płynność kadr 3
L> Zadanie 33.
pkt odp
W badaniach nad zależnością między wielkością produkcji (w tys. szt.) a kosztami produkcji (w USD) uzyskano następujące wyniki: produkcja 25; 31; 40; 45; 52 i odpowiadające jej koszty 50; 40; 35; 30; 26. Czy na tej podstawie można twierdzić, że::
a) zależność pomiędzy cechami ma charakter liniowy 2
b) wzrost wielkości produkcji może oznaczać zmniejszenie kosztów jednostkowych 1
c) współczynnik determinacji liniowej przekracza 70% 1
d) przy produkcji równej 60 tys. sztuk koszty ulegną zmniejszeniu do 22 USD 2
118
Przykładowe zadania testowe
Zadanie 34.
pkt
odp
Wśród 500 absolwentów technikum przeprowadzono sondaż dotyczący zgodności wykonywanej pracy z wyuczonym zawodem i zadowolenia z wykonywanego zawodu. Uzyskano następujące informacje: wśród 150 osób pracujących zgodnie z wyuczonym zawodem 2/3 było zadowolonych z wykonywanej pracy a pozostała część osób nie. Natomiast z pozostałej części absolwentów technikum 150 osób stanowi-ty osoby niezadowolone z wykonywanej pracy. Ustal czy
a) istnieje statystycznie istotna zależność pomiędzy zgodnością wykonywanej pracy z zawodem wyuczonym a stosunkiem do wykonywanej pracy. 1
b) Osoby niezadowolone z wykonywanej pracy stanowią połowę analizowanej grupy absolwentów 1
c) Współczynnik korelacji pomiędzy analizowanymi cechami jest mniejszy niż 0,5 1
d) Współczynnik korelacji pomiędzy analizowanymi cechami jest większy niż 0,5 1
L> Zadanie 35.
pkt odp
Średnioroczne tempo wzrostu spożycia wyrobów tytoniowych jest równe 2,5%.Jeśli dziś kupujemy 300 paczek papierosów to za trzy lata będziemy ich kupować:
a) 307,5 paczek 1
b) 292,5 paczek 1
c) 323,1 paczek 1
d) 350,3 paczek 1
pkt odp
Indeks wartości jest równy 1,25, a indeks Paaschego ilości 0,98. Czy indeks cen La-spevresa może być równy:
a) 307,5 paczek 1
b) 292,5 paczek 1
c) 323,1 paczek 1
d) 350,3 paczek 1
pkt odp
Indeksy łańcuchowe zakupu środków piorących są dla kolejnych tygodni odpowiednio równe: 105%, 110%, 108%, 107%. Czy:
119
Rozdział V
a) średnie tempo zmian zakupu środków piorących było równe 7,48% 2
b) pomiędzy drugim a czwartym okresem nastąpił wzrost zakupu środków piorących o 3% 2
c) pomiędzy trzecim a piątym okresem nastąpił spadek zakupów o 3% 2
b) jeśli w ostatnim okresie obserwacji zakupiono środki piorące za 100 zt to za dwa tygodnie zapłacimy za nie 115,52 zt. 2
Lj Zadanie 38.
pkt odp
Czy indeks wartości równy 2,25 oznacza ogólny wzrost wartości o:
a) 25% 1
b) 125% 1
c) 225% 1
d) 75% 1
pkt odp
Średniookresowe tempo spadku zachorowalności na astmę jest dla ostatnich sześciu lat (czyli w latach 1996-2001) równe 0,7%
a) czy mogą chorować na tę chorobę w 2002 roku 1972 osoby gdy w 2000 chorowało 2000 osób i tempo spadku pozostawało bez zmian 2
b) w 1998 roku chorowało na astmę 2028 osób 2
c) w 1996 roku liczba chorych była równa 2056 osób 2
d) liczba chorych na astmę w 1996 roku była równa 1944 osoby 2
ŚLŚ Zadanie 40.
pkt odp
Indeksy łańcuchowe spożycia czekolady w wybranej rodzinie czteroosobowej w kolejnych dniach tygodnia są odpowiednio równe (poniedziałek jest pierwszym dniem tygodnia): 0,88; 0,92; 1,2; 1,03; 1,15; 1,05. Czy można twierdzić, że w niedzielę zjada się w tej rodzinie o:
a) około 20% czekolady więcej niż w poniedziałek 2
b) około 24% czekolady więcej niż w środę 2
c) około 4% czekolady więcej niż w poniedziałek 2
d) około 20% czekolady więcej niż w piątek . 2
120
Przykładowe zadania testowe
Zadanie 41.
pkt odp
Zużycie produktów higienicznych w kg/osobę w kolejnych latach 1996-2000 było odpowiednio równe: 8; 9; 10; 12; 12.czy prawdą jest, że:
a) zużycie w 2000 roku przekroczyło o 50% poziom zużycia z roku 1996 2
b) pomiędzy rokiem 1997 a 1999 nastąpił wzrost zużycia środków kosmetycznych o 25% 2
c) średnio z roku na rok poziom zużycia środków kosmetycznych wzrastał o 10,6% 2
d) zachowując dotychczasowe tempo wzrostu zużycia kosmetyków w 2002 roku poziom zużycia powinien wynosić 14 kg/osobę. 2
Zadanie 42.
pkt odp
Na podstawie danych kwartalnych dotyczących produkcji mleka (w tys. litrów) w Okręgowej Spółdzielni Mleczarskiej w mieście A w latach 1997-2001 oszacowano liniowy trend produkcji w postaci: y = 2847,5 + 25,9t Na tej podstawie można twierdzić, że:
a) z kwartału na kwartał produkcja mleka wzrastała przeciętnie o 25,9 tys. litrów 1
b) z kwartału na kwartał produkcja mleka wzrastała przeciętnie o 25,9% 1
c) z roku na rok produkcja mleka wzrastała o 25,9 tys. litrów 1
d) w ostatnim kwartale roku 1996 produkcja mleka w tej spółdzielni była równa 2847,5 tys. litrów 1
Zadanie 43.
pkt odp
Na podstawie informacji o rocznym poziomie spożycia artykułów wędliniarskich w rodzinie czteroosobowej oraz poziomie cen tych artykułów w latach 1999 i 2001 wyznaczono odpowiednie mierniki agregatowe: [L= 1,207; 1|!= 1,204; IJ- = 0,938; Pj = 0,935. Czy prawdą jest, że
a) łączna wartość spożycia wymienionych artykułów wzrosła o 20,7% 1
b) nastąpił wzrost cen artykułów wędliniarskich o ok. 20,5% 1
c) spożycie wybranych artykułów wzrosło o ok. 7,2% 1
d) przy założeniu stałego poziomu spożycia z roku 1999 zmiana cen spowoduje wzrost wartości o 20,7% 1
121
Rozdział V
Zadanie 44.
pkt odp
Dynamikę sprzedaży soków owocowych firmy HORTEX w latach 1990-1994 charakteryzował następujący ciąg indeksów łańcuchowych 120%, 180%, 230%, 190%. Czy z roku na rok. przeciętnie sprzedaż soków owocowych u tego producenta:
a) rosła o 75,3%, 1
b) rosła o 175,3% 1
c) malała o 75,3% 1
d) pozostawała bez zmian. 1
Zadanie 45.
pkt odp
W zakładach przetwórstwa zbożowego prowadzono badanie popytu na oferowane nowe gatunki kaszy. Badaniem objęto okres od 01.01.1993-31.12.1997. Okazało się, że popyt kształtował się zgodnie z równaniem (model multiplikatywny): y = 0,83t + 1,07 . Jednocześnie wyznaczono wskaźniki sezonowości równe odpowiednio dla kolejnych kwartałów: c, = 0,76, c, = 0,94, c, = 1,25, c4 = 1,18 Wykorzystując te informacje określić czy: spodziewany poziom popytu na kaszę w III kwartale 1998 roku będzie równy:
a) spodziewany poziom popytu na kaszę w III kwartale 1998 roku będzie równy ok. 25,2 2
b) z kwartału na kwartał popyt na kaszę wzrastał przeciętnie o 1,07 2
c) współczynnik korekty jest równy 0,9685 2
d) spodziewany poziom popytu na kaszę w 111 kwartale 1998 roku będzie równy ok 13,62 2
Zadanie 46.
pkt odp
Na podstawie danych ankietowych stwierdzono, że średnie spożycie owoców cytrusowych (w kg na jednego mieszkańca) w latach 1995-1999 było odpowiednio równe: 31,2; 28,9; 37,2; 40,7; 45,2. Czv prawdą jest, że:
a) średnio z roku na rok spożycie wzrasta o około 10% 2
b) w 2001 roku powinno bvć równe 54,2 kg 2
c) w 1999 roku wzrost w stosunku do roku poprzedniego był silniejszy niż w 1997 w stosunku do 1996 2
d) przeciętny poziom spożycia owoców cytrusowych za cały okres był równy 36,25 kg 2
122
Przykładowe zadania testowe
Zadanie 47.
pkt odp
W firmie Handlowej MARGO obroty ze sprzedaży wybranych artykułów przedstawiały się następująco: w marcu 2002 wartość sprzedanych wyr. tytoniowych wyniosła 200 tys. a w maju 2002 180 tys.zł; dla art. spożywczych odpowiednie kwoty były równe 400 i 450 tys. zł, a dla kosmetycznych 100 i 110 tys. zł. Firma wprowadziła promocyjne ceny na wymienione artykuły obniżając je o odpowiednio 3%, 2% i 6% w maju w stosunku do marca.
a) czy obniżka cen spowodowała zwiększenie obrotów firmy 2
b) czy w ogólnym stopniu ceny artykułów spadły o 3% 2
c) czy wpływ zmiany cen był silniejszy na zmianę wartości obrotów niż wpływ zmiany wielkości sprzedaży 2
d) czy ogólnie obroty firmy MARGO spadły o 5% 1
Zadanie 48.
pkt odp
Względne wskaźniki sezonowości kwartalnej spożycia piwa są odpowiednio równe: S, = 0,797; S" = 1,227; S," = 1,357; S|v = 0,625. Liniowa funkcja trendu wyznaczona na podstawie 5 lat obserwacji (od 1997-2001) ma postać: y = 4,68 + 0,04 (t-t), gdzie =-19,-17,-15,... 15, 17, 19.
a) czy można twierdzić, że w trzecich kwartałach spożycie piwa przekracza poziom przeciętny o 35,7% 2
b) czy można twierdzić, że w trzecich kwartałach spożycie piwa przekracza poziom przeciętny o 35,5% 2
c) średnio spożycie piwa z kwartału na kwartał wzrasta o 0,08 litra na osobę. 2
d) w ostatnim kwartale roku 1996 spożycie piwa było równe 4,68 litra na osobę 2
Zadanie 49.
pkt odp
Dla trzech gmin woj. Śląskiego liczących odpowiednio 10 tys., 40 tys. i 25 tys. mieszkańców gęstość zaludnienia kształtuje się następująco: 40 os./ km2 20 os./ km2 i 50 os./ km2
a) średnia gęstość zaludnienia w tych trzech gminach łącznie wynosi 27,27 os./ km2 2
b) średnia gęstość zaludnienia w tych trzech gminach łącznie wynosi 33,33 os./ km2 2
c) łączna powierzchnia zajmowana przez te trzy gminy razem jest równa 2750 km2 2
d) łączna powierzchnia zajmowana przez te trzy gminy razem jest równa 75 tys. km2 2
123
Rozdział V
Zadanie 50.
pkt odp
Na podstawie pięcioletniego okresu obserwacji (lata 1995-1999) ustalono wskaźniki sezonowości czasu pracy, przy czym utracone zostały dwie informacje. Zakładamy, że funkcja trendu badanego zjawiska ma postać y = 0,257t + 157,52 oraz dla kolejnych kwartałów wskaźniki względne i absolutne wahań są odpowiednio równe: Wsk. względne: 1,03; 0,956; ? ; 1,095 Wsk. absolutne: +31,4; ? ;-84,8; + 99,6
a) czy względny wskaźnik sezonowości dla trzeciego kwartału jest równy 0,919 2
b) czy absolutny wskaźnik sezonowości dla drugiego kwartału jest równy -50,5 2
c) czy spodziewana wartość czasu pracy dla drugiego kwartału roku 2000 jest równa 156 2
d) czy w drugich kwartałach czas pracy przekracza czas przeciętny o 46,6 godz. 2
ROZWIĄZANIA ZADAŃ TESTOWYCH
Zadanie A B C D
1 N T N N
2 T N N T
3 T N N N
4 T N N N
5 T N N N
6 T T N T
7 N N T T
8 T T N N
9 T N T N
10 N T T T
11 N T N T
12 N T T N
13 N T N T
14 N T T N
15 N T N N
16 N N N T
17 N r T N
18 N N N T
19 N T T T
20 N N N T
21 T T T N
124
Przykładowe zadania testowe
Zadanie A B C D
22 N N N T
23 T N N T
24 N N T N
25 T N T N
26 T N N T
27 T T N N
28 T N T N
29 N T N T
30 N T T N
31 T N N T
32 N N N T
34 T N T N
35 N N T N
36 N N N T
37 T N N T Ś
38 N T N N
39 T T T N
40 T N N T
41 T N T N
42 T N N T
43 \ N \ T \ N -X T
44 T N N N
45 N N T T
46 T N N T
47 T T N N
48 N T N N
49 T N T N
50 T N N N
125
Bibliografia
Amir d. Aczel, 2000: Statystyka w zarządzaniu. PWN. Warszawa.
Domański Cz. (Red.), 1991: Zbiór zadań ze statystyki. Wydawnictwo U.Ł. Łódź.
Kassyk-Rokicica H. (Red.), 1996: Statystyka. Zbiór zadań. PWE. Warszawa.
Ostasiewicz S., Rusnak Z., Siedlecka U., 1995: Statystyka. Elementy teorii i zadania. Akademia Ekonomiczna. Wrocław.
Paradysz }., 1996: Statystyka w przykładach i zadaniach. Akademia Ekonomiczna. Poznań. Sobczyk M., 2000: Statystyka. PWN. Warszawa.
126
Wydawnictwo wyższej Szkoły Ekonomii i Administracji
ul. A. Frycza-fflodrzewskiego 1,41-907 Bytom
te!., fax: 032 286 99 58
MARIAN CIEPAJ
STOŁECZH0EK0N0M1CZNE ASPEKTY PRZEKSZTAŁCEŃ USTROJOWYCH
W GOSPODARCE KRAJU I REGIONU
PODSTAWY RACHUNKOWOŚCI
zbiór ćwiczeń
m
ROLA MAŁYCH I ŚREDNICH
PRZEDSIĘBIORSTW W ROZWOJU REGIONALNYM
WPROWADZENIE DO EDYCJI TEKSTÓW
READINGS
IN BUSINESS ENGLISH FOR BEGINNERS
., mbusniiUEwMBMiiwaKnuuanTWiD
I
5"\
*/
n
pkl
Dysponując ciągiem obserwacji empirycznych określających liczbę biędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu : 10, 12, 8, 7, 4, 12, II, 10, 10, 8 ustal czy:
a) ) polowa studentów popełnia co najmniej 10 biędów 1 ^___ł J i
b) najczęściej popełniano 12 błędów 1 ~r i
c) względny poziom zmienności można ocenić na 10 % 1 N
d)) średnia liczba popełnionych błędów równa jest 10 1 M
O
U r
ex ą
W grupie 50 rodzin konsumenckich przeprowadzono badanie statystyczne dotyczące średnich miesięcznych wydatków na przybory szkolne i liczby dzieci w rodzinie. Ustalono, że kowariancja pomiędzy zmiennymi jest równa 1.3, wariancja wydatków jesi równa 4 i wariancja liczby dzieci w rodzinie równa 1. a wartości średnie wydatków na przybory szkolne( w umownych jednostkach pieniężnych ) i liczby dzieci są odpowiednio równe 10 i 2. Czy:_________
pkt
otip I
a) liniowa determinacja zmienności wydatków na artykuły szkolne względem zróżnicowania liczby dzieci jest równa 65.0 % 2
bj względny poziom zróżnicowania wydatków na przybory szkolne jest większy niż liczby dzieci w rodzinie V &,, 1 N
c) korelacja pomiędzy wydatkami i liczbą dzieci ma dodatni kierunek ?* yw j 1 T T
d) współczynnik regresji jest równy 0.52 Ca 4 f\ 2
r %
C
Średnioroczne tempo wzrostu spożycia wyrobów tytoniowych jest równe 2,5%.Jeś!i dziś kupujemy 300 ; paczek papierosów to za. trzy lata będziemy ich kupować:_________________________________________
pkl
odp
i a) 3C7.5 paczek
b) 292,5 paczek
c) 323,1 paczek
d) 350,3 paczek
T)
T
- 11
! W
LZ
5O5,
:Ś
ŚŚŚ \
.?f
Vf \
' _-ui LL?_..,
pki oilp
Prosta regres j i opisująca zależność wydatków na żywność przeciętnej rodziny czteroosobowej (Y w tyś. PLN ) i dochodu w tej rodzinie (X w tyś PLN ) ma postać y = 0.11 x + 0.708. Czy prawdą jesi. y.e:
a) jeśli dochody wzrosną o I tyś. PLN. to wydatki na żywność wzrosną o 110 PLN
b) jeśli dochody wzrosną o I tyś. PLN to wydatki wzrosną o 11%___________
c) przy dochodach równych 5 tyś PLN wydatki będą równe 1,258 tyś PLN j
d) wydatki na żywność w I 1% zależą od dochodów w rodzinie A L
a
r_
łNa podstawie informacji o rocznym poziomie spożycia artykułów wędliniarskich w rodzinie
czteroosobowej oraz poziomie cen tych artykułów w latach 1999 i 2001 wyznaczono odpowiednie mierniki aureuatowe:
* =1.207;/,'' = 1,204;/* = 0,938;/,'' = 0,935 . Czy prawdąjest, że
pkt
c?)
a) łączna wartość spożycia wymienionych artykułów wzrosła o 20,7% F^/ 1 1
b) nastąpił wzrost cen artykułów wędliniarskich o ok. 20.5% % 1
c) spożycie wybranych artykułów wzrosło o ok. 7 2 % 1
d) przy założeniu stałego poziomu spożycia z roku 1999 zmiana cen spowoduje wzrost wartości o 20.7' 1
ZAD.7., :
4
-"~ pkt odp
Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala miejskiego X 0-6 6-12 12-18 18-24 24-30 n,Ś . 10 i? 18 ____ 8 2 _.__,. ... v ocenić czy prawdą jest, że
a) średnia liczba wypalanych papierosów jest równa 15 1 H
b) największa liczba pracowników wypalała dziennie 15 papierosów Q 7 V\f 1 H.
c) polowa pracowników wypala nie więcej niż 13 papierosów f (^ 1 r T
d) 25% pracowników wypala nie więcej niż 7,5 papierosa % 1 r
ZAD.S. M w
pki odp
Rozkład wieku 100 losowo wybranych posłów ostatniej kadencji przedstawiał się następująco: poniżej 20 lat miało 2 posłów, od 30 do 39 lat miało 20 posłów, od 40 do 49 to wiek 46 posłów, od 50 do 59 to 26 posłów i wiek 60 lat przekroczyło 6 posłów. Czy:
a) średni wiek posła to 45 lat
b) polowa posłów nie przekroczyła wieku 46 lat
c) najliczniejszą grupę stanowią posłowie w wieku około 44 lat
d) rozkład wieku posłów jest umiarkowanie lewostronnie asymetryczny
?
ZAD.9. -
=' ^ cl)
W firmie Handlowej MARGO obroty ze sprzedaży wybranych artykułów przedstawiały się następująco: I w marcu 2002 wartość sprzedanych wyr. tytoniowych wyniosła 200 tyś. a w maju 2002 180 tyś.zł; dla art. Spożywczych odpowiednie kwoty były równe 400 i 450 tyś. zł. a dla kosmetycznych 100 i 110 tvs. zł. Firma wprowadziła promocyjne ceny na wymienione artykuły obniżając je o odpowiednio 3%. 2% i 6"!> w maju w stosunku do inarca.
[ /'A/ j odp
a) czy obniżka cen spowodowała zwiększę nie obrotów ilrmv i 2 f N !
bj czv w ogólnym stopniu ceny artvku!ów spadł v o 3/ó 1 7 r !
<:) czy wpływ zmiany cen był silniejszy sprzedaży na zmianę wartości obrotów niż wpływ zmiany wielkości j 2 i
di czy ogólnie obroty firmy MARGO spadły o 5% H \fi i
C
:!)
EGZAMIN TESTOWY ZE STATYSTYKI ZESTAW C
ty-
Nuzwisko i imię
Cr.
H-rtlz. \ih. ifa//Mnju
-"*.'Odpowiedzi należy zaznaczyć w kolumnie "ofl^?. " symbolem T dla tak lub symbolem N dla nie. te'S&Hunktacja odpowiedzi: odpowiedź dobra 1 lub 2 lub 3 pkt, odpowiedź zla -0.5 lub -1 lub-1,5 pkt, brak odpowiedzi Opkt
Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6 zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano następujące dane:
Wielkość produkcji ( w tyś. szt)-cecha X :!; 4; 5; . 6; 7; 9;
Liczba braków (w sztukach )-cecha Y : 10; 30; 40; 50; 50; 60; Czy na tej podstawie można stwierdzić, że______________________________________________________
pkt Otl,
a) korelacji pomiędzy wielkością produkcji a liczbą braków jest duża i wynosi 0.9819
T
,b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji
' c) w zakładzie produkującym 10 tyś, sztuk poziom braków będzie równy 70 sztuk
r
Ś> d) gdy produkcja wzrośnie w wybranym zakładzie o 1 tyś. $zt to poziom braków wzrośnie o 10 sztuk 1
. szt to poziom b
A/
W
:-?tl*'::
W roku akademickim 1999/2000 na II roku Wydziału Zarządzania AE w Katowicach było 500 studentów w tym 220 mężczyzn. Letnią sesją egzaminacyjną w pierwszym terminie zaliczyło 280 osób w tym 100 mężczyzn. Czy:__________________________________; 'v-f: ' _____________________________________
pkt odp
zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie istotna
b) zależność pomiędzy wynikiem sesji a pkią studenta jesr statystycznie nieistotna
wspóJczynniK KOfeiacji pornietizy łmaiizowaiiy.m cccbaiiii jcsi rowcy 0.55
d) wynik sesji w 4% zależy od płci
Jl
;ZAJD.3.
VD
pkt odp
Indeksy łańcuchowe zakupu środków piorących są dla kolejnych tygodni odpowiednio równe : 105%. 110%, 108%, 107%.Czy: średnie tempo zmian zakupu środków piorących byio równe:
a) średnie tempo zmian zakupu środków piorących było równe 7,48%iT? 2 W T V
b) pomiędzy drugim a czwartym okresem nastąpił wzrost zakupu środków piorących o 3% 2 f *i
c) pomiędzy trzecim a piątym okresem nastąpił spadek zakupów o 3%cz 2 | N
f). ż jeśli w ostatnim okresie obserwacji zakupiono środki piorące za lOOzł to za dwa tygodnie zapłacimy za nie 115,52 zl. 2 f
0-l:^Wk^
pkt j odp
Mając dane V. 0.1 8, .4. = 0.75, x = 100 usta! czy:
a) Ś D=85
b) Me=95.5
ty. D* H3.5
d) Ś."' .większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza pozioi średniego
1
1
FTTfi
M
X.
1 T"
}
EGZAMIN- STATYSTYKA 24.01.2003r
ZAD 1. Dysponując ciągiem obserwacji empirycznej określającej liczbę błędów popełnianych przez studentów w teście egzaminacyjnym w postaci szeregu 10,12, 8,7,4,12,11, 10,10,8 ustal czy: . ŚŚ -
f!ga) polowa studentów popełniła co najmniej 10 błędów ~< M.ł 1 ekt; ."-f eJ b) najczęściej popełniono 12 błędów * Ś ^ .." :-lpkt
' c) względny poziom zmienności można ocenić na 10% lpkt
ib łih błdó ó jt 10
* L. / ' Ś "-C" T----j r----
. - d) średnia liczba popełnionych błędów równa jest 10
lpkt
ZAD 2. Mając dane Vz=0S, As=0,75, x=100 Ustal czy: . 3 a) D=85 U* (M< t
otl. Me b) Me=95,5 + &fc łrGM? Um'ć c) D= 113,5 (,v-t" IM-t k^k* > d) Większa część jednostek statystycznych stanowiących analizowaną zbiorowość nie przekracza poziomu średniego : i lpkt łdk, ^OK .f*m.
ZAD 3. Dysponując szeregiem przedstawiającym liczbę wypalanych dziennie papierosów przez pracowników szpitala:
X Ni
0-6 10
6-12 | 12
12-18 18
18-24 8
24-30 2
X
Oceiuć czy prawdąjest:
a) średnia liczba wypalanych papierosów równa jest 15
b) nąj większa liczba pracowników wypalała dziennie 15 papierosów
c) połową praccu-ników wypalała nie ŚAięcej niż 13 papierosów ( d) 25% pracowników wypalała nie więcej niż 7,5 papierosa
lpkt uxe
lpkt oj^
IM \a\C
lokt 4/51/,
UtfC
ZAD 4. Rozkład v.iełru 100 losowo wybranych pcsiów ostairiej kadencji przedstawia- iię iłastępującu: pcuiżcj 29 latnuało 2 posłów, od 30 do 39 iat miało 20 postów, od 40-49 lat to wiek 46 posłów, od 50-59 lat to 26 postów i wiek 60 lat r
przekroczyło 6 posłów. Czy: _ k '
M \- a) średni wiek posła to 45 lat y' 2pkt tut
oH ''' b) połowa posłów nie przekroczyła 46 lat /: 2pkt taki
oi. S c) najliczniejsza grupę stanowią posłowie w wieku ok.441aL 2pkt Mł^
ukifjd) rozkład wieku posłów jest umiarkowanie lewostronnie asymetryczny lokt
&i
ZAD 5. Celem ustalenia zależności pomiędzy liczbą braków a wielkością produkcji wybranego produktu zbadano losowo 6
zakładów produkcyjnych o takim samym zakresie produkcji i otrzymano dane:
wielkość produkcji (w tys. szt) CechaX: 1,4, 5, 6, 7, 9
liczba braków (w szt.) Cecha Y: 10, 30,40,50, 50, 60
Czy na tej podstawie można stwierdzić: < <%j a) korelacja pomiędzy wielkością produkcji a liczbą barków jest duża i wynosi 0,9818 2pkt
d b) zmienność liczby braków jest w 96,4% wyjaśniona zmiennością wielkości produkcji lpkt
,. to c) w zakładzie prod. 10 rys. sztuk poziom braków będzie równy 70 szt 2pkt
,uU d) gdy produkcji wzrośnie w wybranym zakładzie o ltys. szt to poziom braków wzrośnie o 10 szt lpkt
łok,
SqM.
ZAD. 6. W grupie 50 rodzin konsumenckich przeprowadzono badanie statystyczne dotyczące średnich miesięcznych wydatków na przybory szkolne i liczby dzieci w rodzinie. Ustalono, że kowariancja pomiędzy zmiennymi jest równa 1,3 wariancja wydatków je<ś równa 4 i wariancja liczby dzieci w rodzinie-równa 1 a wartości średnie wydatków na przybory szkolne (w umownych jednostkach pieniężnych) i liczby dzieci są odpowiednio równe 10 i 2. Czy: Ol a) liniowa deteminancja zmienności wydatkówna artykuły szkolne względem zróżnicowania liczby dzieci jest równa
65,0% 2pki uJl ^J
względny poziom zróżnicowania wydatków na przybory szkokie jest większy niż liczby dzieci w rodzinie 1 pkt WŁ
korelacja porrjedzy wydatkami i liczba dzieci ma dodatni kierunek 1 pkt
wspólcz\Tuuk regresji jest równy 0,52 2pkt ,,,aL
b)
ZAD 7. Prosta regresji opisująca zależność wydatkówna żywność przeciętnej rodziny czteroosobowej (Y w tys. PLN ) i dochodu w tej rodzinie X w rys. PLN) ma po:3ać y=0,l lx + 0,708 Czy prawdą jest te: stAOso a) jeśli dochód) ^zrosną o 1 tys. PLN, to wydatki na żywność wzrosną o 110 PLN 1 eta
b) jeśli dochód) wzrosną o 1 rys. PLN. to wydatki wzrosną o 11% 1 r-jg
Przy tirchodach rówaych 5 tys. PLN. Wydatki będą równe 1.258 tys. PLN. 2:kt
Wydatki na r>vo
50
d)
w l i % zależą cd dochodów w rodzinie
ZAD 8. W roku Akademickim 1999/200 na II roku Wydziału Zarządzania AE w"Katowicach byio 500 studentów w tym 220 mężczyzn. Czy:
a) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie istotna lpkt ^i.,-e"
b) zależność pomiędzy wynikiem sesji a płcią studenta jest statystycznie nieistotna lpkt hjA/' wlw'/c) współczynnik korelacji pomiędzy analizowanymi cechami jest równy 0,55 2pkt y^Z
V* d) uyn i k sesji w 4% zależy odpici ipkt 'rtJC
%
ZAD. 9. Średniowieczne tempo wzrostu spożycia wyrobów cytoniowych jest równe 2,5%. Jeśli dziś kupujemy 300 paczek
papierosów to za 3 lata będziemy kupować ich:
- k f Ł~* \ J # h
b) 292,55 paczek lpkt /T
ZAD 10. Indeksy łańcuchowe zakupu środków piorących są dla kolejnych tygodni odpowiednio równe: 105%), 110%, 108%, lf|7%. Czv średnie tempo zmian zakupu środków piorących było równe: 1^0 /j\a) średnie tempo zmian zakupu środków piorących byio równe 7,48% 2pkt
' b) pomiędzy druaim a czwartym okresem nastąpD wprost zakupu środków piorących o 3% 2pkt lfr c) pomiędzy trzecim a piątym okresem nastąpił spać;k zakupów o 3% 2pkt u^e. U,uż ŚL d) jeśii w ostatnim okresie obserwacji zakupiono środki piorące za lOOzl to za dwa tygodnie zapłacimy za nie 115 57
2pkt Ś
ZAD 11. Na postawie informacji o rocznym poziomie spoż"; cia art. wędliniarskich w rodzime czteroosobowej oraz na poziomie cen tych artvkulów w latach 1999/2001 wyznaczono odpowiednie mierniki agregatowe: I = 1.207: I = 1.204: 1=0,938: 1=0.935 Czy prawdąjes, że: \ ___,Yp\
"3 M i) łączna wartość spożycia wymienionych artykułów wzrosła o 20,7% j_gkt \x(& Ua/V>/ , ) -- ~?
b) nastąpi! wzrost cen artykułów wędliniarskich o ok. 20.5% lpkt ł(jj/, rG/kl ' ^
spożycie wybranych artykułów wzrosło ok. 72% ipkt ^vL iyo<-?
przy zaiożer.iu siałego poziomu spożycia w robi 1999 zmiana cen sowoduje wzrost wartości o 20.7% lpkt \(\/\
Z_\I 12. W tirmie Handlowej MARGO obroty ze sprzedaż wybranych artyl ułów przedstawiały się następująco: w marcu 21 k.)2 wartość sprzedanych wyrobów tytoniowych 200 tvs. w maju 2002 180 tys. zł dla art. Spożywczych odpowiednie kwot\ były równe 40O i 450 i\s. zł a dla kosmetycznych i00 i 110 tys. zi. Firma wprowadziła promocyjne ceny na wymienione art. obrażające je oiipowś ;_Irio ?%, 2% i 6%. w maju "v stosunku do marca
a) czy obniż!;-'i jen spowodowała zwiększene obrotów jlnny V' 2okt -i
b) czy w ogólnym stopniu ceny an. spadar. o j% / 2ri?
c) czy wpływ zmianv ceny byl silniejszy na zmianę wartości obrotów niż wpływ zmiany wielkości sprzedaży 2okt
d) czy ogólnie obroty firmy MARGO spadły o 5 % .....,._.."..,. ...... ................. Tokt
-}'
~3v*~
. I K
Ł Ś
J1 Ś ~Jf
I ip
o,
Xi
XO; I ' 4 O
s Q i
1
-- z
L?fe_
i
ó
tt ó 5
3
'5,5
X
w r
i.
9 05
_
%
6 Cr) -
fll*
//1/--UJ i ( *-
6 50
i-
>
- - -Z,
6
01-
5 LlAA.i
x
01
fu*.
Jl-
s,
\
i -
4
_.---Ł
J?
NUU
10
zo
C0<
. * i,
i
x 5 o
Ą U>
O
C*/
6
1/
t
! o, i /OD i " .""i..... c i ^ J zza
T ^ 1 210
I M.O
ioo .
-r
^
= /"
ff
100 h{0l6)
i\0
\a
230- 090
[\OQOX>
JL^
7
fjp,
100.070
p
7
?
T
V
>
-
Wyszukiwarka
Podobne podstrony:
Wnioskowanie statystyczne estymacja zadania przykładowe
Przykładowe zadanie statystyka matematyczna
przykladowe zadania redoks
scilab przykładowe zadania
na egzamin przykladowe zadania
przykladowe zadania z kinetyki
1696 przykladowe zadania na,rok 12
więcej podobnych podstron