Wrocław, 6 maja 2010
Lista zadań i poleceń nr 1
Statystyka Matematyczna
II rok Technologii Żywności i Żywienia (semestr IV, studia stacjonarne 1-go stopnia)
Zadania dotyczące statystyki opisowej
I. W celu określenia stopnia przepustowości WZG (Woj. Zakłady Gastronomiczne), wylosowano w
pewnym miesiącu letnim 1980 r. na obszarze Woj. Dolnośląskiego 30 zakładów gastronomicznych,
otrzymując m. in. dane o liczbie miejsc konsumpcyjnych:
lp.
1 2 3 4 5 6 7 8 9 10
11
12
13
14
15
miejsce_kons 70 67 81 83 57 62 78
67
52 52
65 72
74 64 56
lp.
16 17 18 19 20 21 22
23
24 25
26 27
28 29 30
miejsce_kons 75 74 96 68 70 68 91
77
85 63
71 80
54 99 61
.
Dla tych danych dokonaj analizy statystycznej poprzez elementy statystyki opisowej:
a) dokonaj graficznej prezentacji materiału empirycznego poprzez:
1.histogram częstości
- wg algorytmu podanego na wykładzie i w materiałach dydaktycznych
- przyjmując przedział zmienności [50 ; 100] i jednakową rozpiętość przedziałów
klasowych równą 10.
2. wykres pudełkowy w oparciu o statystyki pozycyjne(rangowe)
b) zbierz wyniki i podaj ich interpretację
c) Sformułuj wnioski i zaproponuj hipotezy robocze będące
przedmiotem dalszego wnioskowania statystycznego
II.
OPIS EKSPERYMENTU
Dwie grupy studentów oceniało masę dwóch różnych buł agatowych nie posługując się żadnymi
przyrządami(minerały pochodziły ze złóż melafirów Dolnego Śląska). Pierwsza grupa szacowała agat
małej wielkości(zmienna exp1_190), a druga grupa miała do dyspozycji agat znacznie większy
(zmienna exp2_950). Rzeczywiste masy agatów (mały - 190g, duży - 950g) zostały podane do
wiadomości uczestników eksperymentu na końcu. Celem analizy statystycznej jest wykazanie czy
wielkość badanego obiektu wpływa na wielkość popełnionych błędów (zmienne: exp1_bwzgl (wg
wzoru (exp1_190 - 190)/190 ), exp2_bwzgl ( wg wzoru (exp2_950 - 950)/950 )).
Dane eksperymentalne są zaprezentowane na stronie następnej poniżej:
Dla tych danych (zmienne 5 i 6) dokonaj analizy porównawczej poprzez elementy statystyki opisowej:
• dokonaj graficznej prezentacji materiału empirycznego, tj.:
- histogramy częstości wraz z łamanymi częstości w jednym układzie współrzędnych i dla tej
samej liczby klas (k=5) i wspólnego obszaru zmienności
- wykresy pudełkowe zbudowane w oparciu o statystyki momentowe w jednym układzie
współrzędnych
- wykresy pudełkowe zbudowane w oparciu o statystyki rangowe w jednym układzie
współrzędnych
• wyznacz podstawowe charakterystyki liczbowe z podziałem jakościowym na trzy grup miar
• zbierz wyniki i podaj ich interpretację.
Dane eksperymentalne
1
exp1_190
2
exp2_950
3
exp1_190bbez
4
exp2_950bbez
5
exp1_bwzgl
6
exp2_bwzgl
7
lp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
20
410
-170
-540
-0,8947
-0,5684
1
25
420
-165
-530
-0,8684
-0,5579
2
35
610
-155
-340
-0,8158
-0,3579
3
45
620
-145
-330
-0,7632
-0,3474
4
50
640
-140
-310
-0,7368
-0,3263
5
65
670
-125
-280
-0,6579
-0,2947
6
65
750
-125
-200
-0,6579
-0,2105
7
65
850
-125
-100
-0,6579
-0,1053
8
65
850
-125
-100
-0,6579
-0,1053
9
65
870
-125
-80
-0,6579
-0,0842
10
75
880
-115
-70
-0,6053
-0,0737
11
95
910
-95
-40
-0,5000
-0,0421
12
115
930
-75
-20
-0,3947
-0,0211
13
120
940
-70
-10
-0,3684
-0,0105
14
120
950
-70
0
-0,3684
0,0000
15
130
980
-60
30
-0,3158
0,0316
16
130
980
-60
30
-0,3158
0,0316
17
135
1050
-55
100
-0,2895
0,1053
18
155
1060
-35
110
-0,1842
0,1158
19
155
1120
-35
170
-0,1842
0,1789
20
185
1130
-5
180
-0,0263
0,1895
21
185
1200
-5
250
-0,0263
0,2632
22
195
1250
5
300
0,0263
0,3158
23
210
1250
20
300
0,1053
0,3158
24
1260
310
0,3263
25
1400
450
0,4737
26
1450
500
0,5263
27
1500
550
0,5789
28
1720
770
0,8105
29
Dla której zmiennej empiryczny rozkład prawdopodobieństwa wykazuje
największe podobieństwo do rozkładu normalnego(wsp. asymetrii A
P
=0,
kurtoza K=3)? (odpowiedź uzasadnij)
Sformułuj wnioski i zaproponuj hipotezy robocze będące przedmiotem
dalszego wnioskowania statystycznego
TEST 1a.
Jeżeli funkcja gęstości rozkładu prawdopodobieństwa zmiennej losowej X wyraża się
wzorem:
2
)
2
(
2
2
1
)
(
+
−
=
x
e
x
f
π
, to wartość oczekiwana E(X) i wariancja Var(X) są równe wg podanego
wariantu:
wariant
a b c d e f
E(X)
0 1 -2 -2 1 -2
Var(X)
1 0.5 1 0.5 1
π
ZADANIE 1a.
W oparciu o następujące dane eksperymentalne dotyczące cechy typu ciągłego
0.5, 1, 3, 2.5, 2, 7, 7.5, 6, 8, 4.5, 5.5, 4.5, 5, 7, 7.5, 7
.
1. Sporządź histogram częstości wraz z łamaną i zaznacz wartość modalną, średnią i medianę.
2. Na tle histogramu sporządź wykres pudełkowy, opisz go i podaj frakcję obserwacji która wpada do
przedziału typowych wartości: [Me-0.5Q ; Me+0.5Q], gdzie Me oznacz medianę a Q rozstęp
kwartylowy.
3. Oceń typ asymetrii danej próby.
Pytania ogólne.:
1. Co to jest populacja generalna (jej zasadnicze atrybuty)?
2. Co to jest próba statystyczna i jakie powinna spełniać
podstawowe postulaty?
3. Jakie wyróżniamy typy cech? (określić charakter, skalę
zmienności, jednostki pomiarowe), Podać przykłady
4. Co to są tzw. Outliery , jak je rozpoznawać?
5. Co to są typowe przedziały zmienności?
6. Podać analogon współczynnika zmienności Pearsona(momentowy),
który wykorzystuje w próbie znaczenie mediany. Zinterpretować
ich sens.
7. Za pomocą jakich statystyk możemy określić podobieństwo rozkładu
empirycznego (z próby) z rozkładem normalnym?
Patrz np. pozycja:
Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach.
Część II. Statystyka matematyczna, Krysicki W., Bartos J., Dyczka W., Królikowska K.,
Wasilewski M., PWN, Warszawa, 1993, Wyd.III. strony 1-31
Zadania dotyczące klasycznego rachunku prawdopodobieństwa
1. Opanować podstawowe elementy kombinatoryki:
a) permutacje bez powtórzeń i z powtórzeniami
b) wariacje bez powtórzeń i z powtórzeniami
c) kombinacje bez powtórzeń i z powtórzeniami
☺
Zwrócić uwagę na rodzaj obiektów z matematycznego punktu widzenia (tj. podciągi, podzbiory)
i zastosowanie elementarnej kombinatoryki do konstrukcji przestrzeni Ω zdarzeń elementarnych ω
oraz obliczania mocy zbioru Ω.
Patrz np. pozycja:
Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach.
Część I. Rachunek prawdopodobieństwa, Krysicki W., Bartos J., Dyczka W., Królikowska K.,
Wasilewski M., PWN, Warszawa, 1993, Wyd.III. strony 32-34.
2. Zadania polecane do rozwiązania z powyższej pozycji:
Zad. 1.38. (Rozważamy doświadczenie D, polegające na obserwacji liczby i łącznej masy
pojazdów, znajdujących się w określonej chwili na moście……..)
Zad. 1.40; Zad. 1.43; 1.45; 1.47; 1.58; 1.63, 1.71
3. Niech prawdopodobieństwo tego, że statystyczny student nie jest przygotowany do ćwiczeń,
wynosi 1/3. prowadzący ćwiczenia wybiera 5 osób. Oznaczmy przez X liczbę osób, spośród
wybranych, które nie są przygotowane do ćwiczeń (osobę nieprzygotowaną możemy zakodować jako
1 (umownie sukces), a w przeciwnym wypadku jako 0 ).
a) Określ rozkład prawdopodobieństwa zmiennej losowej X
b) Wyznacz najbardziej prawdopodobną liczbę sukcesów, jeżeli losowo wybrana grupa z większej
podpopulacji liczy n=27 osób, następnie n=35 osób. Podaj rozwiązanie dla dowolnej wartości n.
4. Prom kursuje pomiędzy przystaniami A i B, znajdującymi się na dwu przeciwległych brzegach
rzeki i odległymi od siebie o k metrów. Wiadomo, że prawdopodobieństwo P(A) znajdowania się
promu na przystani A wynosi 0.1, a na przystani B, P(B) = 0.2. Ponadto prom jeździ ze stałą
szybkością, nie zatrzymuje się na rzece (poza przystaniami) i prawdopodobieństwo, tego że znajduje
się na rzece wynosi 0.7. Niech X oznacza odległość promu od przystani A.
a) znaleźć dystrybuantę F
X
zmiennej losowej X
b) obliczyć wartość oczekiwaną E(X), wariancję Var(X), medianę Me(X) oraz odległość
międzykwartylową d
Q
=(Q
3
-Q
1
)/2.
5. W pęku n podobnych kluczy jest tylko jeden klucz otwierający zamek. Niech p
k
oznacza
prawdopodobieństwo zdarzenia losowego A
k
, polegającego na tym, że otworzyliśmy zamek za
k-tym razem. Udowodnić, że P(A
k
)=1/n, zatem nie zależy od k.
6. Zbadać przebieg zmienności funkcji gęstości f(x) rozkładu normalnego N(μ,
σ) postaci
2
(
)
1
2
2
( )
2
x
f x
e
μ
σ
π σ
−
−
=
i podaj interpretację analityczną i probabilistyczną parametrów
μ i
σ
2
oraz przedziałów zmienności: (μ -
σ ; μ + σ) , (μ - 2σ ; μ + 2σ), (μ - 3σ ; μ + 3σ).
7. Wytrzymałość lin stalowych pochodzących z masowej produkcji jest zmienna losową X o
rozkładzie normalnym N(μ,
σ) = N(100MPa , 5MPa). Obliczyć:
a) ile przeciętnie lin spośród 1000 ma wytrzymałość mniejszą niż 90 MPa?
b) co która przeciętnie lina ma wytrzymałość mniejszą niż 90 MPa?
c) ile przeciętnie lin spośród 1000 ma wytrzymałość określoną przez przedział [Q
1
, Q
3
]; wyznacz go.
8. Na płaszczyźnie poprowadzono proste równoległe, w równej odległości 2a. Na płaszczyznę tę
rzucamy w sposób przypadkowy okrągłą monetę o promieniu r < a. Znaleźć prawdopodobieństwo
tego, że moneta nie spadnie na żadna prostą.
9. Dla jakiej wartości A następujące funkcje są gęstościami pewnych zmiennych losowych:
a)
2
( )
x
x
A
e
e
f x
−
+
=
b)
4
| | 1
0
| |
( )
A
dla x
x
dla x
f x
⎧
≥
⎪
⎨
⎪
1
<
⎩
=
10. Czas T bezawaryjnej pracy pewnego urządzenia ma rozkład wykładniczy z parametrem λ=5.
Obliczyć:
a) wartość przeciętną i wariancję bezawaryjnego czasu pracy urządzenia
b) medianę i odległość międzykwartylową
c) prawdopodobieństwo, że czas bezawaryjnej pracy urządzenia wyniesie co najmniej 5
jednostek czasowych zmiennej losowej T.
Opracował dr Andrzej Michalski