Mariusz Kaszubowski
Katedra Statystyki
Wydział Zarządzania i Ekonomii
Politechnika Gdańska
Statystyka – Mariusz Kaszubowski
Zmienna losowa i jej rozkład
Statystyka matematyczna
Statystyka – Mariusz Kaszubowski
Podstawowe pojęcia
•
Zmienna losowa (skokowa, ciągła)
•
Rozkład prawdopodobieństwa, dystrybuanta rozkładu dla zmiennej
skokowej i ciągłej, funkcja gęstości rozkładu zmiennej losowej
ciągłej
•
Wartość oczekiwana i wariancja zmiennej losowej skokowej i ciągłej
Statystyka – Mariusz Kaszubowski
Statystyka – Mariusz Kaszubowski
Rozkład teoretyczny punktowy
• rozkład teoretyczny punktowy tworzymy dla
zmiennej skokowej
Statystyka – Mariusz Kaszubowski
Rozkład teoretyczny przedziałowy
• rozkład teoretyczny przedziałowy tworzymy dla
zmiennej ciągłej
Statystyka – Mariusz Kaszubowski
Parametry rozkładów zmiennych
losowych skokowych
•
Wartość oczekiwana
•
Wariancja
(
)
i
i
i
m
E X
x p
µ
=
=
=
⋅
∑
(
)
i
i
p
P X
x
=
=
( )
(
)
( )
( )
(
)
2
2
2
2
2
i
i
i
E X
E X
D
X
x
m
p
σ
=
−
=
=
−
⋅
∑
( )
( )
•
Odchylenie standardowe
•
Współczynnik zmienności
( )
( )
2
2
D X
D
X
σ
σ
=
=
=
( )
( )
(
)
100%
100%
D X
V X
E X
m
σ
=
⋅
=
⋅
Statystyka – Mariusz Kaszubowski
Parametry rozkładów zmiennych
losowych ciągłych
•
Wartość oczekiwana
•
Wariancja
( )
( )
E X
x f x dx
m
∞
−∞
=
⋅
=
∫
( )
(
)
( )
(
)
( )
(
)
2
2
2
2
2
D
X
x
m
f x dx
E X
E X
σ
∞
−∞
=
−
⋅
=
−
=
∫
•
Odchylenie standardowe
•
Współczynnik zmienności
( )
( )
2
2
D X
D
X
σ
σ
=
=
=
( )
( )
(
)
100%
100%
D X
V X
E X
m
σ
=
⋅
=
⋅
Statystyka – Mariusz Kaszubowski
Zadanie 1
•
Dla zmiennej losowej przedstawiającej liczbę bramek strzelonych w
poszczególnych meczach piłki nożnej w lidze Ekstraklasy rundy
jesiennej 2008/2009 przedstaw odpowiedni rozkład teoretyczny tej
zmiennej oraz oblicz parametry rozkładu (wartość oczekiwaną,
wariancję oraz współczynnik zmienności).
•
Plik o nazwie „ekstraklasa runda jesienna ilość bramek w meczu”
•
Plik o nazwie „ekstraklasa runda jesienna ilość bramek w meczu”
Statystyka – Mariusz Kaszubowski
Rozwiązanie
Statystyka – Mariusz Kaszubowski
Zadanie 2
•
Dla zmiennej losowej przedstawiającej wyniki ankiet odnośnie
miesięcznych wydatków na środki pielęgnacyjne kobiet w wieku 20-
40 lat przedstaw odpowiedni rozkład teoretyczny tej zmiennej oraz
oblicz parametry rozkładu (wartość oczekiwaną, wariancję oraz
współczynnik zmienności).
•
Plik „miesięczne wydatki kobiet na waciki”
•
Plik „miesięczne wydatki kobiet na waciki”
Statystyka – Mariusz Kaszubowski
Rozwiązanie
Statystyka – Mariusz Kaszubowski
Rozkłady zmiennych losowych
•
skokowych
– zero-jedynkowy
– dwumianowy Bernoulliego
– Poissona
– hipergeometryczny
•
ciągłych
– jednostajny
– normalny Gaussa
– chi kwadrat Abbego
– Studenta
Statystyka – Mariusz Kaszubowski
Rozkład Bernoulliego
Statystyka – Mariusz Kaszubowski
Zadanie 1
W pomieszczeniu sypialnym domownicy zlokalizowali 10
osobników Culex pipiens (komary). Zastosowano środek
owadobójczy o skuteczności 90%. Niech zmienną losową będzie
ilość owadów, które przeżyły po zastosowaniu w pomieszczeniu
preparatu. Określ parametry rozkładu tej zmiennej losowej oraz
oblicz następujące prawdopodobieństwa zdarzeń:
oblicz następujące prawdopodobieństwa zdarzeń:
a)
ż
aden owad nie przeżyje
b)
wszystkie owady przeżyją
c)
dokładnie jeden owad przeżyje
d)
co najwyżej 3 owady przeżyją
e)
co najmniej 2 owady przeżyją
Statystyka – Mariusz Kaszubowski
Rozwiązanie
Statystyka – Mariusz Kaszubowski
Rozkład Poissona
Statystyka – Mariusz Kaszubowski
Przykład
W pewnej firmie po analizie danych historycznych stwierdzono, że w
procesie produkcyjnym występują dziennie, średnio 3,84 wadliwe
produkty. Jakie jest prawdopodobieństwo, że losowo wybranych
dniu liczba wadliwych produktów wyniesie 5?
Statystyka – Mariusz Kaszubowski
Rozkład geometryczny
Statystyka – Mariusz Kaszubowski
Przykład
Prawdopodobieństwo znalezienia wadliwego produktu wynosi 0,01.
Oblicz prawdopodobieństwo, że podczas kontroli dopiero 70-ta
sprawdzona sztuka będzie wadliwa oraz prawdopodobieństwo, że
musi być sprawdzone ponad 50 sztuk by wykryć pierwszą wadliwą
sztukę.
sztukę.
Statystyka – Mariusz Kaszubowski
Rozkład normalny
•
Przykłady zmiennych charakteryzujące się rozkładem normalnym
– wzrost
– waga
– poziom IQ
– temperatura ciała
– średnia roczna temperatura
– średnia roczna temperatura
•
Przykłady zmiennych, których rozkład nie jest normalny
– prędkość wiatru
– długość ciąży kobiet
– długość dzioba zięby afrykańskiej
– dobowa temperatura w okresie zimowym
Statystyka – Mariusz Kaszubowski
Rozkład normalny
Statystyka – Mariusz Kaszubowski
Rozkład normalny standardowy
Statystyka – Mariusz Kaszubowski
Rozkład normalny
Statystyka – Mariusz Kaszubowski
Zadanie 2
Ciężar jajek dostarczanych do skupu ma rozkład normalny ze
ś
rednią 2 dag i wariancją 0,1. Jajko kwalifikuję się do odpowiedniej
klasy w zależności od masy co przedstawia poniższe zestawienie:
klasa S
masa <= 1,5 dag
klasa S
masa <= 1,5 dag
klasa M
1,5 dag < masa <= 2,1 dag
klasa L
2,1 dag< masa <= 2,7 dag
klasa XL
masa > 2,7 dag
Określ parametry rozkładu oraz odpowiedz jaki procent jajek
dostarczonych do skupu to jajka klasy a) S, b) M, c) L, d) XL.
Statystyka – Mariusz Kaszubowski
Rozwiązanie
Statistica 8.0 – statystyka - kalkulator prawdopodobieństw
Statystyka – Mariusz Kaszubowski
Zadanie 3
Wzrost dzieci w pewnej grupie przedszkolnej jest zmienną losową
o rozkładzie normalnym o wartości średniej 105 cm i wariancji
400. Określ parametry rozkładu oraz odpowiedz na następujące
pytania.
Jaki procent dzieci to te wzroście:
a)
mniejszym niż 92 cm
b)
większym niż 120 cm
c)
większym niż 100 cm ale mniejszym niż 115 cm
Statystyka – Mariusz Kaszubowski
Rozwiązanie
Statystyka – Mariusz Kaszubowski
Zadanie 4
Pewne urządzenie produkuje kostki masła. Zakładamy, że masa
wyprodukowanego produktu ma rozkład normalny o średniej 250 g
i odchyleniu standardowym 5g. Prawdopodobieństwo tego, że
kostka masła przekroczy masę M wynosi 0,05 zaś będzie poniżej
masy m wynosi 0,13. Oblicz masy M, m.
M = 258,22426
m = 244,36804
Statystyka – Mariusz Kaszubowski
Rozkład wykładniczy
Statystyka – Mariusz Kaszubowski
Przykład
Linia produkcyjna średnio 2 razy wciągu miesiąca jest zatrzymywana z
powodu awarii. Oblicz prawdopodobieństwo, że linia produkcyjna
zostanie zatrzymana ponownie:
a)
później niż 15 miesięcy
b)
wcześniej niż 20 miesięcy
c)
zatrzymana będzie nie wcześniej niż za 10 i nie później niż za 15
miesięcy
miesięcy
Statystyka – Mariusz Kaszubowski