PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Zmienna losowa
Rozkłady zmiennych losowych
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Podstawowe pojęcia – PRZESTRZEŃ PROBABILISTYCZNA
Przestrzeń probabilistyczna składa się z trzech elementów:
1. Zbiór wyników doświadczenia losowego (przestrzeń zdarzeń elementarnych)
Ω
= {ω
1
, ω
2
, ω
3
, …, ω
n
}
2. Zbiór
S
– ciało (zbiór) zdarzeń losowych. Zdarzenia losowe są zbiorami zdarzeń
elementarnych (czyli podzbiorami zbioru Ω).
3. Funkcja
P
, nazywana zwykle prawdopodobieństwem, która zdarzeniom losowym
przypisuje liczby interpretowane zwykle jako prawdopodobieństwo.
Obiekty Ω, S i P muszą spełniać warunki, określone przez aksjomaty rachunku
prawdopodobieństwa (patrz wykład nr 1).
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Zmienna losowa
Funkcję, która każdemu zdarzeniu elementarnemu przyporządkowuje liczbę
rzeczywistą nazywamy ZMIENNĄ LOSOWĄ
Przy czym dla każdej liczby rzeczywistej r muszą być spełnione warunki:
{ω: X(ω) ≤ r }∈S
{ω: X(ω) < r }∈S
Oznacza to, że do zbioru zdarzeń losowych S muszą należeć wszystkie
zdarzenia typu „zmienna losowa X przyjęła wartość mniejszą lub równą r”
oraz „zmienna losowa X przyjęła wartość mniejszą niż r”.
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Przykład
Rozpatrzmy następującą przestrzeń probabilistyczną:
Ω = {a, b, c}
S={{a},{ b, c}, ∅, Ω}
P({a})= ½ P({b, c})= ½
oraz następujące funkcje X(ω) i Y(ω) określone na przestrzeni Ω:
X(a)=1 X(b)=2 X(c)=3
Y(a)=1 Y(b)=3 Y(c)=3
Czy funkcje X i Y są zmiennymi losowymi?
Sprawdźmy dla r=2. Zbiór, który wyznacza X(ω) ≤2 to zbiór {a, b}. Jak widać,
nie należy on do S. Funkcja X NIE JEST ZMIENNĄ LOSOWĄ
Natomiast Y JEST ZMIENNĄ LOSOWĄ, bo dla dowolnej wartości r, zbiorami,
które może wyznaczyć funkcja zdaniowa Y(ω)≤r mogą być jedynie zbiory: ∅,
gdy r < 1, {a}, gdy 1 ≤ r < 3 lub {a, b, c}=Ω, kiedy r ≥3 – a wszystkie te zbiory
należą do S.
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Dystrybuanta zmiennej losowej
Rozważmy eksperyment polegający na serii trzech rzutów rzetelną monetą.
Zmienna losowa X jest zdefiniowana jako „liczba wyrzuconych orłów”. Zmienna
ta może przyjąć wartości ze zbioru: {0, 1, 2, 3}
Prawdopodobieństwa uzyskania każdej z tych wartości wyznaczamy
korzystając z tzw. schematu Bernoulliego.
k
n
k
p
p
k
n
k
X
P
−
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
=
)
1
(
)
(
Prawdopodobieństwo uzyskania k sukcesów w serii n prób oblicza się ze
wzoru:
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
W naszym przykładzie mamy 3 próby. Jako „sukces” zdefiniujemy wyrzucenie
orła. Możemy zatem uzyskać od 0 do 3 orłów. Prawdopodobieństwa każdego z
tych wyników są następujące:
8
1
)
5
,
0
1
(
)
5
,
0
(
0
3
)
0
(
3
0
=
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
=
X
P
8
3
)
5
,
0
1
(
)
5
,
0
(
1
3
)
1
(
2
1
=
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
=
X
P
8
3
)
5
,
0
1
(
)
5
,
0
(
2
3
)
2
(
1
2
=
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
=
X
P
8
1
)
5
,
0
1
(
)
5
,
0
(
3
3
)
3
(
0
3
=
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
=
X
P
x
i
P(X=x
i
)
0
1/8
1
3/8
2
3/8
3
1/8
Rozkład prawdopodobieństwa
zmiennej losowej X
Dystrybuanta zmiennej losowej
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Dystrybuantę F
X
(r) zmiennej losowej X definiuje się jako funkcję, która
każdej liczbie rzeczywistej r przyporządkowuje prawdopodobieństwo
zdarzenia polegającego na tym, że zmienna losowa X przyjmie wartość nie
większą od r
F
X
(r) = P(X ≤ r)
x
i
P(X=x
i
)
P(X ≤ x
i
)
0
1/8
1/8
1
3/8
4/8
2
3/8
7/8
3
1/8
8/8
⎪
⎪
⎪
⎪
⎪
⎩
⎪⎪
⎪
⎪
⎪
⎨
⎧
≥
<
≤
<
≤
<
≤
<
=
3
1
3
2
8
7
2
1
8
4
1
0
8
1
0
0
)
(
r
dla
r
dla
r
dla
r
dla
r
dla
r
F
X
Dystrybuanta zmiennej losowej
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
⎪
⎪
⎪
⎪
⎪
⎩
⎪⎪
⎪
⎪
⎪
⎨
⎧
≥
<
≤
<
≤
<
≤
<
=
3
1
3
2
8
7
2
1
8
4
1
0
8
1
0
0
)
(
r
dla
r
dla
r
dla
r
dla
r
dla
r
F
X
r
F
x
(r)
Dystrybuanta zmiennej losowej
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Zmienna losowa skokowa
0
1
2
3
Wyobraźmy sobie prymitywną ruletkę,
która dzieli się na cztery przedziały.
Zdefiniowana jest przy tym zmienna
losowa X – liczba punktów uzyskanych
podczas gry.
Jeśli ruletka jest symetryczna – rozkład
prawdopodobieństwa zmiennej X będzie
następujący:
x
i
P(X=x
i
)
0
¼
1
¼
2
¼
3
¼
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
x
i
P(X=x
i
)
P(X ≤ x
i
)
0
1/4
1/4
1
1/4
2/4
2
1/4
3/4
3
1/4
4/4
r
F
x
(r)
1
2
3
Zmienna losowa skokowa
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
r
F
x
(r)
1
2
3
0
1
2
3
3,5
0,5
1,5
2,5
Zmienna losowa skokowa
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
r
F
x
(r)
1
2
3
0
1
2
3
3,5
0,5
1,5
2,5
Zmienna losowa skokowa
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
r
F
x
(r)
1
2
3
Zmienna losowa ciągła
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Funkcja gęstości prawdopodobieństwa
r
F
x
(r)
1
2
3
1
f(r)
r
4
1/4
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Funkcja gęstości prawdopodobieństwa
f(r)
r
1/4
Funkcja gęstości prawdopodobieństwa
- pokazuje, jak szybko zmienia się dystrybuanta (jest pochodną dystrybuanty)
- pole pod wykresem funkcji gęstości wynosi 1
Przedstawiony tu wykres to funkcja gęstości prawdopodobieństwa dla
rozkładu jednostajnego (równomiernego)
4
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład normalny
Jeśli na zewnątrz naszej ruletki umieścimy
magnes, wtedy kulka będzie się częściej
zatrzymywać w pobliżu magnesu.
Rozkład prawdopodobieństwa zmiennej
zdającej sprawę z miejsca zatrzymania się
kulki nie będzie już jednostajny…
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0
5
10
15
20
25
x
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład zwany rozkładem Gaussa-Laplace'a jest najczęściej
wykorzystywanym rozkładem zmiennej losowej ciągłej.
(
)
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
−
−
=
2
2
2
2
1
)
(
σ
µ
π
σ
x
e
x
f
Rozkład normalny
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład normalny
0
0,5
-4
-3
-2
-1
0
1
2
3
4
N(0,1)
N(3,1)
N(0,2)
N(3,2)
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład normalny
Funkcja gęstości w rozkładzie normalnym:
- jest symetryczna względem prostej x = µ
- w punkcie x = µ osiąga wartość maksymalną
- ramiona funkcji mają punkty przegięcia dla x = µ - σ
oraz x = µ + σ
- kształt funkcji gęstości zależy od wartości parametrów:
µ i σ. Parametr µ decyduje o przesunięciu krzywej,
natomiast parametr σ decyduje o „smukłości” krzywej.
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład normalny
-0,2
0
0,2
0,4
0,6
0,8
1
1,2
-4
-3
-2
-1
0
1
2
3
4
N (0,1)
N (3,1)
N (0,2)
N (3,2)
PODSTAWY WNIOSKOWANIA STATYSTYCZNEGO
Joanna Konieczna-Sałamatin
Rozkład normalny
Wartości dystrybuanty rozkładu normalnego standaryzowanego są
stablicowane. Tablice można znaleźć w dowolnym podręczniku do statystyki.
Są też w Internecie, np..
http://stat1.is.uw.edu.pl/statystyka