2009-03-17
1
Wykład 4
Rozkład normalny
i standaryzacja zmiennych
Marcin Kocór
WSE, Kraków 2008/2009
Krótka notka historyczna
Stosowane nazwy
• rozkład normalny
• krzywa Gaussa / Gaussa-Laplace’a
• krzywa dzwonowa
Postacie dramatu
• Abraham de Moivre, The Doctrine of Chances (1738) – rozkład normalny
jako przybliżenie rozkładu dwumianowego dla dużych n
• Piotr-Szymon markiz de Laplace – teoria błędów pomiarowych
• Karol Fryderyk Gauss – pomiary geodezyjne w Królestwie Hanoweru
(1818)
2009-03-17
2
Rozkład normalny jako
granica rozkładu dwumianowego
0
1
1/2
1/2
00
01
10
11
1/4
2/4
1/4
000
001
010
100
011
101
110
111
1/8
3/8
3/8
1/8
0
1
0
1/2
1
0
1/3
2/3
1
n=1
n=3
n=2
p=1/2
5
=1/32≈0,031
p=1/2
10
=1/1024
≈0,001
p=1/2
20
=1/1048576
≈0,000001
Krzywa rozkładu normalnego
2
2
2
)
(
2
1
x
e
x
P
Rozkład normalny ma 2 parametry:
• średnią μ
• odchylenie standardowe σ
W rozkładzie występują 2 stałe:
• liczba Pi
π=3,14159…
• liczba Eulera
e=2,17828…
Dystrybuanta
rozkładu
normalnego
2009-03-17
3
Rozkłady normalne
Rozkłady normalne różnią się średnią i odchyleniem standardowym.
Wikipedia
Właściwości rozkładu normalnego
• symetria
• jednomodalnośd
• średnia = mediana = modalna
• μ+σ
i
μ-σ
stanowią
punkty przegięcia
rozkładu
• zmienna może przyjmowad
dowolnie małe/duże wartości
μ+σ
μ–σ
μ
2009-03-17
4
Powierzchnie pod krzywą
μ+1,96σ
μ–1,96σ
μ
95%
μ–2,58σ
μ–2,58σ
99%
Przypadki
odstające
Przypadki
odstające
cała
powierzchnia
pod krzywą
=100%
Rozkład teoretyczny a rozkłady empiryczne
http://www.shodor.org/interactivate/activities/NormalDistribution/
Zmienne będące wypadkową niezależnych oddziaływao losowych mają
rozkład zbliżony do normalnego.
2009-03-17
5
Standaryzacja zmiennej
Przekształcenie zmiennej do takiej postaci,
by jej
średnia była równa 0
,
a
odchylenie standardowe
(i wariancja)
równe 1
.
x
z
x
z
1
lub
Jaka jest jednostka miary dla zmiennej standaryzowanej?
to sprowadza średnią z do zera
to sprowadza odchylenie standardowe do jedności
Jak to osiągnąd?
Standaryzacja zmiennej: przykład
Test ze statystyki:
x
z
4
6
7
8
9
10
11
12
13
14
16
17
18
19
20
3
4
6
7
8
9
10
11
12
13
14
16
17
19
7
9
10
11
12
13
14
16
11
12
13
14
16
12
13
12
12
15
15
15
15
4
5
6
7
8
9
10
11
12
13
14
16
17
18
19
20
0
1
2
3
15
1
2
3
4
5
6
7
μ=12
σ=4
-8
-7
-6
-5
-4
-3
-2
-1
0
1
2
4
5
6
7
8
-12
-11
-10
-9
-8
-6
-5
-4
-3
-2
-1
0
1
2
4
5
6
7
8
-9
-8
-6
-5
-4
-3
-2
-1
0
1
2
4
5
7
-5
-3
-2
-1
0
1
2
4
-1
0
1
2
4
0
1
0
0
3
3
3
3
3
-2
-1,75 -1,5 -1,25
-1
-0,75 -0,5 -0,25
0
0,25
0,5
1
1,25
1,5
1,75
2
-3
-2,75 -2,5 -2,25
-2
-1,5 -1,25
-1
-0,75 -0,5 -0,25
0
0,25
0,5
1
1,25
1,5
1,75
2
-2,25
-2
-1,5 -1,25
-1
-0,75 -0,5 -0,25
0
0,25
0,5
1
1,25
1,75
-1,25
-0,75 -0,5 -0,25
0
0,25
0,5
1
-0,25
0
0,25
0,5
1
0
0,25
0
0
0,75
0,75
0,75
0,75
0,75
wyniki surowe
odchylenia od średniej
wyniki standaryzowane
–
12
=
0
–
12
=
4
÷
4
=
0
÷
4
=
1
μ
μ
+
σ
μ
–
σ
μ=0
σ=4
μ=0
σ=1
2009-03-17
6
Powierzchnie pod krzywą
μ+1,96σ
μ–1,96σ
μ
95%
μ–2,58σ
μ–2,58σ
99%
Przypadki
odstające
Przypadki
odstające
cała
powierzchnia
pod krzywą
=100%
1,96
-1,96
2,58
-2,58
0
Po standaryzacji:
μ=0
σ=1
Tabela
rozkładu
normalnego
(
standaryzowanego)
0
1,96
47,5%
2009-03-17
7
Przykład
zastosowania
Jaki procent populacji
ma wzrost
powyżej 2m?
0
3
49,87%
Wzrost:
μ=170cm
σ=10cm
3
10
170
200
z
0,13%
Przykład
zastosowania
Jaki procent populacji
jest w przedziale
185-190cm?
0
1,5
43,32%
Wzrost:
μ=170cm
σ=10cm
5
,
1
10
170
185
1
z
4,4%
2
10
170
190
2
z
2
47,72%
2009-03-17
8
Przykład
zastosowania
Jaki jest wzrost 20%
najbardziej typowych
jednostek?
0
0,25
10%
Wzrost:
μ=170cm
σ=10cm
5
,
167
10
25
,
0
170
1
x
-0,25
10%
20%
5
,
172
10
25
,
0
170
2
x
Przykład
zastosowania
Jaki jest wzrost 20%
jednostek najniższych?
0
0,84
30%
Wzrost:
μ=170cm
σ=10cm
6
,
161
10
84
,
0
170
x
-0,84
20%
20%
2009-03-17
9
Przypadki odstające (dowolny rozkład)
1
1
Pr
2
w
w
z
Nierówność Czebyszewa
obustronna
(w>0)
2
1
Pr
w
w
z
Nierówność Cantellego
jednostronna
(w>0)
%
25
4
1
2
Pr
z
%
20
5
1
2
Pr
z