Statystyka wyklad 4


Zmienna losowa ciągła
" przyjmuje wartości z nieskończonego i nieprzeliczalnego zbioru;
" nie można stwierdzić, że przyjmuje konkretną wartość, a jedynie, że przyjmuje wartości
z dowolnie małego przedziału "x ;
" funkcja gęstości prawdopodobieństwa
P(x < X < x + "x)
f (x) = lim
"x0
"x
własności f.g.p.
- f (x) > 0
b
- f (x)dx = P(a < X < b) dla a+"
a
"
- f (x)dx = P(- " < X < ") = 1
+"
-"
a
- P(X = a) = P(a < X d" a) = f (x)dx = 0
+"
a
- P(a d" X d" b) = P(a d" X < b) = P(a < X d" b) = P(a < X < b)
Statystyka w. 4 M. Osińska 1
" dystrybuanta zmiennej losowej ciągłej
x
F(x) = f (t)dt
+"
-"
gdzie f (t) funkcja gęstości zmiennej losowej X
własność:
P(a < X < b) = F(b)- F(a)
Charakterystyki (parametry) rozkładu
- wartość oczekiwana
"
E(X ) = xf (x)dx
+"
-"
- wariancja
"
D2(X ) = E[X - E(X )]2 = - E(X )]2 f (x)dx
+"[x
-"
Statystyka w. 4 M. Osińska 2
Rozkłady zmiennych losowych ciągłych
Rozkład normalny Gaussa
" przy nieograniczonym wzroście liczby niezależnych doświadczeń statystycznych,
wszystkie znane teoretyczne rozkłady zmiennych losowych ciągłych i skokowych są
szybko zbieżne do rozkładu normalnego;
" w statystycznym wnioskowaniu o parametrach i rozkładach w populacjach
generalnych na podstawie wyników badań prób losowych popełniane są błędy
przypadkowe, których rozkład jest normalny lub granicznie normalny. Na podstawie tej
prawidłowości, skonstruowane zostały wszystkie metody estymacji parametrów oraz
metody weryfikacji hipotez;
Statystyka w. 4 M. Osińska 3
Funkcja gęstości prawdopodobieństwa r. n.
-( X -M )2
1 2
2
f (x) = e ,
 2Ą
gdzie: M = E(X ) oznacza wartość oczekiwaną zmiennej ciągłej X, f(x) jest funkcją gęstości
prawdopodobieństwa, a  =  (X ) oznacza odchylenie standardowe zmiennej ciągłej.
Zapis N(M , ).
Gęstość rozkładu normalnego przy różnej dyspersji
Statystyka w. 4 M. Osińska 4
Do obliczeń wykorzystujemy zmienną standaryzowaną:
X - M
z = ,

gdzie z oznacza zmienną standaryzowaną. Dlaczego?
Zapis N(0,1)
Funkcja gęstości prawdopodobieństwa i dystrybuanta rozkładu normalnego
Statystyka w. 4 M. Osińska 5
Krzywa normalna ma jedno maksimum, które jest zarazem wartością oczekiwaną, medianą i
dominantą. W środku przedziału od M - do M + funkcja jest wypukła, natomiast na
zewnątrz tego przedziału jest wklęsła. Posiada dwa punkty przegięcia o współrzędnych:
M + i M - .
Reguła trzech sigm
Statystyka w. 4 M. Osińska 6
Rozkład normalny posiada następujące własności:
P(M -  < X < M +  ) = 0,6826,
P(M - 2 < X < M + 2 ) = 0,9545,
P(M - 3 < X < M + 3 ) = 0,9973.
Opisują one stopień skupienia się zmiennej losowej wokół średniej.
Rozkład logarytmiczno-normalny
Za pomocą rozkładu logarytmiczno-normalnego możemy scharakteryzować jedynie
zmienne przyjmujące wartości dodatnie (dlaczego?), a takich w ekonomii jest większość,
np. płace, dochody, oszczędności.
Statystyka w. 4 M. Osińska 7
Definicja
Jeżeli zmienna y przyjmuje wartości dodatnie, to logarytm naturalny tej zmiennej ma
rozkład normalny, a funkcja gęstości rozkładu zmiennej dana jest wzorem:
2
-(ln y-ln y )2 / 2
ln y
f (ln y) = (ln y 2Ą )-1e ,
gdzie:
ln y = E ln y,
2
 = E(ln y - ln y )2 ,
ln y
 = E(ln y - ln y )2 .
ln y
Powyższa funkcja gęstości wyznacza krzywą asymetryczną prawostronnie uzależnioną od
wartości oczekiwanej i wariancji logarytmu zmiennej y.
Statystyka w. 4 M. Osińska 8
Oznacza to, że wartość oczekiwana, dominanta oraz mediana nie pokrywają się i wynoszą
kolejno:
1
2
ln y + ln y
2
E( y) = = e ,
y
ln y
M ( y) = e ,
2
ln y -ln y
D(y) = e .
Zatem D(y) < M (y) < E(y).
2
Skośność rozkładu wzrasta ze wzrostem parametru  , jeśli natomiast wzrasta - krzywa
ulega spłaszczeniu.
Statystyka w. 4 M. Osińska 9
Funkcja gęstości prawdopodobieństwa i dystrybuanta rozkładu logarytmiczno-normalnego
Statystyka w. 4 M. Osińska 10
Rozkład t-Studenta Gosseta
W przypadku, gdy prowadzimy badania na małej próbie, czyli takiej, dla której liczba stopni
swobody jest mniejsza od 30, zastosowanie dystrybuanty rozkładu Gaussa powoduje
błędne oszacowanie przedziału ufności i poziomu ufności.
Definicja:
Jeżeli wartości x1, x2,..., xN zmiennej losowej X mają rozkład normalny, to dla N e" 2
wielkość
x - x0
t = ,
Sx
posiada rozkład t-Studenta o v stopniach swobody.
Statystyka w. 4 M. Osińska 11
Funkcja gęstości prawdopodobieństwa rozkładu t-Studenta:
v +1
ś# v+1
-
#
ś# ź#
2
2
# ś#
2
# #
ś#1+ t ź#
S(t, v) = ,
ś# ź#
v
vĄ # ś# # v #
ś# ź#
2
# #
gdzie v = N -1 jest liczbą stopni swobody, Sx oznacza niepewność standardową średniej
(x) i dana jest wzorem:
N
2
(xi - x)
"
Sx
i=1
(x) = Sx = = ,
N N(N -1)
natomiast (v) oznacza funkcję -Eulera, która dla v > 0 przyjmuje następującą postać:
"
(v) =
+"e-ssv-1ds .
0
Statystyka w. 4 M. Osińska 12
Dystrybuanta rozkładu t-Studenta:
x
F(x) =
+"S(t,v)dt .
-"
Przy liczbie stopni swobody równej 30 rozkład t-Studenta zbliżony jest do rozkładu
normalnego, a powyżej tej liczby można prowadząc badania korzystać z rozkładu
normalnego.
Funkcja gęstości prawdopodobieństwa i dystrybuanta rozkładu t-Studenta
Statystyka w. 4 M. Osińska 13
Statystyka w. 4 M. Osińska 14
Rozkład chi-kwadrat
Definicja
Jeżeli dane są niezależne zmienne losowe Xi i mają one rozkład normalny standaryzowany
N(0, 1), to zmienna
v
2
 = Xi2 , dla i = 1, 2, ..., v
"
i=1
ma rozkład chi-kwadrat o v stopniach swobody.
Funkcja gęstości prawdopodobieństwa:
1
ż#
xv / 2-1e-x / 2, x > 0;
#
f (x) =
#2v / 2(v / 2)
#0, x d" 0,
#
gdzie v"N,  oznacz funkcję Eulera. Dla v < 2 funkcja jest malejąca, natomiast gdy v > 2
funkcja posiada maksimum przy x = v  2. Dla dużych v funkcja zbliżona jest do rozkładu
normalnego. Dla x d" 0 rozkład ten nie istnieje.
Statystyka w. 4 M. Osińska 15
Gęstość prawdopodobieństwa rozkładu chi-kwadrat dla wybranych stopni swobody
Wartość średnia rozkładu 2 równa jest liczbie stopni swobody, natomiast wariancja równa
jest podwojonej liczbie stopni swobody. Rozkład ten ma szerokie zastosowanie w
statystyce, szczególnie jako miara uzyskanego wyniku. Im mniejsza jest wartość 2, tym
słuszniejszy jest wynik.
Statystyka w. 4 M. Osińska 16
Rozkład F - Fishera-Snedecora
Definicja
Gdy niezależne zmienne losowe Xi oraz Yi mają rozkład normalny standaryzowany N(0, 1) to
zmienna
u
1
Xi2
"
u
i=1
F =
v
1
"Y 2
i
v
i=1
ma rozkład F Fishera-Snedecora.
Funkcja gęstości prawdopodobieństwa przyjmuje postać:
0 dla x < 0
ż#
#
u + v
u
ś#
-1
#
u v
ś# ź#
#
2
x
fu,v (x) = 2
# #
#u 2v 2
" dla x e" 0,
u+v
#
u v
# ś## ś#
(ux + v)
ś# ź# ś# ź# 2
#
2 2
# # # #
#
gdzie u, v oznacza liczbę stopni swobody.
Statystyka w. 4 M. Osińska 17
Wykresy funkcji gęstości prawdopodobieństwa rozkładu F dla wybranych par stopni
swobody
Statystyka w. 4 M. Osińska 18


Wyszukiwarka

Podobne podstrony:
Statystyka wyklad 7
Statystyka wyklad4nowy
sdz statystyka wyklad 4
Statystyka wykłady
Statystyka wyklad5
Statystyka wyklad 8
Statystyka wyklad 3
Statystyka wyklad 9
Statystyka1st Wyklad2
Statystyka wyklad 6
Statystyka Wykłady
Statystyka1st Wyklad6 Regresja
20151012 MichalTrzesiok Statystyka wyklad2 miary statystyczne handout
sdz statystyka wyklad 3
Statystyka wyklady
Statystyka wykłady
Statystyka1st Wyklad1

więcej podobnych podstron