Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
1
Wykłady 4.c.d.
Funkcje charakterystyczne
wielowymiarowych zm. los
.,
średnia i wariancja z próby losowej w modelu normalnym, rozkłady
2
c.d.,
rozkłady t-Studenta, rozkłady F-Snedecora.
Funkcje charakterystyczne wielowymiarowych zmiennych losowych
W
poprzednim
wykładzie
mówiliśmy
jedynie
o
funkcjach
charakterystycznych jednowymiarowych zmiennych losowych. Obecnie
podamy definicję i podstawowe własności funkcji charakterystycznych w
przypadku wektorów losowych.
D e f i n i c j a . Funkcją charakterystyczną wektora losowego
n
R
:
X
nazywamy przekształcenie
C
R
:
n
X
, dane wzorem
n
X
,
t
i
X
R
t
,
Ee
)
t
(
,
gdzie X=(X
1
, X
2
, …, X
n
) oraz t=(t
1
, t
2
, …, t
n
), a symbol <·,·> oznacza euklidesowy
iloczyn skalarny.
Własności funkcji charakterystycznej wektora losowego X=(X
1
, X
2
, …, X
n
)
Niech X=(X
1
, X
2
, …, X
n
) będzie wektorem losowym, t=(t
1
, t
2
, …, t
n
)
n
R
. Wówczas funkcja charakterystyczna
n
2
1
X
t
,...,
t
,
t
ma
następujące własności:
i)
1
0
,...,
0
,
0
X
;
ii)
n
n
2
1
n
2
1
X
R
t
,...,
t
,
t
1
t
,...,
t
,
t
;
iii)
n
2
1
X
n
2
1
X
t
,...,
t
,
t
t
,...,
t
,
t
;
iv)
1
X
1
X
t
0
,...,
0
,
t
1
,
gdzie
1
X
t
1
,
to
funkcja
charakterystyczna zmiennej losowej X
1
.
Dowody w przypadkach i)- iii) są podobne do jednowymiarowych.
Własnośd iv) jest konsekwencją definicji. Mamy bowiem
1
X
X
it
X
,
t
i
1
X
t
Ee
Ee
0
,...,
0
,
t
1
1
1
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
2
Przytoczymy teraz twierdzenie, które wskazuje na związek niezależności
zmiennych losowych z iloczynem funkcji charakterystycznej.
T w i e r d z e n i e 4 . 1 ( O z w i ą z k u F . C h. z ni e za l eż no ś ci ą z mi e n ny ch )
Zmienne losowe X
1
, X
2
, …, X
n
są niezależne wtedy i tylko wtedy, gdy
n
X
2
X
1
X
n
2
1
X
,...,
X
,
X
t
...
t
t
t
,...,
t
,
t
n
2
1
n
2
1
. (*)
Dowód. Z niezależności zmiennych wynika już równośd (*). Wystarczy
skorzystad z faktu, że wartośd oczekiwana iloczynu zm. los.
n
,
,
2
,
1
i
,
e
i
i
X
it
jest iloczynem wartości oczekiwanych tych zmiennych.
Mamy więc
)
t
(
)
t
(
)
Ee
Ee
Ee
)
e
e
e
(
E
Ee
)
t
,
,
t
(
,
,
n
n
X
1
1
X
n
X
n
it
2
X
2
it
1
X
1
it
n
X
n
it
2
X
2
it
1
X
1
it
)
n
X
n
t
1
X
1
t
(
i
n
1
)
n
X
1
X
(
Dowód wynikania w przeciwną stronę pomijamy.
Twierdzenie jest ważne, ponieważ daje jeszcze jedną charakteryzację
niezależności zmiennych.
Próba losowa c.d.
Niech
n
2
1
X
,
,
X
,
X
będzie próbą losową prostą pochodzącą z
pewnego rozkładu (czasami nazywanego rozkładem
teoretycznym). W wykładzie występują tylko próby losowe
proste. Zatem przymiotnik prosta bardzo często pomijamy.
Przypominamy: Określenie próba losowa prosta oznacza, iż
tworzące ją zm. los. są niezależne i mają takie same rozkłady
jak ten rozkład , z którego pochodzi próba. Można założyd (i taki
założenie wprowadziliśmy), że zmienne tworzące próbę
określone są na tej samej przestrzeni probabilistycznej.
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
3
Modele normalne
Definicja. Mówimy, że model statystyczny jest normalny jeśli
wiadomo, że próba losowa pochodzi z rozkładu normalnego.
Najważniejsze Statystyki w modelu normalnym
Założenie. Niech
n
2
1
X
,
,
X
,
X
będzie próbą prostą pochodzącą z
rozkładu N(
,
).
a)
Rozkład średniej:
)
X
X
X
(
n
1
X
n
2
1
Wiemy, z poprzednich rozważao, że przy założeniach normalności
średnia arytmetyczna
n
1
i
i
X
n
1
X
ma rozkład normalny
)
n
,
(
N
Standaryzacja prowadzi więc do zmiennej
n
X
U
, która ma rozkład
)
1
,
0
(
N
.
Wykorzystaliśmy fakt, znany z rachunku prawdopodobieostwa, że
suma niezależnych zmiennych losowych o rozkładzie normalnym ma
rozkład normalny. Parametry rozkładu łatwo wyliczyd wykorzystując
własności wartości oczekiwanej i wariancji.
Rys.
(Por.J.Podgórski
.
Statystyka
dla studiów licencjackich.
PWE.2001str.170
).
Na rysunku
m =
)
X
(
E
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
4
b) Rozkład Chi-kwadrat z - stopniami swobody:
2
( ).
Przypominamy definicję i podstawowe własności
Definicja.
2
( ) jest to rozkład zmiennej losowej
k
1
i
2
i
X
Y
, gdzie
k
,
,
2
,
1
i
X
i
są niezależnymi zmiennymi losowymi o rozkładzie
N(0,1).
Stwierdzenia 4.1.
Rozkład
2
(k ) jest rozkładem Gamma
)
p
,
a
(
dla
.
2
/
k
p
,
2
/
1
a
Dowód był podany na poprzednim wykładzie.
Przypominamy: gęstość prawdopodobieństwa dla rozkładu
Gamma (
)
p
,
a
ma postać
f(y)=
.
0
p
,
0
a
;
0
y
,
e
y
)
p
(
a
ay
1
p
p
0
p
,
e
x
)
p
(
0
x
1
p
.
Wartośd oczekiwana i wariancja są wyrażone przez parametry w
następująco: E(Y) =
a
/
p
, Var (Y)=
2
a
/
p
.
Zatem mamy następujący wniosek wynikający z własności
rozkładu Gamma.
Wniosek 4.1. Wartość oczekiwana i wariancja zm. los. Y o rozkładzie
2
(
) przyjmują następujące wartości: E(Y)= , Var (Y)=2 .
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
5
Przykłady gęstości rozkładów chi-kwadrat z stopniami swobody
Ważnymi statystykami w modelu normalnym są wariancje z próby.
Zajmiemy się rozkładami wariancji i ich relacjami ze średnią z próby.
(Przypominamy:
n
1
i
2
i
2
n
1
i
2
i
2
)
)
X
X
(
n
1
S
ˆ
,
)
X
X
(
1
n
1
S
.
Twierdzenie. 4.2 W modelu normalnym
X
i
2
S
są niezależnymi
zmiennymi losowymi z następującymi rozkładami
X
~
)
n
,
(
N
2
2
S
1
n
~
2
(n-1)
Dowód pomijamy.
Rys. Gęstości rozkładów
)
k
(
2
.
Niech
X
1
,X
2
,…X
n
będzie próbą losową z
N(
Rozkłady asymetryczne.
Kształt gęstości zależy od
liczby stopni swobody.
Przy dużej liczbie stopni
swobody, rozkłady zbliżają się
do rozkładu normalnego.
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
6
Uwaga. Zauważmy, że zarówno
X
jak i
2
S
są wyznaczone przez tę
samą próbę losową. Fakt niezależności statystyk, nie jest
oczywisty. Istotne jest tu założenie, iż próba pochodzi z rozkładu
normalnego.
Parametry statystyki S
2
Stwierdzenie 4.2:
2
2
)
S
(
E
,
Var
(
2
S
)=
1
n
2
4
.
Dowód. Na mocy Twierdzenia 4.2,
2
2
S
1
n
~
2
(n-1). Z kolei z
Wniosku 4.1 wynika, że E(
2
2
S
1
n
)=
1
n
)
S
(
E
1
n
2
2
. Z ostatniej
równości mamy więc:
2
2
)
S
(
E
.
Rozumując podobnie otrzymujemy:
Var (
2
2
S
1
n
) =
)
1
n
(
2
)
S
(
Var
)
1
n
(
2
4
2
) zatem Var (
2
S
)=
1
n
2
4
.
Wniosek 4.2. Ze związku
2
2
S
n
1
n
S
ˆ
otrzymujemy natychmiast
oraz
n
1
n
)
S
(
E
n
1
n
)
S
ˆ
(
E
)
a
2
2
2
2
4
4
2
2
2
2
2
2
n
)
1
n
(
2
1
n
2
n
)
1
n
(
)
S
(
Var
n
)
1
n
(
)
S
ˆ
(
Var
)
b
,
c)
X
i
2
Sˆ są niezależnymi zm. los.
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
7
c) Rozkład t-Studenta z
-stopniami swobody, t( )
Definicja. Rozkład t-Studenta z
stopniami swobody jest to rozkład
zmiennej losowej
T =
/
Y
Z
,
gdzie Z i Y są niezależnymi zmiennymi losowymi , Z o rozkładzie
N(0,1), Y o rozkładzie Chi-kwadrat z
-stopniami swobody.
(Zapis T
~t(
)) .
Stwierdzenie 4.3. Statystyka
S
/
)
X
(
n
ma rozkład t-Studenta z
(n-1) stopniami swobody.
Rozkłady t-Studenta są
indeksowane liczbą stopni
swobody
.
Są symetryczne względem
prostej t = 0.
Zwyczajowo wartości
oznacza się literą „t”.
Każdy rozkład ma gestośd
podobną do krzywej
Gaussa ze średnią zero. Przy dużych
gęstości zbliżają się do gęstości N(0,1).
Var(T) =
)
2
/(
.
Rys. Szkice gęstości rozkładów t-Studenta
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
8
Dowód jest wnioskiem z Twierdzenia 4.2 i definicji statystyki
t-Studenta.
Niech Z =
n
)
X
(
i niech Y=
2
2
S
1
n
. Mamy więc
T =
n
)
X
(
:
S
/
)
X
(
n
S
)
1
n
(
1
n
2
2
.
Zatem statystyka
S
/
)
X
(
n
ma rozkład t-Studenta z (n-1)
stopniami swobody.
d) Rozkład F Snedecora z k i m stopniami swobody
Jest to rozkład zm. los.
m
/
U
k
/
Y
R
, gdzie Y i U są niezależne
Y
~
2
(k) i U
~
2
(m)
Zapis R
~ F(k,m). E(R) nie istnieje dla m , natomiast dla m>2
E(R)= m/(m-2). Rozkład jest stablicowany.
e) Model dwu próbek
Załóżmy, że mamy dwie niezależne próby losowe
n
2
1
X
,
,
X
,
X
i
m
2
1
Y
,
,
Y
,
Y
gdzie X
i
~ N(
)
,
X
X
Y
i
~ N(
)
,
Y
Y
Niech statystyki
2
X
S
i
,
X
będą określone dla próby
,
X
,
,
X
,
X
n
2
1
natomiast statystyki
2
Y
S
i
,
Y
dla próby
m
2
1
Y
,
,
Y
,
Y
.
Mat. Statystyka. Wykład 4 c.d. R. Rempała Materiały dydaktyczne
9
Zatem
2
X
2
Y
2
Y
2
X
2
Y
2
Y
2
X
2
X
S
S
)
1
m
(
S
)
1
m
(
1
n
S
)
1
n
(
~F(n-1,m-1) .
Jeśli założymy, że
2
Y
2
X
, to
2
Y
2
X
S
/
S
~F(n-1,m-1), co jest
pomocne przy testach weryfikujących równośd wariancji w
rozkładach normalnych.
Jeśli założymy, że
2
Y
2
X
to
2
Y
2
X
S
/
S
~F(n-1,m-1) co jest pomocne
przy testach weryfikujących równośd wariancji w rozkładach, z
których pochodzą próby. Zauważmy, że przy założeniu
2
Y
2
X
iloraz
2
x
2
y
S
/
S
~F(m-1,n-1)
Ogólnie
Jeżeli
m
/
U
k
/
Y
R
, gdzie Y i U są niezależne, Y
~
2
(k), U
~
2
(m),
to na mocy definicji R
~ F(k,m). Zatem 1/R=
.
k)
F(m,
~
k
/
Y
m
/
U
Niech F
(
będzie kwantylem rzędu
z rozkładu F(k,m).
Oznacza to, że
P(R
=
, a więc P(1/
co znaczy, że
P(1/R 1/ 1-
Tak więc 1/
jest kwantylemrzędu 1- z rozkładu
k)
F(m,
.
Mamy ostatecznie następujący związek
1/ .