Weryfikacja hipotez statystycznych
Janusz Wywiał, Katedra Statystyki, UE Katowice Rodzaje hipotez statystycznych
a) sprawdzana i alternatywne
b) proste i złożone
c) parametryczne i nieparametryczne
Błędy pierwszego rodzaju i drugiego rodzaju, Poziomem istotności i moc testu.
Obszar krytyczny testu.
Sprawdzian testu.
Test jest nieobciążony - gdy moc testu jest nie mniejsza od poziomu istotności.
Test jest zgodny - gdy przy ustalonym poziomie istotności i przy liczebności próby zmierzającej w nieskończoność, moc testu zmierza do liczby 1.
1
Weryfikacja hipotezy o wartości przeciętnej H :µ = µ = 1200 zł
∧ X ~ N µ σ
σ
0
0
( , 0), jest znana
0
H :µ > µ
∧ X ~ N µ σ
1
0
( , 0)
(H0 - prosta, H1 - złożona)
n
1
X =
∑ X
n
n
i
i=1
Wskaźnik
rozbieżności
między
wartością
hipotetyczną parametru a wartością z próby jego estymatora:
X − µ
n
0
Sprawdzian testu:
X − µ
X
0
− µ
Z
n
=
n =
0
n
σo
(
D X)
Gdy prawdziwa hipoteza H0
0
z
2
Jeśli H0 jest prawdziwa, to Zn ~ N (0, 1) Inna hipoteza alternatywna: H :µ = µ∗ > µ
2
0
Wtedy
µ
µ
∗ −
E(Z H
0
= δ > 0,
δ =
1 )
n
n
n
n
σ
o
Jeśli H
Z ~ N δ , 1
2 jest prawdziwa, to
n
( n )
{PZ > z H2 β
α
} = = {PZ ∈KH
n
n
2 }
δn zα
α = {
P Z ≥ z H
n
α
0 }
poziom istotności testu.
Reguła podejmowania decyzji: Jeśli wartość sprawdzianu wpadnie w obszar krytyczny, czyli z ≥ z
n
α , to odrzucamy H0 zastrzegając się, że mogliśmy
popełnić
błędną
decyzję
z
prawdopodobieństwem α .
Gdy wartość sprawdzianu nie będzie należeć do obszaru krytycznego ( z < n
α
z ), nie ma podstaw
do odrzucenia H0, choć nie ma też podstaw do jej przyjęcia. Można by ją przyjąć, gdybyśmy mogli obliczyć moc testu.
3
wyznaczamy
z
tablic
rozkładu
normalnego dla dystrybuanty F(z ) = 1− α
α
.
Weryfikacja hipotezy o wartości średniej, gdy σ
jest nieznane
H : µ = µ ∧ X ~ N µ,σ
0
( 2
0
)
H : µ > µ ∧ X ~ N µ,σ
1
( 2
0
)
X − µ
X − µ
0
0
T =
n =
n −1
ˆ
S
S
1 n
S =
∑( X − X
=
i
)2
n
2
2
2
ˆ
,
S
S
n =
−
i
n 1
1
Gdy hipoteza H0 jest prawdziwa, to
sprawdzian T ma rozkład Studenta z n-1
stopniami swobody, T ~ t(n - 1)
Obszar krytyczny:
{PT≥ t H0 α
α
} =
α
4
K = tα ;+∞ )
Gdyby:
H : µ = µ ∧ X ~ N µ,σ
0
( 2
0
)
H : µ ≠ µ ∧ X ~ N µ,σ
1
( 2
0
)
{
P T ≥ α
t /2}= α
c{
P − α
t
T T
t
/ 2 >
∨ > α/2}= α
α
α
2
2
−
α
t / 2
α
t
/ 2
Rozkład zmiennej w populacji jest dowolny H :µ = µ
0
0
H :µ > µ
1
0
5
X − µ
X − µ
0
0
T =
n =
n −1
ˆ
S
S
Gdy liczebność próby jest duża (n≥100), to sprawdzian ma w przybliżeniu rozkład normalny standardowy T~N(0, 1).
Weryfikacja hipotezy o wskaźniku struktury: H0: p = p0
H1: p ≠ p0
K
W
n
=
n
n
Kn - liczba elementów cechy wyróżnionej
n - liczebność próby prostej
Un - sprawdzian testu
W − p
W − p
n
0
n
0
U =
=
n
p
− p
D W
H
0 (1
0 )
(
|
)
n
0
n
Wn ma rozkład dwumianowy:
6
k
n
−
P W
= =
pk 1
−
n
0 (
p 0 ) n k
n
k
1 −
E( W | H
2
0
0
=
,
|
=
n
0 )
p
D
0
( W H
n
0 )
p (
p )
n
Gdy H0 prawdziwa i n ≥ 100, to Un →U~ N (0, 1)
Z
twierdzenia
granicznego
de
Moivre’a-
Laplace’a:
lim Fn ( un ) = ϕ( un ), U ~ N ( ) 1
,
0
n→∞
{
P U ≥ u
| H
α
α / 2
0 } =
{
P U ∈ K | H
α
0 } =
K = (− ∞ −
,
α
u
u
/ 2 ∪
] [ α /2 +
, ∞)
u ∈ K, to odrzucamy H0 z prawdopodobieństwem popełnienia błędnej decyzji równym α, u ∉ K, to nie ma podstaw do odrzucania H0
7
Testowanie hipotezy o wariancji
2
2
H :σ = σ
0
0
i
X ~ N (
2
µ,σ )
2
2
H :σ ≠ σ
1
0
Sprawdzian:
nS2
(n − 1 S2
) $
U =
2
=
2
σ
σ
0
0
gdzie:
n
1
2
S2 =
∑(X − X
i
)
n
i=1
$
n
S2 =
S2
n − 1
8
Jeśli H0 jest sprawdzalna, to U ma rozkład χn−1
z „n-1” stopniami swobody.
Obszar krytyczny:
K = [0, u1] ∪ [u2, ∞)
P{ U ≤ − u ∪ U ≥ u H = α
1
2
0 }
P{
α
U ≥ − u H
= −
1
0 }
1
2
P{
α
U ≥ u H
=
2
0 }
2
Gdy k→∞ to zmienna losowa Uk o rozkładzie χ2k ma granicznie rozkład normalny, czyli E(U =
k )
k
D2 (U = 2
k )
k
U − k
Z
k
=
, lim
= ϕ( )
k
(Fzk)
z
2k
k→∞
Z ~ N(0, 1)
9
K = <-∞, uα/2> ∪ <uα/2, ∞) P{ U ≤ − α
u
∪ U ≥ α
u
H
= α
/ 2
/ 2
0 }
P{
α
U ≥ − α
u
H
= −
/ 2
0 }
1
2
P{
α
U ≥ α
u
H
=
/ 2
0 }
2
Testowanie hipotezy o współczynniku korelacji liniowej:
10
ρ = D( X) D( Y) H : ρ = 0
0
H : ρ > 0
1
Zakładamy,
że
(X,Y)
ma
w
populacji
dwuwymiarowej rozkład normalny
R
T =
⋅ n − 2
n
1 − R 2
R = Cxy
S S
x
y
n
1
C
X
X Y
Y
xy =
∑( i − )( i − )
n i=1
n
1
2
S 2
Y
Y
y =
∑( i − )
n i=1
Gdy H0 jest prawdziwe, to Tn ma rozkład Studenta o „n-2” stopniu swobody, Tn ~ t (n - 2) 11
0 tα
{PT ≥ t H0 α
α
=
n
}
K = t
α ; ∞)
Współczynnik korelacji rangowej Spearmana: n
∑
2
6
(a − b
i
i )
=
R
i
= 1−
1
s
n3 − n
x → a
i
i
a , b to rangi wartości zmiennych x , y
i
i
i
i
y → b
i
i
− 1 ≤ R ≤ 1
s
R → 0
− zależność jest coraz słabsza
s
12
Gdy H0 jest prawdziwe, to:
Z = n − 1 R
gdy n ≥ 10 ⇒ Z ~ N(0, 1)
n
s
n
{PZ ≥ z H α
α
0
=
n
}
Weryfikujemy, że dwie przeciętne z różnych populacji są równe
H :µ = µ
0
1
2
H :µ ≠ µ
1
1
2
X ~ N µ ,σ
1
( 2
1
)
X ~ N µ ,σ
2
( 2
2
)
X
X
1 −
Tn =
2
2
n S
n S
1
1
1 1 +
2
2
2 +
n
n
2
n
n
1 +
2 −
1
2
13
1
X =
∑ X ; i = 1, 2
i
n
ij
i
j=1
n
1
2
S2 =
∑
−
i
(X X
ij
i )
n j=1
Gdy H0 jest prawdziwe, to Tn ma rozkład Studenta o „n1 +n2 - 2” st. swob. Tn ~ t (n1 +n2- 2)
P Tn ≥ tα H
0
=
2
K = − ∞ −
, tα ∪ t ;
α ∞
2
2
Jeśli H0 jest prawdziwe i n1 ≥ 100, n2 ≥ 100, to sprawdzian:
x1 − x
n
Z =
2
,
S$2 =
S2
i
i
$ 2
$ 2
−
S
S
n 1
1 + 2
n
n
1
2
ma rozkład normalny standardowy Z ~ N (0, 1) 14
Testowanie równości wartości średnich dwóch cech charakteryzujących tę samą populację.
H : µ = µ
0
1
2
H : µ ≠ µ
1
1
2
({
x , x
−
ł
1
2 )}
próba sk ada się z par obserwacji
j
j
Z = X − X
i
1 i
2 i
1 n
Z =
∑ Z = X − X
i
1
2
n i 1
=
Statystyka testowa:
n
2
1
2
Sˆ =
∑
−
z
( Z Z
j
)
n −1 j 1
=
Z
T =
n
Sˆ z
1) Z=X1-X2 ma rozkład normalny, to
T ~ t(n-1).
2) X1 i X2 mają rozkład dowolny i n ≥ 100, to T ~ N(0, 1)
15
Niech X1 i X2 mają rozkład dowolny ciągły i n < 100.
Zj = X1j - X2j
(δ)
d
= Z
gdzie δ = " "
− gdy Z <
j
j
j
0
gdzie δ = "+" gdy Z >
j
0
(δ)
Następnie rangując różnice d j otrzymujemy
{R(δ)j}
ciąg rang
Q
=
R +
∑ ( )
w
j
j
n(n − 1)
K
= O q
,
1
∪ q
Q
i
2
2
{
α
P Q
≤ q H
1
0
=
w
} 2
{
α
P Q
≥ q H
2
0
=
w
} 2
16
w
KQ, to odrzucamy H0 przy poziomie
istotności α
Test na równość dwóch wskaźników struktury H0: p1 = p2
H1: p1 ≠ p2
Sprawdzian:
w1 − w
Z =
2
w 1
1
1 ( − w 1 )
w 2 ( − w2 )
+
n
n
1
2
K
w
i
1, 2
1 =
i =
ni
Gdy n ≥
≥
1 100, n2 100 i H0 jest prawdziwa, to Z~N(0, 1)
K = − ∞, −
∪
,
α
α +∞
2
(
z
z
)
{PZ ≥ zH = α
0 }
α
ϕ(
zα ) = 1 = 2
17
18