2013-04-10
1
1
Metody probabilistyczne
Weryfikacja hipotez statystycznych
Hipotezy parametryczne
2
Hipoteza statystyczna
Hipoteza
-
każde przypuszczenie (sąd) o zbiorowości generalnej
(populacji) wydane na podstawie próby statystycznej.
Weryfikacja hipotezy
– wnioskowanie statystyczne o słuszności
sformułowanej hipotezy.
Rodzaje hipotez:
parametryczne
(o wartości przeciętnej, o wskaźniku struktury, o wariancji, itp.)
nieparametryczne
(o
rozkładzie cechy, o niezależności cech X i Y, itp.).
przy weryfikacji hipotez:
Hipoteza zerowa (H
0
) - hipoteza sprawdzana.
Hipoteza alternatywna (H
1
) -
hipoteza, którą jesteśmy skłonni
przyjąć, gdy odrzucimy hipotezę zerową (H
0
).
2013-04-10
2
3
Test statystyczny
Test statystyczny
-
reguła postępowania, w wyniku której na
podstawie wyników próby decydujemy o odrzuceniu lub przyjęciu
hipotezy zerowej (H
0
).
Rodzaje błędów w testowaniu hipotez
Weryfikując daną hipotezę statystyczną na podstawie zaobserwowanych
wyników próby ponosimy ryzyko podjęcia błędnej decyzji
Sytuacja
Decyzja przyjęcia H
0
Decyzja odrzucenia H
0
H
0
prawdziwa
Decyzja prawidłowa
1 -
Decyzja błędna
błąd I-rodzaju
poziom istotności
H
0
fałszywa
Decyzja błędna
błąd II-rodzaju
Decyzja prawidłowa
1 -
moc testu
4
Dobry test
-
jest to prawdopodobieństwo popełnienia błędu I-rodzaju
i
nazywane jest poziomem istotności.
Zwykle przyjmuje się:
=0,05 (również używane: 0,1; 0,02; 0,01)
-
jest to prawdopodobieństwo popełnienia błędu II-rodzaju
.
Zmniejszenie p-stwa
powoduje zwiększenie p-stwa
.
Aby rozwiązać ten problem można najpierw zmniejszać p-stwa
,
aby następnie – przez zwiększenie liczby próby n – obniżyć również
do wymaganego poziomu i w ten sposób zwiększyć
moc testu
.
W ten sposób traci się jednak korzyści jakie niesie ze sobą metoda
reprezentacyjna.
Dobry test
powinien mieć własność, że
również jest bliskie 0.
W zagadnieniach społeczno-ekonomicznych uznaje się, że
popełnienie błędu I-rodzaju za bardziej niebezpieczne dla badań
i dlatego określa się tylko wymagany poziom dla
.
Wybór liczby
jest w zasadzie dowolny.
Dobry test to test, w którym
2013-04-10
3
5
Rodzaje testów parametrycznych
Testy istotności
-
pozwalają na odrzucenie hipotezy sprawdzanej
z małym ryzykiem popełnienia błędu I-rodzaju lub stwierdzenia, że
brak jest podstaw do jej odrzucenia.
(testy, w których dla z góry ustalonego poziomu p-stwa błędu I-
rodzaju (
) poziom p-stwa
błędu II-rodzaju (
) jest minimalny).
Sprawdzian (hipotezy) - statystyka
, której wartość policzona na
podstawie próby pozwala podjąć decyzję o odrzuceniu hipotezy
zerowej (H
0
). Do budowy testu jest konieczna znajomość rozkładu
wybranego sprawdzianu, przy założeniu prawdziwości sprawdzanej
hipotezy H
0
, np. o parametrze populacji.
Zbiór (obszar) krytyczny
-
zbiór wartości sprawdzianu, które
przemawiają za odrzuceniem hipotezy zerowej (H
0
).
6
Rodzaje zbiorów (obszarów) krytycznych
Lewostronny obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q < Q
0
Prawostronny obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q > Q
0
Obustronny
obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q
Q
0
2013-04-10
4
7
Parametryczne testy istotności
Elementarnymi testami są następujące testy o wartości
parametru:
Testowanie hipotezy o wartości przeciętnej (μ),
Testowanie hipotezy o równości dwóch średnich,
Testowanie hipotezy o wariancji (
σ
2
),
Testowanie hipotezy o równości dwóch wariancji,
Testowanie hipotezy o wskaźniku struktury (p),
Testowanie hipotezy o równości dwóch wskaźników struktury.
8
Etapy w postępowaniu testującym
1.
Założenia o populacji generalnej,
Określenie poziomu istotności α,
2.
Sformułowanie hipotezy zerowej H
0
i alternatywnej H
1
,
3.
Wybór statystyki testowej (dla podjęcia decyzji związanej z H
0
),
Obliczenie statystyki na podstawie próby,
4.
Wyznaczenie obszaru krytycznego testu (tzn. obszaru odrzucenia),
5.
Odczytanie wartości krytycznej statystyki.
6.
Wnioskowanie (podjęcie decyzji).
Brak podstaw do
odrzucenia Ho
Podjęcie decyzji
Wnioskujemy,
że Ho nie jest
prawdziwa
Wnioskujemy,
że Ho może być
prawdziwa
Odrzucić Ho
2013-04-10
5
9
Wartość p (p-value)
α = P(Z<u
α
)
gdzie: u
α
– wartość graniczna obszaru
krytycznego
Wnioskowanie:
jeżeli p ≤ α => odrzucamy H
0
na rzecz H
1
,
jeżeli p > α => brak podstaw do odrzucenia H
0
,
Wartość p - najmniejszy poziom istotności, przy którym zaobserwowana
wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej
H
0
.
p = P(Z<Z
n
)
gdzie: Z
n
– statystyka z próby
p
10
Testowanie hipotezy o wartości przeciętnej (μ)
1.
Założenie:
Cecha ma w populacji rozkład normalny N(μ;
).
Założenie to można weryfikować nieparametrycznymi testami
zgodności (np. test zgodności χ
2
).
2.
Formułowanie hipotez:
Hipoteza zerowa (H
0
)
jest hipotezą „o równości” i brzmi:
H
0
:
μ = μ
0
gdzie:
μ
0
jest konkretną wartością (liczbą).
Hipoteza alternatywna (H
1
)
może być sformułowana trojako
(najczęściej w zależności od wyniku uzyskanego w próbie):
H
1
:
μ
μ
0
(albo H
1
:
μ < μ
0
albo też H
1
:
μ > μ
0
)
Wybór hipotezy alternatywnej (H
1
)
ma decydujące znaczenie dla
sformułowania obszaru odrzucenia.
3.
Konstruowanie sprawdzianu:
Wybór sprawdzianu
hipotezy zerowej (H
0
) zależy od liczebności
próby n oraz od znajomości odchylenia standardowego
w populacji.
2013-04-10
6
11
Rodzaje zbiorów (obszarów) krytycznych
Lewostronny obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q < Q
0
Prawostronny obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q > Q
0
Obustronny
obszar odrzucenia H
0
H
0
: Q = Q
0
H
1
: Q
Q
0
12
Testowanie hipotezy o wartości przeciętnej (μ)
Model 1
1.
Założenia:
próba losowa pobrana z populacji o rozkładzie N(μ,σ)
jest znane
2.
Formułowanie hipotezy: H
0
:
μ = μ
0
wobec
H
1
:
μ ≠ μ
0
3.
Konstruowanie sprawdzianu:
Estymator parametru
μ:
4.
Wartość krytyczna u
α
-
U o rozkładzie N(0,1),
dla której
n
X
U
o
u
U
P
n
N
x
n
x
n
i
i
,
1
1
2013-04-10
7
13
Testowanie hipotezy o wartości przeciętnej (μ)
Model 2
1.
Założenia:
próba losowa pobrana z populacji o rozkładzie N(μ,σ),
jest nieznane i liczność próby mała n
30
2.
H
0
: µ = µ
0
wobec H
1
: µ ≠ µ
0
3.
Przy estymacji wartości
μ
korzystamy ze statystyki t-Studenta z n-1
stopniami swobody
lub
4.
t
α
-
wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni
swobody, dla której
1
0
n
s
X
T
t
T
P
1
1
2
n
i
i
X
x
n
s
n
s
X
n
s
X
T
*
0
0
1
1
1
1
2
*
n
i
i
X
x
n
s
14
Testowanie hipotezy o wartości przeciętnej (μ)
Model 3
1.
Założenia:
próba losowa pobrana z populacji o rozkładzie dowolnym,
jest nieznane i liczność próby duża n>30
2.
Formułowanie hipotezy: H
0
:
μ = μ
0
wobec
H
1
:
μ ≠ μ
0
Estymator parametru
μ:
3.
Standaryzując otrzymujemy statystykę U:
4
.
u
α
-
wartość krytyczna zmiennej losowej U o rozkładzie N(0,1),
która P{|U|≥u
α
} = α
n
N
x
n
x
n
i
i
,
1
1
n
s
X
U
o
2013-04-10
8
15
Testowanie hipotezy o wartości przeciętnej (μ)
4.
Obszar jednostronny:
lewostronny
– hipoteza alternatywna H
1
ma postać H
1
:μ<μ
0
obszar krytyczny określa relacja: P(U ≤ u
α
)=α lub P(T ≤ t
α
)=α
prawostronny
– hipoteza alternatywna H
1
ma postać H
1
:μ>μ
0
obszar krytyczny określa relacja: P(U ≥ u
α
)=α lub P(T ≥ t
α
)=α
Obszar dwustronny:
dwustronny
– hipoteza alternatywna H
1
ma postać H
1
:μ≠μ
0
obszar krytyczny określa relacja: P(|U| ≤ u
α
)=α lub P(|T| ≤ t
α
)=α
6.
Wnioskowanie
Jeżeli wartość sprawdzianu U lub T znajdzie się:
w obszarze krytycznym, to H
0
należy odrzucić i przyjmujemy H
1
.
poza obszarem krytycznym, to nie ma podstaw do odrzucenia
H
0
.
UWAGA !!! Nigdy nie mówimy o przyjęciu hipotezy H
0
.
16
Testowanie hipotezy o wartości przeciętnej (μ)
5.
Jak oczytać z tablic wartość krytyczną u
kryt
, t
kryt
,
tj. granicę (granice) dla obszaru odrzucenia
przyjmujemy poziom istotności, czyli prawdopodobieństwo
popełnienia błędu I-rodzaju.
rodzaj obszaru krytycznego określamy wstępnie na podstawie
hipotezy alternatywnej H
1
Rozkład normalny N(0 ; 1)
Dla obszaru lewostronnego
odczytujemy taką wartość -u
kryt
, dla
której
Dla obszaru prawostronnego
przyjmujemy wartość odczytaną dla
obszaru lewostronnego i bierzemy ją ze znakiem dodatnim: +u
kryt
.
Dla obszaru obustronnego
odczytujemy taką wartość -u
kryt
,
dla której .
Granicami będą wartości: ±u
kryt
kryt
u
2
kryt
u
2013-04-10
9
17
Testowanie hipotezy o wartości przeciętnej (μ)
5.
Jak oczytać z tablic wartość krytyczną u
kryt
, t
kryt
,
tj. granicę (granice) dla obszaru odrzucenia
Rozkład t-Studenta
Dla obszaru lewostronnego lub prawostronnego odczytujemy
taką wartość -t
kryt
, dla której
Dla obszaru obustronnego
odczytujemy taką wartość t
kryt
,
dla której
Granicami będą wartości: ±t
kryt
2
1
kryt
n
t
T
P
kryt
n
t
T
P
1
18
Testowanie hipotezy o wartości przeciętnej (μ) – przykład 1
W 100 losowo wybranych gospodarstwach domowych średnia miesięczna
opłata za energię elektryczną wyniosła 68 złotych, a odchylenie
standardowe 14 złotych. Zweryfikuj panującą opinię, że przeciętne
miesięczne wydatki na energię elektryczną w całej populacji (μ
0
) wynoszą
75 złotych przyjmując poziom istotności 0,05.
Dane: n=100, s=14
,
α =0,05, μ
0
=75, σ≈s
Hipotezy: H
0
:
μ=75 H
1
:μ<75
(obszar lewostronny)
Sprawdzian model 3:
Wartość krytyczna: odczyt z rozkładu normalnego N(0;1)
α =0,05 →
u
kryt
=-1,64
U=-5 < u
kryt
=-1,64
68
x
n
s
X
U
5
100
14
75
68
U
Wniosek:
Należy odrzucić H
0
i przyjąć H
1
,
tzn. że nieznane przeciętne wydatki
na energię w całej populacji (μ) są
mniejsze od 75 zł.
-1,64
2013-04-10
10
Dla 17 losowo wybranych pracowników firmy A otrzymano średni czas
dojazdu 26 minut, a odchylenie standardowe 6 minut. Zweryfikuj panującą
opinię, że przeciętny czas dojazdu w całej populacji (μ
0
) wynosi 25 minut
przyjmując poziom istotności 0,05.
Dane: n=17, s=6
,
α =0,05, μ
0
=25, σ≈S
Hipotezy: H
0
:
μ = 25 H
1
:μ
25
(obszar obustronny)
Sprawdzian model 2:
Wartość krytyczna: odczyt z rozkładu t-Studenta o 17-1=16 stopniach
swobody.
α =0,05 →
t
kryt
=
±2,1199
-2,1199 < T=2/3 < +2,1199
wartość sprawdzianu T nie leży w obszarze odrzucenia
19
Testowanie hipotezy o wartości przeciętnej (μ) – przykład 2
Wniosek:
Nie ma podstaw do odrzucenia H
0
, tzn.
że nieznany przeciętny czas dojazdu w
całej populacji (μ) jest być może równy
25 minut; test tego nie rozstrzyga.
26
x
1
n
S
X
T
3
2
1
17
6
25
26
T
-2,12
2,12
20
Test dla dwóch średnich
Założenie:
Badamy dwie populacje generalne mające rozkłady normalne
N(
μ
1
,
1
) i N(
μ
2
,
2
). W oparciu o wyniki dwu
niezależnych prób,
odpowiednio o liczebnościach n
1
i n
2
, wylosowanych z tych
populacji
Formułowanie hipotez:
należy sprawdzić hipotezę zerową „o równości”: H
0
:
μ
1
=
μ
2
,
wobec
hipotezy alternatywnej H
1
:
μ
1
μ
2
. (albo H
1
:
μ
1
<
μ
2
albo też H
1
:
μ
1
>
μ
2
)
2013-04-10
11
21
Test dla dwóch średnich
Model 1
Założenia:
Odchylenia standardowe
1
i
2
tych populacji są znane.
Sprawdzian (test istotności)
Z wyników prób wylosowanych z tych populacji obliczyć wartości
średnich i , a następnie wartość statystyki U według wzoru:
Wnioskowanie:
Statystyka ta przy założeniu prawdziwości hipotezy H
0
ma rozkład
N(0,1).
Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry
poziomu istotności
wyznaczyć taką wartość krytyczną u
, by spełniona
była równość P{|U|
u
} =
.
2
2
2
1
2
1
2
1
n
n
x
x
u
1
x
2
x
22
Test dla dwóch średnich
Model 2
Założenia:
Odchylenia standardowe tych populacji są nieznane, ale jednakowe,
tzn. zachodzi
1
=
2
.
Próby małe o liczebnościach n
1
i n
2
są wylosowane niezależnie.
Test istotności:
z wyników obu prób obliczyć wartości średnie
oraz wariancje s
1
i s
2
, a następnie wartość statystyki t według wzoru:
Wnioskowanie:
Statystyka
ta ma przy założeniu prawdziwości hipotezy H
0
rozkład
t Studenta o n
1
+n
2
-2 stopniach swobody.
Z tablicy rozkładu t Studenta należy odczytać dla n
1
+n
2
-2 stopni
swobody oraz dla założonego z góry poziomu istotności
taką
wartość krytyczną t
, by spełniona była równość P{|t|
t
}=
2
1
2
1
2
2
2
2
1
1
2
1
1
1
2
n
n
n
n
s
n
s
n
x
x
t
1
x
2
x
2013-04-10
12
23
Test dla dwóch średnich
Model 3
Założenia:
rozkłady normalne lub inne, byle o skończonych wariancjach i ,
które są nieznane.
Test istotności:
na podstawie wyników dwu dużych prób (n
1
oraz n
2
są rzędu co
najmniej kilku dziesiątków) obliczyć wartość statystyki U według
wzoru:
Wnioskowanie:
Statystyka ta przy założeniu prawdziwości hipotezy H
0
ma rozkład
N(0,1).
Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry
poziomu istotności
wyznaczyć taką wartość krytyczną u
, by
spełniona była równość P{|U|
u
} =
.
2
1
2
2
2
2
2
1
2
1
2
1
n
s
n
s
x
x
u
24
Test dla dwóch średnich
Model 4
Założenia:
Wyniki obu prób można traktować jako wyniki pomiarów na tym samym
elemencie populacji, np. wtedy gdy stanowią one pary przyporządkowanych
sobie liczb (wynik przed i po operacji na pewnym elemencie)
Analizujemy wówczas różnice z
i
=y
i
-x
i
.
Test istotności:
Próby małe o liczebności n – test dla średniej
t
α
-
wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni
swobody, dla której P{|T|
t
} =
.
Budowanie hipotezy:
Hipoteza zerowa: wobec
lub H
0
: x
1
= x
2
lub H
0
: x
1
- x
2
= 0 wobec H
1
: x
1
≠ x
2
lub H
1
: x
1
- x
2
≠ 0
gdzie: -
średnia w populacji różnic
1
n
S
z
T
i
0
Z
H
0
:
0
Z
H
1
:
Z
2013-04-10
13
25
Test dla dwóch średnich
Wnioskowanie:
H
1
:
μ
1
μ
2
– obszar krytyczny
dwustronny
: |U|
u
,
H
1
:
μ
1
<
μ
2
– obszar krytyczny
lewostronny
: U
u
.
H
1
:
μ
1
>
μ
2
– obszar krytyczny
prawostronny
: U
u
.
26
Test dla dwóch średnich - przykład
Średnia odległość przejazdu 36 pasażerów w komunikacji tramwajowej wynosi
3,4km, a 64 pasażerów w komunikacji autobusowej 3,8km, odchylenia
standardowe odpowiednio s
T
=0,6, s
A
=0,4. Czy można przyjąć, że średnia
odległość przejazdu pasażerów autobusami i tramwajami jest równa (α=0,02)?
Dane: n
T
=36, n
A
=64, s
T
=0,6, s
A
=0,4,
α=0,02
Hipotezy: H
0
: μ
T
= μ
A
H
1
: μ
T
μ
A
(obszar obustronny)
Sprawdzian model 3:
Wartość krytyczna: odczyt z rozkładu N(0,1) u
α
= 2,33
2
2
2
1
2
1
2
1
n
S
n
S
x
x
u
Wniosek:
Nie ma podstaw do odrzucenia hipotezy, że
średnia odległość przejazdu pasażerów
tramwajami jest równa średniej odległości
przejazdu autobusami
4
3
x
T
,
8
3
x
A
,
-2,33
2,33
206
,
1
11
,
0
4
,
0
0025
,
0
01
,
0
4
,
0
64
4
,
0
36
6
,
0
8
,
3
4
,
3
2
2
u
2013-04-10
14
27
Testowanie hipotezy o wskaźniku struktury (p)
Założenie: Cecha ma w populacji rozkład dwupunktowy z parametrem
p
oznaczającym prawdopodobieństwo, że cecha przyjmie
wyróżnioną wartość.
Próba musi być duża (n>100).
Formułowanie hipotezy:
Hipoteza zerowa (H
0
)
jest hipotezą „o równości” i brzmi: H
0
: p = p
0
gdzie p
0
jest konkretną wartością (liczbą).
Hipoteza alternatywna (H
1
)
może być sformułowana trojako
(najczęściej w zależności od wyniku uzyskanego w próbie):
H
1
: p
p
0
(albo H
1
: p < p
0
albo też H
1
: p > p
0
)
Wybór hipotezy alternatywnej (H
1
) ma decydujące znaczenie dla
sformułowania obszaru odrzucenia.
Estymator ma graniczny rozkład normalny
n
m
p
n
p
p
p
N
1
,
28
Testowanie hipotezy o wskaźniku struktury (p)
Sprawdzian:
która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1),
dla której P{|U|
u
}=
.
Wnioskowanie:
Jeżeli wartość sprawdzianu U znajdzie się:
1.
w obszarze odrzucenia, to odrzucamy H
0
i przyjmujemy H
1
.
2.
poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia
H
0
.
n
p
p
p
n
m
U
0
0
0
1
2013-04-10
15
29
Testowanie hipotezy o wskaźniku struktury (p) -
przykład
Panuje opinia, że w 40 % osób w podróżach codziennych korzysta z
samochodu. Zapytano 200 losowo wybranych osób. W 72 przypadkach
otrzymano odpowiedź, że osoby te wybierają samochód.
Zweryfikuj powszechnie panująca opinię na temat odsetka osób (p), które
najczęściej poruszają się samochodem przyjmując poziom istotności
=0,02.
Dane: n=200, m=72, p
o
=0,4,
α=0,02, α/2=0,01
Hipotezy:
H
0
: p = 0,4
H
1
: p
0,4
(obszar obustronny)
Sprawdzian:
Wartość krytyczna:
odczyt z rozkładu normalnego N(0;1)
u
kryt
=2,33
n
p
p
p
n
m
U
0
0
0
1
15
,
1
200
4
,
0
1
4
,
0
4
,
0
200
72
U
Wniosek:
Nie ma podstaw do odrzucenia H
0
, tzn. że nieznany
odsetek osób w całej populacji (p), które
najczęściej korzystają z samochodu jest być może
równy 40%; test tego nie rozstrzyga
-2,33
2,33