2013-04-10
Metody probabilistyczne
Weryfikacja hipotez statystycznych
Hipotezy parametryczne
1
Hipoteza statystyczna
l Hipoteza - każde przypuszczenie (sąd) o zbiorowości generalnej
(populacji) wydane na podstawie próby statystycznej.
l Weryfikacja hipotezy wnioskowanie statystyczne o słuszności
sformułowanej hipotezy.
Rodzaje hipotez:
l parametryczne
(o wartości przeciętnej, o wskazniku struktury, o wariancji, itp.)
l nieparametryczne
(o rozkładzie cechy, o niezależności cech X i Y, itp.).
przy weryfikacji hipotez:
l Hipoteza zerowa (H0) - hipoteza sprawdzana.
l Hipoteza alternatywna (H1) - hipoteza, którą jesteśmy skłonni
przyjąć, gdy odrzucimy hipotezę zerową (H0).
2
1
2013-04-10
Test statystyczny
Test statystyczny - reguła postępowania, w wyniku której na
podstawie wyników próby decydujemy o odrzuceniu lub przyjęciu
hipotezy zerowej (H0).
Rodzaje błędów w testowaniu hipotez
Weryfikując daną hipotezę statystyczną na podstawie zaobserwowanych
wyników próby ponosimy ryzyko podjęcia błędnej decyzji
Sytuacja Decyzja przyjęcia H0 Decyzja odrzucenia H0
Decyzja błędna
H0 Decyzja prawidłowa błąd I-rodzaju
prawdziwa 1 - a a
poziom istotności
Decyzja błędna Decyzja prawidłowa
H0
błąd II-rodzaju 1 - b
fałszywa
b moc testu 3
Dobry test
l a - jest to prawdopodobieństwo popełnienia błędu I-rodzaju i
nazywane jest poziomem istotności.
Zwykle przyjmuje się: a=0,05 (również używane: 0,1; 0,02; 0,01)
l b - jest to prawdopodobieństwo popełnienia błędu II-rodzaju.
Zmniejszenie p-stwa a powoduje zwiększenie p-stwa b.
Aby rozwiązać ten problem można najpierw zmniejszać p-stwa a,
aby następnie przez zwiększenie liczby próby n obniżyć również
b do wymaganego poziomu i w ten sposób zwiększyć moc testu.
W ten sposób traci się jednak korzyści jakie niesie ze sobą metoda
reprezentacyjna.
l Dobry test powinien mieć własność, że b również jest bliskie 0.
W zagadnieniach społeczno-ekonomicznych uznaje się, że
popełnienie błędu I-rodzaju za bardziej niebezpieczne dla badań
i dlatego określa się tylko wymagany poziom dla a.
Wybór liczby a jest w zasadzie dowolny.
l Dobry test to test, w którym ab
4
2
2013-04-10
Rodzaje testów parametrycznych
l Testy istotności - pozwalają na odrzucenie hipotezy sprawdzanej
z małym ryzykiem popełnienia błędu I-rodzaju lub stwierdzenia, że
brak jest podstaw do jej odrzucenia.
(testy, w których dla z góry ustalonego poziomu p-stwa błędu I-
rodzaju (a) poziom p-stwa błędu II-rodzaju (b) jest minimalny).
l Sprawdzian (hipotezy) - statystyka, której wartość policzona na
podstawie próby pozwala podjąć decyzję o odrzuceniu hipotezy
zerowej (H0). Do budowy testu jest konieczna znajomość rozkładu
wybranego sprawdzianu, przy założeniu prawdziwości sprawdzanej
hipotezy H0, np. o parametrze populacji.
l Zbiór (obszar) krytyczny - zbiór wartości sprawdzianu, które
przemawiają za odrzuceniem hipotezy zerowej (H0).
5
Rodzaje zbiorów (obszarów) krytycznych
Prawostronny obszar odrzucenia H0
Lewostronny obszar odrzucenia H0
H0: Q = Q0
H0: Q = Q0
H1: Q > Q0
H1: Q < Q0
Obustronny
obszar odrzucenia H0
H0: Q = Q0
H1: Q ą Q0
6
3
2013-04-10
Parametryczne testy istotności
Elementarnymi testami są następujące testy o wartości
parametru:
l Testowanie hipotezy o wartości przeciętnej (ź),
l Testowanie hipotezy o równości dwóch średnich,
l Testowanie hipotezy o wariancji (2),
l Testowanie hipotezy o równości dwóch wariancji,
l Testowanie hipotezy o wskazniku struktury (p),
l Testowanie hipotezy o równości dwóch wskazników struktury.
7
Etapy w postępowaniu testującym
1. Założenia o populacji generalnej,
Określenie poziomu istotności ą,
2. Sformułowanie hipotezy zerowej H0 i alternatywnej H1,
3. Wybór statystyki testowej (dla podjęcia decyzji związanej z H0),
Obliczenie statystyki na podstawie próby,
4. Wyznaczenie obszaru krytycznego testu (tzn. obszaru odrzucenia),
5. Odczytanie wartości krytycznej statystyki.
6. Wnioskowanie (podjęcie decyzji).
Brak podstaw do
Podjęcie decyzji Odrzucić Ho
odrzucenia Ho
Wnioskujemy, Wnioskujemy,
że Ho może być że Ho nie jest
prawdziwa prawdziwa
8
4
2013-04-10
Wartość p (p-value)
p
ą = P(Z
p = P(Zgdzie: uą wartość graniczna obszaru
gdzie: Zn statystyka z próby
krytycznego
Wnioskowanie:
l jeżeli p d" ą => odrzucamy H0 na rzecz H1,
l jeżeli p > ą => brak podstaw do odrzucenia H0,
Wartość p - najmniejszy poziom istotności, przy którym zaobserwowana
wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej
H0.
9
Testowanie hipotezy o wartości przeciętnej (ź)
1. Założenie: Cecha ma w populacji rozkład normalny N(ź;s).
Założenie to można weryfikować nieparametrycznymi testami
zgodności (np. test zgodności 2).
2. Formułowanie hipotez:
l Hipoteza zerowa (H0) jest hipotezą o równości i brzmi:
H0: ź = ź0
gdzie: ź0 jest konkretną wartością (liczbą).
l Hipoteza alternatywna (H1) może być sformułowana trojako
(najczęściej w zależności od wyniku uzyskanego w próbie):
H1: ź ą ź0 (albo H1: ź < ź0 albo też H1: ź > ź0)
l Wybór hipotezy alternatywnej (H1) ma decydujące znaczenie dla
sformułowania obszaru odrzucenia.
3. Konstruowanie sprawdzianu:
l Wybór sprawdzianu hipotezy zerowej (H0) zależy od liczebności
próby n oraz od znajomości odchylenia standardowego s
w populacji.
10
5
2013-04-10
Rodzaje zbiorów (obszarów) krytycznych
Prawostronny obszar odrzucenia H0
Lewostronny obszar odrzucenia H0
H0: Q = Q0
H0: Q = Q0
H1: Q > Q0
H1: Q < Q0
Obustronny
obszar odrzucenia H0
H0: Q = Q0
H1: Q ą Q0
11
Testowanie hipotezy o wartości przeciętnej (ź)
Model 1
1. Założenia:
próba losowa pobrana z populacji o rozkładzie N(ź,)
s jest znane
2. Formułowanie hipotezy: H0 : ź = ź0 wobec H1 : ź `" ź0
X - mo
U = n
3. Konstruowanie sprawdzianu:
s
n
1 ć s
Estymator parametru ź: x = N m,
xi
n
n
i=1 Ł ł
4. Wartość krytyczna uą- U o rozkładzie N(0,1),
dla której
P(U ł ua )= a
12
6
2013-04-10
Testowanie hipotezy o wartości przeciętnej (ź)
Model 2
1. Założenia:
próba losowa pobrana z populacji o rozkładzie N(ź,),
s jest nieznane i liczność próby mała nŁ30
2. H0: = 0 wobec H1: `" 0
3. Przy estymacji wartości ź korzystamy ze statystyki t-Studenta z n-1
stopniami swobody
X - m0 n
1 2
T = n -1
s = (xi - X)
s
n
i=1
lub
n
X - m0 X - m0
1 2
T = n -1 = n
s* = - X )
(xi
s s*
n -1
i=1
4. tą- wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni
swobody, dla której
P(T ł ta )= a
13
Testowanie hipotezy o wartości przeciętnej (ź)
Model 3
1. Założenia:
próba losowa pobrana z populacji o rozkładzie dowolnym,
s jest nieznane i liczność próby duża n>30
2. Formułowanie hipotezy: H0 : ź = ź0 wobec H1 : ź `" ź0
n
1 ć s
Estymator parametru ź: x = Nm,
xi
n
n
i=1 Ł ł
3. Standaryzując otrzymujemy statystykę U:
X - mo
U = n
s
4. uą- wartość krytyczna zmiennej losowej U o rozkładzie N(0,1),
która P{|U|e"uą} = ą
14
7
2013-04-10
Testowanie hipotezy o wartości przeciętnej (ź)
4. Obszar jednostronny:
l lewostronny hipoteza alternatywna H1 ma postać H1:ź<ź0
obszar krytyczny określa relacja: P(U d" uą)=ą lub P(T d" tą)=ą
l prawostronny hipoteza alternatywna H1 ma postać H1:ź>ź0
obszar krytyczny określa relacja: P(U e" uą)=ą lub P(T e" tą)=ą
Obszar dwustronny:
l dwustronny hipoteza alternatywna H1 ma postać H1:ź`"ź0
obszar krytyczny określa relacja: P(|U| d" uą)=ą lub P(|T| d" tą)=ą
6. Wnioskowanie
Jeżeli wartość sprawdzianu U lub T znajdzie się:
l w obszarze krytycznym, to H0 należy odrzucić i przyjmujemy H1.
l poza obszarem krytycznym, to nie ma podstaw do odrzucenia
H0.
15
UWAGA !!! Nigdy nie mówimy o przyjęciu hipotezy H0.
Testowanie hipotezy o wartości przeciętnej (ź)
5. Jak oczytać z tablic wartość krytyczną ukryt, tkryt,
tj. granicę (granice) dla obszaru odrzucenia
l przyjmujemy poziom istotności, czyli prawdopodobieństwo a
popełnienia błędu I-rodzaju.
l rodzaj obszaru krytycznego określamy wstępnie na podstawie
hipotezy alternatywnej H1
Rozkład normalny N(0 ; 1)
l Dla obszaru lewostronnego odczytujemy taką wartość -ukryt , dla
F(-ukryt)= a
której
l Dla obszaru prawostronnego przyjmujemy wartość odczytaną dla
obszaru lewostronnego i bierzemy ją ze znakiem dodatnim: +ukryt.
l Dla obszaru obustronnego odczytujemy taką wartość -ukryt ,
F(-ukryt)= a 2
dla której .
Granicami będą wartości: ąukryt
16
8
2013-04-10
Testowanie hipotezy o wartości przeciętnej (ź)
5. Jak oczytać z tablic wartość krytyczną ukryt, tkryt,
tj. granicę (granice) dla obszaru odrzucenia
Rozkład t-Studenta
l Dla obszaru lewostronnego lub prawostronnego odczytujemy
taką wartość -tkryt , dla której
P{Tn-1 > tkryt}> 2a
l Dla obszaru obustronnego odczytujemy taką wartość tkryt ,
dla której
P{Tn-1 > tkryt}> a
Granicami będą wartości: ątkryt
17
Testowanie hipotezy o wartości przeciętnej (ź) przykład 1
l W 100 losowo wybranych gospodarstwach domowych średnia miesięczna
opłata za energię elektryczną wyniosła 68 złotych, a odchylenie
standardowe 14 złotych. Zweryfikuj panującą opinię, że przeciętne
miesięczne wydatki na energię elektryczną w całej populacji (ź0) wynoszą
75 złotych przyjmując poziom istotności 0,05.
l Dane: n=100, s=14, ą =0,05, ź0=75, H"s
x = 68
l Hipotezy: H0: ź=75 H1:ź<75 (obszar lewostronny)
l Sprawdzian model 3: 68 - 75
X - m
U = 100 = -5
U = n
14
s
l Wartość krytyczna: odczyt z rozkładu normalnego N(0;1)
ą =0,05 ukryt =-1,64
U=-5 < ukryt =-1,64
Wniosek:
Należy odrzucić H0 i przyjąć H1,
tzn. że nieznane przeciętne wydatki
na energię w całej populacji (ź) są
-1,64
mniejsze od 75 zł.
18
9
2013-04-10
Testowanie hipotezy o wartości przeciętnej (ź) przykład 2
l Dla 17 losowo wybranych pracowników firmy A otrzymano średni czas
dojazdu 26 minut, a odchylenie standardowe 6 minut. Zweryfikuj panującą
opinię, że przeciętny czas dojazdu w całej populacji (ź0) wynosi 25 minut
przyjmując poziom istotności 0,05.
l Dane: n=17, s=6, ą =0,05, ź0=25, H"S
x = 26
l Hipotezy: H0: ź = 25 H1:ź ą 25 (obszar obustronny)
l Sprawdzian model 2:
26 - 25 2
X - m
T = 17 -1 =
T = n -1
6 3
S
l Wartość krytyczna: odczyt z rozkładu t-Studenta o 17-1=16 stopniach
swobody.
ą =0,05 tkryt =ą2,1199
-2,1199 < T=2/3 < +2,1199
wartość sprawdzianu T nie leży w obszarze odrzucenia
Wniosek:
Nie ma podstaw do odrzucenia H0, tzn.
że nieznany przeciętny czas dojazdu w
całej populacji (ź) jest być może równy
-2,12 2,12
25 minut; test tego nie rozstrzyga.
19
Test dla dwóch średnich
Założenie:
Badamy dwie populacje generalne mające rozkłady normalne
N(ź1, s1) i N(ź2, s2). W oparciu o wyniki dwu niezależnych prób,
odpowiednio o liczebnościach n1 i n2, wylosowanych z tych
populacji
Formułowanie hipotez:
l należy sprawdzić hipotezę zerową o równości : H0: ź1=ź2,
wobec
l hipotezy alternatywnej H1: ź1ąź2. (albo H1: ź1 < ź2
albo też H1: ź1 > ź2)
20
10
2013-04-10
Test dla dwóch średnich
Model 1
Założenia:
l Odchylenia standardowe s1 i s2 tych populacji są znane.
Sprawdzian (test istotności)
l Z wyników prób wylosowanych z tych populacji obliczyć wartości
średnich i , a następnie wartość statystyki U według wzoru:
x1 x2
x1 - x2
u =
2 2
s1 s
2
+
n1 n2
Wnioskowanie:
l Statystyka ta przy założeniu prawdziwości hipotezy H0 ma rozkład
N(0,1).
Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry
poziomu istotności a wyznaczyć taką wartość krytyczną ua, by spełniona
była równość P{|U| ł ua} = a.
21
Test dla dwóch średnich
Model 2
Założenia:
l Odchylenia standardowe tych populacji są nieznane, ale jednakowe,
tzn. zachodzi s1 = s2.
Próby małe o liczebnościach n1 i n2 są wylosowane niezależnie.
Test istotności:
x1 x2
l z wyników obu prób obliczyć wartości średnie
oraz wariancje s1 i s2, a następnie wartość statystyki t według wzoru:
x1 - x2
t =
2 2
ć
n1s1 + n2s2 1 1
+
n1 + n2 - 2 n1 n2
Ł ł
Wnioskowanie:
l Statystyka ta ma przy założeniu prawdziwości hipotezy H0 rozkład
t Studenta o n1+n2-2 stopniach swobody.
Z tablicy rozkładu t Studenta należy odczytać dla n1+n2-2 stopni
swobody oraz dla założonego z góry poziomu istotności a taką
22
wartość krytyczną ta, by spełniona była równość P{|t| ł ta}= a
11
2013-04-10
Test dla dwóch średnich
Model 3
Założenia:
s2
s2 2
l rozkłady normalne lub inne, byle o skończonych wariancjach 1 i ,
które są nieznane.
Test istotności:
l na podstawie wyników dwu dużych prób (n1 oraz n2 są rzędu co
najmniej kilku dziesiątków) obliczyć wartość statystyki U według
wzoru:
x1 - x2
u =
2 2
s1 s2
+
n1 n2
Wnioskowanie:
l Statystyka ta przy założeniu prawdziwości hipotezy H0 ma rozkład
N(0,1).
l Z tablicy rozkładu normalnego N(0,1) należy dla przyjętego z góry
poziomu istotności a wyznaczyć taką wartość krytyczną ua, by
23
spełniona była równość P{|U| ł ua} = a.
Test dla dwóch średnich
Model 4
Założenia:
Wyniki obu prób można traktować jako wyniki pomiarów na tym samym
elemencie populacji, np. wtedy gdy stanowią one pary przyporządkowanych
sobie liczb (wynik przed i po operacji na pewnym elemencie)
Analizujemy wówczas różnice zi=yi-xi.
Test istotności:
l Próby małe o liczebności n test dla średniej
zi
T = n -1
S
l tą- wartość krytyczna zmiennej losowej T o rozkładzie t-Studenta dla n-1 stopni
swobody, dla której P{|T| ł ta} = a.
Budowanie hipotezy:
l Hipoteza zerowa: wobec H1 : Z ą 0
H0 : Z = 0
lub H0: x1 = x2 lub H0: x1 - x2 = 0 wobec H1: x1 `" x2 lub H1: x1 - x2 `" 0
gdzie: - średnia w populacji różnic
Z
24
12
2013-04-10
Test dla dwóch średnich
Wnioskowanie:
l H1: ź1 ą ź2 obszar krytyczny dwustronny : |U| ł ua,
l H1: ź1 < ź2 obszar krytyczny lewostronny : U Ł ua.
l H1: ź1 > ź2 obszar krytyczny prawostronny : U ł ua.
25
Test dla dwóch średnich - przykład
l Średnia odległość przejazdu 36 pasażerów w komunikacji tramwajowej wynosi
3,4km, a 64 pasażerów w komunikacji autobusowej 3,8km, odchylenia
standardowe odpowiednio sT=0,6, sA=0,4. Czy można przyjąć, że średnia
odległość przejazdu pasażerów autobusami i tramwajami jest równa (ą=0,02)?
xT = 3,4
l Dane: nT=36, nA=64, sT=0,6, sA=0,4, ą=0,02 xA = 3,8
l Hipotezy: H0: źT = źA H1: źT ą źA (obszar obustronny)
l Sprawdzian model 3:
x1 - x2
u =
2
S12 S2
+
n1 n2
l Wartość krytyczna: odczyt z rozkładu N(0,1) uą= 2,33
3,4 - 3,8 - 0,4 - 0,4
u = = = = - 1,206
0,62 0,42 0,01+ 0,0025 0,11
+
36 64
Wniosek:
Nie ma podstaw do odrzucenia hipotezy, że
średnia odległość przejazdu pasażerów
tramwajami jest równa średniej odległości
2,33 26
-2,33
przejazdu autobusami
13
2013-04-10
Testowanie hipotezy o wskazniku struktury (p)
Założenie: Cecha ma w populacji rozkład dwupunktowy z parametrem
p oznaczającym prawdopodobieństwo, że cecha przyjmie
wyróżnioną wartość.
Próba musi być duża (n>100).
Formułowanie hipotezy:
l Hipoteza zerowa (H0) jest hipotezą o równości i brzmi: H0: p = p0
gdzie p0 jest konkretną wartością (liczbą).
l Hipoteza alternatywna (H1) może być sformułowana trojako
(najczęściej w zależności od wyniku uzyskanego w próbie):
H1: p ą p0 (albo H1: p < p0 albo też H1: p > p0)
l Wybór hipotezy alternatywnej (H1) ma decydujące znaczenie dla
sformułowania obszaru odrzucenia.
p(1- p)
) m ć
p =
l Estymator ma graniczny rozkład normalny N p, ł
n
Ł
n
27
Testowanie hipotezy o wskazniku struktury (p)
Sprawdzian:
m
- p0
n
U =
p0(1- p0)
n
l która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1),
dla której P{|U|łua}=a.
Wnioskowanie:
l Jeżeli wartość sprawdzianu U znajdzie się:
1. w obszarze odrzucenia, to odrzucamy H0 i przyjmujemy H1.
2. poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia
H0.
28
14
2013-04-10
Testowanie hipotezy o wskazniku struktury (p) -
przykład
l Panuje opinia, że w 40 % osób w podróżach codziennych korzysta z
samochodu. Zapytano 200 losowo wybranych osób. W 72 przypadkach
otrzymano odpowiedz, że osoby te wybierają samochód.
l Zweryfikuj powszechnie panująca opinię na temat odsetka osób (p), które
najczęściej poruszają się samochodem przyjmując poziom istotności a=0,02.
l Dane: n=200, m=72, po=0,4, ą=0,02, ą/2=0,01
l Hipotezy: H0: p = 0,4 H1: p ą 0,4 (obszar obustronny)
l Sprawdzian:
m 72
- 0,4
- p0
200
n
U = = -1,15
U =
0,4(1- 0,4)
p0(1- p0)
200
n
l Wartość krytyczna:
odczyt z rozkładu normalnego N(0;1)
ukryt=2,33
Wniosek:
Nie ma podstaw do odrzucenia H0, tzn. że nieznany
odsetek osób w całej populacji (p), które
-2,33 2,33
najczęściej korzystają z samochodu jest być może 29
równy 40%; test tego nie rozstrzyga
15
Wyszukiwarka
Podobne podstrony:
MP 8 hipot nieparam 1
MP 8 hipot nieparam 2
MP 8 hipot nieparam 2
MP 7 hipot parametryczne 2
Stymulus Zestaw6 STP MP Gesundheitswesen
bibliografia mp
param
GET PARAM
Stymulus Zestaw@ STP MP Berlin
MP logika rozmyta
MP wzory transf 1
więcej podobnych podstron