Weryfikacja hipotez statystycznych
Przez hipotezę statystyczną rozumiemy dowolne przypuszczenie, co do rozkładu populacji
generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość przypuszczenia
oceniana jest na podstawie wyników próby losowej.
Testem statystycznym nazywamy regułę postępowania, która każdej możliwej próbie
losowej pobranej z populacji generalnej przyporządkowuje decyzję przyjęcia lub odrzucenia
stawianej hipotezy.
PRZYKAADY HIPOTEZ STATYSTYCZNYCH
(a) W firmie wprowadzono nową organizację pracy. W grupie 45 pracowników zbadano
wydajność pracy przed i po zmianie. Oznaczając przeciętną wydajność pracy przed zmianą
przez mA a po zmianie przez mB stawiamy hipotezę H: mB > mA .
2
Statystyka w6 M. Osińska
(b) Sprzedawcy w biurach podróży twierdzą, że kobiety częściej niż mężczyzni wybierają letni
wypoczynek nad morzem. Niech p1 oznacza procent kobiet preferujących wyjazd nad morze
(p2 - mężczyzn preferujących morze). Hipotezą jest H: p1 > p2 .
(c) Fizjoterapeuci przypuszczają, że rozkład ubytku masy ciała w czasie turnusu odchudzającego
jest zmienną losową o rozkładzie normalnym ze średnią 5 [kg] i odchyleniem standardowym
3:
H: X~N(5, 3) .
Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru
liczbowego lub wektorowego rozkładu cechy populacji.
W przeciwnym przypadku hipoteza nazywana jest nieparametryczną.
W problemach testowania występują 2 hipotezy:
Hipoteza zerowa oznaczana przez H0 hipoteza testowana, przeznaczona do ewentualnego
odrzucenia,
Hipoteza alternatywna oznaczana przez H1 hipoteza, która jesteśmy skłonni przyjąć, jeśli
odrzucimy hipotezę zerową,
Hipotezy wykluczają się, tzn. nie mogą być jednocześnie prawdziwe
Statystyka w 6 M. Osińska
Rola hipotez H0 i H1 nie jest symetryczna.
Hipoteza alternatywna to taka, którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych
dowodów jej prawdziwości (ta, o której sądzimy, że jest prawdziwa i szukamy potwierdzenia
w próbie).
Hipoteza zerowa to taka, co do której prawdziwości nie jesteśmy przekonani, (ta którą
poddajemy w wątpliwość).
Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi p1 [%]. Zaproponowano
nową terapię, której nieznana skuteczność p2 [%] nie jest gorsza, tzn. wiemy na podstawie próby,
że . Nowa terapia będzie szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych
p2 e" p1
dostatecznie dużą pewność , że p2 > p1.
Należy przeprowadzić testowanie hipotez:
H0: p1 = p2, H1: p1 > p2, .
Możliwe decyzje:
1. Nie ma dostatecznych dowodów, aby odrzucić H0 i przyjąć H1; na podstawie obserwacji nie
możemy stwierdzić, że nowa terapia jest lepsza.
2. Obserwacje dostarczają dostatecznych dowodów, aby przyjąć H1 i równocześnie odrzucić
H0, tzn. stwierdzamy, iż można uznać, że nowa terapia polepsza uzyskiwane rezultaty.
Statystyka w 6 M. Osińska
Błędem I rodzaju nazywamy błąd polegający na odrzuceniu hipotezy zerowej pomimo, że
jest ona prawdziwa.
Prawdopodobieństwo popełnienia błędu pierwszego rodzaju oznaczamy przez ą (poziom
istotności)
Błędem II rodzaju nazywamy błąd polegający na przyjęciu hipotezy zerowej pomimo, że jest
ona fałszywa. Prawdopodobieństwo popełnienia błędu drugiego rodzaju oznaczamy przez
.
Schemat postępowania
1. Sformułować hipotezę zerową H0
2. Postawić hipotezę alternatywną H1
3. Określić poziom istotności i obszary krytyczne (odczytywanie wartości krytycznych z tablic)
4. Wylosować próbę
5. Obliczyć wartość testu
6. Diagnoza: Jeśli wartość testu wpada do obszaru krytycznego, to odrzucamy hipotezę
zerową na rzecz hipotezy alternatywnej. Jeśli nie to nie ma podstaw do odrzucenia hipotezy
zerowej.
Statystyka w 6 M. Osińska
TESTY ISTOTNOŚCI DLA WARTOŚCI ŚREDNIEJ
W POPULACJI
A
Założenia
- populacja generalna ma rozkład normalny o nieznanej wartości średniej m oraz znanym
odchyleniu standardowym
- hipotezę weryfikujemy za pomocą n-elementowej próby
Etapy weryfikacji:
stawiamy hipotezę zerową, że średnia m ma wartość m0, tzn:
H0:m = m0
wobec hipotezy alternatywnej (tylko jednej z poniższych!):
10 H1:m `" m0 2o H1:m > m0 3o H1:m < m0
obliczamy średnią arytmetyczną X
Statystyka w 6 M. Osińska
jeżeli H0 jest prawdziwa to statystyka o postaci:
X - m0
Z = n
N(0; 1)
ma rozkład ,
10
ustalamy wartość zą (wartość krytyczna), której nie powinien przekraczać moduł statystyki
N(0; 1)
Z, określając ją w taki sposób w rozkładzie , aby dla ustalonego poziomu ą
zachodziła relacja:
P(Z e" zą )= ą
wartości zmiennej u spełniające nierówność Z e" zą są obszarem krytycznym testu, tzn.:
(-";-zą > *" < zą ;+")
2 2
Statystyka w 6 M. Osińska
Obszar krytyczny dwustronny
(z)
- zą 0 zą z
2 2
Z d" zą lub Z e" zą to hipotezę
Jeżeli uzyskamy z próby taką wartość statystyki Z, że
2 2
zerową odrzucamy na rzecz hipotezy alternatywnej; jeśli nie - to stwierdzamy, że nie ma
podstaw do odrzucenia hipotezy zerowej.
Statystyka w 6 M. Osińska
2o
ustalamy wartość zą , której nie powinna przekraczać statystyka Z, określając ją w taki
N(0; 1)
sposób w rozkładzie , aby dla ustalonego poziomu ą zachodziła relacja:
P(Z e" zą ) = ą
wartości zmiennej Z spełniające nierówność Z e" zą stanowią obszar krytyczny testu, tzn.:
)#zą ;+")
Obszar krytyczny prawostronny
(z)
0 zą z
Statystyka w 6 M. Osińska
3o
ustalamy wartość zą , od której powinna być większa statystyka Z, określając ją w taki
N(0; 1)
sposób w rozkładzie , aby dla ustalonego poziomu ą zachodziła relacja:
P(Z d" -zą ) = ą
wartości zmiennej Z spełniające nierówność Z d" -zą stanowią obszar krytyczny testu, tzn.:
(- ";-zą *#
Obszar krytyczny lewostronny
(z)
-zą 0 z
Statystyka w 6 M. Osińska
B
Założenia
- populacja generalna ma rozkład normalny o nieznanej wartości średniej m oraz nieznanym
odchyleniu standardowym ,
- hipotezę weryfikujemy w oparciu o wyniki z małej, n-elementowej próby (n<120),
Etapy weryfikacji:
stawiamy hipotezę zerową, że średnia m ma wartość m0, tzn.:
H0:m = m0
wobec hipotezy alternatywnej
H1:m `" m0,
X - m
do weryfikacji hipotezy wykorzystujemy zmienną o postaci t = n -1
S
która ma rozkład t-Studenta o n-1 stopniach swobody.
ustalamy wartość krytyczną tą , której nie powinien przekraczać moduł statystyki t,
określając ją w taki sposób w rozkładzie t-Studenta, aby dla ustalonego poziomu ą
zachodziła relacja:
P(t e" tą )= ą
Statystyka w 6 M. Osińska
wartości zmiennej t spełniające nierówność t e" tą są obszarem krytycznym testu, tzn.:
#
ś#- ";-tą *# *" )#tą ;+"ś#
ź#
# #
2 2
Jeżeli z próby uzyskamy taką wartość statystyki t, że wpada w obszar krytyczny, to hipotezę
zerową odrzucamy na rzecz hipotezy alternatywnej, a jeśli nie, to stwierdzamy, że nie ma
podstaw do odrzucenia H0 .
C
Założenia
- populacja generalna ma dowolny rozkład z nieznanymi parametrami,
- hipotezę weryfikujemy za pomocą dużej, n-elementowej próby (n>120).
Etapy weryfikacji
Stawiamy hipotezę zerową, że średnia m ma wartość m0 , tzn.:
H0 : m = m0
wobec hipotezy alternatywnej:
H1 : m `" m0
Statystyka w 6 M. Osińska
Jeżeli H0 jest prawdziwa to statystyka o postaci
X - m0
Z = n
S
N(0; 1)
ma asymptotyczny rozkład .
TESTY ISTOTNOŚCI DLA DWÓCH ŚREDNICH
A
Założenia
- badane są dwie populacje generalne, a których każda ma rozkład normalny o nieznanych
wartościach średnich m1 i m2 oraz znanych odchyleniach standardowych 1 i 2,
- hipotezę weryfikujemy za pomocą n1 i n2 elementowych prób pobranych z populacji
generalnych
Etapy weryfikacji
stawiamy hipotezę zerową, że wartości średnich w obu populacjach są identyczne, tzn.:
Statystyka w 6 M. Osińska
H0 : m1 = m2
wobec hipotezy alternatywnej
10 H1 : m1 `" m2 20 H1 : m1 > m2 30 H1 : m1 < m2
Jeżeli Ho jest prawdziwa, to statystyka o postaci:
X1 - X
2
Z =
2 2
1
2
+
n1 n2
ma rozkład N(0;1) .
Założenia A1
- badane są dwie populacje generalne, a których każda ma rozkład normalny o nieznanych
wartościach średnich m1 i m2 oraz nieznanych odchyleniach standardowych 1 i 2,
- hipotezę weryfikujemy za pomocą n1 i n2 elementowych dużych prób pobranych z
populacji generalnych
Statystyka w 6 M. Osińska
X1 - X2
Z =
2 2
S1 S2
+
n1 n2
B
Założenia
- badane są dwie populacje generalne, z których każda ma rozkład normalny o nieznanych
wartościach parametrów
- hipotezę weryfikujemy za pomocą małych n1 i n2 elementowych prób pobranych z
populacji generalnych
-
- weryfikacja tej hipotezy wymaga równości wariancji w badanych populacjach (patrz test
F dla dwóch wariancji)
Statystyka w 6 M. Osińska
Etapy weryfikacji
stawiamy hipotezę zerową, że wartości średnich w obu populacjach są identyczne, tzn.:
H0 : m1 = m2
wobec hipotezy alternatywnej
10 H1 : m1 `" m2 20 H1 : m1 > m2 30 H1 : m1 < m2
za sprawdzian hipotezy przyjmuje statystykę o postaci:
(X1 - X2)
t = ,
2 2
# ś#
n1S1 + n2S2 1 1
ś# + ź#
ś#
n1 + n2 - 2 n1 n2 ź#
# #
jeżeli H0 jest prawdziwa to statystyka t posiada rozkład t-Studenta o (n1+n2-2) stopniach
swobody.
Statystyka w 6 M. Osińska
TEST ISTOTNOŚCI DLA FRAKCJI
Założenia
- populacja generalna ma rozkład zero -jedynkowy z nieznanym parametrem p
- hipotezę weryfikujemy za pomocą dużej, n-elementowej próby (n>120)
Etapy weryfikacji
stawiamy hipotezę zerową, że parametr p ma w populacji wartość p0, tzn.:
H0 = p = p0
wobec hipotezy alternatywnej:
10 H0 : p `" p0 20 H0 : p > p0 30 H0 : p < p0
za sprawdzian hipotezy przyjmujemy wskaznik struktury z próby:
m
,
n
gdzie m oznacza liczbę wyróżnionych elementów w próbie.
Statystyka w 6 M. Osińska
Jeżeli H0 jest prawdziwa, to statystyka postaci:
m
- p0
n
Z =
p0(1- p0)
n
ma asymptotyczny rozkład N(0; 1) .
TEST ISTOTNOŚCI DLA DWÓCH FRAKCJI
Założenia
- badane są dwie populacje o rozkładach zero-jedynkowych z nieznanymi parametrami p1 i
p2
- hipotezę weryfikujemy za pomocą bardzo dużych prób (> 400), n1 i n2 elementowych
pobranych z populacji generalnych
Statystyka w 6 M. Osińska
Etapy weryfikacji
stawiamy hipotezę zerową, że parametry p1 i p2 w obu populacjach generalnych są
identyczne, tzn.:
H0 : p1 = p2
10 H1 : p1 `" p2 20 H1 : p1 > p2 30 H1 : p1 < p2
m1 m2
gdzie frakcje z próby: i .
n1 n2
Jeżeli H0 jest prawdziwa, to statystyka postaci:
m1 m2
-
n1 n2
Z =
,
pq
n
m1 + m2
n1n2
p =
ma rozkład N(0; 1), gdzie .
n1 + n2 , q = 1- p , n =
n1 + n2
Statystyka w 6 M. Osińska
TEST ISTOTNOŚCI DLA WARIANCJI
Założenia
- populacja generalna ma rozkład normalny o nieznanych parametrach m i
- do próby wylosowano niezależnie n elementów
2 2
H0 : = 0
2 2
H1 : > 0
2 2
Statystyka ma rozkład o n-1 stopniach swobody
nS2
2
= .
2
0
2
W związku z szybką zbieżnością rozkładu do rozkładu normalnego dla dużych prób
(k>30) stosuje się statystykę Z o rozkładzie normalnym, postaci
2
Z = 2 - 2k -1
gdzie k=n-1, oznacza liczbę stopni swobody.
Statystyka w 6 M. Osińska
TEST ISTOTNOŚCI DLA DWÓCH WARIANCJI
Założenia
- dane są dwie populacje generalne mające odpowiednio rozkłady normalne o nieznanych
parametrach m i
- wylosowano niezależnie dwie próby o liczebnościach odpowiednio n1 i n2 elementów
2 2
H0 :1 =
2
2 2
H1 :1 >
2
Statystyka F ma rozkład F Snedocora z n1-1 i n2-1 stopniami swobody
2
\1
F =
2
\2
n
1
r
2
gdzie: \ =
"(x - x)2 .
n -1i =1 i
Statystyka w 6 M. Osińska
Weryfikacja wybranych hipotez nieparametrycznych testy zgodności
2
Test zgodności
- Stosowany jest do weryfikacji hipotezy mówiącej, że badana cecha (ciągła lub
skokowa) ma określony rodzaj rozkładu, np.: normalny, logarytmiczno-normalny,
Poissona, itp.
- Test zgodności możemy wykorzystać, jeżeli z populacji generalnej wylosujemy w
sposób niezależny dużą próbę, a wyniki losowania podzielimy
na r rozłącznych klas o liczebnościach ni (ni e" 8), przy czym n =
"n .
i
H0 : F(x) = F0(x)
H1 : F(x) `" F0(x)
Statystyka 2 ma, przy założeniu, że hipoteza zerowa jest prawdziwa, rozkład 2 o r 1
stopniach swobody. Statystyka ta dana jest wzorem:
r
(ni - npi )2
2
= ,
"
npi
i =1
Statystyka w 6 M. Osińska
gdzie: pi oznacza wartości prawdopodobieństwa, że zmienna losowa X przyjmuje wartości
należące do klasy i (i = 1, 2, ..., r), natomiast npi są to liczebności teoretyczne, które powinny
wystąpić, gdyby hipoteza zerowa była prawdziwa.
Przykład
Rozkład wydajności pracowników zatrudnionych w spółce w 2005 roku według skali punktowej
Rozkład indywidualnej wydajności pracy pracowników spółki
Indywidualna wydajność Liczba
pracy pracowników
30 - 40 2
40 - 50 5
50 - 60 20
60 - 70 44
70 - 80 45
80 - 90 44
90 - 100 31
100 - 110 7
110 - 120 5
120 - 130 2
130 - 140 2
Ł 207
Statystyka w 6 M. Osińska
W analizie rozkładu indywidualnej wydajności pracy wykorzystano test zgodności chi-kwadrat. Na poziomie
istotności ą = 0,05 została zweryfikowana hipoteza H0 : F(x) = F0 (x ), mówiąca, że rozkład badanej
populacji jest zgodny z rozkładem normalnym, wobec hipotezy alternatywnej H1 : F(x) `" F0 (x), że rozkład
jest inny niż normalny.
Wyniki obliczeń dla testu chi-kwadrat
(X0I- x )2NI
WYDAJNOŚĆ LICZEBNOŚCI X0I*NI STANDARYZACJA F(ZI) PI NPI (NI-NPI)2/NPI
30 - 60 27 1215 28624,83 -0,9132 0,180568 0,180568 37,37764 2,88128
60 - 70 44 2860 6941,586 -0,39317 0,347098 0,16653 34,47171 2,633704
70 - 80 45 3375 295,0011 0,126868 0,550478 0,203379 42,09954 0,199828
80 - 90 44 3740 2435,305 0,646903 0,741153 0,190675 39,46973 0,519977
90 - 100 31 2945 9428,344 1,166938 0,878382 0,137229 28,4065 0,236785
100 - 140 16 1920 28817,93 - 1 0,121618 25,17487 3,343742
razem 207 16055 76543 1 207 9,815315
Wartość krytyczna 11,070
X = 77,5; S = 19,2
Wartość empiryczna statystyki chi-kwadrat równa jest 9,815, natomiast wartość krytyczna dla przyjętego
poziomu istotności wynosi 11,070. Zatem nie mamy podstaw do odrzucenia hipotezy zerowej i twierdzimy, że
badany rozkład jest zgodny z rozkładem normalnym.
Statystyka w 6 M. Osińska
Wyszukiwarka
Podobne podstrony:
Statystyka wyklad 7Statystyka wyklad 4Statystyka wyklad4nowysdz statystyka wyklad 4Statystyka wykładyStatystyka wyklad5Statystyka wyklad 8Statystyka wyklad 3Statystyka wyklad 9Statystyka1st Wyklad2Statystyka WykładyStatystyka1st Wyklad6 Regresja20151012 MichalTrzesiok Statystyka wyklad2 miary statystyczne handoutsdz statystyka wyklad 3Statystyka wykladyStatystyka wykładyStatystyka1st Wyklad1więcej podobnych podstron