Testy parametryczne
Najczęściej występującym w zagadnieniach badawczych problemem
jest obiektywne rozstrzygnięcie stwierdzenie różnic między
średnimi zaobserwowanymi w próbach statystycznych. Jeśli
cecha statystyczna jest wielkością mierzalną, i w dwóch próbach
statystycznych średnie istotnie się różnią, to oznacza to, że występuje
powiązanie (związek) między tą zmienną (mierzalną) a zmienną
jakościową ( na podstawie której nastąpił podział na dwie próby
losowe).
losowe).
Medycyna: podaje się dwa leki A i B obniżające ciśnienie u pacjentów (próbki
niezależne). Po zaaplikowaniu rejestrujemy ciśnienie krwi, i chcemy rozstrzygnąć,
czy występują istotne różnice pomiędzy ciśnieniem w grupie A i B (przez
porównanie średnich ciśnień w grupach).
Technika: dwa urządzenia A i B produkują pewien produkt, którego jakość
charakteryzuje cecha mierzalna X. Po wylosowaniu prób z serii produktów obu
maszyn wyznaczono Å›rednie µA i µB, które siÄ™ różniÄ…. Trzeba rozstrzygnąć, czy
różnice są dziełem przypadku, czy zjawiskiem obiektywnym (jedna maszyn jest
lepsza od drugiej).
Test istotności dla wartości średniej populacji generalnej
Stosujemy, gdy należy sprawdzić, czy różnica zaobserwowanej (w
próbie losowej) średniej istotnie odbiega od znanej wartości
średniej w populacji generalnej.
Założenie: populację charakteryzuje rozkład normalny o nieznanej wartości
Å›redniej m oraz znanym odchyleniu standardowym Ã
Ã.
Ã
Ã
H0 µ H1 µ
H0: µ = m0 wobec H1: µ `" m0
µ µ
µ µ
gdzie m0 pewna wartość założona ( średnia w populacji generalnej).
Pobieramy n elementowÄ… próbÄ™ z populacji, i wyznaczamy Å›redniÄ… z próby µ
µ.
µ
µ
Jeśli prawdziwa jest H0, to średnia z próby jest zmienną
statystycznÄ… o rozkÅ‚adzie normalnym N(m0, Ã/n1/2), co oznacza, że
Ã
Ã
Ã
statystyka
U µ- Ã
U= n1/2[(µ m0)/ Ã]
µ Ã
µ Ã
ma rozkład normalny N(0,1) czyli do weryfikacji hipotezy
stosujemy obszar krytyczny: P{ |U|e"uą} = ą . Jeśli U należy do
P{ |U|e"uÄ…} = Ä…
e" Ä…
e" Ä…
e" Ä…
e" Ä…
e" Ä…
e" Ä…
Ä…
Ä…
Ä…
Ä…
Ä…
Ä…
obszaru krytycznego H0 odrzucamy na korzyść H1.
Przykład. Zastosowanie testu istotności średniej w populacji generalnej
Według normy technologicznej wykonanie obróbki mechanicznej produktu
powinno zajmować 22 minuty. Wylosowano 16 stanowisk obróbki
mechanicznej, dla których średni czas obróbki wyniósł 24 minuty.
Wcześniejsze badania (na szeroką skalę) pokazały, że odchylenie standardowe
czasu obróbki wynosi 4 minuty, a sam rozkład czasu ma charakter normalny.
Zweryfikować na poziomie istotności 5% hipotezę, że zaobserwowana średnia
nie różni się od normy.
RozwiÄ…zanie: Obliczamy statystykÄ™ testowÄ…
U µ- Ã
U=[(µ Ã] n1/2=[(24-22)/4]*161/2=(2/4)*4=2
U µ- m0)/ Ã
U=[(µ m0)/ Ã] n1/2=[(24-22)/4]*161/2=(2/4)*4=2
µ Ã
µ Ã
µ Ã
µ Ã
i konfrontujemy ją z wartością krytyczną rozkładu normalnego dla ą=0.05,
która wynosi ukryt=1.96 (przypominam, że jest to test dwustronny, zatem
odczytujemy z tablic dystrybuanty rozkładu normalnego dla ą/2=0.025 patrz
wcześniejszy materiał).
Ponieważ: |U|=2 > ukryt=1.96 hipotezę o równości rzeczywistego
średniego czasu obróbki na 16 stanowiskach z czasem podanym normą należy
odrzucić, z 5% ryzykiem popełnienia błędu. Przyjmujemy zatem hipotezę
alternatywną: wyznaczona średnia różni się od normy ( trzeba przeprowadzić
szkolenie lub lepiej kontrolować załogę).
Dobór testu dla prób niezależnych
Dwie niezależne próby losowe wybór testu równości średnich
Duże próby losowe (n1>50,n2>50)
Nieduże próby losowe
Rozkład odbiega Rozkład normalny
od normalnego w obu próbach
Znane wariancje Nieznane
Ã12 i Ã12 wariancje
Równe wariancje Nierówne wariancje
Test
Testy
Test z
Test U
Test t Cochran-Cox
nieparametryczne
UWAGA: Przed przystąpieniem do testu należy sprawdzić (jeśli nie wiadomo z góry)
czy rozkłady empiryczne mają charakter normalny test Kołmogorowa-Smirnowa.
Dla sprawdzenia równości wariancji w próbkach można zastosować test F.
Test U - próby niezależne
Test istotności dla 2 średnich
Zakładamy, że badane są dwie populacje, z których każda ma rozkład normalny o
nieznanych Å›rednich m1 i m2, ale znanych odchyleniach standardowych Ã1 i Ã2.
à Ã
à Ã
à Ã
H0 H1
H0: m1 = m2 wobec H1: m1 `" m2
- Losujemy próby z obu populacji o liczebnościach n1 i n2.
- Obliczamy Å›rednie z prób µ1 oraz µ2 .
JeÅ›li prawdziwa jest H0, to różnica Å›rednich µ - µ jako zmienna
JeÅ›li prawdziwa jest H , to różnica Å›rednich µ1 - µ2 jako zmienna
statystyczna ma rozkład normalny o średniej 0 i wariancji
Ã12/n1 + Ã22/n2
à Ã
à Ã
à Ã
a wtedy statystyka testowa
µ1 - µ2
U =
2
Ã1 / n1 + Ã2 / n2
2
ma rozkład normalny N(0,1). Odrzucamy H0 gdy statystyka testowa
|U|e"Ukryt(Ä…)
Przykład. W pewnym sektorze gospodarki narodowej średni staż pracy mężczyzn
uważa się za większy od stażu kobiet. Szerokie badania statystyczne dały
podstawę do założenia o rozkładzie normalnym dla stażu kobiet i mężczyzn, gdzie
wariancje okreÅ›lono : dla mężczyzn Ã12= 1.89 a kobiet Ã12= 1.44. W pewnym
zakładzie tej branży wylosowano n1=35 mężczyzn i n2=30 kobiet i oszacowano
Å›rednie staże w obu grupach: µ1= 3.5, µ2= 2.8 lat. Sprawdz, czy faktycznie w
zakładzie staż mężczyzn jest większy niż kobiet, na poziomie istotności 5%.
Rozwiązanie: Znane są wariancje rozkładów stażu (obszerne badania je
dostarczyły w formie estymat ale bliskich rzeczywistym wariancjom). Nadto,
rozkłady są normalne, przeto na podstawie schematu wyboru testu wybieram
test U. Statystyka testowa U wynosi:
test U. Statystyka testowa U wynosi:
µ1 - µ2
3.5-2.8
U = = = 2.19
2
Ã1 / n1 + Ã2 / n2 1.89/ 35+1.44/ 30
2
Statystykę konfrontujemy z jednostronnym obszarem krytycznym rozkładu
normalnego , gdzie wartość krytyczna Ukryt=1.65 dla ą=0.05.
Wniosek: Ponieważ U=2.19 > 1.65=Ukryt hipotezę zerową o równości średnich
(H0:µ1= µ2) odrzucamy na korzyść hipotezy alternatywnej H1 ( Å›rednia stażu
mężczyzn istotnie wiÄ™ksza od Å›redniej stażu kobiet µ1> µ2).
Test t próby niezależne
Test istotności dla 2 średnich
Zastosowanie: jeśli ani średnie ani wariancje populacji generalnych
nie są znane, zaś test równości wariancji w próbach nie wskazuje na
istotne różnice.
Hipoteza zerowa: H0: m1 = m2 (wobec H1: m1 `" m2)
H0 H1
Jeśli H0 jest prawdziwa to statystyka t
Jeśli H0 jest prawdziwa to statystyka t
H0
H0
µ1 - µ2
t =
2
sn 1/ n1 +1/ n2
( )
ma rozkład t-Studenta o (n1+n2-2) stopniach swobody, gdzie sn2 jest
estymatą wariancji z połączonych prób n1 i n2 :
2 2
s1 (n1 -1) + s2 (n2 -1)
2
sn =
n1 + n2 - 2
gdzie µ1 i µ2 estymaty Å›rednich w badanych próbach losowych.
Test z próby niezależne
Test istotności dla 2 średnich duże próby
Ze względu na dużą liczebność prób możemy założyć, że rozkład
jest zbliżony do normalnego.
Hipoteza zerowa: H0: m1 = m2 (wobec H1: m1 `" m2)
H0 H1
Jeśli H0 jest prawdziwa to statystyka z
H0
µ1 - µ2
µ1 - µ2
z =
z =
2 2
s1 / n1 + s2 / n2
( )
ma rozkÅ‚ad normalny N(0,1), gdzie µ1 i µ2 estymaty Å›rednich w
badanych próbach losowych, zaś zaś s12 i s22 to estymatory
wariancji .
Odrzucamy H0 gdy statystyka testowa z należy do obszaru
H
krytycznego na poziomie istotności ą.
Przykład. W pewnym kraju wykonano badania statystyczne spożycia alkoholu na
dużej liczbie jego mieszkańców (5000), i określono średnie spożycie w wysokości 7
litrów/rok przy odchyleniu standardowym 1 litr/rok. Podobne badanie wykonano dla
300 mieszkańców jednego z regionów (A), gdzie średnia wyniosła 10 l/rok z
odchyleniem standardowym 2 l/rok.
Zbadać czy średnie spożycie alkoholu w regionie A jest równe spożyciu alkoholu w
całym kraju, wobec hipotezy alternatywnej, iż spożycie w regionie A jest istotnie
większe niż w kraju. Poziom istotności ą=0.01.
Rozwiązanie. Przypadek dużych prób statystycznych, stosujemy test z jednostronny:
µ1 - µ2 10 - 7
µ1 - µ2 10 - 7
z = = = 25.79
z = = = 25.79
2 2
s1 / n1 + s2 / n2 22 / 300 +12 / 5000
( ) ( )
Hipoteza: H0 : m1=m2 wobec H1 : m1>m2
Dystrybuanta standardowego rozkładu normalnego Ś(u)= P{ U d" u } , dla u<0 obliczaj używając Ś Ś
Åš d" Åš Åš
Åš d" Åš(u) =1 - Åš(-u) fragment
Åš d" Åš Åš
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158 1-Ä…
Wobec tego, jednostronny (ą=0.01) obszar krytyczny rozkładu normalnego ze"2.33,
skąd wnioskujemy, że średnie się różnią istotnie, i przyjmujemy hipotezę
alternatywną, że w regionie A spożycie alkoholu jest istotnie większe, bowiem
zachodzi relacja z=25.79 > zkryt =2.33
Testy dla prób zależnych (średnie)
Przypominamy, że ten przypadek (prób zależnych), dotyczy sytuacji gdy wyniki
obserwacji zmiennej statystycznej pochodzÄ… z 2 populacji i sÄ… w jakikolwiek
sposób zestawione w pary. Najczęściej jest to przypadek prób powiązanych, gdy
eksperyment dotyczył tych samych elementów (obiektów) a zmienna statystyczna
dla każdego z obiektów reprezentuje dwie serie wyników eksperymentów. Takie
zestawienie w pary daje więcej informacji o różnicy wyników badań, niż
informacja jaką otrzymalibyśmy przy wykorzystaniu odrębnych grup obiektów
poddanych eksperymentom (a wtedy stosowalibyśmy test t Studenta dla
zmiennych niepowiązanych prób niezależnych).
Wybór tej metody, gdy eksperymenty stosujemy dla tej samej grupy obiektów,
eliminuje przypadkową zmienność wyników eksperymentów wskutek wpływu
innych czynników różnicujących własności obiektów ( a które mogłyby mieć
wpływ na rozkład zmiennej statystycznej).
Dowodzi się, że dla 2 prób zależnych (Xi, Yi) zmienna losowa zdefiniowana jako:
ëÅ‚ öÅ‚
D
sr
t = n gdzie Dsr = średnia różnic(Xi-Yi), sD - odchylenie stand. różnic
ìÅ‚ ÷Å‚
sD
íÅ‚ Å‚Å‚
ma rozkład t Studenta o n-1 stopniach swobody, gdy hipoteza zerowa (H0: równość
średnich w obu grupach, H1: brak równości średnich) jest prawdziwa ( n jest
liczebnością prób).
Test istotności dla wariancji
Zakładamy, że badana jest populacja, która charakteryzuje się rozkładem
normalnym o nieznanych parametrach N(m,Ã). Chcemy zweryfikować hipotezÄ™, że
wariancja Ã2 w tej populacji ma ustalonÄ… wartość Ã02 (znanÄ…/postulowanÄ…). W tym
celu losuje się n - elementową próbę w badanej populacji i na jej podstawie
wyznacza estymator wariancji s2
n
ëÅ‚
s2 =
"(X - X )2 öÅ‚ /(n -1)
i
ìÅ‚ ÷Å‚
íÅ‚ i=1 Å‚Å‚
Wiadomo, iż statystyka (n-1)*s2/Ã2 ma rozkÅ‚ad Ç2 o (n-1) stopniach swobody
(bowiem Xi ma rozkład normalny). Tedy, jeśli prawdziwa jest hipoteza zerowa
(bowiem Xi ma rozkład normalny). Tedy, jeśli prawdziwa jest hipoteza zerowa
2
(n -1)s2
-1
(sformuÅ‚owana tutaj tak) H0: Ã2 = Ã02 , to statystyka postaci
Ç2 =
2
Ã0
ma rozkÅ‚ad Ç2 o n-1 stopniach swobody. JeÅ›li rzeczywista wariancja w populacji
wynosi Ã02 , to estymata wariancji z próby s2 powinna być jej bliska, a wtedy
statystyka testowa Ç2 nie powinna być zbyt duża co do wartoÅ›ci. Nie powinna ona
przekraczać wartoÅ›ci krytycznej Ç2 wyznaczanej z rozkÅ‚adu Ç2 , tak by
Ä…,n-1
speÅ‚niona byÅ‚a relacja P(Ç2 e" Ç2 ) = Ä…. Zatem, odrzucamy hipotezÄ™ zerowÄ… H0
Ä…,n-1
wtedy, gdy zachodzi Ç2 e" Ç2 . JeÅ›li ten warunek nie jest speÅ‚niony, nie ma
Ä…,n-1
podstaw do odrzucenia hipotezy zerowej. Ponieważ rozkÅ‚ad Ç2 jest szybko
zbieżny do rozkładu normalnego ze wzrostem liczby stopni swobody, to dla
n-1>30 możemy obszar krytyczny wyznaczać na podstawie rozkładu normalnego.
Przykład. Na pewnym odcinku trasy dokonano 20 pomiarów szybkości
samochodów. Wariancja szybkości wyniosła s2=81 (km/h)2. Według zasad ruchu
drogowego wariancja szybkoÅ›ci powinna wynosić Ã02=77 (km/h)2. ZakÅ‚adajÄ…c, że
rozkład prędkości samochodów jest normalny, zweryfikować hipotezę, że wariancja
na tym odcinku trasy jest równa wariancji hipotetycznej, wobec hipotezy
alternatywnej, iż jest większa od hipotetycznej, na poziomie istotności 5%.
RozwiÄ…zanie.
Hipoteza H0 : Ã2= Ã02 wobec H1: Ã2>Ã02 ( test jednostronny)
20 -1 81
20 -1 81
Statystyka testowa:
Statystyka testowa:
(n -1)s ( )
(n -1)s2 ( )
Ç2 = = = 19.99
Ç2 = = = 19.99
2
Ã0 77
Wartość krytyczna z tablic dla Ä…=0.05 i licz.st.swob.=20-1=19 wynosi Ç2 =30.14
Ç
Ç
Ç
kryt
Wnioskowanie: obliczona statystyka testowa Ç2=19.99 jest poza obszarem
krytycznym (mniejsza od Ç2 ). Wykonane badania nie dajÄ… podstawy do
kryt
odrzucenia hipotezy H0 o równości wariancji empirycznej i teoretycznej, przy 5%
marginesie błędu. Obserwowana różnica jest przypadkowa.
Testy istotności dwóch wariancji
Załóżmy, że badane są dwie populacje, o rozkładach normalnych, ale o nieznanych
parametrach (tzn. zm. stat. X ma rozkÅ‚ad N(m1,Ã1) a zm. Y ma rozkÅ‚ad N(m2,Ã2) ).
Chcemy zbadać przypuszczenie, że wariancje w obu populacjach są identyczne, czyli
hipoteza zerowa ma postać H0: Ã12= Ã22 ( inaczej zapisujÄ…c mamy Ã12/Ã22 =1 ).
à à à Ã
à à à Ã
à à à Ã
Dla zweryfikowania hipotezy pobieramy niezależne próby z obu populacji, i na ich
podstawie wyznaczamy estymatory wariancji s12 (próba o liczebności n1) oraz s22
(liczebność próby n2). Z rozważań teoretycznych wynika, że statystyka
2 2
s1 s2
F = /
2
Ã2 Ã2
Ã1 Ã2
2
ma rozkład F Snedecora z n1-1 oraz n2-1 stopniami swobody. Stąd wniosek, że jeżeli
rzeczywiÅ›cie zachodzi warunek Ã12= Ã22 (hipoteza zerowa), to zmienna postaci
à Ã
à Ã
à Ã
F= s12/ s22 ma również rozkład F Snedecora, co wykorzystujemy do zdefiniowania
obszaru krytycznego testu. UWAGA do wykorzystania tablic rozkładu F: należy
rozróżnić sposoby określania obszaru krytycznego dla testów 1-stronnych lub 2-
stronnych:
H0: Ã12= Ã22 wobec H1: Ã12`" Ã22 (dwustronny) F= s12/ s22 (ale zawsze s12>s22 )
à à à `" Ã
à à à `" Ã
à à à `" Ã
obszar krytyczny F>Fkryt(Ä…
Ä…/2,n1-1,n2-1)
Ä…
Ä…
H0: Ã12=Ã22 wobec H1: Ã12>Ã22 (jednostronny) F= s12/ s22 , wtedy obszar krytyczny
à à à Ã
à à à Ã
à à à Ã
jest określony jako F>Fkryt(ą
Ä…,n1-1,n2-1)
Ä…
Ä…
Testy istotności dla frakcji
Jeśli zmienna statystyczna w danej populacji przyjmuje tylko 2 dopuszczalne wartości
(mówimy wtedy o zmiennej dychotomicznej). W takiej sytuacji, frakcja elementów
populacji przyjmujących jedną z dopuszczalnych wartości zmiennej statystycznej
v
p = nx / n
nazywana jest wskaznikiem struktury w populacji. Liczbowo, frakcja taka
określa prawdopodobieństwo, że przy jednokrotnym losowaniu elementu populacji,
będzie się on charakteryzował tą właśnie wartością zmiennej dychotomicznej
(odpowiadająca wyróżnionej frakcji).
Zagadnienia testowania struktury populacji można sprowadzić do 2 przypadków:
1) weryfikujemy hipotezę że wskaznik struktury p w populacji ma określoną
(znaną) wartość p0,
(znaną) wartość p0,
2) weryfikujemy hipotezę o równości wskaznika struktury w dwóch badanych
populacjach.
Ad. 1) H0: p=p0 wobec H1: p`" (lub H1: p
p0 )
`"p0
`"
`"
v
p = nx / n
statystyka testowa ma asymptotyczny rozkład
N p, p(1 - p) / n
normalny , co przy wystarczająco dużej próbie
( )
pozwala na testowanie hipotezy zerowej względem rozkładu normalnego N(0,1), dla
statystyki testowej z próby obliczonej ze wzoru
v
u = p - p0 / p0(1 - p0) / n
( )
Jeśli wartość statystyki u z próby jest taka, że |u| e" ukryt(ą) odrzucamy H0.
Ad. 2) Przyjmijmy, że p1 oznacza frakcję elementów wyróżnionych z pierwszej
populacji, p2 z drugiej.
H0: p1=p2 wobec H1: p1`"p2 (lub H1: p1 < p2 lub H1: p1 > p2 )
`"
`"
`"
v v
Statystyki z próby: p1 = nx,1 / n1 , p2 = nx,2 / n2
Jeśli H0 jest prawdziwa, to statystyka dana wzorem:
v v v v
u = p1 - p2 / p(1 - p)(1/ n1 + 1/ n2)
( )
ma asymptotyczny rozkład normalny N(0,1), gdzie:
v
p = nx,1 + nx,2 / n1 + n2
( )
( )
Dla testu dwustronnego obszar krytyczny zdefiniowany jest relacjÄ…
Dla testu dwustronnego obszar krytyczny zdefiniowany jest relacjÄ…
P | u |e" ukryt (Ä…) = Ä…
( )
Przykład. Sprawdz, czy wśród pracowników zakładu przynależność do organizacji
społecznej A jest taka sama w grupie robotników (1) i nadzoru (2). Dla weryfikacji
hipotezy zerowej dokonano badań ankietowych: nx,2=180, n2=300, nx,1=400, n1=500
v
p = 580 / 800 = 0.725 u=((180/300)-(400/500))/ 0.725(1-0.725)(1/300+1/500) = -6.13
Dla rozkładu N(0,1) wart. krytyczna na poziomie istotności ą=0.05 wynosi ukr=1.96,
zatem |-6.13|>1.96 statystyka testowa jest w obszarze krytycznym, odrzucamy H0.
Różnica w przynależności do organizacji społecznej A w populacjach jest istotna.
Wyszukiwarka
Podobne podstrony:
STAT 10 W11
STAT 12 W8 Test Niezal
STAT 10 W3
STAT 10 W12
STAT 10 W5
STAT 10 W2
stat zadania1 10
BD W8
WSM 10 52 pl(1)
VA US Top 40 Singles Chart 2015 10 10 Debuts Top 100
10 35
więcej podobnych podstron