wykład5 statystyka

Wykład 5
Weryfikacja hipotez statystycznych, cd.
Weryfikacja hipotezy o równości wariancji dwóch populacji
Gdy prowadzimy badania ze względu na pewną cechę w dwóch populacjach, zachodzi często
potrzeba weryfikacji hipotezy o jednakowym stopniu rozproszenia wartości badanej cechy w
tych populacjach. Musimy wtedy zweryfikować hipotezę o równości wariancji badanej cechy w
rozpatrywanych populacjach.
Model Dane są dwie populacje, w których badana cecha X ma rozkłady N(m1, �1) i N(m2, �2)
2 2
odpowiednio, o nieznanych parametrach. Weryfikujemy hipotezę H0 : �1 = �2, wobec
hipotezy altenatywnej
2 2
" H1 : �1 > �2,
2 2
" H1 : �1 < �2,
2 2
" H1 : �1 = �2.

Uwaga:
Wykorzystując wyniki z prób można też przeprowadzić test formułując hipotezy na dwa
następujące sposoby:
(a)
2 2
H0 : �1 = �2
2 2
H1 : �1 = �2,

test z dwustronnym obszarem krytycznym.
(b)
2 2
H0 : �1 �2
2 2
H1 : �1 > �2,
test z jednostronnym obszarem krytycznym.
Weryfikację hipotezy H0 przeprowadzamy na podstawie wyników dwóch niezależnych prób
prostych o licznościach odpowiednio równych n1 i n2 pobranych z tych populacji. W teście
do weryfikacji wykorzystuje się statystykę:
n1

1
Ż
(X1i - X1)2
Ć2 n1 2
S1 n1-1S1 n1-1 1
F = = = ,
n2 n2
2
2
Ć
S2 n2-1S2 1
Ż
(X2i - X2)2
n2-1
1
która przy założeniu prawdziwości hipotezy H0 ma rozkład F Snedecora o (n1-1, n2-1)
stopniach swobody.
1
Rozkład F Snedecora
W tablicach mamy kwantyle rzędu p = 0.95, 0.975, 0.99 i 0.995 dla pary (�1, �2) stopni
swobody. Ponieważ jednak statystyka
Ć2
1 S2

F = =
2
Ć
F
S1
ma także rozkład F Snedecora o (�2, �1) stopniach swobody, więc można wyznaczyć kwan-
tyle rzędów p = 0.05, 0.025, 0.01 i 0.005, ponieważ zachodzi warunek
F (p, �1, �2) = 1/F (1 - p, �2, �1).
Zbiór krytyczny testu obieramy w zależności od hipotezy alternatywnej, czyli:
2 2
" gdy hipotezą alternatywną jest H1 : �1 > �2, wtedy zbiorem krytycznym jest
przedział: F (1 - ą, n1 - 1, n2 - 1), +"),
2 2
" gdy H1 : �1 < �2, to F (1 - ą, n2 - 1, n1 - 1), +"),
2 2
" gdy H1 : �1 = �2, wtedy test w praktyce jest oparty na statystyce

Ć2 Ć2
max(S1, S2)

F1 = max(F, F ) = ,
2 2
Ć Ć
min(S1, S2)
1
natomiast zbiór krytyczny, to F (1 - ą, nl - 1, nm - 1), +"), gdzie nl to liczność
2
próbki z licznika, a nm z mianownika.
Weryfikacja hipotezy o równości wartości przeciętnych badanej cechy dwóch popu-
lacji
Model 1 Badana cecha X ma w dwóch populacjach rozkłady N(m1, �1) i N(m2, �2) odpowiednio,
o znanych �1, �2 i nieznanych m1 i m2.
Weryfikujemy hipotezę H0 : m1 = m2. Oznaczmy poziom istotności przez ą. Z obu
populacji pobieramy dwie niezależne próbki, o licznościach odpowiednio równych n1 i n2.
Do weryfikacji hipotezy H0 stosujemy test oparty na statystyce:
Ż Ż
X1 - X2
U = ,
2 2
�1 �2
+
n1 n2
2
Ż Ż
gdzie X1 i X2 są odpowiednio śr. aryt. pobranych próbek. Statystyka ta przy założeniu
prawdziwości hipotezy H0 ma rozkład N(0, 1).
Zbiorami krytycznymi testu są przedziały:
" (-", -u(1 - ą) gdy h. a. jest H1 : m1 < m2,
" u(1 - ą), +") gdy H1 : m1 > m2,
1 1
" (-", -u(1 - ą) *" u(1 - ą), +") gdy H1 : m1 = m2.

2 2
Model II Badana cecha X ma w dwóch populacjach rozkłady N(m1, �1) i N(m2, �2) odpowiednio, o
nieznanych ale jednakowych �1 i �2 (tzn. �1 = �2). Weryfikujemy hipotezę H0 : m1 = m2.
Założenia o równości odchyleń stand. można uczynić np. w przypadku, gdy z dwóch próbek
pobieranych co kilka godzin z bieżącej produkcji oblicza się w laboratoriach wariancję
jakości cechy mierzalnej jednakowego wyrobu wykonywanego przez dwa aparaty i okazu-
ją się one przez dłuższy czas praktycznie jednakowe. Najczęściej jednak nie wiemy, czy
założenie to jest spełnione, wobec tego, należy najpierw zweryfikować hipotezę o równo-
ści wariancji i dopiero, gdy na przyjętym poziomie istotności nie będzie ona odrzucona,
stosować poniższy test. W przeciwnym przypadku istnieje możliwość zastosowania innej
wersji testu t, czyli tzw. testu dla dwóch średnich, przy nierównych wariancjach (test
Cochrana-Coxa lub t Satterwhite a).
Do weryfikacji hipotezy H0 : m1 = m2 wykorzystuje się test t oparty na statystyce:
Ż Ż
X1 - X2

t = ,
2 2
n1S1 +n2S2 n1+n2
�
n1+n2-2 n1n2
która przy założeniu prawdziwości hipotezy H0 ma rozkład t Studenta o n1 + n2 - 2
stopniach swobody.
Zbiorami krytycznymi testu są:
" (-", -t(1 - ą, n1 + n2 - 2) gdy h. a. jest H1 : m1 < m2,
" t(1 - ą, n1 + n2 - 2), +") gdy H1 : m1 > m2,
1 1
" (-", -t(1 - ą, n1 + n2 - 2) *" t(1 - ą, n1 + n2 - 2), +") gdy H1 : m1 = m2,

2 2
gdzie t(p, �) oznacza kwantyl rzędu p rozkładu Studenta o � stopniach swobody.
Model III Badana cecha X ma w dwóch populacjach rozkłady N(m1, �1) i N(m2, �2) odpowiednio,
o nieznanych �1 i �2. Weryfikujemy hipotezę H0 : m1 = m2.
Test oparty jest na statystyce (Cochrana i Coxa):
Ż Ż
X1 - X2

C = .
2 2
S1 S2
+
n1-1 n2-1
Rozkład tej statystyki jest zależny od liczności próbek oraz od stosunku �1/�2, który jest
nieznany, ale dla danych n1 i n2 można znalezć przybliżoną wartość c(p, n1, n2) kwantyla
rzędu p rozkładu zmiennej C, tzn.

s2 s2
1 2
<"
c(p, n1, n2) = t(p, n1 - 1) + t(p, n2 - 1) :
n1 - 1 n2 - 1

s2 s2
1 2
: + .
n1 - 1 n2 - 1
Zbiorami krytycznymi są przedziały:
3
" (-", -c(1 - ą, n1, n2) gdy h. a. jest H1 : m1 < m2,
" c(1 - ą, n1, n2), +") gdy H1 : m1 > m2,
1 1
" (-", -c(1 - ą, n1, n2) *" c(1 - ą, n1, n2), +") gdy H1 : m1 = m2,

2 2
t(p, �) oznacza kwantyl rzędu p rozkładu Studenta o � stopniach swobody.
Model IV Badana cecha X ma w dwóch populacjach rozkłady N(m1, �1) i N(m2, �2) odpowiednio,
o nieznanych �1 i �2. Weryfikujemy hipotezę H0 : m1 = m2 na podstawie prób o dużych
licznościach n1 i n2 (n1, n2 100). Test istotności dla sprawdzanej hipotezy H0 buduje
się identycznie jak w modelu I, z tą różnicą, że przy obliczaniu wartości statystyki zamiast
nieznanych wariancji przyjmujemy wartości s2 i s2 uzyskane z próbek.
1 2
Model V Test t Satterwhite a
Test ten polega na obliczeniu wartości statystyki t:
Ż Ż
X1 - X2
t = ,
2 2
Ć Ć
S1 S2
+
n1 n2
która przy założeniu prawdziwości H0 ma rozkład t Studenta o liczbie stopni swobody df
równej części całkowitej z liczby:
2
%5ń2 %5ń2
1 2
+
n1 n2
.
%5ń2 %5ń2
1 2
n1 n2
+
n1-1 n2-1
Model VI Metoda zmiennych połączonych. Czasem w praktyce zdarza się, że wyniki dwu prób
możemy traktować, jak wyniki pomiarów na tym samym elemencie populacji. Jest tak
wtedy, gdy stanowią one pary przyporządkowanych sobie liczb. Typową sytuacją jest tu
model: wynik xi przed jakąś operacją i wynik yi po niej dla tego samego i. Należy wtedy
analizować wyniki obu prób jako wyniki jednej próby, biorąc różnice yi -xi. Czyli hipotezę
dotyczącą równości wartości przeciętnych m1 i m2 badanej cechy w populacji przed i po
operacji zastępujemy hipotezą równoważną H0 : m1 - m2 = 0.
Jeśli więc badaną cechę przed operacją oznaczymy przez X, a po operacji Y oraz różnicę
tych zmiennych losowych ozn. przez Z, skąd
X - Y = Z �! mz = 0,
to weryfikacja hipotezy H0 : m1 - m2 = 0 sprowadza się do weryfikacji równoważnej
hipotezy H0 : mz = 0. Weryfikujemy ją za pomocą testu t dla wartości przeciętnej
(model II). Statystyką testową jest więc tutaj statystyka:
Ż
"
Z
t = n - 1,
Sz
n n n

1 1 2
Ż Ż
gdzie Z = Zi = (Xi - Yi), Sz = (Zi - Z)2, która przy założeniu prawdziwości
n n
1 1 1
hipotezy H ma rozkład t Studenta o n - 1 stopniach swobody.
Sposób wnioskowania w teście dla par obserwacji jest dokładnie taki sam jak w teście dla
wartości średniej.
4
Zadanie1
" Dla oceny odporności wszczepów stomatologicznych, wykonanych ze stopów z pamięcią
kształtu na działanie środowiska (tkanka kostna), dokonano pomiarów masy wszczepów
przed wszczepieniem i 52 tygodnie po wszczepieniu. Zbadać, czy zastosowany stop rokuje
na wdrożenie, jeżeli w ramach eksperymentu uzyskano następujące masy wszczepów:
Zadanie2
" Sprawdzić, czy uzasadnione są koszty modernizacji rekuperatora w rejonie wlotu zimnego
powietrza, mającej na celu podwyższenie temperatury końcowej powietrza, jeżeli w nieza-
leżnie wykonanych pomiarach przed modernizacją uzyskano: 494, 496, 508, 496, 505, 493,
ć%
498, 492, 507(w C), a po modernizacji: 501, 496, 509, 508, 497, 499, 507, 512, 509, 507,
ć%
511 (w C). Przyjąć poziom istotności ą = 0, 01.
Zadanie3
" Autor wniosku racjonalizatorskiego, mającego na celu zmiany konstrukcyjne rekupera-
tora, nie zrażony niepowodzeniem opisanego w poprzednim przykładzie eksperymentu,
podjął dalsze starania, których efektem jest zgłoszenie nowej wersji wniosku. Dalej idą-
ce udoskonalenia konstrukcyjne poddano ocenie wykonując serię dodatkowych pomiarów
temperatury końcowej powietrza: 500, 508, 509, 507, 506, 510, 506, 510, 506, 510, 506,
507, 508, 507, 509ć%C (pomiar III). Sprawdzić, czy wyniki tej serii pomiarowej potwierdza-
ją zasadność przebudowy rekuperatora dla uzyskiwania wyższej temperatury powietrza.
Przyjąć poziom istotności ą = 0, 01.
Weryfikacja hipotezy o równości wielu wariancji
Uogólnieniem testu do weryfikacji hipotezy o równości dwóch wariancji są testy do weryfikacji
hipotezy o równości wariancji badanej cechy w kilku populacjach.
Model I Badana cecha X w k (k 3) populacjach ma rozkład N(mi, �i) (i = 1, . . . , k.). Weryfikacja
2 2
hipotezy H0 : �1 = . . . = �k przeciw hipotezie alternatywnej, że wszystkie wariancje
są równe, w oparciu o wyniki z k próbek o licznościach n1, . . . , nk, pobranych losowo
odpowiednio z tych populacji.
Rozważymy przypadki trzech różnych testów.
1. Test Bartletta. Oznaczmy przez xij j-tą obserwację i-tej populacji oraz niech
ni ni

1
xi = xij, (ni - 1)%5ń2 = (xij - xi)2, i = 1, . . . , k,
Ż Ż
i
ni j=1
j=1
5

k k

1 1 1
c = 1 + - , gdzie n = ni.
3(k - 1) ni - 1 n - k
i=1 i=1
Hipotezę H0 weryfikujemy za pomocą testu opartego na statystyce

k

1 (ni - 1)%5ń2 k
i=1 i
�2 = (n - k) ln - (ni - 1) ln %5ń2 .
i
c n - k
i=1
Statystyka ta ma w przybliżeniu (nawet dla niezbyt licznych prób), rozkład �2(k-1).
Zbiorem krytycznym testu jest przedział
�2(1 - ą, k - 1), +"),
gdzie �2(1 - ą, k - 1) jest kwantylem rzędu 1 - ą rozkładu �2(1 - ą). Test Bartletta
jest bardzo czuły na odchylenia od normalności rozkładów.
2. Test Hartleya. W przypadku, gdy liczności próbek pobranych z tych k populacji są
równe, tzn. n1 = . . . = nk = n 5, wtedy do weryfikacji hipotezy H można także
wykorzystać test Hartleya oparty na statystyce
2 "2
max(Si ) max(Si )
H = = .
2 "2
min(Si ) min(Si )
Zbiorem krytycznym testu jest przedział
H(1 - ą, k, n), +"),
gdzie H(1 - ą, k, n) jest kwantylem rzędu 1 - ą rozkładu statystyki H0 przy danych
k i n.
3. Test Cochrana. Przy tym samym ograniczeniu, co przy teście Hartleya, do weryfikacji
hipotezy H0 można wykorzystać test Cochrana oparty na statystyce
2 "2
max(Si ) max(Si )
G = = .
k 2 k "2
Si i=1 Si
i=1
Zbiorem krytycznym tego testu jest przedział
G(1 - ą, k, n), +"),
gdzie G(1 - ą, k, n) jest kwantylem rzędu 1 - ą rozkładu statystyki G przy danych
k i n.
6

Wyszukiwarka

Podobne podstrony:
Wyklad4 statystyka
Wyklad2 statystyka
wykład statystyka matematyczna cz 4
wykład 1 Statystyka
wykład9 statystyka
wykład10 statystyka
Wykład 2 statystyka opisowa
2010 TB wyklady statystyka
Wyklad1 statystyka
Wyklad3 statystyka
wykład3 statystyka
Wyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]
Statystyka wyklad 7
wyklad 1 wprowadzenie statystyki oisowe
Wykłady z metod statystycznych
Tikhonenko O Wykłady ze statystyki matematycznej Wykład 6
Statystyka wyklad 4
Statystyka wyklad4nowy

więcej podobnych podstron