sad11hipotezy, PJWSTK, 0sem, SAD


TESTOWANIE HIPOTEZ

Hipoteza statystyczna jest to przypuszczenie dotyczące nieznanej własności rozkładu prawdopodobieństwa badanej cechy populacji.

Przykłady

pracy drukarki to 200 godzin. Wówczas

0x01 graphic

emitowanych przez substancję radioaktywną w

przedziałach czasu o danej długości jest zmienną

losową o rozkładzie Poissona. Wówczas

0x01 graphic

sprzedaży ma rozkład normalny. Wówczas

0x01 graphic
0x01 graphic
0x01 graphic
.

Hipotezę nazywamy parametryczną, jeśli jest stwierdzeniem dotyczącym nieznanego parametru liczbowego lub wektorowego rozkładu cechy populacji,

np. hipotezy (a), (b), (c).

W przeciwnym przypadku hipoteza jest nieparametryczną, np. hipotezy (d), (e).

W zadaniach testowania hipotez występują 2 hipotezy:

Hipoteza zerowa - hipoteza testowana celem ewentualnego odrzucenia, oznaczana przez 0x01 graphic
.

Hipoteza alternatywna - hipoteza, która będzie przyjęta, jeśli odrzucimy hipotezę zerową, oznaczana przez 0x01 graphic
.

Hipotezy wykluczają się: nie mogą być jednocześnie prawdziwe, np. niech 0x01 graphic
0x01 graphic
oznacza prawdopodobieństwo sukcesu w doświadczeniu Bernoulli'ego. Możliwe są hipotezy:

0x01 graphic
0x01 graphic
lub

0x01 graphic
, 0x01 graphic
, ale niemożliwe jest sytuacja gdy

0x01 graphic
, 0x01 graphic
, bo wartość 0x01 graphic
jest parametrem z zakresu 0x01 graphic
i 0x01 graphic
jednocześnie. Zbiory parametrów wymieniane w obu hipotezach nie są rozłączne.

Rola hipotez 0x01 graphic
i 0x01 graphic
nie jest symetryczna:

Hipoteza alternatywna, to ta którą zaakceptujemy, jeśli próbka dostarczy nam dostatecznych dowodów jej prawdziwości, ta o której sądzimy, że jest prawdziwa i szukamy potwierdzenia w próbce, to ta na której nam zależy aby była prawdziwa.

Hipoteza zerowa to ta co do której prawdziwości nie jesteśmy przekonani w sytuacji gdy nie możemy zaakceptować na podstawie próbki hipotezy alternatywnej, ta którą poddajemy w wątpliwość.

Przykład. Załóżmy, że skuteczność pewnej terapii medycznej wynosi 0x01 graphic
. Zaproponowano nową terapię, której nieznana skuteczność 0x01 graphic
nie jest gorsza, tzn. wiemy, że 0x01 graphic
. Nowa terapia będzie szeroko stosowana, jeśli będziemy mieli po badaniach wstępnych dostatecznie dużą „pewność”, że 0x01 graphic
. Wówczas

0x01 graphic
, 0x01 graphic
.

Przykład. Nowa technologia produkcji może zmniejszyć dobowy poziom emisji zanieczyszczeń do atmosfery. Chcielibyśmy wiedzieć, czy zmniejsza ona poziom zanieczyszczeń? Wówczas:

0x01 graphic
Nowa technologia nie zmniejsza dobowego poziomu emisji zanieczyszczeń atmosfery, tzn. nie jest lepsza od starej technologii.

0x01 graphic
: Nowa technologia zmniejsza dobowy poziom emisji zanieczyszczeń atmosfery, tzn. jest lepsza.

Zadanie testowania powyższych hipotez polega na podjęciu poniższych decyzji, na podstawie obserwacji dobowych poziomów emisji zanieczyszczeń,:

Możliwe decyzje:

Model matematyczny:

Załóżmy, że

przy starej technologii

przy nowej technologii

stwierdzić, że nowa technologia zmniejsza

poziom emisji. Zatem:

0x01 graphic
, 0x01 graphic

dobowe poziomy emisji przy nowej

technologii: 0x01 graphic

jednakowym rozkładzie 0x01 graphic
, gdzie 0x01 graphic
jest

znane

Decyzję: „ przyjąć 0x01 graphic
” lub „ nie można odrzucić 0x01 graphic
” rozsądnie jest oprzeć na podstawie realizacji średniej z próby losowej 0x01 graphic
, tzn. średniej z próbki 0x01 graphic
.

Uzasadnienie:

Rozkładem 0x01 graphic
jest rozkład 0x01 graphic
skoncentrowany wokół 0x01 graphic
. Zatem dostatecznie małe wartości 0x01 graphic
sugerują, że 0x01 graphic
jest prawdziwa, ponieważ

0x01 graphic
0x01 graphic

Wówczas Z jest sumą zmiennej o rozkładzie 0x01 graphic

oraz stałej ujemnej:

0x01 graphic
.

(1) i (2) sugerują sposób testowania: niech c będzie

odpowiednio dobraną stałą, a 0x01 graphic
wartością 0x01 graphic
obliczoną dla próbki, wówczas

  1. jeśli 0x01 graphic
    , to przyjmujemy 0x01 graphic
    .

  1. jeśli 0x01 graphic
    , to nie ma podstaw do

odrzucenia 0x01 graphic
.

Wybór c: Niech 0x01 graphic
będzie małą liczbą z (0,1), np.

0x01 graphic
lub 0, 01 lub 0,1, ...

Niech 0x01 graphic
. Wówczas jeśli 0x01 graphic
prawdziwa, to

0x01 graphic
.

Stąd 0x01 graphic
jest prawdopodobieństwem błędnej decyzji (przyjęcia 0x01 graphic
) w przypadku gdy hipoteza 0x01 graphic
jest prawdziwa. 0x01 graphic
= prawdopodobieństwo błędu I rodzaju, nazywane poziomem istotności testu.

Zbiór 0x01 graphic
nazywamy zbiorem krytycznym, bo jest to zbiór wartości statystyki testowej Z dla których odrzucamy 0x01 graphic
na korzyść 0x01 graphic
.

Błędy testowania

Podjęta decyzja

Stan natury

Akceptacja 0x01 graphic

( 0x01 graphic
? nie odrzucamy 0x01 graphic
)

Odrzucenie 0x01 graphic

(Akceptacja 0x01 graphic
)

0x01 graphic
prawdziwa

Decyzja prawidłowa

Błąd I rodzaju

0x01 graphic
prawdziwa

Błąd II rodzaju

(? )

Decyzja prawidłowa

I. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy znana jest wariancja

Niech 0x01 graphic
będzie prostą próbą losowa z rozkładu 0x01 graphic
, 0x01 graphic
- znane.

0x01 graphic
.

Statystyka testowa:

0x01 graphic
= 0x01 graphic
.

Jeśli 0x01 graphic
prawdziwa, to ZZZ 0x01 graphic
.

Model 1. 0x01 graphic
0x01 graphic
.

Wówczas przyjmujemy C = 0x01 graphic
= obszar krytyczny testu hipotezy 0x01 graphic
przeciw 0x01 graphic
na poziomie istotności 0x01 graphic
, gdzie

0x01 graphic
.

Model 2. 0x01 graphic
0x01 graphic

Wówczas przyjmujemy C = 0x01 graphic
- obszar krytyczny, gdzie

0x01 graphic
.

Model 3. 0x01 graphic
0x01 graphic

Wówczas

C =0x01 graphic
- obszar krytyczny, gdzie

0x01 graphic
0x01 graphic

0x01 graphic

Zadanie. Dotychczasowa dzienna wartość sprzedaży pewnego artykułu miała rozkład normalny o średniej 1000 ($) i standardowym odchyleniu 100 ($). Po serii reklam telewizyjnych w ciągu 9 losowo wybranych dni uzyskano następujące wartości sprzedaży:

1280, 1250, 990, 1100, 880, 1300, 1100, 950, 1050.

Czy, na poziomie istotności 0x01 graphic
, można twierdzić, że reklamy spowodowały zwiększenie sprzedaży, jeśli można założyć, że wartości dziennych sprzedaży są niezależnymi zmiennymi losowymi o jednakowym rozkładzie normalnym ?

Rozwiązanie:

  1. 0x01 graphic

  2. 0x01 graphic

  3. Statystyka testowa: 0x01 graphic

4. 0x01 graphic
, 0x01 graphic
, 0x01 graphic
= 2,33.

Obszar krytyczny C = 0x01 graphic

5. 0x01 graphic
, 0x01 graphic
, z obliczeń 0x01 graphic
, stąd wartość statystyki testowej

0x01 graphic
.

6. 0x01 graphic
, więc odrzucamy 0x01 graphic
.

Odpowiedź: Na poziomie istotności 0x01 graphic
stwierdzamy, że średnia wartość sprzedaży wzrosła po serii reklam.

II. Testowanie hipotez o wartości średniej rozkładu normalnego, gdy nieznana jest wariancja

Niech 0x01 graphic
będzie prostą próbą losowa z rozkładu 0x01 graphic
, 0x01 graphic
- nieznane.

0x01 graphic
.

Statystyka testowa:

0x01 graphic
= 0x01 graphic
.

Jeśli 0x01 graphic
prawdziwa, to 0x01 graphic
.

Model 1. 0x01 graphic
0x01 graphic

Wówczas przyjmujemy C = 0x01 graphic
= obszar krytyczny testu hipotezy 0x01 graphic
przeciw 0x01 graphic
na poziomie istotności 0x01 graphic
, gdzie

0x01 graphic
,

0x01 graphic
= kwantyl rzędu 0x01 graphic
rozkładu t - Studenta z 0x01 graphic
0x01 graphic
stopniami swobody.

Model 2. 0x01 graphic
0x01 graphic

Wówczas C = 0x01 graphic
- obszar krytyczny, gdzie

0x01 graphic
.

Model 3. 0x01 graphic
0x01 graphic

Wówczas

C = 0x01 graphic
- obszar krytyczny, gdzie

0x01 graphic
0x01 graphic
0x01 graphic

Zadanie. Producent twierdzi, że jego nowy model samochodu ma wartość średnią przebiegu nie wymagającą żadnej interwencji 12000 (mil). W teście dla 4 losowo wybranych samochodów uzyskano następujące przebiegi nie wymagające żadnego serwisu: 11000, 12000, 11800, 11200. Czy można zaprzeczyć twierdzeniu producenta, przyjmując 0x01 graphic
oraz rozkład normalny przebiegu.

Rozwiązanie:

1. 0x01 graphic

  1. 0x01 graphic

  2. Statystyka testowa: 0x01 graphic

4. 0x01 graphic
, 0x01 graphic
, liczba stopni swobody = 0x01 graphic
, 0x01 graphic
= 2,353.

Obszar krytyczny C = 0x01 graphic
.

5. 0x01 graphic
, z obliczeń 0x01 graphic
, 0x01 graphic
, stąd wartość statystyki testowej

0x01 graphic
.

6. 0x01 graphic
, więc nie ma podstaw do odrzucenia 0x01 graphic
na poziomie istotności 0,05.

Odpowiedź: Na poziomie istotności 0x01 graphic
stwierdzamy, że nie można odrzucić twierdzenia producenta.

Definicja.

Najmniejszy poziom istotności, przy którym zaobserwowana wartość statystyki testowej prowadzi do odrzucenia hipotezy zerowej nazywamy p-wartością przeprowadzonego testu.

Np. w ostatnim zadaniu

0x01 graphic
, 0x01 graphic
0x01 graphic

0x01 graphic
0,063.

Im mniejsza jest p-wartość, tym mocniejsze staje się przekonanie testującego o fałszywości hipotezy zerowej i prawdziwości hipotezy alternatywnej.

III. Testowanie hipotez o wariancji rozkładu normalnego, gdy nieznana jest wartość średnia

Niech 0x01 graphic
będzie prostą próbą losowa z rozkładu 0x01 graphic
, 0x01 graphic
,0x01 graphic
- nieznane.

0x01 graphic
.

Statystyka testowa:

0x01 graphic
= 0x01 graphic

Jeśli 0x01 graphic
prawdziwa, to 0x01 graphic
.

Model 1. 0x01 graphic
0x01 graphic

Wówczas przyjmujemy C = 0x01 graphic
= obszar krytyczny testu hipotezy 0x01 graphic
przeciw 0x01 graphic
na poziomie istotności 0x01 graphic
, gdzie

0x01 graphic
,

0x01 graphic
= kwantyl rzędu 0x01 graphic
rozkładu 0x01 graphic
.

Model 2. 0x01 graphic
0x01 graphic

Wówczas C = 0x01 graphic
- obszar krytyczny, gdzie

0x01 graphic
.

Model 3. 0x01 graphic
0x01 graphic

Wówczas obszar krytyczny C = 0x01 graphic
0x01 graphic
,

gdzie 0x01 graphic
, 0x01 graphic
.

Zadanie. Zmierzono czas życia 15 losowo wybranych żarówek z bieżącej produkcji. Policzono standardowe odchylenie próbkowe 0x01 graphic
(godz. ). Czy na poziomie istotności 0x01 graphic
( 5%) można twierdzić, że odchylenie standardowe czasu życia losowo wybranej żarówki jest różne od 10 ( godz.)

Rozwiązanie.

1. 0x01 graphic

2. 0x01 graphic

3. Statystyka testowa: 0x01 graphic

4. 0x01 graphic
, 0x01 graphic
, 0x01 graphic
,

0x01 graphic
, liczba stopni swobody 0x01 graphic
,

0x01 graphic
, 0x01 graphic

0x01 graphic
.

Reguła decyzyjna ( na podstawie obszaru krytycznego ): odrzuć 0x01 graphic
, jeśli obliczona wartość statystyki

0x01 graphic
0x01 graphic
lub 0x01 graphic
0x01 graphic
.0x01 graphic

5. s =13, stąd wartość statystyki testowej

0x01 graphic
= 0x01 graphic
0x01 graphic
0x01 graphic
.

6. 0x01 graphic
0x01 graphic
, więc nie ma podstaw do odrzucenia 0x01 graphic
.

Odpowiedź. Na poziomie istotności 0,05, brak jest dostatecznych dowodów aby twierdzić, że 0x01 graphic
10.

IV. Testy o różnicy wartości średnich dwóch rozkładów normalnych

Niech 0x01 graphic
oraz 0x01 graphic
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych 0x01 graphic
oraz 0x01 graphic
, odpowiednio.

Model 1. ( znane odchylenia standardowe 0x01 graphic
)

0x01 graphic
,

lub równoważnie

0x01 graphic
.

Statystyka testowa:

Konstrukcja oparta na analizie 0x01 graphic
.

Statystka 0x01 graphic
ma rozkład normalny o wartości średniej 0x01 graphic
i wariancji 0x01 graphic
( gdyż

średnie z obu prób losowych 0x01 graphic
są niezależnymi zmiennymi losowymi o rozkładach normalnych

0x01 graphic
, 0x01 graphic
, odpowiednio ). Stąd, po standaryzacji mamy

0x01 graphic
~ 0x01 graphic
.

(a) 0x01 graphic
, 0x01 graphic
.

Jeśli 0x01 graphic
prawdziwa, to

0x01 graphic
~ 0x01 graphic
.

Przyjmujemy C = 0x01 graphic
= obszar krytyczny testu hipotezy 0x01 graphic
przeciw 0x01 graphic
na poziomie istotności 0x01 graphic
, gdzie

0x01 graphic
,

0x01 graphic
= kwantyl rzędu 0x01 graphic
rozkładu 0x01 graphic
.

(b) 0x01 graphic
, 0x01 graphic
.

Przyjmujemy C = 0x01 graphic
= obszar krytyczny.

(c) 0x01 graphic
, 0x01 graphic

Przyjmujemy C = 0x01 graphic
= obszar krytyczny.

Przykład. Średnia waga losowo wybranych 15 Europejczyków wyniosła 0x01 graphic
= 154 (funty), podczas gdy dla próbki 18 Amerykanów otrzymano 0x01 graphic
= 162 (funty).

Z poprzednich badań wiadomo, że wariancje wag losowo wybranego Europejczyka i Amerykanina wynoszą, odpowiednio: 0x01 graphic
i 0x01 graphic
. Czy można twierdzić, że średnie wagi w populacji Europejczyków i Amerykanów są różne? Przyjąć 0x01 graphic
oraz rozkład normalny wag.

1. 0x01 graphic
.

2. 0x01 graphic

3. Statystyka testowa: 0x01 graphic

4. 0x01 graphic
, 0x01 graphic
, 0x01 graphic
.

Obszar krytyczny C = 0x01 graphic
.

5. Mamy0x01 graphic
=154, 0x01 graphic
=162, 0x01 graphic
, 0x01 graphic
, 0x01 graphic
,

0x01 graphic
. Stąd wartość statystyki testowej

0x01 graphic

0x01 graphic
= - 2.

6. 0x01 graphic
, więc odrzucamy 0x01 graphic
.

Odpowiedź: Na poziomie istotności 0x01 graphic
stwierdzamy, że średnia waga Europejczyka różni się od średniej wagi Amerykanina, przy czym dane sugerują, że średnio Amerykanie ważą więcej niż Europejczycy.

Model 2. ( nieznane odchylenia standardowe 0x01 graphic
)

Założenie dodatkowe: 0x01 graphic
, 0x01 graphic
- nieznane.

0x01 graphic
,

lub równoważnie

0x01 graphic
.

Statystyka testowa:

Jeśli 0x01 graphic
prawdziwa, to

0x01 graphic
= 0x01 graphic
~ 0x01 graphic
.

Var(0x01 graphic
) = 0x01 graphic
,

Niech

0x01 graphic
, 0x01 graphic
-

nieobciążone estymatory 0x01 graphic
.

Estymatorem nieobciążonym 0x01 graphic
, opartym na dwu próbach łącznie, jest statystyka

0x01 graphic
.

Wówczas we wzorze na Z podstawiając 0x01 graphic

zamiast 0x01 graphic
otrzymujemy statystykę

0x01 graphic
~ 0x01 graphic
.

Dla trzech przypadków możliwych hipotez alternatywnych (a), (b), (c) z modelu 1 mamy analogiczne obszary krytyczne, przy czym kwantyle rozkładu 0x01 graphic
zastępujemy kwantylami rozkładu 0x01 graphic
.

Przykład. Klasyczne tranzystory domieszkowane złotem ( występujące w układach scalonych ) mają tzw. czas magazynowania ładunku rzędu 7 ns. Producent ma nadzieję, że pewna zmiana technologii zmniejszyła czas magazynowania. Producent chciałby przetestować hipotezę 0x01 graphic
przeciw 0x01 graphic
, gdzie 0x01 graphic
oznacza średni czas magazynowania przy starej technologii a 0x01 graphic
przy nowej technologii. Z poprzednich badań wiadomo, że obie technologie dają w przybliżeniu normalne rozkłady czasu magazynowania, oraz że odchylenia standardowe obu rozkładów są takie same.

Producent pobrał 2 niezależne 50 elementowe próbki tranzystorów, produkowanych starą i nowa technologią.

Średnie czasy magazynowania dla obu próbek wyniosły

0x01 graphic
, 0x01 graphic
oraz 0x01 graphic
.

Statystyka testowa

0x01 graphic
.

Wartość statystyki testowej:

0x01 graphic
.

0x01 graphic
, 0x01 graphic
. Stąd obszar krytyczny

C = 0x01 graphic
.

oraz p-wartość testu wynosi 0x01 graphic
Zatem, można przyjąć, że nowa technologia zmniejszyła średni czas magazynowania ładunku.

V. Testy o różnicy wartości średnich rozkładów brzegowych

Niech 0x01 graphic
będzie prostą próbą losową z rozkładu dwuwymiarowego. Niech 0x01 graphic
tworzą prostą próbę losową z rozkładu normalnego o nieznanej średniej 0x01 graphic
.

Hipoteza zerowa: 0x01 graphic
,

Hipotezy alternatywne możliwe:

  1. 0x01 graphic
    ,

  1. 0x01 graphic

(c) 0x01 graphic
.

Statystyka testowa:

0x01 graphic
.

Jeśli 0x01 graphic
prawdziwa, to 0x01 graphic
.

Zatem, obszary krytyczne takie same jak przy testowaniu hipotez o wartości średniej jednej populacji normalnej przy nieznanym odchyleniu standardowym.

Przykład. Zmierzono ciśnienie tętnicze wśród losowo wybranej grupy chorych na pewną chorobę przed i po podaniu takiego samego leku każdemu z pacjentów. Otrzymano następujące wyniki:

Pacjent: 1 2 3 4 5 6 7

Przed : 210 180 260 270 190 250 180

Po : 180 160 220 260 200 230 180

Czy można twierdzić, na poziomie istotności 0,05, że lek powoduje zmniejszenie wartości średniej ciśnienia?

( podać odpowiednie założenia ).

1. 0x01 graphic
0x01 graphic
0x01 graphic

2. 0x01 graphic
0x01 graphic
0x01 graphic

3. Statystyka testowa: 0x01 graphic
.

4. 0x01 graphic
30, 20, 40, 10, -10, 20, 0, 0x01 graphic
, 0x01 graphic
= 15,9,

n = 7,

0x01 graphic

5. 0x01 graphic
0x01 graphic
0x01 graphic
,

0x01 graphic

6. 2,24 >1,94, więc odrzucamy hipotezę zerową.

Odpowiedź. Można twierdzić, że lek obniżył wartość średnią ciśnienia w populacji pacjentów, na poziomie istotności 0,05.

VI. Testowanie hipotezy o równości wariancji dwóch rozkładów normalnych

Niech 0x01 graphic
oraz 0x01 graphic
będą dwiema niezależnymi prostymi próbami losowymi z rozkładów normalnych 0x01 graphic
oraz 0x01 graphic
, odpowiednio,

0x01 graphic
.

Statystyka testowa:

0x01 graphic

Jeśli 0x01 graphic
prawdziwa, to 0x01 graphic
F Snedecora o 0x01 graphic
stopniami swobody.

(a) 0x01 graphic
,

  1. 0x01 graphic
    ,

  1. 0x01 graphic
    .

W przypadkach (a), (b), (c) odrzucamy hipotezę zerową, na poziomie istotności 0x01 graphic
, jeśli obliczona wartość statystyki F Snedecora f spełnia nierówności, odpowiednio:

(a) f 0x01 graphic
,

(b) f 0x01 graphic

(c) f 0x01 graphic
lub f 0x01 graphic
,



Wyszukiwarka

Podobne podstrony:
kol3(maj), PJWSTK, 0sem, SAD
SAD e 03.01.2006 v1, PJWSTK, 0sem, SAD
SAD k3 zadania pomocnicze, PJWSTK, 0sem, SAD, SAD inne, kolokwia
sadreg2-egzamin, PJWSTK, 0sem, SAD
sad7(3), PJWSTK, 0sem, SAD
zasady, PJWSTK, 0sem, SAD
SAD e 09.02.2007, PJWSTK, 0sem, SAD
sad13p(1), PJWSTK, 0sem, SAD
sad11pp(02), PJWSTK, 0sem, SAD
sad8(2), PJWSTK, 0sem, SAD
SADegzamin2003, PJWSTK, 0sem, SAD
SAD e xx.09.2003 v2, PJWSTK, 0sem, SAD
SAD e 30.01.2009 v2, PJWSTK, 0sem, SAD, egzaminy
SAD e 03.01.2006 v2, PJWSTK, 0sem, SAD
sad9p(02), PJWSTK, 0sem, SAD
SAD e 30.01.2009 v1, PJWSTK, 0sem, SAD, egzaminy

więcej podobnych podstron