Pyt. 5 Testowanie hipotez statystycznych
Inaczej weryfikacja hipotezy statystycznej - (odbywa się przez zastosowanie specjalnego narzędzia, zwanego testem statystycznym) jest to reguła postępowania, która każdej możliwej próbie losowej przyporządkowuje decyzję przyjęcia lub odrzucenia sprawdzanej hipotezy.
Należy jednak podkreślić, że przyjęcie lub odrzucenie hipotezy w teście statystycznym nie jest równoznaczne z logicznym udowodnieniem jej prawdziwości lub fałszywości. Należy bowiem pamiętać, że odrzucając sprawdzaną hipotezę w teście statystycznym, kierujemy się jedynie tym, że dane liczbowe wynikające z pomiarów dają nam małą szansę prawdziwości tej hipotezy.
Hipotezy statystyczne, będące sformułowanymi przypuszczeniami dotyczącymi rozkładu populacji, mogą mieć różną postać, w zależności od hipotez badawczych. Hipoteza statystyczna może być hipotezą dotyczącą parametrów (jest to tzw. hipoteza parametryczna) lub postaci rozkładu określonego zbioru (hipoteza nieparametryczna).
Hipotezy parametryczne testuje/ wnioskuje się za pomocą testów parametrycznych , które pozwalają formułować szereg wniosków dotyczących różnych parametrów statystycznych. Badanie zjawisk w drodze obliczania wybranych parametrów jest bardzo efektywnym sposobem poznania, wynika to ze zwięzłej i precyzyjnej formy opisu. Jednak testy parametryczne, mimo swej różnorodności, nie dają odpowiedzi na wszystkie istotne pytania, głównie dlatego, że testy te mogą być stosowane w przypadku, gdy badana wielkość (populacja) ma rozkład normalny lub bardzo zbliżony do niego. Ponadto testy parametryczne, jak sama nazwa wskazuje, opisują pewną właściwość badanego zjawiska (wyników pomiarów), nie dając dostatecznych podstaw do formułowania wniosków ogólnych. Np. test T- studenta, test chi-kwadrat
Hipotezy nieparametryczne testuje się za pomocą testów nieparametrycznych (test zgodności chi- kwadrat, test zgodności Kołmogorowa) Testy te nie są uzależnione od rozkładu badanej cechy, mogą być więc stosowane także w przypadku dowolnych rozkładów, niekoniecznie zbliżonych do normalnego. Testy nieparametryczne możemy podzielić na dwie grupy:
testy zgodności, pozwalające na sprawdzenie hipotezy, że populacja ma określony typ rozkładu,
testy dla hipotezy, że dwie próby pochodzą z jednej populacji (czyli, że dwie populacje mają ten sam rozkład).
W statystyce przeważnie nie mamy absolutnej pewności co do słuszności pewnej hipotezy, a osiągnięcie całkowitej pewności często jest nieopłacalne (ze względu na czasochłonność i kosztochłonność) lub nawet z różnych względów niemożliwe. W zależności od postaci postawionej hipotezy zerowej (czyli bezpośrednio sprawdzanej) oraz postaci hipotezy alternatywnej (tzn. konkurencyjnej w stosunku do hipotezy zerowej) sposób budowy testu jest różny. Każda hipoteza H0 ma hipotezę do siebie alternatywna H1 lecz zawsze testujemy
hipotezę zerowa i to ona ulega przyjęciu lub odrzuceniu na rzecz hipotezy alternatywnej.
Proces sprawdzania hipotezy ma zwykle następujący przebieg: stawiamy pewną hipotezę H0 odnośnie całej populacji, pobieramy próbę, badamy ją i na tej podstawie akceptujemy lub odrzucamy postawioną hipotezę.
Testowanie hipotez statystycznych
Konfrontacja hipotezy z eksperymentem polega na statystycznym wnioskowaniu o rozkładzie populacji na podstawie wyników eksperymentu stanowiących próbę.
TEST HIPOTEZY/STATYSTYCZNY - oparte na statystyce matematycznej postępowanie pozwalające podjąć decyzję o słuszności lub odrzuceniu hipotezy. Proces weryfikacji hipotezy przebiega według pewnego schematu postępowania nazywanego testem statystycznym. Testy na podstawie wyników z próby losowej pozwalają podjąć decyzję o odrzuceniu lub nie postawionej hipotezy.
Decyzja podjęta w wyniku przeprowadzenia testu hipotezy obejmuje:
1. przyjęcie hipotezy,
2. odrzucenie hipotezy,
3. w pewnych przypadkach żądanie dalszych, dodatkowych eksperymentów przed podjęciem decyzji.
Podstawowe kroki postępowania (szerzej omówione)
Sformułowanie hipotezy
|
Formułowanie hipotezy statystycznej rozpoczyna się zebraniem informacji na temat populacji i jej możliwego rozkładu. Dzięki temu możliwe jest zbudowanie zbioru hipotez dopuszczalnych, czyli zbioru rozkładów, które mogą charakteryzować badaną populację. Hipoteza statystyczna to każdy podzbiór zbioru hipotez dopuszczalnych. |
Określenie sprawdzianu hipotezy |
Określenie pewnej statystykiT(statystyki testowej) będącej funkcją próby pomiarowej. Statystyka ta winna mieć znany i dobrze określony rozkład. |
Określenie poziomu istotności |
Test hipotezy przeprowadzany z określonym poziomem istotności nazywa się testem istotności. Zwykle wybiera się małe poziomy istotności, np. 0,001, 0,01 lub 0,05. np. poziom 0,01 świadczy, że jesteśmy skłonni popełnić jeden błąd na 100 badań.
|
Wyznaczenie zbioru krytycznego |
Zbiorem krytycznym jest zbiór C wartości statystyki testowej T, prowadzących do odrzucenia hipotezy H0 na korzyść hipotezy H1. Prawdopodobieństwo przyjęcia przez tę statystykę wartości z obszaru C jest przy założeniu prawdziwości hipotezy H0 równe poziomowi istotności α |
Obliczenie wartości t sprawdzianu hipotezy i podjęcie decyzji |
Dla wyników eksperymentu obliczamy wartość t sprawdzianu hipotezy T. Hipotezę H0 odrzucamy, jeżeli t ⊂ C. W przeciwnym przypadku uważamy, że nie mamy podstaw do odrzucenia hipotezy H0. |
Testowaniu hipotez statystycznych towarzyszy również ryzyko popełnienia błędu określenia ich prawidłowości. Najczęściej mówi się o błędach w testach statystycznych :
Błąd pierwszego rodzaju, polegający na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Prawdopodobieństwo popełnienia błędu pierwszego rodzaju nazywamy poziomem istotności i najczęściej oznacza się α . Najczęściej przyjmowane są wartości 0,05 oraz 0,01 i 0,001.
Błąd drugiego rodzaju, polegający na przyjęciu hipotezy zerowej, gdy ona w rzeczywistości jest fałszywa. Prawdopodobieństwo popełnienia błędu drugiego rodzaju oznacza się najczęściej literą β .