54 II. P&rametrycznc testy istotności
Przyjęcie i odrzucenie hipotezy w teście statystycznym nie jest równoznaczne z logicznym udowodnieniem jej prawdziwości lub iałszywości. Należy bowiem pamiętać. że odrzucając np. w teście statystycznym sprawdzaną hipotezę kierujemy się jedynie tym, że dane liczbowe wynikające z badania rzeczywistości dają nam małą szansę prawdziwości tej hipotezy, nie zgadzają się z nią. Możliwe jednak, że jest na odwrót, tzn. hipoteza jest prawdziwa, a tylko nasze dane liczbowe z próby są zie lub po prostu mało prawdopodobne przy tej hipotezie. Wprawdzie w ogólnej teorii weryfikacji hipotez statystycznych rozpatruje się różne rodzaje testów* np. testy najmocniejsze, nieobciąźone itd,, ale w praktycznych zastosowaniach, statystyki matematycznej do różnych dziedzin, z których pochodzą sfor-' mułowane hipotezy statystyczne, decydujące znaczenie ma jeden typ testów,-zwanych testami istotności. Testy istotności to taki rodzaj testów, w których na podstawie wyników próby losowej podejmuje się jedynie decyzję od-< rzucenia hipotezy sprawdzanej lub stwierdza się, że brak jest podstaw do jej odrzucenia. Nie podejmuje się natomiast w teście istotności decyzji’ o przyjęciu sprawdzanej hipotezy, gdyż bierze się w nim pod uwagę jedynie błąd pierwszego rodzaju (którego prawdopodobieństwo nosi nazwę poziomu istotności), a nie uwzględnia się konsekwencji popełnienia błędu drugiego rodzaju.
Testy istotności, pozwalające jedynie odrzucać sprawdzaną hipotezę zerową (z określonym, małym ryzykiem popełnienia błędu pierwszego rodzaju) są w ogromnej większości przypadków zupełnie wystarczające dla potrzeb praktyki. Jest tak dlatego, że najczęściej hipotezę badawczą,, którą praktyk-eksperymentator pragnie sprawdzić, da się zamienić na odpowiednią, jak gdyby „odwrotną” hipotezę statystyczną, której odrzucenia pragnie ten praktyk, a na przyjęciu której wcale mu nic zależy . Można to zilustrować następującym, typowym przykładem. Przypuśćmy, że wynaleziono nową technologię produkcji stali o podobno wyższej wytrzymałości niż otrzymywano starą technologią. Przeprowadzono eksperyment próbnej produkcji nową i starą technologią, by na podstawie wyników liczbowych tego eksperymentu wykazać przeciętnie wyższą wytrzymałość, nowej metody. Do udowodnienia tej hipotezy badawczej wystarczy zastosować test istotności dla hipotezy statystycznej sformułowanej następująco: rozkłady wytrzymałości stali uzyskiwanej starą i nową metodą mają jednakowe średnie. Formalnie zapisujemy to w formie hipotezy zerowg
=m2, svobcc hipotezy alternatywnej i/3: rwj >/«jt gdzie/*i oznacza średnią wartość wytrzymałości stali uzyskiwanej nową metodą, a m3 jest mką samą średnią dla starej metody. Jeżeli zastosowany test istotności dla hipotezy H0 doprowadzi do jej odrzucenia, to wyższość nowej metody została udowodniona (z odpowiednio małym ryzykiem błędu, mierzonym poziomem istotności użytym w tym teście). Jeżeli natomiast zastosowany test istotności da odpowiedź, że nie ma podstaw do odrzucenia hipotezy to oznacza to, że cały nagromadzony nieraz wielkim wysiłkiem zbiór danych liczbowych mający świadczyć o wyższości nowej metody, jest za słabym argumentem i nie może tej wyższości udowodnić. Odpowiedź taka przysparza praktykowi, twórcy nowej metody i tak dość zmartwień, natomiast nie zależy mu zupełnie na przyjęciu hipotezy H0. bo to oznaczałoby, że marnował czas nad wynalezieniem metody identycznej pod względem przeciętnego poziomu wytrzymałości ze starą.
Powyższy przykład ilustruje fakt wystarczalności dla prakiyki testów istotności, pozwalających jedynie na odrzucenie sprawdzanej hipotezy statystycznej.
Ogólnie rzecz biorąc, statystyczne testy istotności powstają w taki sposób, że w zależności od postaci hipotezy zerowej buduje się pewmą statystykę Z 7. wyników n-elementowej próby i wyznacza się rozkład tej statystyki przy założeniu prawdziwości hipotezy H0. W rozkładzie tym wybiera się taki obszar Q wartości statystyki Z, by spełniona była równość
%
gdzie a jest ustalonym z góry, dowolnie małym prawdopodobieństwem. Obszar Q nazywa się obszarem krytycznym testu, gdyż ilekroć wartość statystyki Z z próby znajdzie się w nim, to podejmuje sic decyzję odrzucenia hipotezy Hc na korzyść jej alternatywy H1. Natomiast, gdy otrzymana z konkretnej próby wartość statystyki Z nic należy do obszaru krytycznego Q, to nie ma podstaw' do odrzucenia hipotezy H0. Należy wyraźnie podkreślić, źe nie jest to równoważne z jej przyjęciem.
Uzasadnienie powyższych decyzji jest następujące.
Obszar krytyczny Q został tak wyznaczony, że pr2y założeniu prawdziwości hipotezy' Bo prawdopodobieństwo otrzymania z próby «-e!emen-towej wartości statystyki Z należącej do tego obszaru jest znane i jest bardzo małą liczbą. Takie zdarzenie losowe nic powinno się więc zrealizo-