STATYSTYKA
Weryfikacja hipotez statystycznych
(przykłady zastosowań)
Weryfikacja hipotez dotyczących prawdopodobieństw
(wskaźnika struktury)
Weryfikacja hipotezy p=p0 (duże liczności prób n ł 100)
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
lub
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy p=p0.
Weryfikacja hipotezy płp0 (duże liczności prób n ł 100)
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy płp0.
Weryfikacja hipotezy pŁp0 (duże liczności prób n ł 100)
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy pŁp0.
Przykład
Firma prowadząca sprzedaż sprzętu sportowego postanowiła wprowadzić na rynek nowy typ obuwia narciarskiego. Przeprowadzono badanie rynku, w wyniku którego oceniono, że 10% osób jeżdżących na nartach skłonna jest zakupić obuwie tego typu. Menedżment firmy uznał, że jest to zbyt mało, by przedsięwzięcie powiodło się finansowo. Przeprowadzono więc dodatkową akcję promocyjną, po której przebadano próbę losową 200 osób, z których 27 wyraziło chęć zakupu butów nowego typu. Czy dodatkowa akcja promocyjna spełniła swoje zadanie?
Na poziomie istotności a=0.10 weryfikujemy hipotezę:
H : p=p0=0,1
Mamy
oraz
Tak więc nie ma podstaw do zakwestionowania weryfikowanej hipotezy. Uzyskane wyniki badania rynku nie są wystarczającym dowodem by twierdzić, że akcja promocyjna zakończyła się sukcesem.
Weryfikacja hipotez dotyczących bardzo małych wartości prawdopodobieństw
W badaniach jakości interesuje nas spełnienie wymagania by frakcja wyrobów niezgodnych z wymaganiami (wadliwych) była nie większa od pewnej wartości krytycznej p0. Należy wyznaczyć minimalną liczność próby n, tak by na poziomie istotności a=0.05 zweryfikować hipotezę p Ł p0 , przy założeniu, że w badanej próbie nie ma ani jednej jednostki niezgodnej.
Przykład
Hurtownia kosmetyków zamawia u producenta flakony wody toaletowej. Przyjęto, że jeden na tysiąc flakonów może zawierać wyraźnie mniej wody niż podano na opakowaniu. Ile kolejnych skontrolowanych (i właściwie napełnionych) flakonów daje gwarancję (na poziomie istotności 5%), że postawione wymaganie jest spełnione dla danej dostawy towaru?
Należy więc poddać kontroli co najmniej 3000 flakonów, z których każdy powinien być właściwie napełniony.
Porównywanie dwu prawdopodobieństw
Obserwujemy realizacje dwu zmiennych losowych, z których każda ma dwupunktowy rozkład prawdopodobieństwa o parametrach, odpowiednio, p1 oraz p2. Badaniu poddano n1 obiektów opisanych przez pierwszą zmienną losową obserwując k1 przypadków zajścia opisanego przez tą zmienną zdarzenia losowego oraz n2 obiektów opisanych przez drugą zmienną losową obserwując k2 przypadków zajścia opisanego nią zdarzenia losowego. Na podstawie takich danych z eksperymentu losowego należy zweryfikować hipotezę:
H: p1 = p2
Można wykazać, że przy słuszności powyższej hipotezy zmienna losowa
gdzie
, ,
ma standaryzowany rozkład normalny N(0,1).
Jeżeli , to hipotezę p1 = p2 odrzucamy na rzecz hipotezy p1 > p2 gdy
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy p1=p2.
Przykład
Porównywano skłonność do zakupu pewnego wyrobu wśród kobiet i mężczyzn. Gdyby okazało się, że np. kobiety są bardziej skłonne do zakupu tego wyrobu niż mężczyźni, wówczas akcję reklamową skierować należy właśnie na kobiety. Zbadano n1=100 kobiet, z których k1=20 wyraziło chęć zakupu tego wyrobu. Z kolei, wśród zbadanych n2=120 mężczyzn chęć zakupu tego wyrobu wyraziło k2=18 osób. Zweryfikować (na 10% poziomie istotności) hipotezę o podobnej skłonności do zakupu wśród obu grup klientów.
Nie ma więc podstaw do zakwestionowania hipotezy, że kobiety są równie skłonne do zakupu tego wyrobu niż mężczyźni.
Porównywanie dwu małych prawdopodobieństw
W przypadku gdy porównujemy dwa względnie małe prawdopodobieństwa (mniejsze od 0,2) na podstawie badania dwu prób losowych o tej samej liczności większej od 20 elementów, to w przypadku zaobserwowania nierówności hipotezę p1 = p2 odrzucamy na rzecz hipotezy p1 > p2 gdy
gdzie F(1-a,2(k2+1),2k1) jest kwantylem rzędu 1-a w rozkładzie F-Snedecora o parze stopni swobody (2(k2+1),2k1).
Przykład
Badano niezawodność odbiornika TV. Przez 1000 godzin badano n1=50 odbiorników, z których uszkodziły się cztery (k1=4). Po przeprowadzeniu zmian technologicznych ponowiono badanie. Tym razem wśród n2=50 odbiorników uszkodziły się dwa (k2=2). Czy są podstawy do stwierdzenia, że zmiany technologiczne poprawiły niezawodność badanych telewizorów?
Hipotezę p1 = p2 weryfikujemy na poziomie istotności a=0.05. Z tablic kwantyli rozkładu F-Snedecora odczytujemy F(0.95,6,8)=3.581. Tak więc mamy
Tak więc nie ma podstaw do zakwestionowania hipotezy o tej samej niezawodności badanych telewizorów przed i po zmianach technologicznych. Nie ma więc podstaw do stwierdzenia, że zmiany technologiczne poprawiły niezawodność badanych telewizorów.
Weryfikacja hipotez dotyczących
wartości oczekiwanych (średnich)
Niech X będzie zmienną losową o rozkładzie normalnym N(m,s), przy czym parametry m oraz s są nieznane i są oszacowane (wyestymowane) na podstawie próby losowej (X1, X2,...,Xn).
Weryfikacja hipotezy m=m0
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
lub
gdzie tn-1,(1+b)/2 jest kwantylem rzędu (1+b)/2 w rozkładzie t-Studenta o n-1 stopniach swobody (Tablice).
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy m=m0.
Weryfikacja hipotezy młm0
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy młm0.
Weryfikacja hipotezy mŁm0
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy mŁm0.
Przykład
Zaobserwowano 10 realizacji zmiennej losowej o rozkładzie normalnym N(m,s)
-.770 -.648 .353 -1.114 -.803 -.548 .775 -1.380 -.466 .455
Czy są podstawy do kwestionowania hipotezy m=m0=0 na poziomie istotności a=0.10.
Dla badanej próby mamy: n=10 , = -.415 , S0= .941
Z tablic rozkładu t-Studenta odczytujemy: t9,0.95 =1.833.
Mamy więc:
oraz
Tak więc nie ma podstaw do zakwestionowania weryfikowanej hipotezy.
Porównywanie dwu wartości oczekiwanych
Niech X będzie zmienną losową o rozkładzie normalnym N(m1,s), przy czym parametr m1 jest nieznany i jest oszacowany na podstawie próby losowej (X1, X2,...,Xn), zaś Y będzie zmienną losową o rozkładzie normalnym N(m2,s), przy czym parametr m2 jest również nieznany i jest oszacowany na podstawie próby losowej
(Y1, Y2,...,Ym). Zakładamy, że odchylenie standardowe s jest dla obu zmiennych losowych takie same i jest niezależnie estymowane w obu próbach.
Niech oraz będą wartościami średnimi, odpowiednio, w pierwszej i w drugiej próbie, zaś oraz empirycznymi wariancjami w tych próbach.
Hipotezę m1=m2 na poziomie istotności a=1-b odrzucamy gdy spełniona jest nierówność
gdzie
a tn+m-2,(1+b)/2 jest kwantylem rzędu (1+b)/2 w rozkładzie t-Studenta o n+-2 stopniach swobody (Tablice).
Przykład
Zaobserwowano 10 realizacji zmiennej losowej X o rozkładzie normalnym N(m1,s)
-.770 -.648 .353 -1.114 -.803 -.548 .775 -1.380 -.466 .455
oraz 10 realizacji zmiennej losowej Y o rozkładzie normalnym N(m2,s)
-.604 -.980 -.008 -.611 .536 .810 2.022 -1.372 1.064 -.519
Czy są podstawy do kwestionowania hipotezy m1=m2 na poziomie istotności a=0.10.
Dla badanej próby mamy: n=10 , = -0.415 ,
oraz m=10 , = 0.034 ,
Z tablic rozkładu t-Studenta odczytujemy: t18,0.95 =1.734.
Mamy więc:
Tak więc |T|=0.85 < 1.734 i wobec tego nie ma podstaw do kwestionowania hipotezy m1=m2.
Weryfikacja hipotez dotyczących wariancji
Niech X będzie zmienną losową o rozkładzie normalnym N(m,s), przy czym parametry m oraz s są nieznane i są oszacowane (wyestymowane) na podstawie próby losowej (X1, X2,...,Xn).
Weryfikacja hipotezy
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
lub
gdzie jest kwantylem rzędu (1-b)/2 w rozkładzie chi-kwadrat o n-1 stopniach swobody, zaś jest kwantylem rzędu (1+b)/2 w rozkładzie chi-kwadrat o n-1 stopniach swobody (tablice).
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy
Weryfikacja hipotezy
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy .
Weryfikacja hipotezy
Hipotezę na danym poziomie istotności a=1-b odrzucamy gdy:
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy ,
Przykład
Zaobserwowano 10 realizacji zmiennej losowej o rozkładzie normalnym N(m,s)
.641 1.146 -2.796 -1.171 -.095 .276 .499 .076 .956 -1.251
Czy są podstawy do kwestionowania hipotezy na poziomie istotności a=0.10.
Dla badanej próby mamy: n=10 ,
Z tablic rozkładu chi-kwadrat odczytujemy: c0.05,9=3.33, c0.95,9=16.9
Mamy więc:
oraz
Tak więc nie mamy podstaw do odrzucenia hipotezy
Porównywanie dwu wariancji
Niech X będzie zmienną losową o rozkładzie normalnym N(m1,s1), przy czym parametry m1 oraz s1 są nieznane i są oszacowane na podstawie próby losowej (X1, X2,...,Xn), zaś Y będzie zmienną losową o rozkładzie normalnym N(m2,s2), przy czym parametry m2 oraz s2 są również nieznane i są oszacowane na podstawie próby losowej
(Y1, Y2,...,Ym).
Niech oraz będą wartościami średnimi, odpowiednio, w pierwszej i w drugiej próbie, zaś oraz skorygowanymi empirycznymi wariancjami w tych próbach.
Jeżeli >, to hipotezę na poziomie istotności a=1-b odrzucamy, gdy spełniona jest nierówność
gdzie F((1+b)/2,n-1,m-1) jest kwantylem rzędu (1+b)/2 w rozkładzie F-Snedecora o parze stopni swobody (n-1,m-1).
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy .
Przykład
Zaobserwowano 10 realizacji zmiennej losowej X o rozkładzie normalnym N(m1,s)
-.604 -.980 -.008 -.611 .536 .810 2.022 -1.372 1.064 -.519
oraz 10 realizacji zmiennej losowej Y o rozkładzie normalnym N(m2,s)
-.770 -.648 .353 -1.114 -.803 -.548 .775 -1.380 -.466 .455
Czy są podstawy do kwestionowania hipotezy na poziomie istotności a=0.10.
Dla badanej próby mamy: n=10 , oraz m=10,
Z tablic rozkładu F-Snedecora odczytujemy: F(0.95,9,9)=3.179
Mamy więc:
Tak więc nie mamy podstaw do odrzucenia hipotezy .
Porównywanie wielu wartości średnich
(Analiza wariancji)
W wielu przypadkach praktycznych wyniki obserwacji generowane są w następujący sposób:
gdzie m jest wspólną dla wszystkich pomiarów wartością oczekiwaną, hi jest składową wyniku obserwacji wynikającą z działania i-tego czynnika zewnętrznego (przyczyny głównej), zaś eij jest losowym zakłóceniem (błędem), zazwyczaj przyjmowany jako jednakowy dla wszystkich obserwacji.
Powyższy model opisuje - na przykład - sytuację, gdy dokonujemy pomiaru k obiektów, z których każdy mierzony jest ni (i=1,...,k) razy.
Jedną z możliwych hipotez jest taka, że czynniki zewnętrzne (przyczyny główne) nie mają systematycznego wpływu na wynik obserwacji. Hipoteza ta jest równoważna hipotezie
a sposób jej weryfikacji nazywany jest analizą wariancji.
Aby zweryfikować powyższą hipotezę, musimy najpierw zweryfikować hipotezę o stałej wartości odchylenia standardowego
s1=s2=....=sk= s
W przypadku stałych liczności próbek tzn. n1=n2=...=nk=n możemy wykorzystać test Cochrana oparty na statystyce