WERYFIKACJA HIPOTEZ STATYSTYCZNYCH cz.2
Weryfikacja hipotez dla dwóch średnich arytmetycznych (dla dwóch wartości przeciętnych)
Test ten dotyczy weryfikacji hipotezy o równości średnich w dwóch zbiorowościach. W zależność od wielkości wylosowanych z tych zbiorowości prób wyróżnia się dwa modele postępowania.
Model oparty na wynikach z dwóch małych prób.
Zakłada się, że rozkłady obu populacji są normalne o nieznanych wartościach średnich i odchyleniach standardowych. Procedura odbywa się według schematu:
Postawienie hipotez:
H0: E1(x) = E2(x) (czyli że średnia pierwszej populacji jest równa średniej arytmetycznej drugiej populacji E(x) - to oznaczenie średniej arytmetycznej w całej zbiorowości czyli populacji generalnej)
H1: E1(x) ≠ E2(x) (czyli że średnie są różne w obu populacjach)
H1: E1(x) >E2(x) (czyli w pierwszej populacji średnia jest większa niż w drugiej)
H1: E1(x) < E2(x) (czyli w pierwszej populacji średnia jest mniejsza niż w drugiej)
Zakłada się poziom istotności α (z reguły jest podany w treści zadania)
Z obu populacji losuje się próby, muszą to być małe próby czyli do 30 elementów (próby n1 oraz n2). Liczebności prób nie muszą być identyczne, jednak muszą być zliczane do małej próby. Dla obu prób ustalamy wartości średnich arytmetycznych oraz wariancje S2(x).
Na podstawie tych ustalonych dla prób wartości liczymy statystykę empiryczną, liczymy ją według wzoru:
Gdzie:
1 - średnia arytmetyczna pierwszej próby
2 - średnia arytmetyczna drugiej próby
S21- wariancja pierwszej próby
S22- wariancja drugiej próby
n1 - liczebność pierwszej próby
n2 - liczebność drugiej próby
Odczytujemy dla przyjętego poziomu istotności statystykę teoretyczną z tablic rozkładu studenta. Sposób odczytu zależy od postaci hipotezy alternatywnej:
H1: E1(x) ≠ E2(x) odczytujemy dla k= n1 + n2 -2 oraz poziomu istotności α
H1: E1(x) >E2(x) dla k = k= n1 + n2 -2 oraz 2*α
H1: E1(x) < E2(x)
Porównujemy obie statystyki:
Jeżeli: H1 ma postać ≠ to :
|temp|≥tteor - odrzucamy hipotezę zerową i przyjmujemy alternatywną
|temp|< tteor - stwierdzamy brak podstaw do odrzucenia hipotezy zerowej
Jeżeli H1 ma postać >
temp≥ tteor to odrzucamy H0
temp< tteor brak podstaw do odrzucenia H0
Jeżeli H1 ma postać <
temp≤ - tteor to odrzucamy H0
temp> - tteor brak podstaw do odrzucenia H0
PRZYKŁAD
W badaniach absencji pracowniczej w pewnym przedsiębiorstwie w miesiącu lipcu zebrano informacje dla dwóch wylosowanych grup pracowników. Dla grupy 10 kobiet uzyskano następującą liczbę dni nieobecności w pracy :
0; 2; 3; 5; 7; 6; 8; 3; 5; 1
Dla próby 12 mężczyzn odpowiednio:
0; 1; 2; 3; 2; 4; 3; 4; 7; 5; 6;0
Przy poziomie istotności 0,05 zweryfikować hipotezę, że średnia dni nieobecności w pracy kobiet jest większa od mężczyzn.
Czyli zgodnie z procedurą:
Musimy postawić hipotezy w treści mamy podaną hipotezę alternatywną (zweryfikować hipotezę, że średnia dni nieobecności w pracy kobiet jest większa od mężczyzn) a hipoteza zerowa ma zawsze postać równości, w związku z tym:
H0: E1(x) = E2(x) (średnia dni nieobecności jest taka sama w obu populacjach)
H1: E1(x) >E2(x) (średnia dni nieobecności w pracy kobiet jest większa od mężczyzn)
Założony poziom istotności α=0,05
Z obu populacji pobrane są małe próby n1 to próba 10 kobiet oraz n2 to próba 12 mężczyzn musimy teraz dla obu prób policzyć średnią arytmetyczną oraz wariancję
X1 |
n1 |
X1 - |
(X1 - |
0 |
1 |
-4 |
16 |
2 |
1 |
-2 |
4 |
3 |
1 |
-1 |
1 |
5 |
1 |
1 |
1 |
7 |
1 |
3 |
9 |
6 |
1 |
2 |
4 |
8 |
1 |
4 |
16 |
3 |
1 |
-1 |
1 |
5 |
1 |
1 |
1 |
1 |
1 |
-3 |
9 |
Suma = 40 |
Suma =10 |
|
Suma =62 |
Dla kobiet:
1 = 40/10 = 4 dni S21 = 62/10= 6,2 dni
Dla mężczyzn:
2 = 37/12 = 3,1 dni S22 = 54,92 / 12 = 4,58
X2 |
n2 |
X2 - |
(X2 - |
0 |
1 |
-3,1 |
9,61 |
1 |
1 |
-2,1 |
4,41 |
2 |
1 |
-1,1 |
1,21 |
3 |
1 |
-0,1 |
0,01 |
2 |
1 |
-1,1 |
1,21 |
4 |
1 |
0,9 |
0,81 |
3 |
1 |
-0,1 |
0,01 |
4 |
1 |
0,9 |
0,81 |
7 |
1 |
3,9 |
15,21 |
5 |
1 |
1,9 |
3,61 |
6 |
1 |
2,9 |
8,41 |
0 |
1 |
-3,1 |
9,61 |
Suma = 37 |
Suma =12 |
|
Suma =54,92 |
Liczymy statystykę empiryczną:
Z tablic rozkładu studenta odczytujemy wartość statystyki teoretycznej
Hipoteza alternatywna ma postać: H1: E1(x) > E2(x) czyli odczytamy dla: dla k = k= n1 + n2 -2 oraz 2*α
K= 10+12-2=20 0raz 2*0,05=0,1
Czyli z tablic odczytujemy tteor = 1,725
Porównujemy obie statystyki:
Zachodzi relacja temp<tteor wobec tego przy poziomie istotności 0,05 nie ma podstaw do odrzucenia hipotezy zerowej, czyli średnia absencja kobiet jest identyczna jak średnia absencja mężczyzn.
Model dla dwóch dużych prób
Założenia są podobne poza wielkościami prób - tzn. z obu populacji będziemy pobierać duże próby czyli większe od 30.
Zakłada się, że rozkłady obu populacji są normalne o nieznanych wartościach średnich i odchyleniach standardowych. Procedura odbywa się według schematu:
Postawienie hipotez:
H0: E1(x) = E2(x) (czyli że średnia pierwszej populacji jest równa średniej arytmetycznej drugiej populacji E(x) - to oznaczenie średniej arytmetycznej w całej zbiorowości czyli populacji generalnej)
H1: E1(x) ≠ E2(x) (czyli że średnie są różne w obu populacjach)
H1: E1(x) >E2(x) (czyli w pierwszej populacji średnia jest większa niż w drugiej)
H1: E1(x) < E2(x) (czyli w pierwszej populacji średnia jest mniejsza niż w drugiej)
Zakłada się poziom istotności α (z reguły jest podany w treści zadania)
Z obu populacji losuje się próby, muszą to być duże próby czyli powyżej elementów (próby n1 oraz n2). Liczebności prób nie muszą być identyczne, jednak muszą być zliczane do dużej próby. Dla obu prób ustalamy wartości średnich arytmetycznych oraz wariancje S2(x).
Na podstawie tych ustalonych dla prób wartości liczymy statystykę empiryczną, liczymy ją według wzoru:
Gdzie:
1 - średnia arytmetyczna pierwszej próby
2 - średnia arytmetyczna drugiej próby
S21- wariancja pierwszej próby
S22- wariancja drugiej próby
n1 - liczebność pierwszej próby
Odczytujemy wartość statystyki teoretycznej - posługujemy się tablicami rozkładu normalnego. Sposób odczytu zależy od postaci hipotezy alternatywnej
H1: ≠ dla takiej postaci H1 odczytujemy 1- α/2 (czyli jeden minus poziom istotności podzielony przez 2)
H1: > Dla tych postaci sposób odczytu jest taki sam odczytujemy dla 1 - α
H1: <
Porównujemy obie statystyki
Jeżeli: H1 ma postać ≠ to :
|temp|≥tteor - odrzucamy hipotezę zerową i przyjmujemy alternatywną
|temp|< tteor - stwierdzamy brak podstaw do odrzucenia hipotezy zerowej
Jeżeli H1 ma postać >
temp≥ tteor to odrzucamy H0
temp< tteor brak podstaw do odrzucenia H0
Jeżeli H1 ma postać <
temp≤ - tteor to odrzucamy H0
temp> - tteor brak podstaw do odrzucenia H0
PRZYKŁAD
W badaniach efektywności szkolenia zawodowego pracowników bezpośrednio produkcyjnych w pewnym przedsiębiorstwie dla losowo wybranej próby 60 pracowników dokonano pomiaru ich wydajności pracy przed i po szkoleniu. Uzyskano następujące informacje:
Wydajność pracy w sztukach/godzine |
Liczba pracowników |
|
|
Przed szkoleniem (pierwsza próba) |
Po szkoleniu (druga próba) |
<10-14) |
28 |
5 |
<14-18) |
18 |
20 |
<18-22) |
12 |
25 |
<22-26) |
2 |
10 |
Zakładając, że w całej populacji pracowników wydajność pracy ma rozkład zbliżony do normalnego, przy poziomie istotności 0,01 zweryfikować hipotezę że szkolenie zawodowe zwiększa wydajność pracy pracowników.
Zaczynamy od postawienia hipotez:
Z treści mamy znowu hipotezę alternatywną (zweryfikować hipotezę że szkolenie zawodowe zwiększa wydajność pracy pracowników - czyli średnia wydajność musi być mniejsza przed szkoleniem po szkoleniu większa)
H0: E1(x) = E2(x) - czyli hipoteza ta zakłada że średnia wydajność przed szkoleniem jest taka sama jak średnia wydajność po szkoleniu
H1: E1(x) < E2(x) czyli średnia wydajność po szkoleniu jest większa niż przed szkoleniem (czyli to co mamy zweryfikować : że szkolenie zwiększa wydajność pracy)
Poziom istotności α=0,01
Z populacji mamy co prawda pobraną jedną próbę liczącą 60 pracowników ale traktujemy ja jako dwie próby jedna n1 = 60 przed szkoleniem druga n2=60 po szkoleniu
Dla prób liczymy średnie arytmetyczne oraz wariancje:
Przed szkoleniem:
1 = 912/60 = 15,2 szt S21 = 738,4/60 = 12,3 szt2
Po szkoleniu:
2 = 1120/60 = 18,7 szt S22 = 693,4/60 = 11,6 szt2
(Obliczenia zrobione według wzorów dla szeregów z przedziałami klasowymi)
Liczymy statystykę empiryczną:
Odczytujemy statystykę teoretyczną z tablic rozkładu normalnego, hipoteza alternatywna ma postać nierówności H1: E1(x)< E2(x) więc odczytamy dla: 1 - α
1-0,01 = 0,99
Szukamy tej wartości w środkowej części tablic i na tej podstawie odczytujemy statystykę teoretyczną
tteor = 2,33
Porównujemy obie statystyki
Zachodzi relacje t emp< tteor
Czyli odrzucamy hipotezę zerową, przy poziomie istotności 0,01 można twierdzić że szkolenie zawodowe wpływa na wzrost wydajności pracy.