statystyka, Przedzial ufnosci dla m. Testowanie hipotezy dla m., PRZEDZIAŁ UFNOŚCI DLA WARTOŚCI OCZEKIWANEJ


PRZEDZIAŁ UFNOŚCI DLA WARTOŚCI OCZEKIWANEJ

Przedziałem ufności - nazywamy taki przedział, który z zadanym z góry prawdopodobieństwem 0x01 graphic
zwanym poziomem ufności lub współczynnikiem ufności, pokrywa nieznaną wartość szacowanego parametru.

0x01 graphic
to poziom istotności

Konstruowanie przedziału ufności dla wartości przeciętnej m:

Jeżeli mamy dużą próbę (n>30) oraz cecha X ma rozkład normalny X ~ N(m, 0x01 graphic
) , wówczas przedział ufności dla parametru m ma postać:

0x01 graphic

gdzie:

0x01 graphic
- średnia arytmetyczna,

0x01 graphic
- odchylenie standardowe, założenie (0x01 graphic
)

n- liczebność próby,

m - wartość oczekiwana (przeciętna),

0x01 graphic
- wartość krytyczna odczytana z tablic rozkładu normalnego, gdzie: 0x01 graphic

Przykład:

Zakładając, że kwartalne wydatki na reklamę można uznać za cechę o rozkładzie normalnym, wylosowano 100 zakładów usługowych i otrzymano następujący rozkład wydatków na reklamę:

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0x01 graphic

0-5

10

2,5

25

-9,5

90,25

902,5

5-10

20

7,5

150

-4,5

20,25

405

10-15

40

12,5

500

0,5

0,25

10

15-20

30

17,5

525

5,5

30,25

907,5

-

100

-

1200

-

-

2225

Wyznaczyć na poziomie ufności 0x01 graphic
przedział ufności dla przeciętnych kwartalnych wydatków na reklamę.

Najpierw obliczamy średnią arytmetyczną dla szeregu rozdzielczego przedziałowego:

0x01 graphic

0x01 graphic

Następnie obliczamy wariancję S2:

0x01 graphic

Teraz obliczamy odchylenie standardowe, czyli pierwiastek z wariancji:

0x01 graphic

Zakładamy, że 0x01 graphic

Następnie z tablic rozkładu normalnego odczytujemy wartość 0x01 graphic
, przy czym 0x01 graphic
, zatem 0x01 graphic
.

Podstawiamy wszystko do wzoru:

0x01 graphic

Odp. Z prawdopodobieństwem 98% ten przedział pokrywa wartość przeciętną m.

TESTOWANIE HIPOTEZY DLA WARTOŚCI OCZEKIWANEJ

Testowanie hipotez statystycznych obejmuje zasady i metody sprawdzania określonych przypuszczeń (założeń), dotyczących parametrów lub postaci rozkładu cech statystycznych populacji generalnej na podstawie wyników z próby prostej.

Hipotezą statystyczną - nazywamy każdy sąd o zbiorowości generalnej, wydany bez przeprowadzenia badania całkowitego, prawdziwość hipotezy statystycznej orzeka się na podstawie próby losowej.

Hipoteza zerowa H0 - hipoteza sprawdzana (testowana, weryfikowana).

Hipoteza alternatywna H1 - hipoteza, którą można przyjąć, gdy zostanie odrzucona hipoteza zerowa H0.

Sprawdzianem hipotezy - (zwanym też statystyką testową) jest taka zmienna losowa T, o znanym rozkładzie, której wartość empiryczna temp., policzona na podstawie próby losowej, pozwala na podjęcie decyzji, czy przyjąć, czy też odrzucić hipotezę H0.

Zbiór krytyczny Z - jest to zbiór tych wartości sprawdzianu hipotezy, które przemawiają za odrzuceniem hipotezy H0. W zależności od hipotezy może być zbiorem jednostronnym (prawostronnym lub lewostronnym) albo zbiorem dwustronnym.

Przeprowadzanie testu polega na weryfikacji hipotez - stawiamy hipotezę zerową (H0) i hipotezę alternatywną (H1). Ważna jest ich postać, bo przy np. innej postaci H1 mamy inny test i inną konkluzję, - więc postaci hipotez trzeba dokładnie wypisać. Następnie potrzebujemy postaci tzw. sprawdzianu testu, - czyli statystyki testowej - zmiennej losowej, dla której wartość realizacji możemy wyliczyć korzystając z posiadanych danych i na tej podstawie wnioskować o hipotezach. Możemy to zrobić, ponieważ znamy rozkład statystyki testowej przy prawdziwości hipotezy zerowej - to jeden z zasadniczych elementów testu. Następnie badamy, jak ma się uzyskana realizacja statystyki testowej do tego rozkładu. Jeżeli uzyskujemy realizację z obszaru wysokiego prawdopodobieństwa, świadczy to, że H0 MOŻE być prawdziwa - nie udało się temu zaprzeczyć - zaobserwowaliśmy zdarzenie, które jest bardzo prawdopodobne przy prawdziwości H0.

Jednak nie możemy bezpośrednio wnioskować, że H0 jest prawdziwa - musielibyśmy wiedzieć, że statystyka testowa przy fałszywości hipotezy zerowej ma rozkład przypisujący niskie prawdopodobieństwo zaobserwowanej wartości statystyki. Konkluzja testu brzmi wobec tego „NIE MA PODSTAW DO ODRZUCENIA H0”.

Inaczej jest, gdy zaobserwujemy realizację statystyki testowej z obszaru niskiego prawdopodobieństwa w rozkładzie statystyki przy prawdziwości H0 (tzw. obszaru krytycznego) - wnioskujemy wtedy, że gdyby prawdziwa była H0, to musiałoby zajść bardzo mało prawdopodobne zdarzenie. Przypuszczamy, że to się raczej nie stało, że obserwujemy realizację z INNEGO rozkładu niż ten przy prawdziwości H0, więc że H0 nie jest prawdziwa. W tym wypadku konkluzja brzmi - ODRZUCAMY H0 i PRZYJMUJEMY H1. Zauważmy, że taka konkluzja jest bardziej konkretna niż w pierwszym przypadku.

Czyli w dużym skrócie - konkluzja się zmienia w zależności od tego, czy uzyskana wartość statystyki testowej wpada do obszaru krytycznego (odrzucamy H0) czy nie (nie ma podstaw do odrzucania H0).

Warto zawsze przyjrzeć się konstrukcji statystyki testowej - na tej podstawie można wyrobić sobie intuicję, jakie (np. duże czy małe) wartości statystyki odpowiadają prawdziwości H1 a jakie są niesprzeczne z prawdziwością H0.

Jak jednak określa się, co to znaczy „mało prawdopodobne”, - czyli: Jak dokładnie konstruuje się obszar krytyczny, jak wyznacza się jego granice?

Na samym początku ustalamy, tzw. poziom istotności (oznaczany zwykle alfa), - czyli prawdopodobieństwo fałszywego odrzucenia prawdziwej hipotezy zerowej. To jest określenie, co uznajemy za „mało prawdopodobne” - godzimy się z tym, że np. błędnie odrzucimy prawdziwą hipotezę zerową raz na 20 przypadków (wtedy 0x01 graphic
=0,05) lub raz na 100 (0x01 graphic
=0,01). Z rozkładu statystyki testowej wyznaczamy zbiór wartości zmiennej taki, że „odcinamy” pod funkcją gęstości dokładnie alfa prawdopodobieństwa - oczywiście nie wszystko jedno, jak, lecz tak, był to obszar odpowiadający „jak najlepiej” zaprzeczeniu H0, czyli prawdziwości hipotezy alternatywnej. Granica obszaru krytycznego to tzw. wartość krytyczna. Porównujemy ją ze zrealizowaną (wyliczoną na podstawie zaobserwowanych danych) wartością statystyki i wyprowadzamy konkluzję testu.

Postacie hipotezy alternatywnej:

1) 0x01 graphic
jest to dwustronny obszar krytyczny, dla którego 0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
t 0x08 graphic

0x01 graphic
0 0x01 graphic

0x01 graphic

Gdzie: 0x01 graphic
- wartość krytyczna odczytana z tablic rozkładu normalnego.

2) 0x01 graphic
jest to lewostronny obszar krytyczny, dla którego 0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
t 0x08 graphic

0x01 graphic
0

0x01 graphic

3) 0x01 graphic
jest to prawostronny obszar krytyczny, dla którego 0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
t 0x08 graphic

0 0x01 graphic

0x01 graphic

Tryb postępowania przy weryfikacji:

  1. Sformułowanie hipotez.

  2. Wybór sprawdzianu hipotezy (jest uzależniony od n, czyli liczebności próby oraz od tego, czy 0x01 graphic
    jest znane).

Jeżeli 0x01 graphic
jest znane i 0x01 graphic
lub 0x01 graphic
znane i n>30 lub 0x01 graphic
nieznane i n>30 (wtedy 0x01 graphic
), wtedy sprawdzianem hipotezy zerowej jest statystyka:

0x01 graphic

o rozkładzie normalnym N(0,1)

3) Rysujemy wykres funkcji rozkładu normalnego i zaznaczamy obszar krytyczny, w zależności od postaci hipotezy alternatywnej. Następnie na wykresie zaznaczamy wartość 0x01 graphic
obliczoną z powyższego wzoru na T.

Jeżeli uzyskana wartość statystyki testowej 0x01 graphic
wpada do obszaru krytycznego, wówczas odrzucamy hipotezę H0 na korzyść H1. Jeżeli 0x01 graphic
nie wpada do obszaru krytycznego, to nie ma podstaw do odrzucenia H0, czyli hipotezę zerową przyjmujemy za prawdziwą.

Przykład 1 (zad. 5 z listy nr 8):

Zbadano w 81 wylosowanych zakładach pewnej gałęzi przemysłowej koszty materiałowe przy produkcji pewnego wyrobu i otrzymano średnią 0x01 graphic
zł oraz 0x01 graphic
zł. Na poziomie istotności 0x01 graphic
zweryfikować hipotezę, że średnie koszty materiałowe przy produkcji tego wyrobu wynoszą 600 zł.

Dane:

0x01 graphic
; 0x01 graphic
zł - średnia arytmetyczna ; 0x01 graphic
zł - odchylenie standardowe ; 0x01 graphic
- poziom istotności ; 600 zł - średnie koszty materiałowe.

- Formułujemy hipotezę zerową oraz hipotezę alternatywną:

(a) hipoteza zerowa 0x01 graphic
, tzn., że średnie koszty materiałowe wynoszą 600 zł.

(b) hipoteza alternatywna 0x01 graphic
, tzn., że średnie koszty materiałowe nie wynoszą 600 zł.

Ponieważ hipoteza 0x01 graphic
, więc zbiór krytyczny jest dwustronny i dla rozkładu normalnego dla 0x01 graphic
mamy: 0x01 graphic
.

Teraz odczytujemy z tablic 0x01 graphic
.

Podstawiamy dane do wzoru na T:

0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic
t 0x08 graphic

-3,6 0x01 graphic
0 0x01 graphic

0x01 graphic

0x01 graphic

Ponieważ 0x01 graphic
wpada do obszaru krytycznego, wobec tego hipotezę 0x01 graphic
odrzucamy na korzyść hipotezy alternatywnej, co oznacza, że średnie koszty materiałowe nie wynoszą 600 zł.

Przykład 2:

Średnia życia mężczyzn w Polsce wynosi 67,5 lat. Interesuje nas obszar zagłębia legnicko-głogowskiego. Podejrzewamy, że z uwagi na duże zagrożenie ekologiczne, średnia życia jest tutaj niższa niż średnia krajowa. Wybrano losowo 238 mężczyzn i obliczono, że 0x01 graphic
oraz S=12,9. Na poziomie istotności 0,05 zweryfikować powyższą hipotezę.

Dane:

0x01 graphic
; 0x01 graphic
zł - średnia arytmetyczna; S=12,9zł - odchylenie standardowe; 0x01 graphic
- poziom istotności; 67,5 lat - średnia życia mężczyzn w Polsce (średnia krajowa).

- Formułujemy hipotezę zerową oraz hipotezę alternatywną:

(a) hipoteza zerowa 0x01 graphic
, tzn., że średnia życia jest równa średniej krajowej.

(b) hipoteza alternatywna 0x01 graphic
, tzn., że średnia życia jest niższa niż średnia krajowa.

Ponieważ hipoteza 0x01 graphic
, więc zbiór krytyczny jest lewostronny i dla rozkładu normalnego dla 0x01 graphic
mamy: 0x01 graphic
.

Teraz odczytujemy z tablic 0x01 graphic
.

Podstawiamy dane do wzoru na T:

0x01 graphic

0x08 graphic
0x01 graphic

0x08 graphic

0x08 graphic
0x08 graphic
0x08 graphic

0x08 graphic
0x08 graphic
t 0x08 graphic

-2,51 0x01 graphic
0

0x01 graphic

Ponieważ 0x01 graphic
wpada do obszaru krytycznego, wobec tego hipotezę 0x01 graphic
odrzucamy na korzyść hipotezy alternatywnej, co oznacza, że średnia życia na obszarze zagłębia legnicko-głogowskiego jest niższa niż średnia krajowa.

STATYSTYKA I RACHUNEK PRAWDOPODOBIEŃSTWA - ĆWICZENIA

LISTA ZADAŃ NR 8 - PRZEDZIAŁ UFNOŚCI I HIPOTEZY

Zad. 1 W 49 - elementowej próbie losowej robotników otrzymano 0x01 graphic
jednorodnych operacji wykonanych w ciągu 1 dnia, przy współczynniku zmienności 8%. Przyjmując poziom ufności 0,95 wyznaczyć metodą przedziałową przeciętną liczbę operacji.

Zad. 2 Dane dotyczące stażu pracy w zakładzie A są następujące:

Staż w latach

0 - 6

6 - 12

12 - 18

18 - 24

Liczba pracowników

10

20

40

30

Wyznaczyć przedział ufności dla przeciętnego stażu pracy pracowników tego zakładu, jeśli poziom ufności wynosi 0,95.

Zad. 3 W firmie „Telimena” zbadano 500 płaszczy spośród nowo wyprodukowanych partii i otrzymano następujący rozkład liczby usterek:

Liczba usterek

0

1

2

3

4

5

Liczba płaszczy

90

160

100

80

50

20

Wyznaczyć na poziomie ufności 0,95 przedział ufności dla przeciętnej liczby usterek w płaszczach produkowanych w badanej firmie.

Zad. 4 W celu oszacowania średniego czasu poświęconego tygodniowo przez studentów na naukę, wylosowano próbę 132 studentów i otrzymano w niej następujące wyniki:

Czas nauki (w h)

0-2

2-4

4-6

6-8

8-10

10-12

Liczba studentów

10

28

42

30

15

7

Przyjmując poziom ufności 0,90 oszacować metodą przedziałową średni tygodniowy czas nauki studentów.

Zad. 5 Zbadano w 81 wylosowanych zakładach koszty materiałowe produkcji pewnego wyrobu i otrzymano 0x01 graphic
i s=150. Na poziomie istotności α = 0,10, zweryfikuj hipotezę, ze średnie koszty materiałowe = 600.

Zad.6 Z populacji o rozkładzie normalnym N(m; 0,2) pobrano próbę czteroelementową: 1,14; 1,06; 1,13; 1,17. Na poziomie istotności 0x01 graphic
zweryfikować hipotezę, że m=1,05.

Zad. 7 Z próby 100 elementowej obliczono 0x01 graphic
i 0x01 graphic
. Na poziomie istotności 0,05 zweryfikować hipotezę 0x01 graphic
przeciw hipotezie 0x01 graphic
.

Zad. 8 W pewnym teście psychologicznym przeprowadzonym na wylosowanych 50 dzieciach otrzymano następujący rozkład wyników liczby zapamiętanych przez dzieci elementów:

Liczba elementów

15-20

20-25

25-30

30-35

35-40

40-45

45-50

Liczba dzieci

6

8

12

10

7

4

3

Sprawdzić hipotezę, że średnia liczba zapamiętanych przez dzieci elementów w teście wynosi 35. Przyjąć poziom istotności 0,02.

Zad. 9 Z populacji o rozkładzie normalnym N(m; 0,1) pobrano próbę trzyelementową: 1,12; 1,05; 1,13. Na poziomie istotności 0,01 zweryfikować hipotezę, że m=1,20 przeciw hipotezie 0x01 graphic
.

Państwowa Wyższa Szkoła Zawodowa im. Witelona w Legnicy

Specjalność: Sterowanie Systemami Przemysłowymi

mgr Iwona Czerska

e-mail: iwona_czerska@op.pl

1



Wyszukiwarka