2013-04-17
Metody probabilistyczne
Weryfikacja hipotez statystycznych
Hipotezy parametryczne
cz.2
30
Testowanie hipotezy o dwóch wskaznikach struktury (p)
l Badanie dwu skończonych populacji generalnych ze względu na
wyróżnioną cechę. Zachodzi konieczność weryfikacji hipotezy o równości
wskazników struktury w obu zbiorowościach.
Założenie: Cecha ma w populacjach rozkład dwupunktowy z parametrem
odpowiednio p1 i p2 oznaczającym prawdopodobieństwo, że cecha przyjmie
wyróżnioną wartość.
Próby muszą być duże (n1e"100) i (n2e"100).
Formułowanie hipotezy:
l Hipoteza zerowa (H0) jest hipotezą o równości i brzmi: H0: p1 = p2
gdzie p1 i p2 są konkretną wartością (liczbą).
l Hipoteza alternatywna (H1) może być sformułowana trojako (najczęściej w
zależności od wyniku uzyskanego w próbie):
H1: p1 ą p2 (albo H1: p1 < p2 albo też H1: p1 > p2)
l Wybór hipotezy alternatywnej (H1) ma decydujące znaczenie dla
sformułowania obszaru odrzucenia,
ć
m1 m2
,
n2
l Rozkład różnicy między wskaznikami struktury n można
Ł 1 ł
aproksymować za pomocą rozkładu normalnego o parametrach
ć p1(1- p1) p2(1- p2)
N p1 - p2, +
31
n1 n2
Ł ł
1
2013-04-17
Testowanie hipotezy o dwóch wskaznikach struktury (p)
* *
p1 - p2
Sprawdzian:
U =
pq
n
n1 *n2
m1 * m2 p = m1 + m2
*
n =
p1 = p2 =
q =
n1 + n2
gdzie: , , , 1- p
n1 n2 n1 + n2 ,
l która ma w przybliżeniu rozkład asymptotycznie normalny N(0 ; 1), dla
której P{|U|łua}=a.
Wnioskowanie
l Jeżeli wartość sprawdzianu U znajdzie się:
1. w obszarze odrzucenia, to odrzucamy H0 i przyjmujemy H1.
2. poza obszarem odrzucenia, to nie mamy podstaw do odrzucenia
H0.
Brak podstaw do odrzucenia oznacza, że obie próby pochodzą z
tej samej populacji
32
Testowanie hipotezy o dwóch wskaznikach struktury (p)
- przykład
l Zweryfikować przypuszczenie kobiety i mężczyzni jednakowo często
dojeżdżają do pracy komunikacją zbiorową.
l Wylosowano 500 mężczyzn i 600 kobiet. Okazało się, że 200 mężczyzn i
250 kobiet korzysta z komunikacji zbiorowej. Na poziomie istotności ą=0,05
zweryfikować hipotezę, że odsetek jeżdżących pojazdami komunikacji
zbiorowej kobiet i mężczyzn jest jednakowy.
l Dane: n1=500, n2=600, m1=200, m2=250, ą=0,05,
*
l Ho : p1=p2 wobec H1 : p1`"p2 p1 = m1 = 200 = 0,4 p2 = m2 = 250 = 0,42
*
n2 600
n1 500
m1 + m2 200 + 250 450
q =1- p =1- 0,41= 0,59
p = = = = 0,41
n1 + n2 500 + 600 1100
n1 *n2 500*600 300000
n = = = = 272,727
n1 + n2 500 + 600 1100
Wniosek:
u0,025 = 1,96 gdyż obszar jest dwustronny
* *
0,4 - 0,42
p1 - p2 uemp< u0,025, czyli brak podstaw do
U = = = 0,671
odrzucenia hipotezy H0 => mężczyzni i
pq 0,41*0,59
kobiety jednakowo często korzystają z
n 273
komunikacji zbiorowej.
33
2
2013-04-17
Testowanie hipotezy o wariancji populacji generalnej 2
Założenie: Populacja generalna ma rozkład normalny N(ź, s)
o nieznanych parametrach ź i s.
Z populacji tej wylosowano niezależnie n elementów do próby
Formułowanie hipotez:
l Hipoteza zerowa: H0 : s2= s02 , wobec
l hipotezy alternatywnej H1: s2ą s02 ,
(albo H1: s2> s02 , albo też H1: s2 < s02 )
gdzie: s02 jest hipotetyczną wartością wariancji s2 .
l H1: s2> s02 - najczęściej gdyż sytuację, w której wariancja jest
wysoka uznaje się niekorzystną.
34
Testowanie hipotezy o wariancji populacji generalnej 2
Model 1
l Założenia:
próba mała (nd"30); ź i s - nieznane
l Sprawdzian:
Test istotności dla tej hipotezy jest następujący. Z wyników n elementowej
próby losowej obliczmy wartość s2, a następnie wartość statystyki:
n
ns2 (n -1)*%5ń2 1
2
c2 = = = - x)
(xi
2 2 2
s0 s0 s0 i=1
l Test istotności:
Statystyka ta ma przy założeniu prawdziwości hipotezy H0 rozkład 2 z n-1
stopniami swobody.
Dla ustalonego z góry poziomu istotności a i dla n-1 stopni swobody
odczytujemy z tablicy rozkładu 2 taką wartość krytyczną, aby spełniona
byłą równość P{2 ł ą2 }= a. (obszar prawostronny)
35
3
2013-04-17
Testowanie hipotezy o wariancji populacji generalnej
2
Wnioskowanie
l Nierówność 2 ł ą2 określa prawostronny obszar krytyczny, tzn. gdy
z porównania wartości 2 obliczonej z próby z wartością krytyczną
zajdzie nierówność 2 ł ą2 , hipotezę H0 odrzucamy na korzyść
alternatywy H1.
l Natomiast, gdy zajdzie nierówność 2 < ą2 , nie ma podstaw do
odrzucenia hipotezy H0, że wartość wariancji s2 populacji generalnej
jest s02.
ą
36
ą2
Testowanie hipotezy o wariancji populacji generalnej 2
Model 2
Założenia:
próba duża (n>30); ź i s - nieznane
l Sprawdzian:
Wartość 2 należy przekształcić na U = 2c 2 - 2k -1 = 2c 2 - 2n -3
gdzie: k liczba stopni swobody k=n-1
2
ns
U = 2 - 2n - 3
2
s0
l Test istotności:
Statystyka ta przy założeniu prawdziwości hipotezy H0
dla ustalonego U ma w przybliżeniu rozkład asymptotycznie normalny
N(0 ; 1), dla którego P{Ułua}=a.
37
4
2013-04-17
Testowanie hipotezy o wariancji populacji generalnej
2 - przykład
l Pewnego dnia dokonano 15 pomiarów opóznień pociągów
przyjeżdżających do stacji Kraków Główny. Na podstawie wyników
pomiarów otrzymano wartość średniego opóznienia 23min i s2 = 523,07.
Zakłada się, że czas opóznień pociągów ma rozkład N(ź,). Sprawdzić na
poziomie istotności ą=0,05 hipotezę, że wariancja opóznień wynosi 400.
l Dane: n=15, , s2 = 523,07, 02=400, ą=0,05,
x = 23
l Hipotezy: H0: 2=400 H1: 2>400
l Statystyka:
2
nS 15*523,07
2
cemp = = =19,615
2
s0 400
2
l Wnioskowanie: obszar krytyczny: c0,05;15-1 = 23,685
2 2
cemp < c0,05;15-1
Wniosek:
Nie ma podstaw do odrzucenia hipotezy
głoszącej, że wariancja opóznień całej
populacji kształtuje się na poziomie 400.
38
Test dla dwóch wariancji
l Test służy do sprawdzenia hipotezy o jednakowym stopniu rozproszenia
wartości badanej cechy w dwóch populacjach.
l Estymatory wariancji:
n n
n
1 1
2 2
%5ń2 = s2
%5ń2 = - x) s2 = - x)
lub
(xi (xi
n -1
n -1 n
i=1 i=1
39
5
2013-04-17
Test dla dwóch wariancji
l Model
Założenia:
l Dane są dwie populacje generalne mające odpowiednio rozkłady normalne
N(ź1, s1) i N(ź2, s2), gdzie parametry tych rozkładów są nieznane,
l Wylosowano niezależnie dwie próby o liczebności n1 i n2 elementów,
Formułowanie hipotez
l Należy sprawdzić hipotezę H0: s12 = s22,
wobec hipotezy alternatywnej H1: s12 > s22. (postać najczęściej)
2 2
l Sposób postępowania: z obu prób wyznaczyć: i
%5ń1 %5ń2
W liczniku zawsze
większa z wariancji
Sprawdzian statystyka F:
2 2
%5ń1 n1s1 /(n1 -1)
F = =
2 2
%5ń2 n2s2 /(n2 -1)
l statystyka F, przy założeniu prawdziwości hipotezy H0, ma
rozkład F Snedecora z n1 1 i n2 1 stopniami swobody,
Wnioskowanie:
l jeżeli F e" Fa, to hipotezę H0 należy odrzucić na rzecz hipotezy alternatywnej H1.
40
Test dla dwóch wariancji - przykład
l Wyniki dwóch czasu prowadzenia pojazdu przez kierowców.
Poziom istotności ą=0,05.
2
I 7,48 7,88 8,00 7,15 7,26 7,33 7,71 7,18
%5ń1 = 0,1072
II 7,62 7,83 8,03 7,97 7,17 8,08 7,92 7,93 7,58
%5ń2 = 0,0837
2
l Zweryfikować hipotezę o równości wariancji wyników obu kierowców.
l Dane: n1=8, n2=9,
l H0: s12 = s22 wobec H1: s12 > s22
0,1072
Fa=3,5 stąd F=1,28 < Fa=3,5
F = =1,28
0,0837
Wniosek:
Brak podstaw do odrzucenia H0, że wariancje
wyników czasu prowadzenia pojazdów przez
obu kierowców są jednakowe.
41
6
2013-04-17
Test jednorodności wielu wariancji
Test Bartletta jest stosowany do sprawdzenia założenia o jednakowych
wariancjach we wszystkich badanych populacjach.
Model
Założenia:
l danych jest k populacji normalnych N(źi , si) (i = 1, 2, ..., k),
l z każdej populacji wylosowano niezależnie ni elementów,
l wyniki każdej próby są oznaczone xij (i = 1, 2, ..., k, j = 1, 2, ..., ni).
Formułowanie hipotez:
l należy sprawdzić hipotezę H0 : s12 = s22 = ... = sk2.
l hipoteza alternatywna H1 : nie wszystkie wariancje są równe.
Sposób postępowania:
ni
1
2
l z wyników k prób należy obliczyć: s2 = (xij - xi)
ni -1 j=1
ni
k k
1 1
2
2
~
s = -1)*%5ńi2 = (xij - xi)
(ni
n - k n - k
i=1 i=1 j=1
k
ć
1 1 1
k
c =1+
-
n =
gdzie: ni
42
3(k -1) ni -1 n - k
i=1
Ł ł
i=1
Test jednorodności wielu wariancji
Statystyka:
l dla ustalonego poziomu istotności ą i dla k 1 stopni swobody należy
odczytać wartość ą2 .
k
2,303
2 2
~
c = (n - k)*log s - (ni -1)*log s2ł
ę ś
c i=1
log logarytm dziesiętny
Wnioskowanie:
l jeżeli 2 ł ą2 , to hipotezę H0 należy odrzucić.
l jeżeli 2 < ą2 brak podstaw do odrzucenia hipotezy H0.
43
7
2013-04-17
Test jednorodności wielu wariancji - przykład
l Zbadano liczbę pasażerów przewożonych linią tramwajową w godzinach szczytu
w kolejnych 3 dniach roboczych tygodnia. Otrzymano następujące wariancje
liczby pasażerów przewożonych 20, 100, 70. Przyjmując poziom istotności
ą=0,05 zweryfikować hipotezę, że wariancja liczby pasażerów w kolejne dni
tygodnia jest jednakowa.
lp si2 log(si2) (ni-1) (ni-1)*(si2) (ni-1)*log(si2)
1 20 1,301 9 180 11,709
Wniosek
Nie ma podstaw do
2 100 2,000 9 900 18,000
odrzucenia hipotezy, że
3 70 1,845 9 630 16,606
wariancje są jednakowe
suma 1710 46,315
ni= 10 s2= 63,333 c= 1,049
n= 30 n-k= 27 2= 5,111
k= 3 log(s2) 1,802 20,05,2= 5,991
k
1 9 1
2
~
s = -1)*%5ńi2 = (20 +100 + 70)= *190 = 63,3
(ni
n - k 27 3
i=1
k k
ć
1 1 1 1 ć
c =1+ =1+ =1,049
- =1+
101-1 - 301 1 ć 3 - 1
3(k -1) ni -1 n - k 3(3-1)Ł - 3ł 6 9 27
i=1 i=1 Ł ł
Ł ł
k
2,303 ł 2,303
2
c = (n - k)*log %5ń2 - -1)*log %5ńi2 ś = [(30 - 3)log(63,333)- 46,315]= 5,111 44
(ni
ę
c 1,049
i=1
Test analizy wariancji dla wielu średnich
Klasyfikacja pojedyncza
l Podstawowe narzędzie statystyki eksperymentalnej,
l Pozwala na sprawdzenie, czy pewne czynniki, które można regulować w
toku eksperymentu, wywierają wpływ (jak duży) na kształtowanie się
średnich wartości badanych cech,
l Polega na porównaniu wariancji wynikającej z działania danego czynnika z
wariancją resztkową mierzącą losowy błąd eksperymentu.
l Klasyfikacja pojedyncza suma kwadratów wariancji ogólnej jest rozbijana
na dwa składniki mierzące zmienność między grupami (populacjami) i
wewnątrz grup.
45
8
2013-04-17
Test analizy wariancji dla wielu średnich
Model
Założenia:
l danych jest k populacji o rozkładzie normalnym N(źi, si) lub o rozkładzie
zbliżonym do normalnego,
l wariancje wszystkich k populacji są równe (s12 = s22 = ... = sk2 = s2),
ale nie muszą być znane,
l z każdej z tych populacji wylosowano niezależnie próby o liczności ni
elementów,
l wyniki prób oznaczone są przez xij (i = 1, 2, ..., k, j = 1, 2, ..., ni)
przy czym xij = źi + eij,
gdzie: eij jest wartością zmiennej losowej nazywanej składnikiem losowym,
mającej rozkład N(0, s),
46
Test analizy wariancji dla wielu średnich cd
Formułowanie hipotez:
l należy zweryfikować hipotezę H0 : ź1 = ź2 =... = źk.
l hipoteza alternatywna H1 : nie wszystkie średnie badanych populacji są
równe
Sposób postępowania:
l z wyników poszczególnych prób należy obliczyć średnie grupowe xi
i średnią ogólną :
x ni k ni
1 1
x =
xi =
xij
xij
n
ni j=1 i=1 j=1
l wypełnić tablicę analizy wariancji:
Stopnie
yródło zmienności Suma kwadratów Wariancja Test F
swobody
2
k
między
k %5ń1
- x)2 ni
(xi
F =
(xi - x) 2ni
2
populacjami k - 1 i=1 2
%5ń1 =
%5ń2
i=1
k -1
(grupami)
k ni
ni
k
wewnątrz grup
- xi )2
(xij
(xij - xi) 2
n - k
2 i=1 j=1
(składnik losowy)
%5ń2 =
i=1 j=1
n - k
47
9
2013-04-17
Test analizy wariancji dla wielu średnich cd
Sprawdzian
l obliczoną w tablicy wartość F należy porównać z wartością krytyczną Fa
odczytaną z tablic rozkładu F Snedecora dla ustalonego poziomu istotności a
i dla liczby stopni swobody k-1 i n-k,
Wnioskowanie:
l jeżeli F e" Fa to hipotezę H0 należy odrzucić,
l jeżeli F < Fa brak podstaw do odrzucenia hipotezy H0.
48
Test analizy wariancji dla wielu średnich - przykład
l Koszt wytworzenia pewnego usługi transportowej trzema różnymi metodami
ma rozkład normalny o jednakowej wariancji dla każdej z metod. Na
poziomie istotności ą=0,05 zweryfikować hipotezę, że średnie koszty
materiałowe są jednakowe dla wszystkich metod produkcji usługi.
xi ni * xi
Metoda ni si2 ni*si2 (xi - x) 2ni
1 5 20 100 50 250 55,56
2 6 30 180 175 1050 266,67
3 7 20 140 121,43 850 77,78
suma 18 420 2150 400
Średnia 420/18=23,33
x
Suma Stopnie
yródło zmienności Wariancja Test F
kwadratów swobody
między grupami 400 k-1=2 200,0 Femp=1,39
wewnątrz grup 2150 n-k=15 143,3 Fą,2,15=3,68
F
o równości średnich kosztów produkcji usługi
49
10
Wyszukiwarka
Podobne podstrony:
MP 8 hipot nieparam 1
MP 7 hipot param 1
MP 8 hipot nieparam 2
MP 8 hipot nieparam 2
1 parametry technniczne wymiary tablic zal nr1id?43
Stymulus Zestaw6 STP MP Gesundheitswesen
Cw 6 Parametryczny stabilizator napiecia
Oszacowanie parametrów charakterystyk podatnych połączeń stalowych za pomocą sieci neuro rozmytej
kernel parameters
3 2 invocation parameters
parametryw
bibliografia mp
Algorytm obliczania parametrów termodynamicznych
klotoida przyklad doboru parametru
więcej podobnych podstron