2013-04-28
Metody probabilistyczne
Weryfikacja hipotez statystycznych
Hipotezy nieparametryczne
Testy nieparametryczne
Sprawdzana jest hipoteza H0 dotycząca rozkładu badanej cechy
w populacji generalnej, która nie określa wartości parametrów tego
rozkładu.
Podział testów nieparametrycznych
Testy losowości
Testy zgodności Testy niezależności
próby
Warunki konieczne do spełnienia w odniesieniu do wszystkich ww.
testów:
l liczebność próby duża w porównaniu z liczebnością populacji generalnej
N,
l próba powinna być próbą prostą (losowanie niezależne),
l dopuszczalna wielkość błędu I-rodzaju (poziom istotności ą) jest
najczęściej równa 0,05 lub 0,01.
2
1
2013-04-28
Testy statystyczne
(nieparametryczne i parametryczne)
Testy statystyczne
nieparametryczne parametryczne
skale
nominalna porządkowa przedziałowa i ilorazowa
zmienne
jedna dwie i więcej jedna dwie i więcej jedna dwie i więcej
test zgodności
-Kołmogorowa -test z
chi2
-serii -test t
niezależne zależne niezależne zależne niezależne zależne
niezależności -McNemara -znaków -test z -test t
chi2 -QCochrana -Wilcoxona -test t
-Friedmana -test F
-serii Walda-Wolfowitza
-U Manna-Whitneya
-Smirnowa-Kołmogorowa
-Kruskala Wallisa
3
-mediany
Testy zgodności
Testy zgodności testy weryfikujące hipotezy dotyczące postaci
rozkładu populacji generalnej
H0: f(x)=f0(x) H1: f(x)`" f0(x) H0: F(x)=F0(x) H1: F(x)`" F0(x)
Przykłady testów zgodności:
l Test 2 Pearsona - test dla jednej populacji zmiennej ciągłej lub
dyskretnej,
l Test Kołmogorowa test dla jednej populacji zmiennej ciągłej,
l Test Shapiro Wilka - test dla jednej populacji; weryfikuje hipotezę, że
rozkład jest normalny,
l Test Kołmogorowa-Lillieforsa - test dla jednej populacji; weryfikuje
hipotezę, że rozkład jest normalny,
l Test Kołmogorowa - Smirnowa testuje hipotezy o jednakowym
rozkładzie dwóch populacji,
4
2
2013-04-28
Testy zgodności
Pojedyncza próba
5
Test zgodności c2
Dotyczy rozkładów ciągłych i dyskretnych,
l Polega na porównaniu liczebności teoretycznej i empirycznej
ustalonych przedziałów klasowych.
l Gdy rozbieżność między liczebnościami jest zbyt duża,
hipoteza, że populacja ma dany rozkład teoretyczny, musi zostać
odrzucona.
l Ograniczenie duża liczebność próby
l n co najmniej kilkadziesiąt;
l co najmniej 8 wyników próby w każdym przedziale klasowym.
l Statystyka używana do weryfikacji hipotezy ma rozkład asymptotyczny
c2.
6
3
2013-04-28
Test zgodności c2
Model
Założenia:
l populacja generalna ma dowolny rozkład o dystrybuancie należącej do
pewnego zbioru W rozkładów o określonym typie postaci funkcyjnej
dystrybuanty,
l wylosowano niezależnie dużą próbę, której wyniki podzielono na k
rozłącznych klas o liczebności ni w każdej klasie n =
,
ni
Formułowanie hipotezy:
l należy sprawdzić, że populacja generalna ma rozkład typu W, tzn.
l H0: F(x) W.
l H1 : F(x) / W.
Sposób postępowania:
l obliczyć dla każdej z k klas wartości badanej cechy X prawdopodobieństwo
(teoretyczne) pi, że zmienna losowa X o rozkładzie W przyjmie wartości
należące do klasy o numerze i (i = 1, 2, ..., k),
l obliczyć liczność teoretyczną npi,
7
Test zgodności c2
Sprawdzian - wartość statystyki:
2
k
(ni - npi )
2
c =
npi
i=1
l która ma przy założeniu prawdziwości hipotezy H0 asymptotyczny rozkład
c2
l o k-1 stopniach swobody lub
l o k-r-1 stopniach swobody, jeżeli z próby oszacowano r parametrów
rozkładu,
Wnioskowanie:
l odczytać wartość krytyczną testu dla poziomu istotności a tak, aby
2 2
P{c ł ca}= a
zachodziło:
l Formułowanie wniosków:
jeżeli 2 e" ą2, to hipotezę H0 należy odrzucić na korzyść H1,
jeżeli 2 < ą2, brak podstaw do odrzucenia hipotezę H0
8
4
2013-04-28
Test zgodności c2 - przykład
l Należy sprawdzić czy kostka do gry jest prawidłowo wyważona.
Dla zweryfikowania hipotezy należy przyjąć poziom istotności ą=0,05.
W tym celu rzucono kostką 200 razy uzyskując wyniki:
Wyniki (ni - n pi)2
n pi n*pi
i
rzutów
n pi
1 42 0,167 33,3 2,253
2 41 0,167 33,3 1,763
3 27 0,167 33,3 1,203
4 25 0,167 33,3 2,083
5 41 0,167 33,3 1,763
6 24 0,167 33,3 2,613
suma 200 1 200 11,680
2
k
2
i
c =
(n - npi ) =11,68
npi
Wniosek:
i=1
Hipotezę H0 należy odrzucić
9
2ą,k-1= 11,07
Test zgodności l Kołmogorowa
l Polega na porównaniu dystrybuanty empirycznej i teoretycznej.
l Jeżeli populacja generalna ma rozkład zgodny z hipotezą, to wartości
dystrybuanty powinny być we wszystkich badanych punktach zbliżone.
l Największa różnica między dwoma dystrybuantami służy do zbudowania
statystyki l, której rozkład (niezależny od postaci dystrybuanty
hipotetycznej) podał Kołmogorow.
l Ograniczenia:
l dystrybuanta hipotetyczna musi być ciągła,
l parametry rozkładu hipotetycznego powinny być znane
(jeżeli próba jest duża to dopuszcza się oszacowanie parametrów
z próby),
l podział na klasy szeregu rozdzielczego przedziałowego o wąskich
przedziałach lub o jednakowej liczebności w klasach.
10
5
2013-04-28
Test zgodności l Kołmogorowa
Model
Założenia:
l populacja generalna ma rozkład ciągły o dystrybuancie F(x),
l z populacji wylosowano niezależnie do próby n elementów (co najmniej
kilkadziesiąt)
Formułowanie hipotezy:
l należy zweryfikować hipotezę H0: F(x) = F0(x), H1: F(x) `" F0(x),
gdzie F0(x) jest konkretną, hipotetyczną i ciągłą dystrybuantą.
Sposób postępowania:
l wyniki próby należy uporządkować w kolejności rosnącej lub pogrupować w
stosunkowo wąskie przedziały o prawych końcach xj
i odpowiadających im liczebnościach nj,
nsk
l dla każdego xj wyznaczyć wartość dystrybuanty empirycznej Fn(x): Fn(xk )=
n
nsk =
nj
gdzie nsk skumulowana od początku aż do xk liczebność:
jŁk
l dla każdego xj wyznaczyć wartość teoretycznej dystrybuanty F(x),
l obliczyć dla każdego xj bezwzględną wartość różnicy |Fn(x) - F(x)|,
11
Test zgodności l Kołmogorowa
Sprawdzian - wartość statystyki:
D = Fn(x)- F(x)
sup
x
l oraz
l = D n
l która ma rozkład Kołmogorowa
Obszar krytyczny:
l jeżeli nd"100 wartość krytyczną należy odczytać z tablic wartości Dn(ą),
l jeżeli n>100 dla ustalonego poziomu istotności a wartość krytyczną la można
odczytać z tablic granicznego rozkładu Kołmogorowa
l i porównać w wartością empiryczną l,
Wnioskowanie:
l jeżeli zachodzi nierówność e" ą, to hipotezę H0 należy odrzucić,
jeżeli zachodzi nierówność < ą, brak podstaw do odrzucenia hipotezy H0.
12
6
2013-04-28
Test zgodności l Kołmogorowa - przykład
l Dokonano ocen rangowych (w skali 1-5) nowego produktu wśród 100
respondentów. Należy na poziomie istotności ą=0,05 zweryfikować
hipotezę, że rozkład ocen wg przypisanych rang jest rozkładem
równomiernym.
Proporcje
Proporcje -
Liczba
skumulowane - Różnice
prawdopodobieństwa
Ranga respon-
dystrybuanta
dentów
Empirycz. Teoret. Empirycz. Teoret. |E-T|
1 12 0,12 0,20 0,12 0,20 0,08
2 24 0,24 0,20 0,36 0,40 0,04
3 32 0,32 0,20 0,68 0,60 0,08
4 24 0,24 0,20 0,92 0,80 0,12
5 8 0,08 0,20 1 1 0,00
Suma 100 1 1
l = D n = 0,12* 100 =1,2
Wniosek:
Z tablic wartości krytycznych Dn(ą)=0,134 Nie ma podstaw do odrzucenia
13
hipotezy H0
l0,90 =1,224 l0,95 =1,358 l0,99 =1,628
Testy zgodności
Dwie próby niezależne
l Test serii,
l Test serii Walda-Wolfowitz a,
l Test U Manna-Whitney a,
l Test Smirnowa-Kołmogorowa
18
7
2013-04-28
Testy serii
l Testy serii służą do weryfikacji hipotezy:
l o identyczności rozkładów badanej cechy z dwóch lub
kilku populacji tzn, że dwie populacje mają ten sam rozkład
(dwie próby pochodzą z jednej populacji),
l o losowości (niezależności) próby,
l Serią nazywa się każdy podciąg złożony z kolejnych
elementów jednego rodzaju utworzony w ciągu
uporządkowanych w dowolny sposób elementów dwu
rodzajów.
l Gdy elementy danego ciągu są losowe, wtedy zarówno
długość serii jak i liczba serii utworzona w danym ciągu
jest losowa
19
Test serii
Model 1 - Założenia:
l dana jest populacja generalna o dowolnym rozkładzie,
l pobrano próbę n elementową,
Formułowanie hipotezy:
l należy sprawdzić hipotezę, że jest to próba losowa.
Sposób postępowania:
l z uporządkowanego według kolejności pobierania elementów do próby
ciągu wyników próby obliczyć medianę me z próby,
l każdemu wynikowi próby xi w tym uporządkowanym chronologicznie ciągu
należy przypisać symbol:
l a jeżeli xi < me
l b jeżeli xi > me
l wynik xi = me można odrzucić.
l obliczyć w otrzymanym w ten sposób ciągu (np. aaabbaaab) liczbę serii k
l przy założeniu losowości próby, liczba serii k ma znany i stablicowany
rozkład zależny tylko od n1 i n2 liczebności elementów a i b,
Wnioskowanie:
l w oparciu o rozkład buduje się dwustronny obszar krytyczny dla testu dla
przyjętego poziomu istotności a tak, żeby zachodziły relacje:
P{ k d" k1 } = ą/2 i P{ k d" k2 } = 1 - ą/2
l jeżeli k d" k1 lub k e" k2 , to hipotezę o losowości próby należy odrzucić
20
8
2013-04-28
Test serii losowość - przykład
l Zbadano liczbę pasażerów w autobusach kolejno podjeżdżających na
przystanek. Na poziomie istotności ą=0,1 zweryfikować hipotezę, że liczba
pasażerów jest liczbą losową.
l Wyniki próby liczba pasażerów:
48 46 20 18 51 47 29 40 35 12 10 => n=11
b b a a b b a b a a
l Hipoteza: próba jest losowa,
l 10 12 18 20 29 35 40 46 47 48 51 => Me = 35
l kemp= 6, ą=0,1
l k1,ą/2 = 3, k2,1-ą/2 = 8, - dwustronny obszar krytyczny
l k1=3 d" kemp=6 d" k2=8
Wniosek:
Nie ma podstaw do odrzucenia
hipotezy o losowości liczby
pasażerów w autobusach
21
Test serii identyczność rozkładów
Model 2 próby niezależne skala nominalna
Założenia:
l dane są dwie populacje generalne o dowolnych rozkładach badanej cechy,
l wylosowano dwie próby o licznościach odpowiednio n1 i n2,
l stosowany dla zmiennych dychotomicznych takich jak płeć (kobieta,
mężczyzna), decyzja (tak, nie), wybór (albo, albo)
l Zmienna dychotomiczna przyjmuje wartości 1 lub 0.
Formułowanie hipotezy:
l należy zweryfikować hipotezę, że rozkłady obu populacji nie różnią się.
l H0: F1(x) = F2(x) wobec H1: F1(x) `" F2(x)
Sposób postępowania:
l uzyskane wyniki ustawić w jeden ciąg według kolejności pojawiania się,
l oznaczyć elementy wg wartości zmiennej dychotomicznej za pomocą
symboli a, a drugiej wartości za pomocą b,
l odczytać liczbę serii k,
Wnioskowanie:
l zbudować obustronny obszar krytyczny testu tak, aby:
22
l P{k1d"k}=ą/2 i P{kd"k2}=1-ą/2
l jeżeli kd"k1 lub ke"k2, to hipotezę H0 należy odrzucić.
9
2013-04-28
Test serii identyczność rozkładów - przykład
l 16 pasażerów przychodzących na przystanek to 10 kobiet i 6 mężczyzn.
Pojawiali się oni w następującej kolejności:
K K K M M K K K K M K M M M K K
l Na poziomie istotności ą=0,05 zweryfikować hipotezę, że kolejność
przychodzenia kobiet i mężczyzn jest przypadkowa.
l Hipoteza: kobiety i mężczyzni przychodzą na przystanek przypadkowo,
l Liczba serii kemp= 7, liczba elementów n=16, nk=10, nm=6, ą=0,05
l k1,ą/2 = 4, k2,1-ą/2 = 11
l k1=4 d" kemp=7 d" k2=11
Wniosek:
Nie ma podstaw do odrzucenia hipotezy,
że kolejność przychodzenia na
przystanek mężczyzn jest inna niż kobiet
23
Test serii identyczność rozkładów
test Walda-Wolfowitza
Model 2 próby niezależne skala porządkowa
2 szeregi ocen rangowych dokonanych przez dwie niezależne grupy
Założenia:
l dane są dwie populacje generalne o dowolnych rozkładach badanej cechy,
l wylosowano dwie próby o licznościach odpowiednio n1 i n2,
Formułowanie hipotezy:
l należy zweryfikować hipotezę, że rozkłady obu populacji nie różnią się.
l H0: F1(x) = F2(x) wobec H1: F1(x) `" F2(x)
Sposób postępowania:
l wyniki obu prób ustawić w jeden ciąg według rosnących wartości,
l oznaczyć elementy jednej próby za pomocą symboli a, a drugiej próby za pomocą b,
l odczytać liczbę serii k,
Wnioskowanie (próba mała):
l zbudować obustronny obszar krytyczny testu tak, aby:
P{k1d"k}=ą/2 i P{kd"k2}=1-ą/2
l jeżeli kd"k1 lub ke"k2, to hipotezę H0 należy odrzucić.
24
10
2013-04-28
Test serii identyczność rozkładów
test Walda-Wolfowitza
Wnioskowanie - dla większych prób
l Rozkład r jest w przybliżeniu rozkładem normalnym o średniej:
2n1 n2
mr = +1
n1 + n2
l I odchyleniu standardowym
2n1n2 *(2n1n2 - n1 - n2)
sr =
2
(n1 + n2) *(n1 + n2 -1)
l Wykorzystuje się statystykę U:
r - mr
U =
sr
l Wnioskowanie stosowane również w hipotezach o losowości rozkładu
l Uwaga: wykorzystuje się jedynie liczebności, a nie wartości
poszczególnych cech.
25
Test serii identyczność rozkładów przykład
test Walda-Wolfowitza
l Pasażerowie dokonywali ocen funkcjonowania transportu zbiorowego w
mieście. Oceny mężczyzn: 50, 51, 37,
Oceny kobiet: 44, 32, 44, 29, 55, 52, 44, 55, 61
l Hipoteza: między ocenami mężczyzn i kobiet nie ma różnic, czyli obie próby
pochodzą z tej samej populacji
l Na poziomie istotności ą=0,05 zweryfikować hipotezę, że oceny kobiet i
mężczyzn nie różnią się,
l Ciąg rosnący:
29 32 37 44 44 44 50 51 52 55 55 61
l Liczba serii kemp= 5, liczba elementów n=12, nk=9, nm=3, ą=0,05
l k1,ą/2 = 2, k2,1-ą/2 = 7,
l k1=2 d" kemp=5 d" k2=7
Wniosek:
Nie ma podstaw do odrzucenia
hipotezy, że oceny kobiet
26
i mężczyzn nie różnią się istotnie.
11
2013-04-28
Test serii identyczność rozkładów
test U Manna-Whitneya
Model 2 próby niezależne skala porządkowa, gdy występują takie
same oceny między różnymi respondentami
2 szeregi ocen rangowych dokonanych przez dwie niezależne grupy
Założenia:
l dane są dwie populacje generalne o dowolnych rozkładach badanej cechy,
l wylosowano dwie próby o licznościach odpowiednio n1 i n2,
Formułowanie hipotezy:
l należy zweryfikować hipotezę, że rozkłady obu populacji nie różnią się.
Sposób postępowania:
l przypisać uszeregowanym wg wartości ocenom respondentów rangi
l zsumować rangi dla poszczególnych grup,
l obliczyć wartość U:
n(n +1)
U = s -
2
gdzie: s suma mniejsza,
n liczebność próby, dla której suma jest mniejsza
Wnioskowanie:
l zbudować obustronny obszar krytyczny testu tak, aby: P{Ud"U1}=ą
U1 tabela wartości krytycznych testu U Manna-Whitneya, U2 = n1*n2 U1
l jeżeli Ud"U1 lub Ue"U2, to hipotezę H0 należy odrzucić. 27
Test serii identyczność rozkładów
test U Manna-Whitneya
Wnioskowanie - dla większych prób
l Rozkład U jest w przybliżeniu rozkładem normalnym o średniej:
n1 n2
mU =
2
l I odchyleniu standardowym
n1n2 *(n1 + n2 +1)
sU =
12
l Wykorzystuje się statystykę Z:
U - mU
Z =
sU
l Uwaga: wykorzystuje się jedynie liczebności, a nie wartości
poszczególnych cech.
28
12
2013-04-28
Test serii identyczność rozkładów
test U Manna-Whitneya - przykład
l Mieszkańcy dokonywali ocen funkcjonowanie wypożyczalni rowerów w
mieście. Oceny mężczyzn: 25, 18, 28, 30, 33,
Oceny kobiet: 27, 15, 25, 30, 25, 18, Na poziomie istotności ą=0,05
zweryfikować hipotezę Ho, że oceny kobiet i mężczyzn nie różnią się,
l Hipoteza Ho : między ocenami mężczyzn i kobiet nie ma różnic, czyli obie
próby pochodzą z tej samej populacji.
l Uporządkowane oceny:
15 18 18 25 25 25 27 28 30 30 33
1 2 3 4 5 6 7 8 9 10 11
Dane surowe Rangi łączone n(n +1) 6(6 +1)
U = s - = 30 - = 9
2 2
18 15 2,5 1
25 18 5 2,5
U1,ą,n1,n2=6 U2=n1*n2-U1=5*6-6=24
28 25 8 5
30 25 9,5 5
Wniosek:
33 27 11 7
Nie ma podstaw do odrzucenia
hipotezy Ho, że oceny kobiet
30 9,5
i mężczyzn nie różnią się
29
n1=5 n2=6 S1=36 S2=30
Test istotności Smirnowa-Kołmogorowa
Model - 2 próby niezależne skala porządkowa
Założenia:
l dane są dwie populacje generalne o rozkładach z ciągłymi dystrybuantami
F1(x) i F2(x),
l pobrano dwie próby losowe o liczebnościach n1 i n2,
Formułowanie hipotezy:
l należy sprawdzić hipotezę, że obie próby pochodzą z tej samej populacji,
czyli H0: F1(x) = F2(x),
Sposób postępowania:
l wyniki obu prób pogrupować w stosunkowo wąskie przedziały o tych
samych końcach xj,
l dla każdego xj obliczyć wartości dystrybuant empirycznych z obu prób:
n1,sk n2,sk
Fn1(x)= Fn2(x)=
n1 n2
30
13
2013-04-28
Test istotności Smirnowa-Kołmogorowa
Sprawdzian - wartość statystyki:
D* = Fn1(x)- Fn2(x)
sup
x
l oraz: ,
l = D* n
n1n2
gdzie:
n =
n1 + n2
Wnioskowanie:
l dla ustalonego poziomu istotności a odczytać wartość krytyczną la
i porównać w wartością empiryczną l,
l jeżeli zachodzi nierówność e" ą, to hipotezę H0 należy odrzucić.
31
Test istotności Smirnowa-Kołmogorowa - przykład
l Badane są rozkłady odstępów między przyjazdami kolejnych pojazdów na
przystanki A i B. Należy na poziomie istotności ą=0,02 zweryfikować
hipotezę, że rozkłady odstępów pochodzą z tej samej populacji.
Liczebności Dystrybuanty
Przedziały
Liczebności skumulowane empiryczne
Nr odstępów |FnA(x)-FnB(x)|
czasu
A B A B FnA(x) FnB(x)
1 1,50 2,00 3 16 3 16 0,030 0,080 0,050
2 2,00 2,50 5 20 8 36 0,080 0,180 0,100
3 2,50 3,00 17 24 25 60 0,250 0,300 0,050
4 3,00 3,50 40 60 65 120 0,650 0,600 0,050
5 3,50 4,00 25 40 90 160 0,900 0,800 0,100
6 4,00 4,50 5 30 95 190 0,950 0,950 0,000
7 4,50 5,00 5 10 100 200 1,000 1,000 0,000
Liczebności prób 100 200 l = D * n = 0,100*8,165 = 0,816 Dn=0,100
n
ą=1,52 Wniosek:
n1n2 100*200
n = = = 8,165
32
n1 + n2 300 Nie ma podstaw do odrzucenia
hipotezy H0
14
2013-04-28
Testy zgodności
Trzy i więcej prób niezależnych
l Test niezależności 2,
l Test serii Kruskala-Wallisa,
l Test mediany,
33
Test niezależności c2 skala nominalna (i każda inna)
l Służy do sprawdzenia, czy dwie lub więcej badanych cech
(niekoniecznie mierzalnych) sa niezależne.
Zmienne losowe X i Y są niezależne, gdy dla dystrybuant zachodzi
równość: F(x,y) = F1(x) F2(y)
l Polega na porównaniu macierzy liczebności teoretycznych
i empirycznych.
l Prawdopodobieństwami hipotetycznymi są oszacowane z próby
prawdopodobieństwa otrzymania jednocześnie określonej wartości (lub
kategorii jakościowej) cechy X oraz Y.
l Ograniczeniem testu jest duża liczebność próby i liczebność w
każdym przedziale klasowym nije"8
34
15
2013-04-28
Test niezależności c2 skala nominalna (i każda inna)
Model 2 i więcej prób niezależnych skala nominalna
Założenia:
l populacja generalna jest równocześnie badana ze względu na dwie cechy,
niekoniecznie mierzalne,
l wylosowano niezależnie dużą próbę o liczebności n elementów,
l należy zweryfikować hipotezę H0, że badane cechy są niezależne,
Sposób postępowania:
l wyniki próby poklasyfikować w kombinowaną tablicę niezależności
o r wierszach i s kolumnach,
l na boku tablicy jest r grup wartości cechy X, a w nagłówku tablicy jest s grup
wartości cechy Y,
l wnętrze tablicy wypełniają liczebności nij (i = 1, 2, ..., r, j = 1, 2, ..., s)
oznaczające, ile elementów w próbie miało wartości obu cech należące do
kombinacji (i, j),
35
Test niezależności c2 skala nominalna (i każda inna)
2 i więcej prób niezależnych
Sposób postępowania c.d.:
l sumowanie wierszy i kolumn macierzy liczebności empirycznych daje
s r
liczebności brzegowe: ,
n j =
ni =
nij
nij
i=1
j=1
ni n j
pi
l oszacować prawdopodobieństwa brzegowe: = n j = n
, p
zakładając prawdziwość hipotezy H0, należy obliczyć prawdopodobieństwa
hipotetyczne:
pij = pi p j
l mnożąc te prawdopodobieństwa przez liczebność próby otrzymuje się
macierz liczebności teoretycznych [npij],
l Sprawdzian wartość statystykę:
r s
(nij -npij ) 2
2
c =
npij
i=1 j=1
l Statystyka ta ma przy założeniu prawdziwości hipotezy H0 asymptotyczny
rozkład c2 z (r 1)(s 1) stopniami swobody.
36
16
2013-04-28
Test niezależności c2 skala nominalna (i każda inna)
2 i więcej prób niezależnych
Formułowanie hipotez:
H0: cecha Y NIE ZALEŻY od cechy X
H1: cecha Y ZALEŻY od cechy X
Wnioskowanie:
l Obszar odrzucenia jest zawsze obszarem prawostronnym.
l Jeżeli wartość sprawdzianu 2 znajdzie się:
l w obszarze odrzucenia (tzn. 2 > 2ą), to odrzucamy H0 i przyjmujemy H1.
l poza obszarem odrzucenia (tzn. 2 d" 2ą), , to nie mamy podstaw do
odrzucenia H0.
37
Test niezależności c2 skala nominalna (i każda inna)
2 i więcej prób niezależnych - przykład
Na poziomie istotności =0,05 zweryfikuj
hipotezę, czy wybór środka transportu
Hij=ni. * n.j /n
zależy od statusu zawodowego
L K D
H0: wybór środka nie zależy od statusu,
P 56 172 172 400
H1: wybór środka zależy od statusu,
E/R 14 43 43 100
Transport
U/S 49 151 151 350
Status L K D "ni.
NP. 21 65 65 150
Pracujący 100 80 220 400
140 430 430
Emeryci/
10 60 30 100
(nij-Hij)2/Hij
renciści
Uczniowie/ P 34,571 49,209 13,395
20 190 140 350
studenci
E/R 1,143 6,721 3,930
Niepracujący 10 100 40 150
U/S 17,163 10,367 0,733
"n.j 140 430 430 1000
NP. 5,762 19,539 9,306
20,05;(4-1)(3-1)=12,591
2 171,840
Wniosek:
38
H0 należy odrzucić
17
2013-04-28
Test niezależności c2 skala nominalna (i każda inna)
2 i więcej prób niezależnych - przykład
Na poziomie istotności =0,05 zweryfikuj
hipotezę, czy wybór środka transportu
Hij=ni. * n.j /n
zależy od statusu zawodowego
L K D
H0: wybór środka nie zależy od statusu,
P 56 172 172 400
H1: wybór środka zależy od statusu,
E/R 14 43 43 100
Transport
U/S 49 151 151 350
Status L K D "ni.
NP. 21 65 65 150
Pracujący 100 80 220 400
140 430 430
Emeryci/
10 60 30 100
(nij-Hij)2/Hij
renciści
Uczniowie/ P 34,571 49,209 13,395
20 190 140 350
studenci
E/R 1,143 6,721 3,930
Niepracujący 10 100 40 150
U/S 17,163 10,367 0,733
"n.j 140 430 430 1000
NP. 5,762 19,539 9,306
20,05;(4-1)(3-1)=12,591
2 171,840
Wniosek:
39
H0 należy odrzucić
18
Wyszukiwarka
Podobne podstrony:
MP 8 hipot nieparam 2MP 8 hipot nieparam 2MP 7 hipot param 1MP 7 hipot parametryczne 2Stymulus Zestaw6 STP MP Gesundheitswesenbibliografia mpWyklad 7 Nieparametryczne metody statystyczne PL [tryb zgodności]Stymulus Zestaw@ STP MP Berlin7 hipotezy nieparametryczneMP logika rozmytaMP wzory transf 1więcej podobnych podstron