Test nieparametryczne
Dotycz膮:
佛 por贸wnania dw贸ch grup danych typu ilo艣ciowego, gdy ich rozk艂ad jest
zdecydowanie r贸偶ny od normalnego,
佛 por贸wnania dw贸ch grup danych typu porz膮dkowego,
佛 rodzaju samego rozk艂adu zmiennej losowej,
佛 losowo艣ci pr贸by,
佛 niezale偶no艣ci zmiennych.
Hipotez臋 zerow膮 odrzucamy, je偶eli wynik testu nale偶y do obszaru krytycznego
i w贸wczas przyjmujemy hipotez臋 alternatywn膮 (HA). W przeciwnym
przypadku, nie ma podstaw do odrzucenia H0.
Podstawowym kryterium odrzucenia weryfikowanej hipotezy, w programie
STATISTICA jest nier贸wno艣膰: p < a, gdzie p jest obliczonym przez program
prawdopodobie艅stwem testowym, a a to za艂o偶ony poziom istotno艣ci.
Parametryczne testy istotno艣ci:
1) Por贸wnanie dw贸ch pr贸b niezale偶nych:
H0 : m = m0
佛 dla zmiennych mierzalnych:
佛 dla zmiennych w skali porz膮dkowej:
H0: wyst臋powanie badanej cechy w r贸偶nych pr贸bach nie r贸偶ni si臋
istotnie
a) Test U Manna Whitneya
b) Test serii Walda Wolfowitza
c) Test Ko艂mogorowa - Smirnowa
2) Testy nieparametryczne dla pr贸b zale偶nych (ta sama grupa dwukrotnie
badana)
H0: wyst臋powanie badanej cechy w r贸偶nych pr贸bach nie r贸偶ni si臋
istotnie
a) Test znak贸w (oparty na znakach r贸偶nic pomi臋dzy kolejnymi parami
wynik贸w)
b) Test kolejno艣ci par Wilcoxona
3) Por贸wnywanie zmiennych jako艣ciowych
a) Dwie pr贸by zale偶ne z wynikami dychotomicznymi
佛 Test McNemary,
H0: jedna cecha nie ma istotnego wp艂ywu na drug膮
b) Wi臋cej pr贸b zale偶nych z wynikami dychotomicznymi
佛 Test Q Cochrana
佛 Test Kruskala - Wallisa
H0: jedna cecha nie ma istotnego wp艂ywu na drug膮
c) Test niezale偶no艣ci chi kwadrat
H0: zmienne X i Y s膮 niezale偶ne
4) Testy zgodno艣ci
a) Test chi kwadrat Pearsona
b) Test Ko艂mogorowa - Smirnowa
H0: zmienna X ma rozk艂ad R
Test McNemary
Test ten s艂u偶y do okre艣lania istotno艣ci r贸偶nic w wynikach, kt贸re zasz艂y pod
wp艂ywem jakiego艣 dzia艂ania
H0: jedna cecha (oddzia艂ywanie) nie ma istotnego wp艂ywu na drug膮
Po dzia艂aniu
Suma
- +
+ A B A+B
Przed dzia艂aniem
- C D C+D
Suma
A+C B+D N
A oznacza liczb臋 os贸b, u kt贸rych w wyniku zastosowanego dzia艂ania, poziom badanej cechy
zmieni艂 si臋 (z + na -) lub cecha + zmienia艂a si臋 na cech臋 -
D oznacza liczb臋 os贸b, u kt贸rych w wyniku zastosowanego dzia艂ania, poziom badanej cechy
zmieni艂 si臋 (z - na +) lub cecha - zmienia艂a si臋 na cech臋 +
B i C liczba os贸b, u kt贸rych w wyniku zastosowanego dzia艂ania, poziom badanej cechy nie
zmieni艂 si臋 (z + na + lub z - na -)
Test Obszar krytyczny Obszar przyj臋cia hipotezy
2
A - D -1
2 2
( )
2
c ,+鹉勷 0, c
( )
c =
a a
A + D
2
c餫 c2
liczb臋 odczytujemy z tablic rozk艂adu (chi kwadrat) dla 1 stopnia swobody i
danego poziomu istotno艣ci a.
Przyk艂ad
Przebadano 195 pacjent贸w na wyst臋powanie pewnych bakterii. Stwierdzono ich
wyst臋powanie u 103 os贸b. Po zastosowaniu leczenia przeprowadzono ponownie
badania. Bakterie wykryto u 47 os贸b, z czego 39 to pacjenci, u kt贸rych wcze艣niej tez
wykryto bakterie. Czy mo偶na stwierdzi膰, 偶e leczenie ma istotny wp艂yw na zmniejszenie
si臋 liczby os贸b zaka偶onych bakteriami?
Przyk艂ad
Przebadano 195 pacjent贸w na wyst臋powanie pewnych bakterii. Stwierdzono ich
wyst臋powanie u 103 os贸b. Po zastosowaniu leczenia przeprowadzono ponownie
badania. Bakterie wykryto u 47 os贸b, z czego 39 to pacjenci, u kt贸rych wcze艣niej tez
wykryto bakterie. Czy mo偶na stwierdzi膰, 偶e leczenie ma istotny wp艂yw na zmniejszenie
si臋 liczby os贸b zaka偶onych bakteriami?
Po leczeniu
Suma
- +
+ A B A+B
Przed leczeniem
- C D C+D
Suma
A+C B+D N
Przyk艂ad
Przebadano 195 pacjent贸w na wyst臋powanie pewnych bakterii. Stwierdzono ich wyst臋powanie
u 103 os贸b. Po zastosowaniu leczenia przeprowadzono ponownie badania. Bakterie wykryto u
47 os贸b, z czego 39 to pacjenci, u kt贸rych wcze艣niej tez wykryto bakterie. Czy mo偶na stwierdzi膰,
偶e leczenie ma istotny wp艂yw na zmniejszenie si臋 liczby os贸b zaka偶onych bakteriami?
Po leczeniu
Suma
- +
+ 64 39 103
Przed leczeniem
- 84 8 92
Suma
148 47 195
22
A - D -1 64 - 8 -1
( ) ( )
2
c = = = 42,01
A + D 64 + 8
2
c餫
Liczba dla 1 stopnia swobody i poziomu istotno艣ci a = 0,01 wynosi 6,64, czyli statystyka
6,64;+鹉勷
testowa nale偶y do obszaru krytycznego . Odrzucamy wi臋c hipotez臋 zerow膮 i
( )
stwierdzamy, 偶e leczenie ma istotny wp艂yw na liczb臋 os贸b zaka偶onych bakteriami.
Test niezale偶no艣ci chi kwadrat
Je偶eli przedmiotem badania jest populacja ze wzgl臋du na wyst臋powanie dw贸ch cech
X i Y, to w celu stwierdzenia niezale偶no艣ci tych cech stosujemy test niezale偶no艣ci chi
kwadrat. Jest on oparty o tak zwan膮 tablic臋 niezale偶no艣ci. Tablica ta zawiera tyle
wierszy ile jest wariant贸w cechy X i tyle kolumn ile jest wariant贸w cechy Y.
Niech k oznacza liczb臋 wariant贸w cechy X, a r liczb臋 wariant贸w cechy Y. Wtedy tablica
niezale偶no艣ci wygl膮da nast臋puj膮co:
Y
y1 y2 & yr
X
r
x1 n11 n12 & n1r
屦n
1 j
j=1
r
x2 n21 n22 & n2r
屦n
2 j
j=1
& & & & & &
r
xk nk1 nk2 & nkr
屦n
kj
j=1
k k k
&
屦n 屦n 屦n
i1 i2 ir
i=1 i=1 i=1
Test Obszar krytyczny Obszar przyj臋cia hipotezy
2
k r
膰 鲳
nij
2 2
c2 =
c ,+鹉勷 0, c
琊 黟
屦屦琊 nij 黟 - n ( )
a a
i=1 j=1
艁 艂
gdzie
n to liczno艣膰 pr贸by ,
nij to zaobserwowane liczno艣ci z tabeli niezale偶no艣ci,
nij to teoretyczne liczno艣ci wyst膮pienia odpowiednich wariant贸w, gdyby zmienne X i Y by艂y
niezale偶ne.
kr
1
Teoretyczne liczno艣ci oblicza si臋 wed艂ug wzoru: nij = 尊
屦n 尊屦n
ij ij
n
i=1 j=1
c2
Dla zadanego poziomu istotno艣ci a, z tablic rozk艂adu z r -1 k -1 stopniami swobody
( )( )
2
odczytujemy liczb臋 c餫
Przyk艂ad
Przy nowym podziale student贸w na grupy, postanowiono zbada膰 zale偶no艣膰 mi臋dzy ocen膮
semestraln膮 z j臋zyka angielskiego, a ocen膮 semestraln膮 z matematyki. Poni偶sza tablica zawiera
liczebno艣ci student贸w, kt贸rzy uzyskali dane oceny z angielskiego i z matematyki.
r
Mat
2 3 4 5
屦n
kj
J. Ang
j=1
2 8 5 0 0 13
3 7 57 34 3 101
4 1 17 27 4 47
5 0 20 12 3 39
k
16 99 71 14 200
屦n
ir
i=1
Zweryfikujemy hipotez臋 o niezale偶no艣ci ocen z j臋zyka angielskiego i z matematyki, na
poziomie istotno艣ci 0,1.
2
k r
膰 鲳
nij
Testem jest w tym wypadku statystyka: c2 =
琊 黟
屦屦琊 nij 黟 - n, gdzie n = 200, a nij to zaobserwo-
i=1 j=1
艁 艂
wane liczno艣ci z tabeli niezale偶no艣ci .
kr
1
Teoretyczne liczno艣ci obliczamy wed艂ug wzoru: nij = 尊
屦n 尊屦n
i j i j
n
i=1 j=1
1
n11 = 尊13尊16 = 1,04
200
1
n12 = 尊13尊99 = 6,44
200
Obliczamy tak wszystkie liczebno艣ci teoretyczne i obliczamy statystyk臋 testow膮. Dla u艂atwienia
dalszych oblicze艅, liczebno艣ci teoretyczne mo偶na r贸wnie偶 umie艣ci膰 w tabeli:
r
Mat
2 3 4 5
屦n
kj
J. Ang
j=1
2 1,04 6,44 4,62 0,91 13
3 8,08 50 35,86 7,07 101
4 3,76 23,27 16,69 3,29 47
5 3,12 19,31 13,85 2,73 39
k
16 99 71 14 200
屦n
ir
i=1
Warto艣膰 statystyki testowej wynosi .
c2 = 274,03
Jako, 偶e liczba wariant贸w cechy X (J. Ang.) jest r贸wna k=4 i 偶e liczba wariant贸w cechy Y (Mat)
2
jest r贸wna r=4, st膮d warto艣膰 krytyczn膮 c餫 odczytujemy z tablic rozk艂adu c2 dla 9 stopni
swobody ( r -1 k -1 ) i a=0,1.
( )( )
2
c餫 = 14,684 czyli obszarem krytycznym jest przedzia艂 (14,684; 膭).
Warto艣膰 statystyki testowej nale偶y do tego przedzia艂u, nale偶y wi臋c zdecydowanie odrzuci膰
hipotez臋 o niezale偶no艣ci ocen z j臋zyka angielskiego i z matematyki.
Test zgodno艣ci chi kwadrat (Pearsona)
Hipoteza jest hipotez膮 orzekaj膮c膮, 偶e dystrybuanta zmiennej losowej X ma posta膰
H0
F x , a hipotez膮 alternatywn膮 jest hipoteza, kt贸ra stwierdza, 偶e rozk艂ad zmiennej X
( )
ma dystrybuant臋 r贸偶n膮 od F x .
( )
Zak艂adamy, 偶e zmienna losowa X ma rozk艂ad o nieznanej dystrybuancie F x . Dysponujemy n
( )
elementow膮 pr贸b膮 losow膮 o warto艣ciach x1, x2,..., xn. Zbi贸r mo偶liwych warto艣ci zmiennej
losowej X dzielimy na r roz艂膮cznych podzbior贸w Jk , k =1,2,..., r za pomoc膮 liczb
-鹉勷 = a0 < a1 <... < ar = 膭.
Niech pk pk > 0 oznacza prawdopodobie艅stwo, 偶e zmienna losowa X przyjmuje warto艣膰 z
( )
przedzia艂u , tzn.
Jk
pk = P X 勿Jk = F ak -餏 ak-1 , k =1,2,..., r
( ) ( ) ( )
gdzie F x jest hipotetyczn膮 dystrybuant膮.
( )
Test Obszar krytyczny Obszar przyj臋cia hipotezy
2
r
Nk - npk
)
2 2
c ,+鹉勷 0, c
c2 =
( )
屦(
a a
npk
k=1
Liczba jest oczekiwan膮 liczb膮 obserwacji n elementowej pr贸bki wed艂ug za艂o偶onego
npk
rozk艂adu, kt贸re powinny znalez膰 si臋 w przedziale ,
Jk
natomiast jest zmienn膮 losow膮 o warto艣ciach b臋d膮cych liczb膮 obserwacji, kt贸re znalaz艂y
Nk nk
si臋 w przedziale .
Jk
c2
Dla zadanego poziomu istotno艣ci a, z tablic rozk艂adu z (k m - 1) stopniami swobody
2
odczytujemy liczb臋 c餫 (m oznacza liczb臋 estymowanych parametr贸w hipotetycznego
rozk艂adu).
Empiryczny wsp贸艂czynnik korelacji i regresja liniowa
Niech (x1, y1), (x2, y2), & , (xn, yn) b臋d膮 realizacjami zmiennej losowej dwuwymiarowej (X Y ).
Empirycznym wsp贸艂czynnikiem korelacji nazywamy liczb臋:
n
屦x yi - n尊 X 尊Y
i
i=1
r =
n尊 SX 尊SY
gdzie
nn
22
11
SX = Xk - X i SY = Yk -餣
( ) ( )
屦屦
nn
k=1 k=1
Powy偶szy wsp贸艂czynnik jest miernikiem si艂y zwi膮zku prostoliniowego mi臋dzy dwoma cechami
mierzalnymi X i Y.
Bezpo艣rednio z poj臋ciem korelacji wi膮偶e si臋 zagadnienie regresji. Polega ono na znalezieniu
takiej linii o r贸wnaniu y = f(x), aby suma kwadrat贸w r贸偶nic pomi臋dzy warto艣ciami
zaobserwowanymi yi i obliczonymi f(xi) by艂a najmniejsza (metoda najmniejszych kwadrat贸w).
Najprostsz膮 i najcz臋艣ciej u偶ywan膮 funkcj膮 w regresji jest funkcja liniowa. M贸wimy wtedy o
regresji linowej. Wtedy zale偶no艣膰 mi臋dzy zmiennymi X i Y jest opisana funkcj膮 liniow膮:
y = a 穢 + b,
gdzie
SY
a = r 尊 i b =餣 -餫尊 X
SX
Przyk艂ad
Mierzono wsp贸艂zale偶no艣膰 mi臋dzy ci艣nieniem, a temperatur膮 dla 10 elementowej pr贸by losowej
urz膮dze艅 pewnego typu. Wyniki pomiar贸w przedstawiono w poni偶szej tabeli
Ci艣nienie
17 19 20 21 22 24 26 27 27 30
[hPa]
Temperatura
19 20 23 21 23 23 26 25 26 34
[梆 C]
Wyznaczymy najpierw wsp贸艂czynnik korelacji mi臋dzy ci艣nieniem, a temperatur膮, a nast臋pnie
r贸wnanie regresji liniowej dla tych dw贸ch zmiennych. Jako zmienn膮 X wzi臋to ci艣nienie, a
temperatura to zmienna Y. St膮d parametry poszczeg贸lnych zmiennych wynosz膮:
n
X = 23,3 , Y = 24, SX = 3,95 , SY = 4,02 , a suma
屦x yi wynosi 5735. Wstawiaj膮c te warto艣ci do
i
i=1
wzoru na empiryczny wsp贸艂czynnik korelacji
n
屦x yi - n尊 X 尊Y
i
i=1
r =
n尊 SX 尊 SY
otrzymujemy r = 0,899.
SY 4,02
Wsp贸艂czynnik a w r贸wnaniu regresji liniowej y = a 穢 + b wynosi: a = r 尊 = 0,899尊 0,915.
SX 3,95
Natomiast wsp贸艂czynnik b jest r贸wny 2,655.
St膮d r贸wnanie regresji ma posta膰:
y = 0,915 穢 + 2,655.
Tego typu r贸wnania mo偶na wykorzystywa膰 do wyznaczania warto艣ci zmiennej Y czyli
temperatury. Na przyk艂ad dla ci艣nienia r贸wnego 25 hPa, obliczona warto艣膰 temperatury wynosi
25,53.
Wyszukiwarka
Podobne podstrony:
zadanie testy nieparametryczne15 testy nieparametrycznerafaj艂owicz,In偶ynierskie zastosowania statystyki, testy nieparametryczne, testy zgodno艣citesty nieparametrycznenieparametryczne testy istotnosciinformatyka w prawnicza testyHistoria pa艅stwa i prawa Polski Testy TabliceSprawdziany i Testy Nauczycieliwi臋cej podobnych podstron