Nie parametryczne testy istotności:
Test zgodności Testy weryfikujący
Testy zgodności:
-test zgodności ᵡ2 Pearsona
-test zgodności λ Kołmogorowa
-Shapiro – Wilka (normalność rozkładu)
-λ Kołmogorowa – Smirnowa
ᵡ2 Pearsona:
w testach nieparametrycznych wartość statystyki ᵡ2 oblicza się wykorzystując wzór:
ᵡ2 = $\sum_{}^{}\frac{(E - H)^{2}}{H}$
E – wartość empiryczna
H – wartość hipotetyczna
Założenia: analizowana w populacji generalnej cecha ma określony typ rozkładu, badana cecha (zmienna) może być skokowa lub ciągła(dowolna skala pomiarowa)
Dane: wyniki próby xj = 1,2,…,n
liczebność próby n (duża próba, minimum kilkadziesiąt)
liczba klas k
poziom istotności α
Cel: na podstawie wyników próby weryfikacja hipotezy zerowej względem H1
Hipotezy: H0: rozkład badanej cechy jest określonego typu – znana postać dystrybuanty
H1: weryfikowany rozkład jest innego typu
Obliczenia: liczebności empiryczne w klasach ni ji =1,…,k n=$\sum_{i = 1}^{k}n_{i}$
prawdopodobieństwo zaobserwowania zmiennej w i-tej klasie pi
(z wykorzystaniem dystrybuanty hipotetycznej)
statystyka ᵡ2 :
ᵡ2 = $\sum_{i = 1}^{k}\frac{(n_{i} - np_{i})^{2}}{np_{i}}$
Statystyka ᵡ2 ma przy założeniu prawdziwości H0 rozkład ᵡ2 o liczbie stopni swobody df= k-1 (jeżeli rozkład hipotetyczny ma parametry to r jest liczbą parametrów tego rozkładu niezbędnych do wyznaczenia pi które oszacowano na podstawie wyników próby).
Test zgodności λ Kołmogorowa:
Założenia: analizowana w populacji generalnej cecha ma określony typ rozkładu
badana cecha (zmienna) musi być ciągłą (skala co najmniej różnicowa)
Dane: wyniki próby xj = 1,2,…,n
liczebność próby n
liczba klas (klasyfikacja tylko przy bardzo dużej próbie)
poziom istotności α
Cel: na podstawie wyniku próby zweryfikować H0 względem H1
Hipotezy: H0 Fe(x) = Fh(x) (dystrybuanta empiryczna)
H1 Fe(x) ≠ Fh(x) (dystrybuanta hipotetyczna)
Obliczenia: po uporządkowaniu wyników próby (rosnąco) bądź klasyfikacji (bardzo duża próba).
Wyniki próby | ni | Liczebność skumulowana |
---|---|---|
x1 …………………………………….. |
n1=1 n2=3 ……………………………………………. ni=1 nk-1=2 nk = 1 |
n1=1 n1+n2=4 ……………………………………………… n1+n2+n3+…+ni n1+n2+…+nk-2+nk-1=n-1 n1+n2+…+nk-1+nk = n |
Tworzymy dwa ciągi wartości:
Dystrybuanta empiryczna | Dystrybuanta hipotetyczna |
---|---|
Fe(xi)=n(sk)/n Fe(x1)=n1/n Fe(x2)=(n1+n2)/n ………………. Fe(xk)=(n1+n2+…+nk)/n |
Fh(xi) Fh(x1) Fh(x2) …………….. Fh(xk) |
Dn = supx (fe(xi) – Fh(xi))
Wnioskowanie:
Wariant I:
n>100 λ=Dn$\sqrt{n}$ Statystyka λ ma przy założeniu prawdziwości H0 rozkład λ Kołmogorowa. Z tablic rozkładu λ Kołmogorowa odczytuje się wartości ????????????? Jeżeli zajdzie relacja λ>=λα odrzucamy H0 na korzyść H1 – rozkład innego typu, lecz niewiadomo jaki. Gdy zajdzie λ<=λα to brak podstaw do odrzucenia H0 – badany rozkład może być zgodny z hipotetycznym.|
Wartości krytyczne:
α=0,05 λα=1,358
α=0,01 λα=1,627
α=0,001 λα=1,950
Wariant II:
m<=100 Podstawą wnioskowania jest wartość statystyki Dn. Przy założeniu prawdziwości H0 statystyka ma znany (tablicowy) rozkład. Z tablic dla założonego z góry poziomu istotności i liczebności próby m wartość krytyczna Dn(α) i sprawdza relację w stosunku do Dn.
Jeżeli Dn>=Dn(α) odrzucamy H0, przyjmujemy H1
Dn<=Dn(α) to brak podstaw do odrzucenia H0
Test Shapiro – Wilka (normalności rozkładu):
Cel: weryfikacja H0 względem H1
Hipotezy: H0 rozkład badanej cechy jest rozkładem normalnym
H1 rozkład inny niż normalny
Założenia: badana cecha jest zmienną losową typu ciągłego
Dane: wyniki próby losowej xi
liczebność próby n
Obliczenia: wartość statystyki W:
W=$\frac{(\sum_{}^{}{a_{i}\left( n \right)(x_{n - i + 1} - x_{i}))^{2}}}{\sum_{j = 1}^{n}{(x_{j} - \ \overset{\overline{}}{x}})^{2}}$
xn − i + 1 − xi – quasi-rozstęp rzędu „i” w uporządkowanym następująco zbiorze wartości xi
ai(n) – stałe zależne zarówno od n jak i od „i” (tablice)
Jeżeli liczebność próby n jest liczbą parzystą sumowanie (w liczniku) przebiega do wartości n/2, w przypadku gdy n jest nieparzyste (n-1)/2
Wnioskowanie: Jeżeli wartość statystyki W trafi do dwustronnego obszaru krytycznego, którego granice leżą od przyjętego poziomu istotności α i liczebności próby n (tablice) H0 należy odrzucić.
Jeżeli statystyka W nie trafi do dwustronnego obszaru krytycznego stwierdzą się brak podstaw do odrzucenia H0.