Nieparametryczne testy istotności
Służą do sprawdzania hipotez nieparametrycznych
(czyli takich, które nie dotyczą parametrów).
Testy te można podzielić na trzy zasadnicze grupy:
lð testy zgodnoÅ›ci
lð testy losowoÅ›ci
lð testy niezależnoÅ›ci
lð testy losowoÅ›ci - weryfikujÄ… hipotezÄ™, że próba ma charakter
losowy, np. test serii
lð testy niezależnoÅ›ci - sprawdzajÄ…ce hipotezÄ™ o niezależnoÅ›ci dwóch
zmiennych losowych, np. test niezależnoÅ›ci Ç2.
Testy zgodności można podzielić na dwie grupy:
1. Służące do weryfikacji hipotez o postaci funkcyjnej rozkładu
populacji generalnej (sprawdza się zgodność rozkładu
empirycznego z próby z rozkładem hipotetycznym). Wśród tych
testów można wyróżnić grupę testów służących do weryfikacji
hipotezy, że populacja generalna ma rozkład normalny.
2. Służące do weryfikacji hipotez, że dystrybuanty dwóch lub więcej
zmiennych losowych są identyczne (sprawdza się zgodność dwóch
lub więcej rozkładów empirycznych z próby).
Test zgodnoÅ›ci Ç2
Polega na porównaniu liczebności teoretycznych i empirycznych. Gdy
rozbieżność między liczebnościami jest zbyt duża, hipoteza, że
populacja ma dany rozkład teoretyczny, powinna zostać odrzucona.
Założenia:
- populacja generalna ma dowolny rozkład o dystrybuancie F(x),
- wylosowano niezależnie dużą próbę, której wyniki podzielono na r
r
rozłącznych klas o liczebności ni w każdej klasie n = ni ,
"
i=1
( )
Sprawdzamy, czy populacja generalna ma założony rozkład F0 x
( ) ( )
co zapisujemy: H0 : F x = F0 x
( ) ( )
Hipoteza alternatywna ma postać H1 : F x `" F0 x co oznacza, że
populacja generalna ma inny rozkład niż ten, który zakładamy.
2
Stosujemy statystykÄ™ Ç :
r
( - npi 2
ni )
2
Ç = ,
"
npi
i=1
która przy zaÅ‚ożeniu prawdziwoÅ›ci hipotezy H0 ma rozkÅ‚ad Ç2 o r-k-1
stopniach swobody, gdzie k oznacza liczbę oszacowanych parametrów
rozkładu, natomiast pi - prawdopodobieństwo teoretyczne obliczone
przy założeniu prawdziwości hipotezy zerowej.
Test zgodności Kołmogorowa
Podobnie jak poprzedni test, polega na porównaniu dystrybuanty
empirycznej i teoretycznej. Jeżeli populacja generalna ma rozkład
zgodny z hipotezą, to wartości dystrybuanty powinny być we
wszystkich badanych punktach zbliżone. Największa różnica między
dwiema dystrybuantami służy do zbudowania statystyki .
Założenia
" Z populacji wylosowano niezależnie do próby n elementów (co
najmniej kilkadziesiÄ…t).
( ) ( )
Hipoteza zerowa H0 : F x = F0 x
( ) ( )
Hipoteza alternatywna H1 : F x `" F0 x
Sposób postępowania:
" Wyniki próby należy uporządkować w kolejności rosnącej i
pogrupować w przedziały. Górne krańce tych przedziałów
oznaczamy jako x1i , natomiast ich liczebności jako ni,
" Dla każdego przedziału wyznaczamy wartość dystrybuanty
empirycznej F(x):
nskum
( )
F x =
n
gdzie nskum oznacza skumulowane liczebności, natomiast n to liczba
obserwacji.
" W każdym przedziale wyznaczamy teoretyczną wartość
dystrybuanty F0(x).
" Dla każdego przedziału obliczamy bezwzględną wartość różnicy:
F(x) F0(x).
" Obliczamy kres górny (sup), co w praktyce polega na znalezieniu
największej różnicy bezwzględnej:
| ( )- ( )|
Dn = sup F x F0 x .
" HipotezÄ™ zerowÄ… weryfikujemy za pomocÄ… statystyki lambda:
= Dn n
Dla ustalonego poziomu istotności ą odczytujemy wartość krytyczną
ą i porównujemy z wartością testu .
Jeżeli zachodzi nierówność e" ą , to hipotezę H0 należy odrzucić.
Oznacza to, że badany rozkład jest najprawdopodobniej inny niż
zakładamy.
Dla poziomu istotności 0,05 wartość krytyczna wynosi 1,36:
0,05 = 1,36 .
Test zgodności Kołmogorowa-Smirnowa
Założenia:
" Pobrano dwie, niezależne próby losowe o liczebnościach n1 i n2.
( ) ( )
Hipoteza zerowa: H0 : F1 x = F2 x - obie próby pochodzą z tej samej
(nie wiadomo z jakiej) populacji.
( ) ( )
Hipoteza alternatywna: H1 : F1 x `" F2 x - obie próby pochodzą z
innych (nie wiadomo jakich) populacji.
Sposób postępowania jest podobny jak w poprzednim teście z tą
różnicą, że tym razem porównujemy dwie dystrybuanty empiryczne, a
poprzednio porównywaliśmy dystrybuantę empiryczną i teoretyczną:
" Wyniki obu prób porządkujemy od wartości najmniejszej i
grupujemy w przedziałach klasowych.
" Dla obu prób, w każdym przedziale klasowym obliczamy wartości
dystrybuant empirycznych:
n1skum n2skum
( ) ( )
Fn1 x = , Fn2 x = .
n1 n2
" Obliczamy kres górny (sup), co w praktyce polega na znalezieniu
największej różnicy bezwzględnej między dystrybuantami:
| ( )- ( )|
Dn1,n2 = sup Fn1 x Fn2 x .
HipotezÄ™ zerowÄ… weryfikujemy za pomocÄ… statystyki lambda:
= Dn1,n2 n,
n1n2
gdzie n = .
n1 + n2
2
Test niezależnoÅ›ci Ç
Służy do sprawdzenia, czy dwie badane cechy mierzalne lub
niemierzalne są niezależne.
Hipoteza zerowa: Cechy X i Y są niezależne, co zapisujemy jako
( ) ( ) ( )
H0 : F x, y = Fx x Fy y
Hipoteza alternatywna: Cechy X i Y są zależne, co zapisujemy jako
( ) ( ) ( )
H1 : F x, y `" Fx x Fy y
Sposób postępowania:
" Wyniki próby należy poklasyfikować w tablicę o k wierszach i r
kolumnach. W boczku tablicy jest k grup wartości cechy X, a w
główce tablicy jest r grup wartości cechy Y.
" Wnętrze tablicy wypełniają liczebności nij (i = 1, 2, ..., k,
j = 1, 2, ..., r) oznaczające, ile elementów w próbie miało wartości
obu cech należące do kombinacji (i, j).
" Sumowanie wierszy i kolumn w tablicy daje liczebności brzegowe:
r k
ni. = nij , n. j = nij .
" "
j=1 i=1
" Liczebności teoretyczne nij obliczamy ze wzoru:
Ć
ni. Å" n. j
nij = .
Ć
n
Do weryfikacji hipotezy służy statystyka:
k r
(nij - nij )2
Ć
2
Ç = .
" "
nij
Ć
i=1 j=1
2
Przy zaÅ‚ożeniu prawdziwoÅ›ci hipotezy H0 statystyka ta ma rozkÅ‚ad Ç
( )( )
z r - 1 k - 1 stopniami swobody.
Testowanie normalności za pomocą testu Jarque-Bera
Hipoteza zerowa: próba pochodzi z rozkładu normalnego
Hipoteza alternatywna: próba pochodzi z innego rozkładu niż
normalnego
Do obliczeń wykorzystujemy następującą statystykę:
2
2 2
( ( ) ),
Ç = N As / 6 + K - 3 / 24
N
1
3
3
gdzie As = ( - x / S - klasyczny współczynnik asymetrii
xi )
"
N
i=1
N
1
4
4
K = ( - x / S - klasyczny współczynnik koncentracji.
xi )
"
N
i=1
Wiadomo, że dla rozkładu normalnego zachodzi:
As = 0 , K = 3.
Zatem najmniejszą wartością jaką może osiągnąć statystyka Jarque-
Bera jest zero. Jakakolwiek wartość większa od zera sugeruje
odstępstwo od rozkładu normalnego.
2
Przy zaÅ‚ożeniu hipotezy zerowej statystyka JB ma rozkÅ‚ad Ç z dwoma
stopniami swobody.
Test serii
Serią nazywa się każdy podciąg złożony z kolejnych elementów
jednego rodzaju.
Założenia:
" Dana jest populacja generalna o dowolnym rozkładzie.
" Pobrano próbę n elementową.
Hipoteza zerowa: próba jest losowa.
Hipoteza alternatywna: próba nie jest losowa.
Sposób postępowania:
" Na podstawie uporządkowanych wartości w szeregu (w kolejności od
najmniejszej do największej) obliczamy medianę me.
" Wracamy do szeregu wyjściowego (nieuporządkowanego) i każdemu
wynikowi próby xi przypisujemy symbol:
a jeżeli xi < me,
b jeżeli xi > me,
wynik xi = me pomijamy.
" Obliczamy w otrzymanym w ten sposób ciągu liczbę serii k.
Przy założeniu losowości próby, liczba serii k ma znany i stablicowany
rozkład zależny tylko od n1 i n2 - liczebności elementów a i b.
" Znajdujemy dwie wartości krytyczne k1 i k2 spełniające warunek:
Ä… Ä…
( ) ( )
P k d" k1 = oraz P k d" k1 = 1 - .
2 2
Jeżeli k d" k1 lub k e" k2 , to hipotezę o losowości próby należy odrzucić.
W przypadku gdy liczebność próby przekracza 20, należy wykorzystać
zbieżność liczby serii do rozkładu normalnego i zastosować statystykę:
k - k
z =
s(k)
gdzie:
2n1n2(2n1n2 - n1n2)
2n1n2
s(k) =
k = + 1
(n1 + n2)2(n1 + n2 - 1)
n1 + n2 , .
z e" zÄ…
Jeżeli zachodzi nierówność , to hipotezę H0 należy odrzucić, gdy
z < zÄ…
to brak podstaw do odrzucenia H0.
Wyszukiwarka
Podobne podstrony:
wyklad stat 2wyklad stat 3Stat LWZ LZZ wyklad1Stat wyklad2 11 na notatkiSopot stat 11 wyklad 9 Analiza kowariancji i ogolny model liniowyStat wyklad3 11 na notatki1 stat wykladstat wyklad1,2stat biot wyklady z matSTAT wyklad3Podstawy stat wyklad(1)4 Stat niewyz wykładStat wyklad4 11 na notatkiSieci komputerowe wyklady dr FurtakWykład 05 Opadanie i fluidyzacjawięcej podobnych podstron