www.etrapez.pl
Krystian Karczyński
Strona 1
Nieparametryczne Testy Istotności
Wzory
Nieparametryczne testy istotności – schemat postępowania punkt
po punkcie
1. Formułujemy hipotezę główną
0
H
odnoszącą się do:
zgodności populacji generalnej z jakimś rozkładem, lub:
losowości próby
2. Obliczamy odpowiednią statystykę.
3. Tworzymy i rysujemy obszar krytyczny (obu lub jednostronny w zależności od
1
H
)
4. Sprawdzamy, czy statystyka znalazła się w obszarze krytycznym. Jeśli tak – odrzucamy
hipotezę
0
H
na rzecz hipotezy alternatywnej
1
H
. Jeśli nie – stwierdzamy, że nie ma
podstaw do odrzucenia hipotezy
0
H
.
www.etrapez.pl
Krystian Karczyński
Strona 2
I.
Test zgodności Pearsona
1. Formułujemy hipotezy:
0
H
: populacja generalna ma rozkład …
1
:
H
populacja generalna nie ma tego rozkładu
2. Obliczamy statystykę:
2
2
1
r
i
i
i
i
n
np
np
gdzie
r
to liczba przedziałów w szeregu,
i
n
to liczebności empiryczne w próbce,
i
p
prawdopodobieństwa/odsetki teoretyczne, n liczebność ogólna próbki,
i
np
liczebności
teoretyczne
Prawdopodobieństwa
i
p
w rozkładzie normalnym odczytujemy odpowiednio
odczytując tablice
Prawdopodobieństwa
i
p
w rozkładzie Poissona odczytujemy liczymy ze wzoru:
!
i
x
i
i
p
e
x
, gdzie
jest średnią rozkładu (najczęściej przyjmujemy tu średnią z
próbki X )
Prawdopodobieństwa
i
p
w rozkładzie Bernoulliego/dwumianowym liczymy ze wzoru:
1
1
i
i
x
x
i
i
n
p
p
p
x
, gdzie
p
jest prawdopodobieństwem sukcesu w pojedynczej
próbie
3. Tworzymy i rysujemy prawostronny obszar krytyczny dla rozkładu chi-kwadrat, dla
1
r
k
stopni swobody, gdzie k oznacza liczbę parametrów w rozkładzie teoretycznym (
2
k
w rozkładzie normalnym,
1
k
w rozkładach Poissona i dwumianowym/Bernoulliego)
4. Sprawdzamy, czy statystyka znalazła się w obszarze krytycznym. Jeśli tak – odrzucamy
hipotezę
0
H
na rzecz hipotezy alternatywnej
1
H
. Jeśli nie – stwierdzamy, że nie ma podstaw
do odrzucenia hipotezy
0
H
.
www.etrapez.pl
Krystian Karczyński
Strona 3
II.
Test losowości próby
II.a Dla małej liczebności próby
1. Formułujemy hipotezy:
0
H
: próba ma charakter losowy
1
:
H
populacja generalna nie ma tego rozkładu
2. Porządkujemy próbę w kolejności rosnącej i wszystkim wynikom przyporządkowujemy
literę a , jeśli jest on mniejszy od mediany; b , jeśli większy (jeśli równy – pomijamy).
3. Ustawiamy z powrotem wyniki otrzymując ciąg znaków aababb… . Liczbę serii oznaczamy
przez k. Liczby znaków a i b oznaczamy przez
1
n
i
2
n
.
4. Z tablic rozkładu serii odczytujemy wartości graniczne
1
k
i
2
k
takie, żeby
1
2
P k
k
;
2
1
.
2
P k
k
5. Sprawdzamy, czy k należy do obszaru krytycznego
1
2
k
k
k
k
i piszemy odpowiedź.
www.etrapez.pl
Krystian Karczyński
Strona 4
II.b Dla dużej liczebności próby
1. Formułujemy hipotezy:
0
H
: populacja generalna ma rozkład …
1
:
H
populacja generalna nie ma tego rozkładu
2. Porządkujemy próbę w kolejności rosnącej i wszystkim wynikom przyporządkowujemy
literę a , jeśli jest on mniejszy od mediany; b , jeśli większy (jeśli równy – pomijamy).
3. Ustawiamy z powrotem wyniki otrzymując ciąg znaków aababb… . Liczbę serii oznaczamy
przez k. Liczby znaków a i b oznaczamy przez
1
n
i
2
n
.
4. Obliczamy statystykę:
1 2
1
2
1 2
1 2
1
2
2
2
1
2
2
1
,
2
2
1
n n
k
n
n
Z
n n
n n
n
n
n
n
n
n
5. Tworzymy i obustronny obszar krytyczny dla rozkładu normalnego.
6. Sprawdzamy, czy statystyka znalazła się w obszarze krytycznym. Jeśli tak – odrzucamy
hipotezę
0
H
na rzecz hipotezy alternatywnej
1
H
. Jeśli nie – stwierdzamy, że nie ma podstaw
do odrzucenia hipotezy
0
H
.
www.etrapez.pl
Krystian Karczyński
Strona 5
III.
Test zgodności dwóch rozkładów
III.a Dla małej liczebności próby
1. Formułujemy hipotezy:
0
H
: próbki pochodzą z tej samej populacji (o tym samym rozkładzie)
1
:
H
próbki pochodzą z tej samej populacji
2. Porządkujemy wyniki obu próbek w ciąg o kolejności niemalejącej ( w przypadku takich
samych wartości w obu próbkach najpierw wypisujemy wyniki z pierwszej, a potem z drugiej)
i wszystkim wynikom z pierwszej próbki przyporządkowujemy literę a , a wszystkim wynikom
z próbki drugiej literkę b .
3. Liczbę serii oznaczamy przez k. Liczby znaków a i b oznaczamy przez
1
n
i
2
n
.
4. Z tablic rozkładu serii odczytujemy wartość graniczną
1
k
taką, żeby
1
P k
k
(lewostronny obszar krytyczny).
5. Sprawdzamy, czy k należy do obszaru krytycznego
1
k
k
i piszemy odpowiedź.
www.etrapez.pl
Krystian Karczyński
Strona 6
III.b Dla dużej liczebności próby
1. Formułujemy hipotezy:
0
H
: próbki pochodzą z tej samej populacji (o tym samym rozkładzie)
1
:
H
próbki pochodzą z tej samej populacji
2. Porządkujemy wyniki obu próbek w ciąg o kolejności niemalejącej ( w przypadku takich
samych wartości w obu próbkach najpierw wypisujemy wyniki z pierwszej, a potem z drugiej)
i wszystkim wynikom z pierwszej próbki przyporządkowujemy literę a , a wszystkim wynikom
z próbki drugiej literkę b .
3. Obliczamy statystykę:
1 2
1
2
1 2
1 2
1
2
2
2
1
2
2
1
,
2
2
1
n n
k
n
n
Z
n n
n n
n
n
n
n
n
n
4. Tworzymy i obustronny obszar krytyczny dla rozkładu normalnego.
5. Sprawdzamy, czy statystyka znalazła się w obszarze krytycznym. Jeśli tak – odrzucamy
hipotezę
0
H
na rzecz hipotezy alternatywnej
1
H
. Jeśli nie – stwierdzamy, że nie ma podstaw
do odrzucenia hipotezy
0
H
.