TESTY ISTOTNOŚCI DLA WARTOŚCI ŚREDNIEJ W POPULACJI
MODEL I
Założenia
- populacja generalna ma rozkład normalny o nieznanej wartości średniej m oraz znanym odchyleniu standardowym
- hipotezę weryfikujemy za pomocą n-elementowej próby
Etapy weryfikacji:
stawiamy hipotezę zerową, że średnia m ma wartość
, tzn:
wobec hipotezy alternatywnej:
1
2
3
za sprawdzian hipotezy przyjmujemy średnią arytmetyczną
jeżeli
jest prawdziwa to statystyka o postaci:
ma rozkład
,
1
ustalamy wartość
(tzw. wartość krytyczna), której nie powinien przekraczać moduł statystyki U, określając ją w taki sposób w rozkładzie
, aby dla ustalonego poziomu zachodziła relacja:
wartości zmiennej u spełniające nierówność
są obszarem krytycznym testu, tzn.:
Obszar krytyczny (dwustronny)
ϕ(u)
0
u
2
ustalamy wartość
, której nie powinna przekraczać statystyka U, określając ją w taki sposób w rozkładzie
, aby dla ustalonego poziomu zachodziła relacja:
wartości zmiennej U spełniające nierówność
stanowią obszar krytyczny testu, tzn.:
Obszar krytyczny (prawostronny)
ϕ(u)
0 uα u
3
ustalamy wartość
, od której powinna być większa statystyka U, określając ją w taki sposób w rozkładzie
, aby dla ustalonego poziomu zachodziła relacja:
wartości zmiennej U spełniające nierówność
stanowią obszar krytyczny testu, tzn.:
Obszar krytyczny (lewostronny)
ϕ(u)
-uα 0 u
Jeżeli z próby uzyskamy taką wartość statystyki u, że
-
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej,
-
to stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej.
MODEL II
Założenia
- populacja generalna ma rozkład normalny o nieznanej wartości średniej m oraz nieznanym odchyleniu standardowym ,
- hipotezę weryfikujemy za pomocą małej, n-elementowej próby (n<120).
Etapy weryfikacji
stawiamy hipotezę zerową, że średnia m ma wartość
, tzn.:
wobec hipotezy alternatywnej
,
do weryfikacji hipotezy wykorzystujemy zmienną o postaci
, która ma rozkład t-Studenta o n-1 stopniach swobody,
ustalamy wartość krytyczną
, której nie powinien przekraczać moduł statystyki t, określając ją w taki sposób w rozkładzie t-Studenta, aby dla ustalonego poziomu zachodziła relacja:
wartości zmiennej t spełniające nierówność
są obszarem krytycznym testu, tzn.:
Jeżeli z próby uzyskamy taką wartość statystyki t, że:
-
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej,
-
to stwierdzamy, że nie ma podstaw do odrzucenia
MODEL III
Założenia
- populacja generalna ma dowolny rozkład z nieznanymi parametrami,
- hipotezę weryfikujemy za pomocą dużej, n-elementowej próby (n>120).
Etapy weryfikacji:
Stawiamy hipotezę zerową, że średnia m ma wartość
, tzn.:
wobec hipotezy alternatywnej:
za sprawdzian hipotezy przyjmujemy średnią arytmetyczną
mającą asymptotyczny rozkład
,
jeżeli
jest prawdziawa to statystyka o postaci
ma asymptotyczny rozkład
TESTY ISTOTNOŚCI DLA DWÓCH WARTOŚCI OCZEKIWANYCH
Etapy weryfikacji
stawiamy hipotezę zerową, że średnia m1 jest równa m2, tzn.:
wobec hipotezy alternatywnej
, lub
, lub
MODEL I
Założenia:
badane cechy maja rozkłady normalne
oraz
,
znane są odchylenia standardowe z populacji (σ1, σ2) tych zmiennych,
sprawdzianem hipotezy jest statystyka:
charakteryzująca się rozkładem normalnym.
MODEL II
Założenia:
badane cechy maja rozkłady normalne
oraz
,
nieznane są odchylenia standardowe z populacji (σ1, σ2) tych zmiennych,
liczebności prób są małe nk ≤ 30,
wariancje w obu populacjach są jednakowe.
sprawdzianem hipotezy jest statystyka:
która ma rozkład Studenta o (n1+n2-2) stopniach swobody.
wariancje w obu populacjach nie są jednakowe.
sprawdzianem hipotezy jest statystyka Cohrana i Coxa:
dla której wartość krytyczną odczytujemy według schematu:
MODEL III
Założenia:
badane cechy mają dowolne rozkłady,
wariancje przyjmują wartości skończone,
nieznane są odchylenia standardowe z populacji'
liczebności prób są duże nk > 30
sprawdzianem hipotezy jest statystyka:
charakteryzująca się rozkładem normalnym
TEST ISTOTNOSCI DLA WARIANCJI
Etapy weryfikacji
stawiamy hipotezę zerową, że wariancje σ1 jest równa σ 2, tzn.:
wobec hipotezy alternatywnej
, lub
, lub
Model I
Założenia:
badana cecha ma rozkład normalny
,
nieznana jest wartość oczekiwana z populacji,
liczebność próby jest mała n ≤ 30,
sprawdzianem hipotezy jest statystyka:
która ma rozkład chi - kwadrat z n - 1 stopniami swobody
Model II
Założenia:
badana cecha ma rozkład normalny
,
nieznana jest wartość oczekiwana z populacji,
liczebność próby jest duża n > 30,
sprawdzianem hipotezy jest statystyka:
która ma rozkład zbliżony do normalnego
TEST ISTOTNOŚCI DLA DWÓCH WARIANCJI
Założenia
badane są dwie populacje o rozkładach odpowiednio
oraz
,
żaden z parametrów tych rozkładów nie jest znany,
hipotezę weryfikujemy na podstawie dwóch niezależnych prób o liczebnościach odpowiednio n1 i n2.
Etapy weryfikacji
stawiamy hipotezę zerową, że wariancje w obu populacjach są identyczne, tzn.:
wobec hipotezy alternatywnej:
do weryfikacji hipotezy wykorzystujemy wariancje
i
obliczane z dwóch niezleżnych prób gdzie:
jeżeli H0 jest prawdziwa to statystyka o postaci:
ma rozkład F-Snedecora o
oraz
stopniach swobody
ustalamy wartość krytyczną
, której nie powinna przekraczać statystyka F, określając ją w taki sposób w rozkładzie F-Snedecora, aby dla ustalonego poziomu α zachodziła relacja:
wartości zmiennej F spełniają nierówność
są obszarem krytycznym testu, tzn.:
jeżeli uzyskamy taką wartość statystyki F, że:
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej,
to stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej
TEST ISTOTNOŚCI DLA WSKAŹNIKA STRUKTURY
Założenia:
populacja generalna ma rozkład dwupunktowy z prawdopodobieństwem p oznaczającym, że badana cecha przyjmie wyróżnioną wartość,
liczebność próby jest duża (n≥100) sprawdzianem hipotezy jest statystyka:
która ma w przybliżeniu rozkład normalny → N(0, 1)
, q0=1-p0, gdzie ni - liczba jednostek o wyróżnionej wartości cechy w badanej próbie.
Obszar odrzucenia - obustronny, prawostronny, lewostronny.
Zbiorami krytycznymi testu są przedziały:
H1: p≠p0 →
H1: p>p0 →
H1: p<p0 →
TEST ISTOTNOŚCI DLA DWÓCH WSKAŹNIKÓW STRUKTURY
Założenia:
populacje generalne mają rozkłady dwupunktowe z prawdopodobieństwami p1 i p2 oznaczające, że badane cechy przyjmują wyróżnione wartości,
liczebności prób są duże (n1 ≥100 oraz n2 ≥100) sprawdzianem hipotezy jest statystyka:
która ma w przybliżeniu rozkład normalny → N(0, 1).
;
;
;
, gdzie nik- ilość jednostek o wyróżnionych wartościach cechy dla k-tych prób
TEST ISTOTNOŚCI DLA WSPÓŁCZYNNIKA KORELACJI LINIOWEJ
Współczynnik korelacji liniowej (ρ) jest nieznany
Założenia:
dwuwymiarowy rozkład zmiennych losowych X i Y w populacji generalnej jest rozkładem normalnym N(m1, m2, σ1, σ2),
liczebność próby jest mała sprawdzianem hipotezy jest statystyka
która przy założeniu słuszności
ma rozkład Studenta z n - 2 stopniami swobody
liczebność próby jest duża sprawdzianem hipotezy jest statystyka:
która przy założeniu słuszności
ma rozkład normalny → N(0, 1)
c) sprawdzianem hipotezy jest statystyka:
gdzie
która przy założeniu słuszności
ma, już dla niedużych
w przybliżeniu rozkład normalny
TEST ISTOTNOŚCI DLA DWÓCH WSPÓŁCZYNNIKÓW KORELACJI LINIOWEJ
Założenia:
dwuwymiarowy rozkład zmiennych losowych, dla których wyznaczono współczynniki korelacji r1 i r2 w populacji generalnej jest w przybliżeniu rozkładem normalnym,
sprawdzianem hipotezy jest statystyka
która przy założeniu słuszności
ma rozkład normalny → N(0, 1)
gdzie :
a błąd standardowy zr wyraża się wzorem:
Zastosowanie testu w przypadku prób nawet o wyraźnej różnicy w liczebnościach jest proste, lecz interpretacja ewentualnej różnicy pomiędzy współczynnikami korelacji niezwykle trudna
Test niezależności χ2
Służy do weryfikacji hipotezy, że badane cechy są niezależne, przy czym mogą to być cechy: jakościowe, ilościowe oraz jakościowe i ilościowe. Jeżeli próba prosta ma dużą liczebność sprawdzianem hipotezy jest statystyka:
w przypadku tablicy czteropolowej
,
ma asymptotyczny rozkład χ2 o (r-1)(k-1) stopniach swobody
a, b, c, d, nij - liczebności empiryczne w poszczególnych polach tablicy niezależności, npij - liczebności teoretyczne (hipotetyczne) w poszczególnych polach tablicy dwudzielnej
.
H0: χ2 = 0 H1: χ2 > 0
Obszar odrzucenia - prawostronny. Zbiorem krytycznym testu jest przedział:
H1: cechy X i Y są zależne →
TEST SERII
Służy do zweryfikowania hipotezy o losowości próby.
Wyznaczamy medianę; po jej wyznaczeniu przyporządkowujemy dwa symbole - jeden wartościom mniejszym od mediany, drugi wartościom większym od mediany. Wartości równe medianie pomijamy (jeżeli nie obliczamy mediany, dwa różne symbole przyporządkowujemy - jeden elementom populacji pierwszej, drugi elementom populacji drugiej); wyznaczamy ogólną liczbę serii, przez którą rozumiemy każdy maksymalny podciąg składający się z kolejnych elementów tego samego rodzaju; z tablic rozkładu serii odczytujemy dwie wartości krytyczne k1 i k2, takie, że:
k1 < K < k2 - nie ma podstaw do odrzucenia H0 o losowości próby,
K
k1 lub K ≥ k2 - odrzucamy H0 o losowości próby.
Obszar odrzucenia - obustronny
,
Test serii. Dwie próby pobrane z populacji o dowolnym rozkładzie.
H0 : próby pochodzą z tej samej populacji generalnej,
H1 : próby pochodzą z dwóch różnych populacji generalnych.
Zaczynamy od oznaczenia przez a wszystkich n1 wyników w pierwszej próbie oraz przez b wszystkich n2 wyników w drugiej próbie. Następnie wszystkie wyniki obu prób razem porządkujemy rosnąco, co da nam analogiczny ciąg, jak w modelu poprzednim. Odmiennie niż poprzednio, budujemy tutaj lewostronny obszar krytyczny na poziomie istotności α w taki sposób, żeby
P{k ≤ kα} = α.
Gdy k ≤ kα , to odrzucamy H0. To znaczy, że dwie próby istotnie pochodzą z dwóch różnych populacji generalnych
TEST ZGODNOŚCI
stawiamy hipotezę zerową, że populacja generalna ma rozkład określony pewną dystrybuantą
,
wobec hipotezy alternatywnej:
losujemy z populacji dużą próbę, z której wyniki porządkujemy w rozkład empiryczny, przez utworzenie r rozłącznych klas wartości badanej zmiennej w próbie,
przyjmując, że
jest prawdziwa, tzn., że rozkład populacji generalnej opisany jest dystrybuantą
, liczymy prawdopodobieństwo
tego, że zmienna losowa przyjmuje wartości z i-tej klasy,
oceniamy zgodność rozkładu empirycznego z rozkładem hipotetycznym poprzez obserwację różnic pomiędzy liczebnościami empirycznymi
a liczebnościami teoretycznymi (hipotetycznymi)
w oparciu o statystykę o postaci:
która przy założeniu prawdziwości hipotezy zerowej ma asymptotyczny rozkład
o
stopniach swobody, gdzie k oznacza liczbę parametrów rozkładu, które zostały oszacowane na podstawie rozkładu empirycznego
ustalamy wartość krytyczną
, której nie powinna przekraczać statystyka
, określając ją w taki sposób w rozkładzie Chi-kwadrat, aby dla ustalonego poziomu zachodziła relacja:
wartości zmiennej
spełniające nierówność
są obszarem krytycznym testu, tzn.:
jeżeli uzyskamy taką wartość statystyki
, że
-
to hipotezę zerową odrzucamy na rzecz hipotezy alternatywnej,
to stwierdzamy, że nie ma podstaw do odrzucenia hipotezy zerowej.
Test zgodności
Kołmogorowa
sup = supremum
;
- dystrybuanty, patrz wyżej.
Jeśli
H0 należy odrzucić
odczytuje się z tablic rozkładu Kołmogorowa
w taki sposób, żeby współczynnik ufności
,
na przykład: dla α = 0,05 oraz 1 - α
Test zgodności Smirnowa-Kołmogorowa
gdzie:
gdy
to H0 należy odrzucić
Warunki stosowania testu
Kołmogorowa:
1) zmienne ciągłe, 2) małe przedziały klasowe, 3) duża liczba przedziałów klasowych.