Populacja generalna - jest to zbiorowość statystyczna, tzn. zbiór dowolnych elementów, nieidentycznych z punktu widzenia badanej cechy.
Próba (próbka) - część, tj. podzbiór populacji, podlegający bezpośrednio badaniu ze względu na ustaloną cechę, w celu wyciągnięcia wniosku o kształtowaniu się wartości tej cechy w popu-lacji.
PODSTAWOWE POJĘCIA
STATYSTYKI MATEMATYCZNEJ
Liczebność próby - liczba (jednostek) elementów populacji generalnej wybranych do próby.
Liczebność próby oznacza się zwykle przez n.
Gdy n < 30 to mówi się często o małej próbie.
Próba losowa - próba, której dobór z całej populacji dokonany był w drodze losowania
(np. za pomocą tablicy liczb losowych),
tzn. w taki sposób, że jedynie przypadek decy-duje o tym, który element populacji generalnej wchodzi do próby, a który nie.
Próba reprezentacyjna - próba, której struktura pod względem badanej cechy nie różni się istotnie od struktury populacji generalnej.
Próba reprezentacyjna jest jak gdyby „miniaturą” populacji generalnej, daje więc podstawę do wysuwania prawidłowych o niej wniosków. Uzyskiwaniu prób reprezentacyjnych sprzyja dobór właściwego schematu losowania próby.
Schemat losowania próby - praktyczny sposób losowania elementów populacji generalnej, uwzględniający możliwości techniczne, koszt
i efektywność uzyskiwanych wyników.
Losowanie niezależne - schemat losowania próby ze zwracaniem każdego wylosowanego elementu w trakcie losowania, tak, że jeden element może zostać wylosowany do próby więcej niż jeden raz.
Losowanie zależne - schemat losowania próby bez zwracania każdego wylosowanego elementu populacji generalnej, tak, że jeden element populacji może zostać wylosowany do próby tylko raz.
Wyniki próby - zaobserwowane wartości badanej cechy u tych elementów populacji generalnej, które zostały wybrane do próby.
Wyniki próby losowej o liczebności n stanowią wartość n-wymiarowej zmiennej losowej
(n-wymiarowego wektora losowego).
Wyniki dużej próby grupuje się zwykle w klasy, tworząc tzw. szereg rozdzielczy.
Przestrzeń próby - zbiór wszystkich możliwych wyników próby o liczebności n.
Rozkład populacji - rozkład wartości badanej cechy statystycznej w całej zbiorowości.
Parametry populacji - parametry rozkładu badanej cechu w populacji.
Charakteryzują one ten rozkład.
Do najczęściej używanych parametrów należą tzw. momenty.
Parametry populacji zwykle dzielimy na następujące grupy:
Miary skupienia - np. średnia arytmetyczna, mediana.
Miary rozproszenia (rozrzutu) - np. wariancja, odchylenie standardowe.
Miary asymetrii
Miary korelacji - przy badaniu populacji ze względu na wiele cech.
Statystyka z próby - zmienna losowa będąca dowolną funkcją wyników próby losowej, np. średnia arytmetyczna wyników próby , statystyka pozycyjna rzędu 0,5 czyli mediana.
Rozkład statystyki - teoretyczny rozkład prawdopodobieństwa zmiennej losowej będącej statystyką.
Rozkład ten zależy zwykle od rozkładu populacji i schematu losowania n-elementowej próby.
Rozkład dwupunktowy
(rozkład zero - jedynkowy) –
teoretyczny rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:
dla k = 0 lub k = 1
(0<p<1, q=1-p)
Rozkładu tego w statystyce używa się przy badaniu cech niemierzalnych (jakościowych).
Rozkład dwumianowy –
rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:
dla k = 0, 1, 2, ... n
(0<p<1, q=1-p)
Rozkład Poissona –
rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:
dla k = 0, 1, 2, ... n (λ > 0)
Rozkład jednostajny (rozkład równomierny) - rozkład prawdopodobieństwa zmiennej losowej ciągłej X o funkcji gęstości prawdopodobieństwa określonej wzorem:
dla a ≤ x ≤ b
dla x < a oraz x > b
Rozkład normalny – rozkład zmiennej losowej ciągłej X o funkcji gęstości prawdopodobieństwa określonej wzorem:
dla x ∈ R, σ > 0
Często rozkład normalny oznacza się symbolem N(m,σ), gdzie:
m - wartość oczekiwana (średnia), m = E(X)
σ - odchylenie standardowe w tym rozkładzie,
σ2 = D2(X)
Funkcja gęstości rozkładu normalnego
z parametrami m i σ
Własności krzywej gęstości rozkładu normalnego:
Jest symetryczna względem prostej x=m
Dla x=m osiąga maksimum równe
Jej ramiona mają punkty przegięcia dla
x=m-σ oraz x=m+σ
Wpływ parametrów m i σ na położenie
oraz kształt krzywej normalnej
Rozkład normalny standaryzowany - rozkład normalny N(0,1), tzn. o funkcji gęstości określonej wzorem:
Wykresem tej funkcji gęstości jest tzw. krzywa Gaussa.
Zmienna losowa U mająca rozkład N(0,1) nosi nazwę standaryzowanej zmiennej losowej.
Funkcja gęstości rozkładu N(0,1)
Rozkład χ2 (chi-kwadrat) o k stopniach swobody - rozkład zmiennej losowej ciągłej
o funkcji gęstości prawdopodobieństwa określonej wzorem:
Funkcja Г (gamma)
Rozkład t-Studenta o k stopniach swobody - rozkład zmiennej losowej ciągłej o funkcji gęstości prawdopodobieństwa określonej wzorem:
Rozkład F-Snedecora o k1 i k2 stopniach swobody - rozkład zmiennej losowej ciągłej
o funkcji gęstości prawdopodobieństwa określonej wzorem:
Estymator - dowolna statystyka Z służąca do oszacowania nieznanej wartości parametru Θ populacji generalnej.
Rozkład estymatora - rozkład prawdopodobieństwa statystyki będącej estymatorem parametru Θ.
Parametry rozkładu estymatora - najważniejsze to wartość oczekiwana E(Z) oraz wariancja D2(Z) w rozkładzie statystyki Z będącej estymatorem jakiegoś parametru Θ populacji.
Błąd przeciętny szacunku –
pierwiastek z wariancji, tzn. odchylenie standardowe D(Z) w rozkładzie estymatora Z,
za pomocą którego szacuje się parametr Θ populacji generalnej.
Estymacja punktowa - metoda szacunku nieznanego parametru Θ populacji polegająca
na tym, że jako wartość parametru Θ przyjmuje się wartość estymatora Z tego parametru, otrzymaną z danej n-elementowej próby losowej.
Estymator nieobciążony –
estymator Z spełniający równość E(Z) = Θ, oznaczającą, że estymator Z szacuje parametr bez błędu systematycznego.
Estymator efektywny –
estymator Z o możliwie małej wariancji D2(Z).
Stosowanie estymatora efektywnego oznacza popełnianie małego błędu przeciętnego szacunku D(Z).
Estymator zgodny - estymator Z parametru Θ spełniający warunek:
tzn. estymator, który jest stochastycznie zbieżny do parametru Θ, czyli jest to estymator podlegający działaniu prawa wielkich liczb. Gdy używa się estymatora zgodnego parametru Θ, to stosowanie większych prób poprawia dokładność szacunku tego parametru.
Estymacja przedziałowa –
estymacja parametru Θ polegająca na budowaniu tzw. przedziału ufności dla tego parametru.
Przedział ufności –
losowy przedział wyznaczony za pomocą rozkładu estymatora, a mający tę własność, że
z dużym, z góry danym prawdopodobieństwem, pokrywa wartość szacowanego parametru Θ.
Przedział ufności zapisujemy zwykle w postaci
P{a < Θ < b} = 1 - α ,
gdzie: a i b noszą nazwę dolnej i górnej granicy (końca) przedziału ufności,
a prawdopodobieństwo 1 - α jest dane z góry.
Współczynnik ufności –
prawdopodobieństwo 1 - α występujące po prawej stronie wzoru na przedział ufności, oznaczające prawdopodobieństwo, z jakim parametr Θ jest pokryty tym przedziałem.
Współczynnik ufności w praktyce wybiera się jako dowolnie duże prawdopodobieństwo.
Najczęściej przyjmowanymi wartościami są liczby 0,90; 0,95; 0,99.
Im bliższy 1 jest współczynnik ufności, tym szerszy (więc o mniejszej użyteczności) otrzy-muje się przedział ufności.
Dlatego też bez specjalnej potrzeby nie należy przyjmować zbyt wysokich wartości współczyn-nika ufności.
DYSTRYBUANTA
Dystrybuantą zmiennej losowej X nazywamy funkcję F(x) zmiennej rzeczywistej x, zdefinio-waną następująco:
Własności:
0 ≤ F(x) ≤ 1
F(x) – funkcja niemalejąca
F(x) – funkcja przynajmniej lewostronnie ciągła
Dla zmiennej losowej ciągłej dystrybuanta ma postać:
dla
f(x) – funkcja gęstości
F’(x)=f(x)
Dla zmiennej losowej dyskretnej
dla i = 1, 2, …, n
Zmienna losowa X przyjmuje wartości xi z prawdo-podobieństwem pi
Rozkład prawdopodobieństwa zmiennej losowej dyskretnej X – zestawienie wszystkich możliwych par (xi, pi)
Dystrybuanta ma postać:
Wartość oczekiwana:
Wariancja:
Przedział ufności dla średniej
MODEL I
Z1: Populacja generalna ma rozkład N(m, σ),
Z2: Wartość średnia m jest nieznana,
Z3: Odchylenie standardowe σ jest znane,
Z4: Z populacji generalnej pobrano próbkę
o liczebności n elementów wylosowaną niezależnie
Wówczas przedział ufności dla średniej m populacji ma postać:
gdzie: x oznacza średnią arytmetyczną obliczoną z próby
1-α jest z góry przyjętym prawdopodobieństwem
i nazywa się współczynnikiem ufności
uα oznacza wartość zmiennej losowej U mającej rozkład normalny standaryzowany.
Wartość uα dla danego współczynnika ufności 1-α wyznacza się z tablicy dystrybuanty rozkładu normalnego N(0,1) w taki sposób, by spełniona była relacja: P{-uα< u < uα }= 1 - α
MODEL II
Z1: Populacja generalna ma rozkład N(m, σ),
Z2: Wartość średnia m jest nieznana,
Z3: Odchylenie standardowe σ jest nieznane,
Z4: Z populacji generalnej wylosowano niezależnie małą próbkę o liczebności n elementów
(n ≤ 30).
Wówczas przedział ufności dla średniej m populacji ma postać:
lub wzór równoważny:
gdzie: x oznacza średnią arytmetyczną obliczoną
z próby
S i Ŝ są odchyleniami standardowymi z próby obliczonymi wg wzorów:
tα oznacza wartość zmiennej t Studenta odczytaną z tablicy tego rozkładu dla
r = n – 1 stopni swobody
w taki sposób, by dla danego z góry prawdopodo-bieństwa 1-α spełniona była relacja:
P{-tα< t < tα }= 1 - α
MODEL III
Z1: Populacja generalna ma rozkład normalny N(m.σ),
Z2: Wartość średnia m jest nieznana,
Z3: Odchylenie standardowe σ jest nieznane,
Z4: Z populacji generalnej wylosowano dużą próbkę o liczebności n elementów (n > 30).
Z5: Nie tworzymy szeregu rozdzielczego
Przedział ufności dla średniej m populacji ma postać:
x, S – obliczamy jak poprzednio
uα z tablicy dystrybuanty standaryzowanego rozkładu N(0,1)
MODEL IV
Z1: Populacja generalna ma rozkład normalny N(m,σ),
Z2: Wartość średnia m jest nieznana,
Z3: Odchylenie standardowe σ jest nieznane,
Z4: Z populacji generalnej wylosowano dużą próbkę o liczebności n elementów (n > 30).
Z5: Tworzymy szereg rozdzielczy o w klasach
Przedział ufności dla średniej m populacji ma postać:
gdzie:
środek poszczególnych przedziałów klasowych,
nj – liczebność w poszczególnych przedziałach klasowych
Gdy liczba w przedziałów klasowych jest mała tzn, gdy długość (h) każdego przedziału klasowego jest duża to do obliczenia S należy stosować tzw. poprawkę na grupowanie: poprawkę Sheparda
Wtedy
h – szerokość przedziału klasowego
WYZNACZANIE NIEZBĘDNEJ LICZBY
POMIARÓW DLA PRÓBY
Szacując metodą przedziałową parametr Θ popula-cji generalnej budujemy przedział ufności .
Ma on pewną długość 2d i może się okazać, że że połowa długości przedziału d, która jest miarą maksymalnego błędu szacunku jest tak duża, że dyskredytuje dokonywaną estymację.
Dążymy do zapewniania maksymalnie dobrej dokładności szacunku, np. przez dobranie dostatecznie dużej próby.
Przy budowaniu przedziału ufności dla średniej
m∈(a,b)
Długość przedziału ufności
b – a = 2d
d – max błąd szacowania parametru
MODEL I
Z1: Populacja generalna ma rozkład normalny N(m,σ) lub zbliżony do normalnego,
Z2: Wariancja populacji σ2 jest znana,
Z3: Przyjmujemy współczynnik ufności 1- α,
Z4: Zakładamy max błąd szacunku d (tj. połowa długości przedziału ufności)
Liczebność próby:
gdzie:
uα jest wartością odczytaną z tablicy dystrybuanty rozkładu normalnego N(0,1)
MODEL II
Z1: Populacja generalna ma rozkład normalny N(m.σ),
Z2: Wariancja populacji σ2 jest nieznana,
Z3: Znana jest wartość statystyki S2 uzyskana
z małej próby wstępnej o liczebności no,
Z4: Przyjmujemy współczynnik ufności 1- α,
Z5: Zakładamy max błąd szacunku d
Niezbędna liczebność próby
gdzie:
wariancja próby wstępnej
tα - wartość zmiennej t Studenta odczytana
z tablicy tego rozkładu dla współczynnika ufności 1 - α i dla no – 1 stopni swobody w taki sposób, by P {-tα < t < tα} = 1 - α
Jeżeli n ≤ no to liczebność próby wstępnej jest wystarczająca,
Jeżeli n > no to należy dolosować do właściwej próby n–no elementów
PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)
MODEL I
Z1: Populacja generalna ma rozkład N(m, σ)
o nieznanych parametrach m i σ,
Z2: Z populacji generalnej wylosowano niezależnie małą próbę (n < 30).
Wówczas przedział ufności dla wariancji ma postać:
lub (wzór równoważny):
gdzie: c1 i c2 są wartościami χ2 wyznaczonymi
z tablicy tego rozkładu dla r=n-1 stopni swobody i współczynnika ufności 1-α, w taki sposób, by spełnione były relacje:
Ponieważ tablice rozkładu χ2 podają prawdopodo-bieństwo P{χ2 ≥ χα2} zatem dla przyjętego współ-czynnika ufności 1-α, c1 odczytuje się z tablic
rozkładu χ2 dla prawdopodobieństwa ,
a wartość c2 dla prawdopodobieństwa .
Dla wyznaczenia przedziału ufności dla odchylenia standardowego σ oblicza się pierwiastki kwadratowe z końców przedziału ufności dla wariancji σ2
Przedział ufności nie jest symetryczny względem wartości S2.
MODEL II
Z1: Populacja generalna ma rozkład N(m, σ)
o znanej wartości oczekiwanej m,
Z2: Z populacji wylosowano niezależnie małą próbę (n < 30).
PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)
Przedział ufności dla wariancji ma postać:
gdzie: c1 i c2 są wartościami χ2 wyznaczonymi
z tablicy tego rozkładu dla r=n stopni swobody (znane m) i współczynnika ufności 1-α, w taki sposób, by spełnione były relacje:
Ponieważ tablice rozkładu χ2 podają prawdopodo-bieństwo P{χ2 ≥ χα2} zatem dla przyjętego współ-czynnika ufności 1-α, c1 odczytuje się z tablic
rozkładu χ2 dla prawdopodobieństwa ,
a wartość c2 dla prawdopodobieństwa .
MODEL III
Z1: Populacja generalna ma rozkład normalny lub zbliżony do normalnego o nieznanych parame-trach m i σ,
Z2: Z populacji generalnej wylosowano niezależnie próbę o dużej liczebności.
Przedział ufności dla odchylenia standardowego
ma postać:
Wartość uα odczytujemy z tablic dystrybuanty rozkładu normalnego
PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)
MODEL IV
Z1: Populacja generalna ma rozkład N(m, σ)
o znanej wartości oczekiwanej m,
Z2: Z populacji wylosowano niezależnie
próbę o dużej liczebności (n > 30).
Wówczas rozkład χ2 można z niewielkim błędem
zastąpić rozkładem zmiennej
TESTOWANIE HIPOTEZ
Hipoteza statystyczna - jakiekolwiek przypusz-czenie dotyczące rozkładu populacji generalnej.
Hipoteza parametryczna - hipoteza statysty-czna precyzująca wartość parametru w rozkła-dzie populacji generalnej znanego typu.
Hipoteza nieparametryczna - hipoteza statys-tyczna precyzująca typ rozkładu populacji generalnej.
Hipoteza zerowa - podstawowa hipoteza statys-tyczna sprawdzana danym testem.
Oznacza się ją zwykle symbolem Ho.
Hipoteza alternatywna - hipoteza statystyczna konkurencyjna w stosunku do hipotezy zerowej, w tym sensie, ze jeżeli odrzuca się hipotezę zerową, to przyjmuje się hipotezę alternatywną.
Oznacza się ją zwykle symbolem H1.
Błąd pierwszego rodzaju - możliwy do popeł-nienia błąd przy weryfikacji hipotezy statysty-cznej, polegający na odrzuceniu testowanej hipotezy prawdziwej.
Błąd drugiego rodzaju - możliwy do popełnienia błąd przy weryfikacji hipotezy statystycznej, polegający na przyjęciu testowanej hipotezy fałszywej.
Poziom istotności - prawdopodobieństwo popeł-nienia błędu pierwszego rodzaju w postępowaniu testującym hipotezę.
Poziom istotności oznacza się zwykle α i dobiera się go z góry (zwykle jako małe prawdopodobień-stwo).
Do najczęściej przyjmowanych poziomów istot-ności należą prawdopodobieństwa: 0,1; 0,05; 0,01; 0,001.
Test statystyczny - reguła postępowania, która na podstawie wyników próby ma doprowadzić do decyzji przyjęcia lub odrzucenia postawionej hipo-tezy statystycznej.
Za pomocą testu weryfikuje się hipotezę statys-tyczną.
Moc testu - prawdopodobieństwo podjęcia decyzji prawidłowej przy weryfikacji hipotezy statystycz-nej danym testem, a polegającej na odrzuceniu testowanej hipotezy fałszywej.
Test istotności - najczęściej używany w prakty-ce statystycznej typ testu, pozwalający na odrzu-cenie hipotezy z małym ryzykiem popełnienia błędu.
Parametryczny test istotności - test istotności weryfikujący hipotezę zerową precyzującą wartość parametru w ustalonym typie rozkładu populacji generalnej.
Nieparametryczny test istotności - test istotności dla hipotezy zerowej precyzujący ogólny typ, postać rozkładu populacji generalnej.
Obszar krytyczny testu - podzbiór przestrzeni próby o tej własności, że jeżeli otrzymamy w pró-bie punkt przestrzeni należący do tego podzbioru, to podejmuje się decyzję odrzucenia hipotezy zerowej.
Obszar krytyczny testu dwustronny - obszar krytyczny złożony z dwu rozłącznych podzbiorów przestrzeni próby (wyznaczony najczęściej syme-trycznie), w rozkładzie odpowiedniej statystyki.
Testu z dwustronnym obszarem krytycznym używa się zwykle, gdy hipoteza alternatywna (parametryczna) jest w postaci nierówności typu ≠.
Obszar krytyczny testu jednostronny - w zależności od hipotezy alternatywnej może być lewo- lub prawostronny.
Jest to obszar krytyczny złożony z jednego podzbioru przestrzeni próby wybranego z jednej strony w rozkładzie odpowiedniej statystyki.
Testu z jednostronnym obszarem krytycznym używa się zwykle wtedy, gdy hipoteza alterna-tywna występuje w postaci nierówności typu < lub >.
TEST
DLA WARTOŚCI ŚREDNIEJ POPULACJI
MODEL I
Z1: Populacja generalna ma rozkład normalny N(m,σ) lub zbliżony do normalnego,
Z2: Odchylenie standardowe σ jest znane,
Z3: Hipoteza podstawowa H0: m= m0
Z4: Hipoteza alternatywna H1: m≠m0
(m>m0 lub m<m0)
Test istotności dla hipotezy H0 jest następujący:
a: Oblicza się wartość średniej z próby
b: Oblicza się wartość zmiennej normalnej standa-ryzowanej U wg wzoru:
c: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego z góry poziomu istotności
zachodziła równość
d. Porównuje się obliczoną i odczytaną wartość statystyki U.
Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1
w postaci m ≠ m0 otrzyma się z próby taką
wartość U, że to hipotezę H0 odrzuca
się na korzyść hipotezy alternatywnej H1.
Natomiast gdy to nie ma podstaw
do odrzucenia hipotezy H0.
Jeżeli H1 : m>m0 to stosuje się test istotności z prawostronnym obszarem krytycznym.
Wówczas z tablicy dystrybuanty rozkładu normal-nego N(0,1) odczytuje się uα tak, by spełniona była równość
H0 odrzuca się, gdy wyznaczona z próby wartość U spełni warunek: U ≥ uα.
Jeżeli H1: m<m0 to stosuje się test istotności
z lewostronnym obszarem krytycznym.
Wówczas odczytuje się uα tak, by spełniona była równość
H0 odrzuca się, gdy U ≤ -uα.
MODEL II
Z1: Populacja generalna ma rozkład N(m, σ)
Z2:Odchylenie standardowe σ jest nieznane
Z3:Z populacji generalnej wylosowano niezależnie małą próbkę n ≤ 30).
Z4 : Hipoteza podstawowa H0: m= m0
Z5: Hipoteza alternatywna H1: m≠m0
(m>m0 lub m<m0)
TEST
DLA WARTOŚCI ŚREDNIEJ POPULACJI
Test istotności dla hipotezy H0 ma postać:
a: Oblicza się wartość średniej z próby
b: Oblicza się wartość s lub
c: Oblicza się wartość statystyki t z wzoru:
lub z wzoru równoważnego:
d: Z tablic rozkładu t-Studenta, dla ustalonego poziomu istotności α i dla r = n-1 stopni swobody odczytuje się taką wartość tα, żeby zachodziła równość
e: Porównuje się obliczoną i odczytaną wartość statystyki t.
Dla testu dwustronnego (m ≠ m0) mogą zaistnieć 2 przypadki:
P1: Jeżeli to H0 należy odrzucić na korzyść H1.
P2: Jeżeli to nie ma podstaw do odrzucenia H0. f(t)
Dla lewostronnego testu (H1: m < m0) stosuje się lewostronny obszar krytyczny wyznaczany w ten sposób, by
Dla prawostronnego testu (H1: m>m0) tα wyznacza się w ten sposób, by zachodziła równość
MODEL III
Z1: Populacja generalna ma rozkład N(m, σ) lub dowolny inny rozkład o wartości średniej m
Z2:Odchylenie standardowe σ jest nieznane
Z3:Z populacji generalnej wylosowano niezależnie dużą próbkę
Z4 : Hipoteza podstawowa H0: m= m0
Z5: Hipoteza alternatywna H1: m≠m0
(m>m0 lub m<m0)
a: Oblicza się wartość średniej z próby
b: Oblicza się wartość s
c: Oblicza się wartość statystyki U z wzoru:
d: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość
e: Porównuje się obliczoną i odczytaną wartość statystyki U.
Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m≠m0 otrzyma się z próby taką war-tość U, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.
Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.
Jeżeli H1: m>m0 to stosuje się test istotności z prawostronnym obszarem krytycznym.
Wówczas z tablicy dystrybuanty rozkładu normalnego N(0,1) odczytuje się uα tak, by spełniona była równość
H0 odrzuca się, gdy wyznaczona z próby wartość U spełni warunek: U ≥ uα.
Jeżeli H1: m<m0 to stosuje się test istotności z lewostronnym obszarem krytycznym.
Wówczas odczytuje się uα tak, by spełniona była równość
H0 odrzuca się, gdy U ≤ uα.
TEST DLA DWÓCH ŚREDNICH
HIPOTEZA O DWÓCH WARTOŚCIACH OCZEKIWANYCH
MODEL I
Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m1,σ1) i N(m2,σ2)
Z2: Odchylenia standardowe tych populacji σ1 i σ2 są znane,
Z3: Wykonano n1 i n2 niezależnych prób
Z4: Stawiamy hipotezę podst. H0: m1-m2 = a
Z5: Stawiamy hipotezę alternatywną
H1: m1-m2 ≠ a ( m1-m2 < a lub m1-m2 > a )
Jeżeli a = 0 to m1 = m2
Test istotności dla hipotezy H0 ma postać:
a: Oblicza się wartości średnie z prób ,
b: Oblicza się wartość statystyki u z wzoru:
c: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość
Obszary krytyczne są takie same jak dla jednej wartości średniej.
d: Porównuje się obliczoną i odczytaną wartość statystyki u.
Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2≠a otrzyma się z próby taką wartość u, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.
Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.
MODEL II
Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m1,σ1) i N(m2,σ2)
Z2: Odchylenia standardowe tych populacji σ1 i σ2 są nieznane,
Z3: Wykonano n1 i n2 niezależnych prób o dużej liczebności n1, n2 > 30
Z4: Stawiamy hipotezę podstawową
H0: m1-m2 = a
Z5: Stawiamy hipotezę alternatywną
H1: m1-m2 ≠ a ( m1-m2 < a ) lub ( m1-m2 > a )
Test istotności dla hipotezy H0 ma postać:
a: Oblicza się wartości średnie z prób ,
b: Oblicza się odchylenia standardowe z próby s1, s2
c: Oblicza się wartość statystyki u z wzoru:
d: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość
e: Porównuje się obliczoną i odczytaną wartość statystyki u.
Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2≠a otrzyma się z próby taką wartość u, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.
Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.
MODEL III
Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m1,σ1) i N(m2,σ2)
Z2: Odchylenia standardowe σ1 i σ2 są nieznane,
Z3: Wykonano n1 i n2 niezależnych prób o małej liczebności n1, n2 < 30
Z4: Stawiamy hipotezę podstawową
H0: m1-m2 = a
Z5: Stawiamy hipotezę alternatywną
H1: m1-m2 ≠ a ( m1-m2 < a lub m1-m2 > a )
Test istotności dla hipotezy H0 ma postać:
a: Oblicza się wartości średnie z prób ,
b: Oblicza się odchylenia standardowe z próby s1, s2 lub ,
c: Oblicza się wartość statystyki T z wzoru:
d: Z tablic rozkładu t- Studenta odczytuje się wartość krytyczną tα dla r = n1+n2-2 stopni swobody tak, aby dla założonego poziomu istotności zachodziła równość
e: Porównuje się obliczoną i odczytaną wartość statystyki t.
Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2 ≠ a otrzyma się z próby taką wartość t, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1
Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.
TEST DLA WARIANCJI
MODEL I
Z1: Badana populacja ma rozkład normalny N(m,σ)
Z2: Z populacji generalnej wybrano niezależnie próbkę o małej liczebności n<30
Z3:Stawiamy hipotezę podstawową
H0: σ2 = σ20
Z4: Stawiamy hipotezę alternatywną
H1: σ2 ≠ σ20 (σ2 < σ20 lub σ2 > σ20)
Statystyka określona wzorem ma
rozkład z liczbą stopni swobody r = n-1
Obszary krytyczne
H1:
H1:
H1:
MODEL II
Z1: Badana populacja ma rozkład normalny N(m,σ)
Z2: Z populacji generalnej wybrano niezależnie próbkę o dużej liczebności n>30
Z3: Stawiamy hipotezę podstawową
H0: σ2 = σ20
Z4: Stawiamy hipotezę alternatywną
H1: σ2 ≠ σ20 (σ2 < σ20 lub σ2 > σ20)
Statystyka u określona wzorem
ma rozkład normalny N(0,1).
WERYFIKACJA HIPOTEZ
DLA DWÓCH WARIANCJI
Z1: Badamy dwie zmienne losowe mające rozkłady normalne N(m1,σ1) i N(m2,σ2)
n1 - liczebność jednej zmiennej losowej
n2 - liczebność drugiej zmiennej losowej
Z2: Stawiamy hipotezę H0:
Z3: Stawiamy hipotezę alternatywną:
H1: ( lub )
H1:
rM i rm – ilość stopni swobody
H1:
H1:
Statystyka F ma rozkład F-Snedecora
Statystyka F-Snedecora
Rozkład F-Snedecora podaje taką wartość Fα, dla której zachodzi równość , tzn dla prawo-stronnego obszaru krytycznego.
Dlatego oznaczenia populacji indeksami (1 i 2) (M i m) należy tak przyjąć, aby w ilorazie dwu wariancji z prób licznik był większy od mianownika.
TEST ZGODNOŚCI λ KOŁMOGOROWA
MODEL I
Z1: Populacja generalna ma rozkład o ciągłej dystrybuancie F(x)
Z2: Z populacji wylosowano niezależnie do próby n elementów (n – co najmniej kilkadziesiąt)
Na podstawie wyników tej próby zweryfikować hipotezę, że populacja ma rozkład ciągły określony konkretną, hipotetyczną, ciągłą dystrybuantą Fo(x)
Ho: F(x)=Fo(x)
H1: F(x)≠Fo(x)
1. Wyniki próby grupujemy w stosunkowo wąskie przedziały o prawych końcach xj i liczebnościach nj
2. Dla każdego xj wyznaczamy wartość tzw. empiry-cznej dystrybuanty Fn(x)
gdzie liczebność skumulowana od początku do xk
3. Z rozkładu hipotetycznego wyznaczamy dla każdego xj wartość teoretycznej dystrybuanty Fo(x)
4. Obliczamy wartość statystyk
Statystyka λ ma przy prawdziwości hipotezy Ho rozkład λ Kołmogorowa, niezależny od postaci hipotetycznej dystrybuanty F(x)
Dla ustalonego poziomu istotności α z granicznego rozkładu λ Kołmogorowa odczytujemy taką wartość krytyczną λα, aby zachodziło
Następnie porównujemy wartość empiryczną λ z wartością krytyczną λα
Jeżeli to hipotezę Ho należy odrzucić na korzyść hipotezy alternatywnej H1
Gdy to nie ma podstaw do odrzucenia hipotezy Ho
MODEL II
Z1: Dane 2 populacje generalne o rozkładach z ciągłymi dystrybuantami F1(x) i F2(x)
Z2: Z populacji pobrano losowo 2 duże próby o liczebnościach n1 i n2 elementów
Na podstawie wyników tych prób zweryfikować hipotezę, że obie próby pochodzą z tej samej populacji
Ho: F1(x)=F2(x)
H1: F1(x)≠F2(x)
Test istotności Smirnowa oparty na statystyce λ Kołmogorowa
Wyniki prób grupujemy w stosunkowo wąskie przedziały klasowe o tych samych końcach xj
Dla każdego xj wyznaczamy wartości empirycznych dystrybuant
gdzie n1sk , n2sk liczebności skumulowane od po-czątku do xj
Obliczamy wartość statystyk
Statystyka λ przy prawdziwości hipotezy Ho ma asymptotyczny rozkład λ Kołmogorowa
Dla ustalonego poziomu istotności α z tablic tego rozkładu odczytujemy taką wartość krytyczną λα, aby zachodziło
Następnie porównujemy wartość empiryczną λ z wartością krytyczną λα
Jeżeli to hipotezę Ho należy odrzucić na korzyść hipotezy alternatywnej H1, tzn. próby pochodzą z różnych populacji
Gdy to nie ma podstaw do odrzucenia hipotezy Ho
Zmienna losowa standaryzowana
Dystrybuanta empiryczna
gdzie liczebność skumulowana od początku do xk
TEST ZGODNOŚCI χ2
Z1: Populacja generalna ma dowolny rozkład o dystrybuancie należącej do pewnego zbioru Ω rozkładów o określonym typie postaci funkcyjnej dystrybuanty
Z2: Z populacji wylosowano niezależnie dużą próbę n elementów (n – co najmniej kilkadziesiąt)
Na podstawie wyników tej próby zweryfikować hipo-tezę, że populacja generalna ma rozkład typu Ω
Ho: F(x)∈Ω,
gdzie F(x) jest dystrybuantą rozkładu populacji
H1: F(x) Ω
Wyniki próby dzielimy na r rozłącznych klas o liczebnościach nj - otrzymujemy w ten sposób rozkład empiryczny
1. Z hipotetycznego rozkładu typu Ω obliczamy dla każdej z r klas wartości badanej cechy X prawdopodobieństwa pi, że zmienna losowa X o rozkładzie Ω przyjmie wartości należące do klasy o numerze i (i=1,2,…,r).
2. Obliczamy liczebności teoretyczne npi, które powinny wystąpić w klasie i, gdyby populacja miała rozkład typu Ω, tzn. gdyby hipoteza Ho była prawdziwa.
3. Obliczamy wartość statystyki
Statystyka χ2 ma przy prawdziwości hipotezy Ho rozkład asymptotyczny χ2 o r-1 stopniach swobo-dy, niezależny od postaci hipotetycznej dystry-buanty F(x)
(Statystyka ma r-k-1 stopni swobody, gdy z próby szacowano k parametrów rozkładu Ω metodą największej wiarygodności)
Obszar krytyczny w tym teście buduje się prawostronnie w oparciu o rozkład χ2
Dla ustalonego poziomu istotności α z tablicy rozkładu χ2 przy odpowiedniej ilości stopni swo-body odczytujemy taką wartość krytyczną χ2α, aby zachodziło
Następnie porównujemy wartość empiryczną χ2 z wartością krytyczną χ2α
Jeżeli to hipotezę Ho należy odrzucić
Gdy to nie ma podstaw do odrzucenia hipotezy Ho
Im bliższa zeru jest wartość χ2 tym hipoteza jest bardziej wiarygodna
Gdy w rozkładzie empirycznym z próby wystąpi w jakiejś klasie liczebność mniejsza od 8, to nale-ży ją połączyć z sąsiednią uzyskując większą liczebność.
Zmniejszy się wtedy liczba stopni swobody