STATYSTYKA MATEMATYCZNA Opracowanie na kolokwium

Liczebność próby oznacza się zwykle przez n.

Gdy n < 30 to mówi się często o małej próbie.

(np. za pomocą tablicy liczb losowych),

tzn. w taki sposób, że jedynie przypadek decy-duje o tym, który element populacji generalnej wchodzi do próby, a który nie.

Próba reprezentacyjna jest jak gdyby „miniaturą” populacji generalnej, daje więc podstawę do wysuwania prawidłowych o niej wniosków. Uzyskiwaniu prób reprezentacyjnych sprzyja dobór właściwego schematu losowania próby.

i efektywność uzyskiwanych wyników.

Wyniki próby losowej o liczebności n stanowią wartość n-wymiarowej zmiennej losowej

(n-wymiarowego wektora losowego).

Wyniki dużej próby grupuje się zwykle w klasy, tworząc tzw. szereg rozdzielczy.

Charakteryzują one ten rozkład.

Do najczęściej używanych parametrów należą tzw. momenty.

Parametry populacji zwykle dzielimy na następujące grupy:

Rozkład ten zależy zwykle od rozkładu populacji i schematu losowania n-elementowej próby.

(rozkład zero - jedynkowy)

teoretyczny rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:

dla k = 0 lub k = 1

(0<p<1, q=1-p)

Rozkładu tego w statystyce używa się przy badaniu cech niemierzalnych (jakościowych).

rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:

dla k = 0, 1, 2, ... n

(0<p<1, q=1-p)

rozkład prawdopodobieństwa zmiennej losowej skokowej X o funkcji prawdopodobieństwa określonej wzorem:

dla k = 0, 1, 2, ... n (λ > 0)

dla a ≤ x ≤ b

dla x < a oraz x > b

dla x ∈ R, σ > 0

Często rozkład normalny oznacza się symbolem N(m,σ), gdzie:

σ2 = D2(X)

Funkcja gęstości rozkładu normalnego

z parametrami m i σ

Własności krzywej gęstości rozkładu normalnego:

x=m-σ oraz x=m+σ

Wpływ parametrów m i σ na położenie

oraz kształt krzywej normalnej

Wykresem tej funkcji gęstości jest tzw. krzywa Gaussa.

Zmienna losowa U mająca rozkład N(0,1) nosi nazwę standaryzowanej zmiennej losowej.

Funkcja gęstości rozkładu N(0,1)

o funkcji gęstości prawdopodobieństwa określonej wzorem:

Funkcja Г (gamma)

o funkcji gęstości prawdopodobieństwa określonej wzorem:

pierwiastek z wariancji, tzn. odchylenie standardowe D(Z) w rozkładzie estymatora Z,

za pomocą którego szacuje się parametr Θ populacji generalnej.

na tym, że jako wartość parametru Θ przyjmuje się wartość estymatora Z tego parametru, otrzymaną z danej n-elementowej próby losowej.

estymator Z spełniający równość E(Z) = Θ, oznaczającą, że estymator Z szacuje parametr bez błędu systematycznego.

estymator Z o możliwie małej wariancji D2(Z).

Stosowanie estymatora efektywnego oznacza popełnianie małego błędu przeciętnego szacunku D(Z).

tzn. estymator, który jest stochastycznie zbieżny do parametru Θ, czyli jest to estymator podlegający działaniu prawa wielkich liczb. Gdy używa się estymatora zgodnego parametru Θ, to stosowanie większych prób poprawia dokładność szacunku tego parametru.

estymacja parametru Θ polegająca na budowaniu tzw. przedziału ufności dla tego parametru.

losowy przedział wyznaczony za pomocą rozkładu estymatora, a mający tę własność, że

z dużym, z góry danym prawdopodobieństwem, pokrywa wartość szacowanego parametru Θ.

Przedział ufności zapisujemy zwykle w postaci

P{a < Θ < b} = 1 - α ,

gdzie: a i b noszą nazwę dolnej i górnej granicy (końca) przedziału ufności,

a prawdopodobieństwo 1 - α jest dane z góry.

prawdopodobieństwo 1 - α występujące po prawej stronie wzoru na przedział ufności, oznaczające prawdopodobieństwo, z jakim parametr Θ jest pokryty tym przedziałem.

Współczynnik ufności w praktyce wybiera się jako dowolnie duże prawdopodobieństwo.

Najczęściej przyjmowanymi wartościami są liczby 0,90; 0,95; 0,99.

Im bliższy 1 jest współczynnik ufności, tym szerszy (więc o mniejszej użyteczności) otrzy-muje się przedział ufności.

Dlatego też bez specjalnej potrzeby nie należy przyjmować zbyt wysokich wartości współczyn-nika ufności.

Dystrybuantą zmiennej losowej X nazywamy funkcję F(x) zmiennej rzeczywistej x, zdefinio-waną następująco:

Własności:

  0 ≤ F(x) ≤ 1

  F(x) – funkcja niemalejąca

  F(x) – funkcja przynajmniej lewostronnie ciągła

Dla zmiennej losowej ciągłej dystrybuanta ma postać:

dla

f(x) – funkcja gęstości

F’(x)=f(x)

Dla zmiennej losowej dyskretnej

dla i = 1, 2, …, n

Zmienna losowa X przyjmuje wartości xi z prawdo-podobieństwem pi

Rozkład prawdopodobieństwa zmiennej losowej dyskretnej X – zestawienie wszystkich możliwych par (xi, pi)

Dystrybuanta ma postać:

Wartość oczekiwana:

Wariancja:

Przedział ufności dla średniej

MODEL I

 

o liczebności n elementów wylosowaną niezależnie

Wówczas przedział ufności dla średniej m populacji ma postać:

gdzie: x oznacza średnią arytmetyczną obliczoną z próby

1-α jest z góry przyjętym prawdopodobieństwem

i nazywa się współczynnikiem ufności

uα oznacza wartość zmiennej losowej U mającej rozkład normalny standaryzowany.

Wartość uα dla danego współczynnika ufności 1-α wyznacza się z tablicy dystrybuanty rozkładu normalnego N(0,1) w taki sposób, by spełniona była relacja: P{-uα< u < uα }= 1 - α

MODEL II

 

(n ≤ 30).

Wówczas przedział ufności dla średniej m populacji ma postać:

lub wzór równoważny:

gdzie: x oznacza średnią arytmetyczną obliczoną

z próby

S i Ŝ są odchyleniami standardowymi z próby obliczonymi wg wzorów:

tα oznacza wartość zmiennej t Studenta odczytaną z tablicy tego rozkładu dla

r = n – 1 stopni swobody

w taki sposób, by dla danego z góry prawdopodo-bieństwa 1-α spełniona była relacja:

P{-tα< t < tα }= 1 - α

MODEL III

  

MODEL IV

Gdy liczba w przedziałów klasowych jest mała tzn, gdy długość (h) każdego przedziału klasowego jest duża to do obliczenia S należy stosować tzw. poprawkę na grupowanie: poprawkę Sheparda

Wtedy

h – szerokość przedziału klasowego

Szacując metodą przedziałową parametr Θ popula-cji generalnej budujemy przedział ufności .

Ma on pewną długość 2d i może się okazać, że że połowa długości przedziału d, która jest miarą maksymalnego błędu szacunku jest tak duża, że dyskredytuje dokonywaną estymację.

Dążymy do zapewniania maksymalnie dobrej dokładności szacunku, np. przez dobranie dostatecznie dużej próby.

Przy budowaniu przedziału ufności dla średniej

m∈(a,b)

Długość przedziału ufności

b – a = 2d

d – max błąd szacowania parametru

MODEL I

 

MODEL II

z małej próby wstępnej o liczebności no,

tα - wartość zmiennej t Studenta odczytana

z tablicy tego rozkładu dla współczynnika ufności 1 - α i dla no – 1 stopni swobody w taki sposób, by P {-tα < t < tα} = 1 - α

Jeżeli n ≤ no to liczebność próby wstępnej jest wystarczająca,

Jeżeli n > no to należy dolosować do właściwej próby n–no elementów

PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)

MODEL I

Z1: Populacja generalna ma rozkład N(m, σ)

o nieznanych parametrach m i σ,

Z2: Z populacji generalnej wylosowano niezależnie małą próbę (n < 30).

Wówczas przedział ufności dla wariancji ma postać:

lub (wzór równoważny):

gdzie: c1 i c2 są wartościami χ2 wyznaczonymi

z tablicy tego rozkładu dla r=n-1 stopni swobody i współczynnika ufności 1-α, w taki sposób, by spełnione były relacje:

Ponieważ tablice rozkładu χ2 podają prawdopodo-bieństwo P{χ2 ≥ χα2} zatem dla przyjętego współ-czynnika ufności 1-α, c1 odczytuje się z tablic

rozkładu χ2 dla prawdopodobieństwa ,

a wartość c2 dla prawdopodobieństwa .

Dla wyznaczenia przedziału ufności dla odchylenia standardowego σ oblicza się pierwiastki kwadratowe z końców przedziału ufności dla wariancji σ2

Przedział ufności nie jest symetryczny względem wartości S2.

MODEL II

Z1: Populacja generalna ma rozkład N(m, σ)

o znanej wartości oczekiwanej m,

Z2: Z populacji wylosowano niezależnie małą próbę (n < 30).

PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)

Przedział ufności dla wariancji ma postać:

gdzie: c1 i c2 są wartościami χ2 wyznaczonymi

z tablicy tego rozkładu dla r=n stopni swobody (znane m) i współczynnika ufności 1-α, w taki sposób, by spełnione były relacje:

Ponieważ tablice rozkładu χ2 podają prawdopodo-bieństwo P{χ2 ≥ χα2} zatem dla przyjętego współ-czynnika ufności 1-α, c1 odczytuje się z tablic

rozkładu χ2 dla prawdopodobieństwa ,

a wartość c2 dla prawdopodobieństwa .

MODEL III

Z1: Populacja generalna ma rozkład normalny lub zbliżony do normalnego o nieznanych parame-trach m i σ,

Z2: Z populacji generalnej wylosowano niezależnie próbę o dużej liczebności.

Przedział ufności dla odchylenia standardowego

ma postać:

Wartość uα odczytujemy z tablic dystrybuanty rozkładu normalnego

PRZEDZIAŁ UFNOŚCI DLA WARIANCJI (odchylenia standardowego)

MODEL IV

Z1: Populacja generalna ma rozkład N(m, σ)

o znanej wartości oczekiwanej m,

Z2: Z populacji wylosowano niezależnie

próbę o dużej liczebności (n > 30).

Wówczas rozkład χ2 można z niewielkim błędem

zastąpić rozkładem zmiennej


TESTOWANIE HIPOTEZ

Hipoteza statystyczna - jakiekolwiek przypusz-czenie dotyczące rozkładu populacji generalnej.

 

Hipoteza parametryczna - hipoteza statysty-czna precyzująca wartość parametru w rozkła-dzie populacji generalnej znanego typu.

 

Hipoteza nieparametryczna - hipoteza statys-tyczna precyzująca typ rozkładu populacji generalnej.

Hipoteza zerowa - podstawowa hipoteza statys-tyczna sprawdzana danym testem.

Oznacza się ją zwykle symbolem Ho.

 

Hipoteza alternatywna - hipoteza statystyczna konkurencyjna w stosunku do hipotezy zerowej, w tym sensie, ze jeżeli odrzuca się hipotezę zerową, to przyjmuje się hipotezę alternatywną.

Oznacza się ją zwykle symbolem H1.

Błąd pierwszego rodzaju - możliwy do popeł-nienia błąd przy weryfikacji hipotezy statysty-cznej, polegający na odrzuceniu testowanej hipotezy prawdziwej.

 

Błąd drugiego rodzaju - możliwy do popełnienia błąd przy weryfikacji hipotezy statystycznej, polegający na przyjęciu testowanej hipotezy fałszywej.

Poziom istotności - prawdopodobieństwo popeł-nienia błędu pierwszego rodzaju w postępowaniu testującym hipotezę.

Poziom istotności oznacza się zwykle α i dobiera się go z góry (zwykle jako małe prawdopodobień-stwo).

Do najczęściej przyjmowanych poziomów istot-ności należą prawdopodobieństwa: 0,1; 0,05; 0,01; 0,001.

Test statystyczny - reguła postępowania, która na podstawie wyników próby ma doprowadzić do decyzji przyjęcia lub odrzucenia postawionej hipo-tezy statystycznej.

Za pomocą testu weryfikuje się hipotezę statys-tyczną.

 

Moc testu - prawdopodobieństwo podjęcia decyzji prawidłowej przy weryfikacji hipotezy statystycz-nej danym testem, a polegającej na odrzuceniu testowanej hipotezy fałszywej.

Test istotności - najczęściej używany w prakty-ce statystycznej typ testu, pozwalający na odrzu-cenie hipotezy z małym ryzykiem popełnienia błędu.

Parametryczny test istotności - test istotności weryfikujący hipotezę zerową precyzującą wartość parametru w ustalonym typie rozkładu populacji generalnej.

Nieparametryczny test istotności - test istotności dla hipotezy zerowej precyzujący ogólny typ, postać rozkładu populacji generalnej.

Obszar krytyczny testu - podzbiór przestrzeni próby o tej własności, że jeżeli otrzymamy w pró-bie punkt przestrzeni należący do tego podzbioru, to podejmuje się decyzję odrzucenia hipotezy zerowej.

Obszar krytyczny testu dwustronny - obszar krytyczny złożony z dwu rozłącznych podzbiorów przestrzeni próby (wyznaczony najczęściej syme-trycznie), w rozkładzie odpowiedniej statystyki.

Testu z dwustronnym obszarem krytycznym używa się zwykle, gdy hipoteza alternatywna (parametryczna) jest w postaci nierówności typu ≠.

Obszar krytyczny testu jednostronny - w zależności od hipotezy alternatywnej może być lewo- lub prawostronny.

Jest to obszar krytyczny złożony z jednego podzbioru przestrzeni próby wybranego z jednej strony w rozkładzie odpowiedniej statystyki.

Testu z jednostronnym obszarem krytycznym używa się zwykle wtedy, gdy hipoteza alterna-tywna występuje w postaci nierówności typu < lub >.

TEST
DLA WARTOŚCI ŚREDNIEJ POPULACJI

MODEL I

 

Z1: Populacja generalna ma rozkład normalny N(m,σ) lub zbliżony do normalnego,

Z2: Odchylenie standardowe σ jest znane,

Z3: Hipoteza podstawowa H0: m= m0

Z4: Hipoteza alternatywna H1: m≠m0

(m>m0 lub m<m0)

Test istotności dla hipotezy H0 jest następujący:

a: Oblicza się wartość średniej z próby

b: Oblicza się wartość zmiennej normalnej standa-ryzowanej U wg wzoru:

c: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego z góry poziomu istotności

zachodziła równość

d. Porównuje się obliczoną i odczytaną wartość statystyki U.

Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1

w postaci m ≠ m0 otrzyma się z próby taką

wartość U, że to hipotezę H0 odrzuca

się na korzyść hipotezy alternatywnej H1.

Natomiast gdy to nie ma podstaw

do odrzucenia hipotezy H0.

Jeżeli H1 : m>m0 to stosuje się test istotności z prawostronnym obszarem krytycznym.

Wówczas z tablicy dystrybuanty rozkładu normal-nego N(0,1) odczytuje się uα tak, by spełniona była równość

H0 odrzuca się, gdy wyznaczona z próby wartość U spełni warunek: U ≥ uα.

Jeżeli H1: m<m0 to stosuje się test istotności

z lewostronnym obszarem krytycznym.

Wówczas odczytuje się uα tak, by spełniona była równość

H0 odrzuca się, gdy U ≤ -uα.

MODEL II

Z1: Populacja generalna ma rozkład N(m, σ)

Z2:Odchylenie standardowe σ jest nieznane

Z3:Z populacji generalnej wylosowano niezależnie małą próbkę n ≤ 30).

Z4 : Hipoteza podstawowa H0: m= m0

Z5: Hipoteza alternatywna H1: m≠m0

(m>m0 lub m<m0)

TEST
DLA WARTOŚCI ŚREDNIEJ POPULACJI

Test istotności dla hipotezy H0 ma postać:

a: Oblicza się wartość średniej z próby

b: Oblicza się wartość s lub

c: Oblicza się wartość statystyki t z wzoru:

lub z wzoru równoważnego:

d: Z tablic rozkładu t-Studenta, dla ustalonego poziomu istotności α i dla r = n-1 stopni swobody odczytuje się taką wartość tα, żeby zachodziła równość

e: Porównuje się obliczoną i odczytaną wartość statystyki t.

Dla testu dwustronnego (m ≠ m0) mogą zaistnieć 2 przypadki:

P1: Jeżeli to H0 należy odrzucić na korzyść H1.

P2: Jeżeli to nie ma podstaw do odrzucenia H0. f(t)

Dla lewostronnego testu (H1: m < m0) stosuje się lewostronny obszar krytyczny wyznaczany w ten sposób, by

Dla prawostronnego testu (H1: m>m0) tα wyznacza się w ten sposób, by zachodziła równość

MODEL III

Z1: Populacja generalna ma rozkład N(m, σ) lub dowolny inny rozkład o wartości średniej m

Z2:Odchylenie standardowe σ jest nieznane

Z3:Z populacji generalnej wylosowano niezależnie dużą próbkę

Z4 : Hipoteza podstawowa H0: m= m0

Z5: Hipoteza alternatywna H1: m≠m0

(m>m0 lub m<m0)

a: Oblicza się wartość średniej z próby

b: Oblicza się wartość s

c: Oblicza się wartość statystyki U z wzoru:

d: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość

e: Porównuje się obliczoną i odczytaną wartość statystyki U.

Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m≠m0 otrzyma się z próby taką war-tość U, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.

Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.

Jeżeli H1: m>m0 to stosuje się test istotności z prawostronnym obszarem krytycznym.

Wówczas z tablicy dystrybuanty rozkładu normalnego N(0,1) odczytuje się uα tak, by spełniona była równość

H0 odrzuca się, gdy wyznaczona z próby wartość U spełni warunek: U ≥ uα.

Jeżeli H1: m<m0 to stosuje się test istotności z lewostronnym obszarem krytycznym.

Wówczas odczytuje się uα tak, by spełniona była równość

H0 odrzuca się, gdy U ≤ uα.


TEST DLA DWÓCH ŚREDNICH
HIPOTEZA O DWÓCH WARTOŚCIACH OCZEKIWANYCH

MODEL I

 Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m11) i N(m22)

Z2: Odchylenia standardowe tych populacji σ1 i σ2 są znane,

Z3: Wykonano n1 i n2 niezależnych prób

Z4: Stawiamy hipotezę podst. H0: m1-m2 = a

Z5: Stawiamy hipotezę alternatywną

H1: m1-m2 ≠ a ( m1-m2 < a lub m1-m2 > a )

Jeżeli a = 0 to m1 = m2

Test istotności dla hipotezy H0 ma postać:

a: Oblicza się wartości średnie z prób ,

b: Oblicza się wartość statystyki u z wzoru:

c: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość

Obszary krytyczne są takie same jak dla jednej wartości średniej.

d: Porównuje się obliczoną i odczytaną wartość statystyki u.

Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2≠a otrzyma się z próby taką wartość u, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.

Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.

MODEL II

 Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m11) i N(m22)

Z2: Odchylenia standardowe tych populacji σ1 i σ2 są nieznane,

Z3: Wykonano n1 i n2 niezależnych prób o dużej liczebności n1, n2 > 30

Z4: Stawiamy hipotezę podstawową

H0: m1-m2 = a

Z5: Stawiamy hipotezę alternatywną

H1: m1-m2 ≠ a ( m1-m2 < a ) lub ( m1-m2 > a )

Test istotności dla hipotezy H0 ma postać:

a: Oblicza się wartości średnie z prób ,

b: Oblicza się odchylenia standardowe z próby s1, s2

c: Oblicza się wartość statystyki u z wzoru:

d: Z tablic dystrybuanty rozkładu normalnego N(0,1) odczytuje się wartość krytyczną uα tak, aby dla założonego poziomu istotności zachodziła równość

e: Porównuje się obliczoną i odczytaną wartość statystyki u.

Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2≠a otrzyma się z próby taką wartość u, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1.

Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.

MODEL III

 Z1: Badamy dwie populacje generalne mające rozkłady normalne N(m11) i N(m22)

Z2: Odchylenia standardowe σ1 i σ2 są nieznane,

Z3: Wykonano n1 i n2 niezależnych prób o małej liczebności n1, n2 < 30

Z4: Stawiamy hipotezę podstawową

H0: m1-m2 = a

Z5: Stawiamy hipotezę alternatywną

H1: m1-m2 ≠ a ( m1-m2 < a lub m1-m2 > a )

Test istotności dla hipotezy H0 ma postać:

a: Oblicza się wartości średnie z prób ,

b: Oblicza się odchylenia standardowe z próby s1, s2 lub ,

c: Oblicza się wartość statystyki T z wzoru:

d: Z tablic rozkładu t- Studenta odczytuje się wartość krytyczną tα dla r = n1+n2-2 stopni swobody tak, aby dla założonego poziomu istotności zachodziła równość

e: Porównuje się obliczoną i odczytaną wartość statystyki t.

Jeżeli dla dwustronnego obszaru krytycznego stosowanego przy hipotezie alternatywnej H1 w postaci m1-m2 ≠ a otrzyma się z próby taką wartość t, że to hipotezę H0 odrzuca się na korzyść hipotezy alternatywnej H1

Natomiast gdy to nie ma podstaw do odrzucenia hipotezy H0.


TEST DLA WARIANCJI

MODEL I

 Z1: Badana populacja ma rozkład normalny N(m,σ)

Z2: Z populacji generalnej wybrano niezależnie próbkę o małej liczebności n<30

Z3:Stawiamy hipotezę podstawową

H0: σ2 = σ20

Z4: Stawiamy hipotezę alternatywną

H1: σ2 ≠ σ202 < σ20 lub σ2 > σ20)

Statystyka określona wzorem ma

rozkład z liczbą stopni swobody r = n-1

Obszary krytyczne

H1:

H1:

H1:

MODEL II

 

Z1: Badana populacja ma rozkład normalny N(m,σ)

Z2: Z populacji generalnej wybrano niezależnie próbkę o dużej liczebności n>30

Z3: Stawiamy hipotezę podstawową

H0: σ2 = σ20

Z4: Stawiamy hipotezę alternatywną

H1: σ2 ≠ σ202 < σ20 lub σ2 > σ20)

Statystyka u określona wzorem

ma rozkład normalny N(0,1).

WERYFIKACJA HIPOTEZ
DLA DWÓCH WARIANCJI

Z1: Badamy dwie zmienne losowe mające rozkłady normalne N(m11) i N(m22)

n1 - liczebność jednej zmiennej losowej

n2 - liczebność drugiej zmiennej losowej

Z2: Stawiamy hipotezę H0:

Z3: Stawiamy hipotezę alternatywną:

H1: ( lub )

H1:

rM i rm – ilość stopni swobody

H1:

H1:

Statystyka F ma rozkład F-Snedecora

Statystyka F-Snedecora

Rozkład F-Snedecora podaje taką wartość Fα, dla której zachodzi równość , tzn dla prawo-stronnego obszaru krytycznego.

Dlatego oznaczenia populacji indeksami (1 i 2) (M i m) należy tak przyjąć, aby w ilorazie dwu wariancji z prób licznik był większy od mianownika.


TEST ZGODNOŚCI λ KOŁMOGOROWA

MODEL I

Z1: Populacja generalna ma rozkład o ciągłej dystrybuancie F(x)

Z2: Z populacji wylosowano niezależnie do próby n elementów (n – co najmniej kilkadziesiąt)

Na podstawie wyników tej próby zweryfikować hipotezę, że populacja ma rozkład ciągły określony konkretną, hipotetyczną, ciągłą dystrybuantą Fo(x)

Ho: F(x)=Fo(x)

H1: F(x)≠Fo(x)

1. Wyniki próby grupujemy w stosunkowo wąskie przedziały o prawych końcach xj i liczebnościach nj

2. Dla każdego xj wyznaczamy wartość tzw. empiry-cznej dystrybuanty Fn(x)

gdzie liczebność skumulowana od początku do xk

3. Z rozkładu hipotetycznego wyznaczamy dla każdego xj wartość teoretycznej dystrybuanty Fo(x)

4. Obliczamy wartość statystyk

Statystyka λ ma przy prawdziwości hipotezy Ho rozkład λ Kołmogorowa, niezależny od postaci hipotetycznej dystrybuanty F(x)

Dla ustalonego poziomu istotności α z granicznego rozkładu λ Kołmogorowa odczytujemy taką wartość krytyczną λα, aby zachodziło

Następnie porównujemy wartość empiryczną λ z wartością krytyczną λα

Jeżeli to hipotezę Ho należy odrzucić na korzyść hipotezy alternatywnej H1

Gdy to nie ma podstaw do odrzucenia hipotezy Ho

MODEL II

Z1: Dane 2 populacje generalne o rozkładach z ciągłymi dystrybuantami F1(x) i F2(x)

Z2: Z populacji pobrano losowo 2 duże próby o liczebnościach n1 i n2 elementów

Na podstawie wyników tych prób zweryfikować hipotezę, że obie próby pochodzą z tej samej populacji

Ho: F1(x)=F2(x)

H1: F1(x)≠F2(x)

Test istotności Smirnowa oparty na statystyce λ Kołmogorowa

Wyniki prób grupujemy w stosunkowo wąskie przedziały klasowe o tych samych końcach xj

Dla każdego xj wyznaczamy wartości empirycznych dystrybuant

gdzie n1sk , n2sk liczebności skumulowane od po-czątku do xj

Obliczamy wartość statystyk

Statystyka λ przy prawdziwości hipotezy Ho ma asymptotyczny rozkład λ Kołmogorowa

Dla ustalonego poziomu istotności α z tablic tego rozkładu odczytujemy taką wartość krytyczną λα, aby zachodziło

Następnie porównujemy wartość empiryczną λ z wartością krytyczną λα

Jeżeli to hipotezę Ho należy odrzucić na korzyść hipotezy alternatywnej H1, tzn. próby pochodzą z różnych populacji

Gdy to nie ma podstaw do odrzucenia hipotezy Ho

Zmienna losowa standaryzowana

Dystrybuanta empiryczna

gdzie liczebność skumulowana od początku do xk

TEST ZGODNOŚCI χ2

Z1: Populacja generalna ma dowolny rozkład o dystrybuancie należącej do pewnego zbioru Ω rozkładów o określonym typie postaci funkcyjnej dystrybuanty

Z2: Z populacji wylosowano niezależnie dużą próbę n elementów (n – co najmniej kilkadziesiąt)

Na podstawie wyników tej próby zweryfikować hipo-tezę, że populacja generalna ma rozkład typu Ω

Ho: F(x)∈Ω,

gdzie F(x) jest dystrybuantą rozkładu populacji

H1: F(x) Ω

Wyniki próby dzielimy na r rozłącznych klas o liczebnościach nj - otrzymujemy w ten sposób rozkład empiryczny

1. Z hipotetycznego rozkładu typu Ω obliczamy dla każdej z r klas wartości badanej cechy X prawdopodobieństwa pi, że zmienna losowa X o rozkładzie Ω przyjmie wartości należące do klasy o numerze i (i=1,2,…,r).

2. Obliczamy liczebności teoretyczne npi, które powinny wystąpić w klasie i, gdyby populacja miała rozkład typu Ω, tzn. gdyby hipoteza Ho była prawdziwa.

3. Obliczamy wartość statystyki

Statystyka χ2 ma przy prawdziwości hipotezy Ho rozkład asymptotyczny χ2 o r-1 stopniach swobo-dy, niezależny od postaci hipotetycznej dystry-buanty F(x)

(Statystyka ma r-k-1 stopni swobody, gdy z próby szacowano k parametrów rozkładu Ω metodą największej wiarygodności)

Obszar krytyczny w tym teście buduje się prawostronnie w oparciu o rozkład χ2

Dla ustalonego poziomu istotności α z tablicy rozkładu χ2 przy odpowiedniej ilości stopni swo-body odczytujemy taką wartość krytyczną χ2α, aby zachodziło

Następnie porównujemy wartość empiryczną χ2 z wartością krytyczną χ2α

Jeżeli to hipotezę Ho należy odrzucić

Gdy to nie ma podstaw do odrzucenia hipotezy Ho

Im bliższa zeru jest wartość χ2 tym hipoteza jest bardziej wiarygodna

Gdy w rozkładzie empirycznym z próby wystąpi w jakiejś klasie liczebność mniejsza od 8, to nale-ży ją połączyć z sąsiednią uzyskując większą liczebność.

Zmniejszy się wtedy liczba stopni swobody


Wyszukiwarka

Podobne podstrony:
Zagadnienia do opracowania na kolokwium zaliczeniowe2
zagadnienia opracowane na kolokwium nr3 (marynaty, soki)
Opracowanie na kolokwium z psychologii społecznej, Uczelnia, Psychologia społeczna
OPRACOWANIE NA KOLOKWIUM Z ETYKI, medycyna, II rok, etyka lekarska, notatki, opracowania
Fizyka budowli opracowanie na kolokwium
2011 statystyka matematyczna pytania na egzamin
Opracowanie na kolokwium, Akademia Morska, I semestr, urządzenia nawigacyjne, Test do Gucmy, Urządze
Opracowanie na kolokwium, Automatyka i Robotyka, Semestr 4, Metody sztucznej inteligencji
Metody badań ilościowych - Opracowanie na kolokwium, pedagogika
zachowania konsumenckie - opracowanie na kolokwium (notatki z zajęć), Uniwersytet Wrocławski, zachow
zagadnienia opracowane na kolokwium nr 2 (dżemy,kompoty,kapusta kiszona,mrożonki)
ubytkowa, Studia PWr W-10 MBM, Semestr V, Obróbka Ubytkowa, Kolokwium, pytania, opracowania, Pytania
Pojazdy opracowanie na kolokwium
Opracowanie na kolokwium redukcjie i anomalie
OPRACOWANE na kolokwium
geodezja drogowa opracowanie na kolokwium
Opracowanie na kolokwium
PZRP - OPRACOWANEpytania na kolokwium, Dyplomaca Europejska, 4 semestr, polit ZP, polit ZP, Polityka

więcej podobnych podstron