ESTYMACJA
Szacowanie wartości parametrów w populacji na podstawie próby jest zadaniem estymacji parametrycznej.
Estymacja przedziałowa
Przedziałem ufności nazywamy taki przedział, który z zadanym z góry prawdopodobieństwem (1-α), zwanym poziomem ufności (lub współczynnikiem ufności), pokrywa nieznaną wartość szacowanego parametru Q.
Z reguły przyjmuje się poziom ufności bliski jedności, tzn. (1-α)=0,9; 0,95; 0,99.
-------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------
Przedziały ufności dla średniej.
Zakładamy, że cecha X ma w populacji rozkład normalny N(m,σ). Niech
m - średnia arytmetyczna w populacji
σ - odchylenie standardowe w populacji
![]()
- średnia arytmetyczna z próby
S - odchylenie standardowe z próby
n - liczebność próby
-------------------------------------------------------------------------------------------------
(1) Przedział ufności dla średniej w przypadku, gdy σ - znane, dowolna liczebność próby

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
-------------------------------------------------------------------------------------------------
(2) Przedział ufności dla średniej w przypadku, gdy σ - nieznane, liczebność próby n < 30

gdzie tα odczytujemy z tablic rozkładu t-Studenta dla danego α i (n-1) stopni swobody.
-------------------------------------------------------------------------------------------------
(3) Przedział ufności dla średniej w przypadku, gdy σ - nieznane, liczebność próby n ≥ 30, rozkład X w populacji nie musi być normalny

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
-------------------------------------------------------------------------------------------------
-------------------------------------------------------------------------------------------------
Przedział ufności dla wskaźnika struktury.
Niech
p - wskaźnik struktury ( procent wyróżnionych elementów) w populacji,
k - liczba elementów wyróżnionych w próbie
n - liczebność próby
Zakładamy, że n>100, k/n >0,05. Wówczas

-------------------------------------------------------------------------------------------------
Przy ostrożnym szacunku

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α
-----------------------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------
Przedział ufności dla wariancji.
Zakładamy, że cecha X ma w populacji rozkład normalny N(m,σ). Niech
σ2 - wariancja w populacji
S2 - wariancja w próbie
n - liczebność próby
-------------------------------------------------------------------------------------------------
(1) Dla n < 30

gdzie c1 - odczytujemy z tablic rozkładu χ2 dla (1- α/2) i (n-1) stopni swobody,
c2 - odczytujemy z tablic rozkładu χ2 dla ( α/2) i (n-1) stopni swobody.
(2) Dla n≥30

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
-------------------------------------------------------------------------------------------------
Minimalna liczebność próby przy szacowaniu średniej m w populacji (losowanie proste)
Zakładamy, że cecha X ma w populacji rozkład normalny N(m,σ). Niech
m - średnia arytmetyczna w populacji
σ - odchylenie standardowe w populacji
![]()
- średnia arytmetyczna z próby
S - odchylenie standardowe z próby
n - niezbędna liczebność próby
n0 - liczebność próby wstępnej
d - dopuszczalny błąd szacunku
-------------------------------------------------------------------------------------------------
(1) σ - znane, dowolna liczebność próby, cecha X ma w populacji rozkład normalny N(m,σ)

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
[ ] - oznacza całość z liczby
-------------------------------------------------------------------------------------------------
(2) σ - nieznane, liczebność próby n < 30, cecha X ma w populacji rozkład normalny N(m,σ)

gdzie tα odczytujemy z tablic rozkładu t-Studenta dla danego α i (n-1) stopni swobody.
-------------------------------------------------------------------------------------------------
(3) σ - nieznane, liczebność próby n ≥ 30, rozkład X w populacji nie musi być normalny

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Jeżeli n > n0 to należy dolosować n-n0 elementów.
Minimalna liczebność próby przy szacowaniu wskaźnika struktury w populacji (losowanie proste)
p - wskaźnik struktury ( procent wyróżnionych elementów) w populacji,
k - liczba elementów wyróżnionych w próbie
n - niezbędna liczebność próby
n0 - liczebność próby wstępnej
d - dopuszczalny błąd szacunku
-------------------------------------------------------------------------------------------------
Zakładamy, że n>100, k/n >0,05, znamy wskaźnik struktury p w populacji

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Zakładamy, że n>100, k/n >0,05, nie znamy wskaźnika struktury p w populacji

gdzie uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
PARAMETRYCZNE TESTY ISTOTNOŚCI
-------------------------------------------------------------------------------------------------
Test dla wartości średniej
------------------------------------------------------------------------------------------------
m - średnia arytmetyczna w populacji, m0- hipotetyczna wartość średniej arytmetycznej w populacji, ![]()
- średnia arytmetyczna z próby, σ - odchylenie standardowe w populacji, S - odchylenie standardowe w próbie, n - liczebność próby
-------------------------------------------------------------------------------------------------
(1) Zakładamy, że rozkład cechy w populacji jest normalny N(m,σ) lub zbliżony do normalnego, odchylenie standardowe σ w populacji jest znane.
H0 : m = m0
H1 : m ≠ m0 (obustronny obszar odrzucenia)
m < m0 ( lewostronny obszar odrzucenia)
m > m0 (prawostronny obszar odrzucenia)
Postać statystyki testowej:
![]()
Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-------------------------------------------------------------------------------------------------
(2) Zakładamy, że rozkład cechy w populacji jest normalny N(m,σ) lub zbliżony do normalnego, odchylenie standardowe σ w populacji jest nieznane oraz n ≤ 30
H0 : m = m0
H1 : m ≠ m0 , m < m0 , m > m0
Postać statystyki testowej:
![]()
Dla obszaru obustronnego tα odczytujemy z tablic rozkładu t-Studenta dla α i (n-1) stopni swobody.
Dla obszaru jednostronnego tα odczytujemy z tablic rozkładu t-Studenta dla 2α i (n-1) stopni swobody.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
------------------------------------------------------------------------------------------------- (3) Zakładamy, że rozkład cechy w populacji jest normalny N(m,σ) lub dowolny, odchylenie standardowe σ w populacji jest nieznane oraz n > 30.
H0 : m = m0
H1 : m ≠ m0 , m < m0 , m > m0
Postać statystyki testowej:
![]()
Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego.W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-------------------------------------------------------------------------------------------------
Test dla wariancji
------------------------------------------------------------------------------------------------
m - średnia arytmetyczna w populacji, ![]()
- średnia arytmetyczna z próby
σ - odchylenie standardowe w populacji, σ0- hipotetyczna wartość odchylenia standardowego w populacji, S - odchylenie standardowe w próbie, n - liczebność próby
---------------------------------------------------------------------------------------------
Zakładamy, że rozkład cechy w populacji jest normalny N(m,σ), odchylenie standardowe σ w populacji jest nieznane.
H0 : σ2 = σ20
H1 : σ2 > σ20
Postać statystyki testowej:

Dla obszaru obustronnego ![]()
odczytujemy z tablic rozkładu normalnego dla α i (n-1) stopni swobody. Hipotezę zerową odrzucamy gdy: ![]()
. W przeciwnym przypadku brak jest podstaw do odrzucenia H0. Pamiętając, że
![]()
-------------------------------------------------------------------------------------------------
Test dla wskaźnika struktury.
-------------------------------------------------------------------------------------------------
p - wskaźnik struktury ( procent wyróżnionych elementów) w populacji,, p0- hipotetyczna wartość wskaźnika struktury w populacji, k - liczba elementów wyróżnionych w próbie
n - liczebność próby
Zakładamy, że rozkład cechy w populacji dwupunktowy z parametrem p oraz n>100.
H0 : p = p0
H1 : p ≠ p0 , p < p0 , p > p0
Postać statystyki testowej:

Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-------------------------------------------------------------------------------------------------
Test dla dwóch średnich.
-------------------------------------------------------------------------------------------------
m1 - średnia arytmetyczna w populacji I, m2- średnia arytmetyczna w populacji II
![]()
- średnia arytmetyczna z próby I, ![]()
- średnia arytmetyczna z próby II
σ1 - odchylenie standardowe w populacji I, σ2 - odchylenie standardowe w populacji II
S1 - odchylenie standardowe w próbie I, S2 - odchylenie standardowe w próbie II
n1 - liczebność próby I, n2 - liczebność próby II,
-------------------------------------------------------------------------------------------------
(1) Zakładamy, że rozkład cechy w populacjach jest normalny N(m1,σ1) i N(m2,σ2) lub zbliżony do normalnego, odchylenia standardowe σ1 i σ2 w populacjach są znane.
H0 : m1 = m2
H1 : m1 ≠ m2 (obustronny obszar odrzucenia)
m1 < m2 ( lewostronny obszar odrzucenia)
m1 > m2 (prawostronny obszar odrzucenia)
Postać statystyki testowej:

Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-----------------------------------------------------------------------------------------------------------------
(2) Zakładamy, że rozkład cechy w populacjach jest normalny N(m1,σ1) i N(m2,σ2) lub zbliżony do normalnego, n1≤ 30 i n2≤ 30, odchylenia standardowe σ1 i σ2 w populacjach są nieznane oraz zachodzi równość:![]()
. Normalność weryfikujemy testem Shapiro-Wilka, równość wariancji w populacjach weryfikujemy testem dla dwóch wariancji
H0 : m1 = m2
H1 : m1 ≠ m2 ,m1 < m2 ,m1 > m2
Postać statystyki testowej:

Dla obszaru obustronnego tα odczytujemy z tablic rozkładu t-Studenta dla α i (n1+n2-2) stopni swobody.
Dla obszaru jednostronnego tα odczytujemy z tablic rozkładu t-Studenta dla 2α i (n1+n2-2) stopni swobody.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-----------------------------------------------------------------------------------------------------------------
(3) Zakładamy, że n1> 30 i n2>30 oraz odchylenia standardowe σ1 i σ2 w populacjach są nieznane.
H0 : m1 = m2
H1 : m1 ≠ m2 ,m1 < m2 ,m1 > m2
Postać statystyki testowej:

Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego.W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
-------------------------------------------------------------------------------------------------
Test dla dwóch wariancji.
------------------------------------------------------------------------------------------------
Zakładamy, że rozkład cechy w populacjach jest normalny N(m1,σ1) i N(m2,σ2) lub zbliżony do normalnego, odchylenia standardowe σ1 i σ2 w populacjach są nieznane.
H0 : ![]()
H1 : ![]()
Postać statystyki testowej:

Fα odczytujemy z tablic F-Snedecora dla (n1 -1) i (n2 -1) stopni swobody.
Hipotezę zerową odrzucamy gdy: ![]()
. W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
------------------------------------------------------------------------------------------------
Test dla dwóch wskaźników struktury.
-------------------------------------------------------------------------------------------------
Zakładamy, że populacje mają rozkłady dwupunktowe z parametrami p1 i p2 oraz n1> 100 i n2>100 .
H0 : p1 = p2
H1 : p1 ≠ p2 ,p1 < p2 ,p1 > p2
Postać statystyki testowej:

Dla obszaru obustronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- ½ α.
Dla obszaru jednostronnego uα odczytujemy z tablic rozkładu normalnego dla F(uα)= 1- α.
Hipotezę zerową odrzucamy gdy: ![]()
dla obszaru obustronnego, ![]()
dla obszaru lewostronnego, ![]()
dla obszaru prawostronnego.W przeciwnym przypadku brak jest podstaw do odrzucenia H0.
TESTY NIEPARAMETRYCZNE
Test normalności Shapiro-Wilka
![]()
, gdzie ![]()
jest dystrybuantą rozkładu normalnego
![]()
![]()
próba prosta n-elementowa, pobrana z populacji o ciągłej dystrybuancie ![]()
![]()
poziom istotności
Postać statystyki testowej

![]()
tablicowane współczynniki
![]()
uporządkowana próba według wartości rosnących
![]()
odczytujemy z tablic wartości krytycznych dla testu Shapiro-Wilka
Obszar odrzucenia ![]()
- zatem hipotezę H0 odrzucamy gdy ![]()
-lewostronny obszar odrzucenia.
Test zgodności ![]()
![]()
, gdzie ![]()
jest zbiorem rozkładów o określonym typie postaci funkcyjnej dystrybuanty
![]()
n- elementowa próba (n>100, dane przedstawione są w postaci szeregu rozdzielczego o r przedziałach klasowych o liczebnościach ![]()
(i=1,…,r)
![]()
poziom istotności
Postać statystyki testowej

Statystyka ta przy założeniu prawdziwości ![]()
ma rozkład ![]()
o ![]()
stopniach swobody.
k - liczba szacowanych parametrów, które należy wstępnie wyznaczyć na podstawie próby
r - liczba przedziałów klasowych
![]()
- prawdopodobieństwo, że zmienna X przyjmuje wartość należącą do i-tego przedziału klasowego, gdy rozkład jest zgodny z ![]()
![]()
- liczba jednostek, które powinny się znaleźć w i-tym przedziale, przy założeniu, że zmienna ma rozkład zgodny z hipotetycznym
Obszar odrzucenia ![]()
(prawostronny), Wartość ![]()
odczytujemy z tablic dla (r-k-1) stopni swobody i danego![]()
Test serii losowości próby (test medianowy)
![]()
próba jest losowa
![]()
próba n-elementowa
![]()
poziom istotności
Wyznaczamy Me z próby (w tym celu porządkujemy próbę niemalejąco).
Każdemu wynikowi z próby (według kolejności losowania elementów) przypisujemy symbol:
a gdy ![]()
,
b gdy ![]()
,
![]()
odrzucamy.
Zliczamy:
k - liczba serii
n1- liczba symboli a
n2 - liczba symboli b
Obszar odrzucenia dwustronny odczytujemy z tablic rozkładu liczby serii
![]()
, ![]()
Tablice ![]()
; ![]()
Test serii dla sprawdzenia hipotezy, że dwie próby pochodzą z jednej populacji
![]()
![]()
dane:
dwie próby o liczebnościach:![]()
![]()
poziom istotności
Wyniki obu prób ustawiamy w jeden niemalejący ciąg. Elementy I próby oznaczamy symbolem a, próby II symbolem b. Zliczamy liczbę serii k
Obszar odrzucenia ![]()
odczytujemy z tablic rozkładu liczby serii dla danych ![]()
tak, aby ![]()
(lewostronny obszar odrzucenia hipotezy zerowej).
Test niezależności chi-kwadrat
W teście niezależności chi-kwadrat hipotezy zerowa i alternatywana mają postać
H0: cechy X i Y są niezależne (![]()
)
H1: cechy X i Y są zależne
Z populacji generalnej losuje się co najmniej 100 elementową próbę losową, a jej wyniki grupuje w tablicę o r-wierszach i s-kolumnach, nazywaną tablicą kontyngencji:
X |
Y |
|
|
|
|
|
|
|
|
|
|
|
|
n |
1 |
|
|
1 |
|
Wnętrze tablicy kontyngencji (korelacyjnej) stanowią liczebności empiryczne ![]()
takie, że ![]()
. Przez ![]()
,![]()
oznaczamy liczebności brzegowe, natomiast ![]()
oraz ![]()
są prawdopodobieństwami brzegowymi.
Postać statystyki testowej testu niezależności chi-kwadrat

gdzie ![]()
są prawdopodobieństwami teoretycznymi.
Statystyka ta ma przy założeniu prawdziwości hipotezy H0 asymptotyczny rozkład ![]()
z (r-1)(s-1) stopniami swobody.
Test ma prawostronny obszar odrzucenia, tzn. że na poziomie istotności α hipotezę H0 odrzucamy na korzyść hipotezy alternatywnej, gdy ![]()
. W przeciwnym przypadku: na poziomie istotności α brak jest podstaw do odrzucenia H0.
10