Wnioskowanie statystyczne
Polega na uogólnianiu wyników otrzymanych na podstawie próby
losowej na całą populację generalną, z której próba została
pobrana.
Wnioskowanie statystyczne dzieli się na:
1.
Estymację – szacowanie wartości parametrów lub postaci
rozkładu zmiennej na podstawie próby – na podstawie
wyników próby formułujemy wnioski dla całej populacji
2.
Weryfikację hipotez statystycznych – sprawdzanie
określonych założeń sformułowanych dla parametrów
populacji generalnej na podstawie wyników z próby –
najpierw wysuwamy założenie, które weryfikujemy na
podstawie wyników próby
Estymacja przedziałowa
Estymator – wielkość (charakterystyka, miara), obliczona na podstawie próby,
służąca do oceny wartości nieznanych parametrów populacji generalnej.
Dobór właściwej statystyki, będącej najlepszym estymatorem parametru w
populacji generalnej na podstawie właściwości estymatorów (nieobciążony,
zgodny, efektywny, dostateczny).
Estymacja przedziałowa – polega na budowie przedziału zwanego
przedziałem ufności, który z określonym prawdopodobieństwem będzie
zawierał nieznaną wartość szacowanego parametru
α
−
=
<
<
1
)}
(
)
(
{
2
1
n
n
Z
g
Q
Z
g
P
gdzie:
Q – nieznany parametr populacji generalnej
)
(
1
n
Z
g
,
)
(
2
n
Z
g
- końce przedziałów (dolna i górna granica przedziału),
będące funkcją wylosowanej próby
1–α współczynnik ufności – oznacza prawdopodobieństwo tego, że
wyznaczając na podstawie n-elementowych prób wartość funkcji
)
(
1
n
Z
g
i
)
(
2
n
Z
g
średnio w (1-α)·100% przypadków otrzymamy przedziały pokrywające
nieznaną wartość parametru Q – z prawdopodobieństwem (1- α) przedział
ufności pokrywa nieznaną wartość szacowanego parametru.
Im krótszy przedział (różnica między górną i dolną granicą przedziału),
tym bardziej precyzyjna jest estymacja przedziałowa.
Im wyższa jest wartość współczynnika ufności,
tym większa jest długość przedziału.
1. Przedział ufności dla wartości oczekiwanej (średniej) ze znanym
odchyleniem standardowym.
Estymatorem wartości oczekiwanej (średniej) jest średnia arytmetyczna z próby
X
, która ma rozkład
)
,
(
n
m
N
σ
. Po standaryzacji zmiennej
X
statystyka
n
U
m
X
⋅
=
−
σ
ma rozkład normalny
)
1
,
0
(
N
.
Przedział ufności dla wartości oczekiwanej (średniej) ma postać:
α
σ
α
σ
α
−
=
+
<
<
−
1
}
{
2
/
2
/
n
n
u
X
m
u
X
P
gdzie:
2
/
α
u
- wartość odczytana z tablic rozkładu normalnego dla danego poziomu
istotności α/2
σ
- odchylenie standardowe w populacji generalnej
Względną precyzję oszacowania oceniamy następująco:
%
1 00
)
(
2
/
⋅
=
⋅
⋅
n
X
u
X
B
σ
α
Jeżeli:
%
5
)
(
≤
X
B
- oszacowanie charakteryzuje się dużą precyzją
%
10
)
(
%
5
≤
≤
X
B
- uogólnienia wyników na populację generalną należy
dokonywać ostrożnie
%
10
)
(
>
X
B
- nie należy dokonywać żadnych uogólnień na populację
generalną
2. Przedział ufności dla wartości oczekiwanej (średniej) z nieznanym
odchyleniem standardowym
Wykorzystujemy statystykę t o rozkładzie Studenta o n–1 stopniach swobody:
1
−
⋅
=
−
n
t
S
m
X
spełniona jest następująca zależność:
α
α
α
−
=
<
<
−
−
−
1
}
{
1
,
2
/
1
,
2
/
n
n
t
t
t
P
Przedział ufności dla wartości oczekiwanej (średniej) ma postać (n < 30):
α
α
α
−
=
+
<
<
−
−
−
−
−
1
}
{
1
1
,
2
/
1
1
,
2
/
n
S
n
n
S
n
t
X
m
t
X
P
gdzie:
∑
=
−
=
n
i
i
n
x
x
S
1
2
1
)
(
- odchylenie standardowe z próby
1
,
2
/
−
n
t
α
- wartość odczytana z tablic rozkładu Studenta dla poziomu istotności α
oraz n–1 stopni swobody
Względną precyzję oszacowania oceniamy następująco:
%
100
)
(
1
1
,
2
/
⋅
=
−
⋅
⋅
−
n
X
S
t
n
X
B
α
Gdy n > 30 wartość
1
,
2
/
−
n
t
α
, odczytaną z tablic rozkładu Studenta możemy
zastąpić wartością
2
/
α
u
, odczytaną z tablic rozkładu normalnego oraz
S
≈
σ
.
Przedział ufności dla wartości oczekiwanej (średniej) ma postać (n >30):
α
α
α
−
=
+
<
<
−
1
}
{
2
/
2
/
n
S
n
S
u
X
m
u
X
P
3. Przedział ufności dla wariancji i odchylenia standardowego
Najlepszym estymatorem wariancji w populacji
2
σ
jest wariancja z próby
2
S
Do budowy przedziału stosujemy statystykę
2
χ
o n–1 stopniach swobody:
2
2
2
σ
χ
S
n
⋅
=
Dla danego współczynnika ufności 1–α istnieją wartości
2
1
,
2
−
n
α
χ
2
1
1
2
−
−
n
α
χ
spełniające zależność:
{
}
α
χ
χ
χ
α
α
−
=
<
<
−
−
−
1
2
1
,
2
2
1
,
1
2
2
n
n
P
Przedział ufności dla wariancji ma postaci (n
≤
30):
α
σ
α
α
χ
χ
−
=
<
<
−
−
−
⋅
⋅
1
2
1
,
2
1
2
2
1
,
2
2
2
n
n
S
n
S
n
P
Przedział ufności dla odchylenia standardowego ma postać (n
≤
30):
α
σ
α
α
χ
χ
−
=
<
<
−
−
−
⋅
⋅
1
2
1
,
2
1
2
2
1
,
2
2
n
n
S
n
S
n
P
gdzie:
2
1
,
2
−
n
α
χ
,
2
1
1
2
−
−
n
α
χ
- wartości odczytane z rozkładu
2
χ
dla n–1 stopni swobody
Przedział ufności dla odchylenia standardowego (n > 30):
α
σ
α
α
−
=
<
<
−
+
1
2
2
/
2
2
/
1
1
n
u
n
u
S
S
P
gdzie:
2
/
α
u
- wartość odczytana z tablic rozkładu normalnego dla poziomu istotności α
Względną precyzję oszacowania
σ
dla licznej próby (n >30) wyznaczamy:
%
100
)
(
2
⋅
=
n
u
S
B
α