Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Przedziały ufności
Definicja przedziału ufności
Przykłady konstrukcji przedziałów ufności
Przedziały ufności dla wartości oczekiwanej
Przedziały ufności dla wariancji
Przedziały ufności dla ilorazu wariancji
1
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Definicja przedziału ufności
Zajmowaliśmy się punktową estymacją nieznanego
parametru rozkładu. Obecnie zajmiemy się tzw. estymacją
przedziałową określając górną i dolną granicę oszacowania.
Niech X1,L,Xn będzie próbą prostą pochodzącą z
populacji, w której cecha X ma rozkład typu ciągłego,
zależny od nieznanego parametru qQ. Niech a oznacza
małą liczbę z przedziału (0,1).
Definicja. Niech g(q) będzie estymowana wielkością.
Rozważmy dwie statystyki g1(X1,L,Xn ) i g2(X1,L,Xn ).
Mówimy, że losowy przedział [g1(X1,L,Xn ), g2(X1,L,Xn )]
jest przedziałem ufności dla wielkości g(q) na poziomie
ufności 1- a jeśli
Pq[g1(X1,L,Xn ) Ł g(q) Ł g2(X1,L,Xn )] =1- a. (*)
Jako poziom ufności najczęściej przyjmuje się 1- a = 0,95
lub 1- a = 0,99.
Komentarz do definicji przedziału ufności
Krańce przedziału ufności są zmiennymi losowymi. Zależą od
obserwowalnych zmiennych losowych.
Zauważmy także, że g(q) jest stałą wielkością. Zatem (*)
należy rozumieć tak: losowy przedział
[g1(X1,& Xn), g2((X1,& Xn)]
z prawdopodobieństwem 1- a pokrywa nieznaną wielkość
g(q).
2
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Innymi słowy, biorąc pod uwagę częstościową definicję
prawdopodobieństwa, można powiedzieć tak: w dużej serii
próbek częstość zdarzenia polegającego na tym, że realizacje
przedziałów ufności pokrywają nieznaną wartość parametru
g(q) jest w przybliżaniu równa (1- a) 100%.
Uwaga. Przy konkretnej realizacji próby losowej x1,x2,...,xn
krańce przedziału ufności są dokładnie wyznaczonymi
konkretnymi wielkościami. Nie ma wtedy sensu stwierdzenie,
że wielkość g(q) znajdzie się w takim przedziale z
prawdopodobieństwem 1- a.
Ogólna metoda konstrukcji przedziału ufności. (por. A.
Plucińska& )
Przy konstrukcji przedziałów, postępuję się najczęściej
następująco.
Wybiera się taki estymator %1ń(X1,& ,Xn ) wielkości g(q),
którego rozkład asymptotyczny lub dokładny jest znany.
Dla danego poziomu ufności 1- aposzukuje się takich
stałych , , dla których
1 2
Pq( Ł %1ń(X1,X2,...,Xn ) Ł ~2 ) =1- a (*)
u
1
~
W przypadku, gdy nierówność Ł %1ń(X1,...,Xn ) Ł u2 daje
1
się zastąpić równoważną nierównością postaci
f1(%1ń(X1,...,Xn )) Ł g(q) Ł f2(%1ń(X1,...,Xn ))
stąd po podstawieniu:
g1(X1,& Xn) = f1(%1ń(X1,...,Xn )),
g2(X1,& Xn) = f2(%1ń(X1,...,Xn )),
3
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
otrzymujemy przedział [g1(X1,& Xn),g2((X1,& Xn)], który jest
przedziałem ufności nieznanej wielkości g(q) na poziomie
ufności 1- a.
Ponieważ dla ustalonego poziomu ufności 1- a, liczby
i w równości (*) można wybierać na wiele
1 2
sposobów, zazwyczaj wybiera się je w taki sposób, aby
~ ~
Pq(%1ń(X1,X2,...,Xn ) Ł u1) = Pq(%1ń(X1,X2,...,Xn ) ł u2) = a / 2
Przypadek cechy skokowej
Jeśli cecha badana X ma rozkład skokowy, to liczby ,
1 2
spełniające równość (*) mogą nie istnieć. Dlatego też w
sytuacji, gdy próba pochodzi z rozkładu skokowego
przedziałem ufności na poziomie 1- a dla wielkości g(q)
nazywa się taki przedział losowy[g1(X1,.. ,Xn ), g2(X1,.. ,Xn],
dla którego spełniona jest nierówność
Pq[g1(X1,L,Xn ) Ł g(q) Ł g2(X1,L,Xn )] ł1- a.
Zatem liczby i spełniają warunki:
1 2
~
Pq(%1ń(X1,X2,...,Xn ) Ł u1) Ł a / 2
~
Pq(%1ń(X1,X2,...,Xn ) ł u2) Ł a / 2
Przykłady konstrukcji przedziałów ufności
1. Przedziały ufności dla wartości oczekiwanej
Przypadek a).
Niech X1,L,Xn będzie próbą losową z rozkładu N(m,s) o
nieznanym m, znanym s . Estymujemy m. Jako estymator
4
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Ć
nieznanego parametru wybieramy m(X1,...,Xn ) =
(1/n)(X1+& +Xn)= X
n
1
Wiadomo, że średnia X = Xi z próby losowej pochodzącej
n
i=1
s
z rozkładu N(m,s) ma rozkład normalny N(m, )
n
X - m
Zatem standaryzowana średnia ma rozkład N(0,1).
s
n
Dla ustalonego poziomu ufności 1-a możemy więc
wyznaczyć taką wielkość ~ , że dla = ~ , 2= ~
u u u
1
X - m
~)
Pm (-~ Ł
u Ł u =1- a (**)
s
n
co oznacza, że
s s
~
Pm(-~ Ł X - m Ł u ) =1- a.
u
n n
Stąd otrzymujemy
s s
~ ~
Pm{X - u Ł m Ł X + u } = 1- a
n n
~
Z zapisu (**) wynika, że u jest kwantylem rzędu 1- a/ 2 z
rozkładu N(0,1). Przyjmijmy wygodniejsze oznaczenie
~
u =u1-a / 2.
Kwantyle rozkładu N(0,1) są podawane w tablicach
statystycznych.
(Przypominamy. Ogólnie: kwantylem rzędu p z rozkładu
5
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
o dystrybuancie ciągłej F nazywamy taką wartość up, że
F(up) = p, p(0,1)).
Tak wiec przedział
s s
[X - u1-a / 2 , X + u1-a / 2 ]
n n
jest przedziałem losowym, który z prawdopodobieństwem 1-a
pokrywa nieznaną wartość oczekiwaną rozkładu. Zatem,
zgodnie z definicją, jest on przedziałem ufności dla wartości
oczekiwanej na poziomie ufności 1- a.
Częstościowa interpretacja przedziałów ufności dla średniej
f ( x )
|
m x
Rys. 1. Przykłady przedziałów dla m. Spodziewamy się, że około
(1-a )100% przedziałów pokrywa nieznaną wartość m (interpretacja
rysunku na wykładzie).
Przykład.1. Załóżmy, że waga proszku do prania w pudełku, które napełniane
jest automatycznie jest zmienną losową o rozkładzie normalnym.
Dokonano nowego ustawienia automatu dozującego proszek do prania, tak że
wartość oczekiwana wagi zawartości pudełka przy nowym ustawieniu nie jest
znana. W celu jej oszacowania pobrano próbę prostą -10 pudełek - uzyskując
następujące wyniki podane w gramach: 605, 601, 605, 599, 602, 597, 602, 603,
602, 600. Wyznacz realizację przedziału ufności dla średniej wagi w nowym
6
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
ustawieniu przy współczynniku ufności 0.95 przyjmując, że odchylenie
standardowe wagi proszku wynosi 2.4 g.
Dane: n=10, s = 2.4, a = 0.05.
Założenia. Badana cecha ma rozkład normalny N(m,2.4).
Estymujemy parametr m. Wyliczenia:x = 601.6,
Odczyt z tablicy rozkłady normalnego N(0,1) : u1-0.025 = 1.96
Podstawiając dane do wzoru na przedział ufności dla m
s s
[X - u1-a / 2 , X + u1-a / 2 ]
n n
2.4 2.4
Otrzymujemy [X 1.96 , X + 1.96 ].
10 10
W tym przykładzie mamy następującą realizację przedziału ufności na
poziomie 0.95
2.4 2.4
[601.6 1.96 , 601.6 + 1.96 ][600.11,603.09]
10 10
Estymacja z zadaną precyzją. Przypadek a)
Niech 2d oznacza długość przedziału ufności na poziomie1- a
dla parametru m w rozważanym modelu. Zatem
s
2d = 2u1-a / 2
n
Stąd wynika, że
s2u2
1-a / 2
n= .
d2
Jeśli badacz może ustalać rozmiary próby (wielkość n), to
dla otrzymania przedziału ufności o zadanej długości, która
nie przekracza 2d (zadanej precyzji ), wystarczy rozważać
7
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
s2u2-a / 2
1
próby o rozmiarze n ł . Mówimy wówczas o
d2
estymacji z zadaną precyzją.
Przypadek 2. Populacja normalna N(m,s), nieznane m,
nieznane s
Niech X1,L,Xn będzie próbą losową z tego rozkładu.
Przy konstrukcji przedziału ufności zamiast statystyki
X - m
U =
s
n
stosuje się statystykę
n
1
X - m
t = gdzie S = (Xi - X)2
s
n -1i=1
n
Statystyka ta ma rozkład t-Studenta z (n-1) stopniami
swobody (por. definicji rozkładu t-Studenta). Postępując
podobnie jak w przypadku statystyki U, konstruujemy
przedział ufności dla średniej m na zadanym poziomie ufności
1- a (dokładną konstrukcję zostawiamy jako ćwiczenie).
W tym przypadku otrzymujemy przedział
S S
[X - t1-a / 2,n-1 , X + t1-a / 2,n-1 ]
n n
gdzie t1-a / 2,n-1 jest kwantylem rzędu 1- a / 2 z rozkładu
t-Studenta o (n-1) stopniach swobody (kwantyle dla
8
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
rozkładów t-Studenta podane są w tablicach statystycznych).
Przykład 2.
Zauważono, że waga ludzi dorosłych odwiedzających pewną
przychodnię rodzinną ma rozkład normalny.
Postanowiono ocenić, na podstawie 15-elementowej próby prostej,
średnią wagę dorosłych pacjentów odwiedzających przychodnię.
Posłużono się metodą opartą na przedziałach ufności, przy
współczynniku ufności 0.95 i przy nieznanym odchyleniu
standardowym populacji. Podać realizację przedziału ufności dla
wartości oczekiwanej znając wyniki próby (dane w kg): 76, 82, 67,
52, 79, 86, 77, 70, 68, 76, 80, 74, 66, 60, 73.
Dane zadania: n=15, a = 0,05, liczba stopni swobody =14.
Założenia. Cecha ma w populacji rozkład normalny o
nieznanych parametrach. Estymujemy wartość oczekiwaną m .
Wyliczenia: x = 72.4 , s = 8.84
Odczyt z tablic : t0.975,14 = 2.145
Podstawienie do wzoru
8.84 8.84
[72.4 - 2.145 ,72.4 + 2.145 ]
15 15
Wniosek. Przedział (67.5,77.3) jest realizacją takiego
przedziału ufności, który z prawdopodobieństwem 0.95
pokrywa nieznaną wartość średniej wagi pacjenta w badanej
przychodni.
2. Przedziały ufności dla wariancji
Rozważmy ten sam model, który opisuje Przypadek 2.
Badana zmienna ma rozkład N(m,s), nieznane m, nieznane s.
Estymujemy s2.
Niech X1,L,Xn będzie próbą losową z tego rozkładu.
9
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Przy budowie przedziału ufności posłużymy się statystyką
(n -1)S2
, która ma rozkład c2(n -1) (por. Wykład 3).
s2
Niech ca / 2,n-1 i c1-a / 2,n-1 oznaczają odpowiednie kwantyle
z rozkładu c2(n -1). Zatem
Pms[ca / 2,n-1 Ł (n -1)S2 / s2 Ł c1-a / 2,n-1] =1- a
Stąd
ć
(n -1)S2 (n -1)S2
Pms Ł s2 Ł =1- a
c1-a / 2,n-1 ca / 2,n-1
Ł ł
Zatem przedziałem ufności dla s2 jest
ć
(n -1)S2 (n -1)S2
,
c1-a / 2,n-1 ca / 2,n-1
Ł ł
Natomiast przedział ufności dla odchylenia standardowego s
przyjmuje postać
ć
(n -1)S2 (n -1)S2
,
c1-a / 2,n-1 ca / 2,n-1
Ł ł
Przykład 3. W celu zbadania zróżnicowania płac (brutto) w
pewnej firmie wybrano losowo 20 pracowników i zbadano ich
miesięczne zarobki. Podać realizację 95% przedziału ufności
dla wariancji i odchylenia standardowego całej populacji
pracowników firmy, jeżeli wariancja (s2) obliczona z próby
wynosiła 0.313.
Dane: n = 20, = 0.05, s2 = 0.313.
Wartości kwantyli wyznaczonych z tablic wynoszą:
ca / 2,n-1 = 8.907, c1-a / 2,n-1 = 32.852
10
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Zatem realizacja 95% przedziału ufności dla wariancji
to przedział:
ć
(n -1)s2 (n -1)s2 190.313 190.313
, = [ , ] [0.18,0.668]
c1-a / 2,n-1 ca / 2,n-1 32.852 8.907
Ł ł
95% realizacją przedziału ufności dla odchylenia
standardowego jest przedział [0.424, 0.817].
3.Przedział ufności dla ilorazu wariancji
Rozważmy dwie niezależne próby X1,X2,L,Xn
i Y1,Y2,L,Ym gdzie Xi ~ N(mX,sX) Yi ~ N(mY,sY)
Załóżmy, że nieznane są parametry: mX,sX , mY,sY.
s2
Y
Zbudujemy przedział ufności dla ilorazu
s2
X
Zadanie takie pojawia się np. wówczas gdy chcemy porównać
dokładność pomiarów dokonanych dwoma przyrządami.
Statystyki X, i S2 określone dla próby X1,X2,L,Xn oraz
X
Y, i S2 określone dla próby Y1,Y2,L,Ym
Y
Z wykładu 3 wiadomo, że
S2 s2
X Y
~F(n-1,m-1) rozkład F-Snedecora z
S2 s2
Y X
(n-1) stopniami swobody licznika i (m-1)- stopniami
swobody mianownika.
Niech f1 i f2 oznaczają odpowiednio kwantyle rzędu a / 2
i 1-a / 2 z rozkładu F(n-1,m-1).
f1 = F(a / 2,n-1,m-1), f2 = F(1-a / 2,n-1,m-1)
Z definicji kwantyli mamy więc
11
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
S2 s2
X Y
Pm (f1 Ł Ł f2) = 1- a
xm ysxsy
S2 s2
Y X
Stąd po przekształceniu otrzymujemy
S2 s2 S2
Y
Pm (f1 Y Ł Ł f2 Y ) = 1- a.
xm ysxsy
S2 s2 S2
X X X
(Warto pamiętać (np. przy korzystaniu z tablic), że kwantyle
dowolnego ustalonego rozkładu F są związane zależnością
1/ , .
Ostatecznie przedział ufności na poziomie 1- dla ilorazu
s2
Y
wariancji przybiera postać
s2
X
S2 S2
[(f1 Y , f2 Y ]
S2 S2
X X
Przykład. Automat produkuje pewne detale, których długości
mają rozkład normalny. Dokonano nowego ustawienia
automatu. Zakładamy, że zmiana nie naruszyła typu rozkładu.
Zbudować 90% przedział ufności dla ilorazu wariancji
długości z ustawień po zmianie i przed zmianą , jeżeli w dwu
niezależnych próbkach o 10 pomiarach przed zmianą
ustawienia i 10 po zmianie, wariancje długości wynosiły
odpowiednio 4cm i 6cm.
Rozwiązanie. Niech oznacza wariancje w próbce przed
zmianą, po zmianie. Zatem =4,
12
Mat. Statystyka.Wykład 8. (2013 L) R. Rempała. Materiały dydaktyczne
Odczyt z tablic kwantyla rzędu 0.95 z rozkładu F-Snedecora dla
rzędu (9,9) daje: F(1-a / 2,9,9) =2.98 . Zatem (F(1-a / 2,9,9))-1 = 0.33.
s2
Y
Realizacją 90% przedziału ufności dla ilorazu wariancji
s2
X
jest więc przedział [0.33 (6/4). 2.98 (6/4)]=[0.495, 4.47].
13
Wyszukiwarka
Podobne podstrony:
Mat Stat WykĹ 6 7 Est c d (2013L)Mat Stat WykĹ? 2 ( 2013L)Mat Stat WykĹ? 3 (2013L)(1)Mat Stat WykĹ 7b Es c d (2013L)Mat Stat WykĹ? 5 Ws Estym ( 2013L)Mat Stat WykĹ? 1 ( 2013L)Mat Bud wykMet mat i stat w inz chem W 1Met mat i stat w inz chem W 2Met mat i stat w inz chem W 3Met mat i stat w inz chem W 5Met mat i stat w inz chem W 4Mat Bud wykMat Bud wykMat Bud wykMat WIP Wyk?26Mat Bud wykstat wyk zaocz3więcej podobnych podstron