Centralne twierdzenie graniczne
Przedział ufności
Wykład V
(06.12.2010)
Centralne Twierdzenie Graniczne
Dla dużych prób (n>30)
mm=m sm=s/ n
Prawo wielkich liczb
Jeżeli pobieramy kolejno próby losowe o liczebności n
z populacji o dowolnym rozkładzie i o średniej m i wariancji s2,
wtedy ze wzrostem n, rozkład statystyki dąży do rozkładu
normalnego o średniej m i wariancji s2/n.
Co to oznacza?
Wiele zjawisk można przybliżyć rozkładem normalnym.
ź
źx =m
s = s/
n
x
źx
Estymacja punktowa jest to punktowe oszacowanie
wartości szukanego parametru rozkładu.
Punktowe oszacowanie oznacza tutaj, że uzyskujemy
konkretną wartość liczbową, nie zaś przedział liczbowy,
jak dzieje się to w przypadku estymacji przedziałowej.
Metody estymacji punktowej sprowadzają się do
wyznaczenia odpowiednią metodą estymatora
szacowanego parametru.
Estymacja punktowa nie daje oceny dokładności
oszacowania nieznanego parametru q rozkładu populacji
generalnej.
Estymacja przedziałowa konstrukcja losowego przedziału
pokrywającego z dużym prawdopodobieństwem prawdziwą
wartość parametru populacji.
Estymator przedziałowy jest wyznaczany przez dwie
zmienne losowe, w przeciwieństwie do estymatora
punktowego, który jest pojedynczą zmienną losową.
Przedział ufności jest podstawowym narzędziem
estymacji przedziałowej.
Pojęcie to zostało wprowadzone do statystyki przez
amerykańskiego matematyka polskiego pochodzenia
Jerzego Spławę-Neymana.
Niech cecha X ma rozkład w populacji z nieznanym parametrem
. Z populacji wybieramy próby losowe (X1, X2, ..., Xn), na
podstawie których wyznaczmy przedział ufności ( - 1, + 2) o
współczynniku ufności 1-ą. Przedział ( - 1, + 2) spełnia
warunek:
P(1 < < 2) = 1 - ą
gdzie 1 i 2 są funkcjami wyznaczonymi w oparciu o wyniki
otrzymane dla prób losowych.
Wzrost całej populacji studentów (cecha X) przybiera rozkład o
nieznanej wartości średniej (nieznany parametr ).
Na podstawie pomiarów przeprowadzonych na próbach można
wyznaczyć granice przedziału ufności (1 i 2).
W wyznaczonym przedziale prawdopodobieństwo występowania
nieznanego parametru wynosi 1 - ą
Poziom ufności - (1 ą) określa prawdopodobieństwo, że
rzeczywista wartość parametru w populacji znajduje się w
wyznaczonym przedziale ufności.
Im większa wartość tego współczynnika istotności ą, tym
szerszy przedział ufności, a więc mniejsza dokładność
estymacji parametru. Im mniejsza wartość 1 - ą, tym większa
dokładność estymacji, ale jednocześnie tym większe
prawdopodobieństwo popełnienia błędu.
Przyjmując poziom istotności 0.05, zakłada się, że w 95%
średnia z populacji mieści się w wyznaczonym na podstawie
analizy prób przedziale ufności (1 i 2).
Wybór odpowiedniego współczynnika jest więc kompromisem
pomiędzy dokładnością estymacji a ryzykiem błędu.
W praktyce poziom ufności 1 - ą przyjmuje zazwyczaj
wartości: 0.99; 0.95 lub 0.90, zależnie od parametru s.
Do wyznaczenia granic przedziału ufności przy zadanym
poziomie ufności 1- ą konieczna i wystarczająca jest
x
znajomość rozkładu estymatora .
Zgodnie z Centralnym Twierdzeniem Granicznym
Jeżeli pobieramy kolejno próby losowe o liczebności n z
populacji o wymiarze N i o rozkładzie normalnym, ze średnią ź
x
i wariancją s2, to rozkład średniej statystyki będzie
źx
rozkładem normalnym o średniej i wariancji s2/n, pod
warunkiem, że n/NŁ 0.05.
Estymacja przedziałowa średniej populacji
w przypadku dużej próby.
- Rozmiar próby jest ł30;
x
- Zgodnie z centralnym twierdzeniem granicznym wartość
przyjmuje rozkład normalny niezależnie od rozkładu w populacji;
- Na podstawie powyższego twierdzenia odchylenie standardowe
wartości wynosi s = s/ ;
n
x
x
s
- Jeżeli odchylenie standardowe populacji, tzn. jest wartością
nieznaną, w takiej sytuacji używa się odchylenia standardowego
n
próby s = s/ .
x
W tym przypadku s jest estymatorem punktowym s ;
x x
Przedział ufności parametru ź dla dużej próby
Dla (1-a)100% poziomu ufności przedział ufności wynosi:
jeżeli jest znane
ą
s x
x z
s
lub
jeżeli jest nieznane
ą
s x
x z
s
gdzie
s = s/ s x = s/
n n
x
Zacieniowana powierzchnia
0.6826
Zacieniowana powierzchnia
0.9544
Zacieniowana powierzchnia
0.9974
_
z.sx
mx
x
_
_
_
s
m x
x = + z
x
x-
m x
z=
s x
s x z s
s x
Wielkość z , lub jeżeli jest nieznane,
w wyrażeniu na przedział ufności nosi nazwę
maksymalnego błędu estymacji, E.
Jest to wielkość, o która jest pomniejszana i powiększana
x m.
wartość w celu uzyskania przedziału ufności dla zmiennej
Wartość z w wyrażeniu na przedział ufności pochodzi z tabeli
dystrybuanty rozkładu normalnego przy założonym poziomie
ufności 1-a.
m.
Sposób konstruowania 95% przedziału ufności dla parametru
95% przedział ufności oznacza, że całkowita powierzchnia
x
pod krzywa rozkładu normalnego dla estymatora
pomiędzy dwoma punktami wynosi 95%.
W celu obliczenia wartości z dla założonego przedział
ufności należy podzielić przez 2, tzn. 0.95/2=0.4750
Zmienną losową X zastępujemy
zmienną standaryzowaną z, która ma rozkład N(0,1)
-
m
x
-
m
x
x
u = x s z =
s x
s
2
2
1
1 z
= -
= -
( )
)
f ; , exp
f z;0 1 exp
,
2
2
2 p
2p
z = zmienna standaryzowana
Powierzchnia pod krzywa rozkładu normalnego N(0,1) od 0 do z
z
Z
Zacieniowana powierzchnia
wynosi 95% całkowitej powierzchni
N(0,1)
Powierzchnia na skrzydłach
Wydawnictwo planowało wydać nowy podręcznik akademicki. Zanim podjęto
decyzję o cenie postanowiono przeanalizować rynek. W tym celu pracownicy
wydawnictwa wybrali losowo 36 podręczników i przeprowadzili analizę ich ceny.
Wartość średnia wyniosła $70.50. Ponadto dotarli do informacji, że odchylenie
standardowe dla wszystkich podręczników wynosi $4.5.
x=$70.50; s=$4.50
n=36;
- Podaj estymator punktowy średniej ceny wszystkich podręczników. Ile wynosi
wartość maksymalnego błędu estymacji, przy założeniu 95% przedziale ufności?
s 4.50
sx = = = 0.75; margines blędu = ą1.96 *(0.75)
6
n
Wynik= $70.5 i $1.47
Podaj z 90% prawdopodobieństwem granice przedziału dla wartości średniej
wszystkich książek.
Wynik= od $69.26 do $71.74
Testowanie hipotez składa się z następujących etapów:
1. Przyjęcie założeń;
2. Otrzymanie rozkładu z próby;
3. Wyznaczenie poziomu istotności i obszaru krytycznego;
4. Wyliczenie statystyki testu;
5. Podjecie decyzji.
Wyszukiwarka
Podobne podstrony:
informatyka II w3T II W5 Stale sprezynowe 27 10 2012informatyka ii w1STEROWANIE DOSTĘPEM DO SYSTEMU INFORMATYCZNEGO IIinformator ii 1Zagadnienia do zaliczenia przedmiotu Informatyka IIinformatyka II w1informatyka excel 2007 pl leksykon kieszonkowy wydanie ii curt frye ebookinformatyka internet ilustrowany przewodnik wydanie ii radoslaw sokol ebookTłumaczenia (80) Informacji Renault Scenic IIBaptystyczny Serwis Informacyjny www baptysci pl Prymat Rzymu z perspektywy historycznej (część ITłumaczenia Informacji Renault Scenic II(1)mp informatyka styczeń 2009 IITłumaczenia Informacji Renault Scenic IIZastosowania Informatyki w Medycynie czesc IIInformatyka arkusz rozsz cz IIInformatyka, sem II (lab komputerowe) wszystkie bloki na kolokwium (Więckiewicz)więcej podobnych podstron