informatyka II w5


Centralne twierdzenie graniczne
Przedział ufności
Wykład V
(06.12.2010)
Centralne Twierdzenie Graniczne
Dla dużych prób (n>30)
mm=m sm=s/ n
Prawo wielkich liczb
Jeżeli pobieramy kolejno próby losowe o liczebności n
z populacji o dowolnym rozkładzie i o średniej m i wariancji s2,
wtedy ze wzrostem n, rozkład statystyki dąży do rozkładu
normalnego o średniej m i wariancji s2/n.
Co to oznacza?
Wiele zjawisk można przybliżyć rozkładem normalnym.
ź
źx =m
s = s/
n
x
źx
Estymacja punktowa  jest to punktowe oszacowanie
wartości szukanego parametru rozkładu.
Punktowe oszacowanie oznacza tutaj, że uzyskujemy
konkretną wartość liczbową, nie zaś przedział liczbowy,
jak dzieje się to w przypadku estymacji przedziałowej.
Metody estymacji punktowej sprowadzają się do
wyznaczenia odpowiednią metodą estymatora
szacowanego parametru.
Estymacja punktowa nie daje oceny dokładności
oszacowania nieznanego parametru q rozkładu populacji
generalnej.
Estymacja przedziałowa  konstrukcja losowego przedziału
pokrywającego z dużym prawdopodobieństwem prawdziwą
wartość parametru populacji.
Estymator przedziałowy jest wyznaczany przez dwie
zmienne losowe, w przeciwieństwie do estymatora
punktowego, który jest pojedynczą zmienną losową.
Przedział ufności jest podstawowym narzędziem
estymacji przedziałowej.
Pojęcie to zostało wprowadzone do statystyki przez
amerykańskiego matematyka polskiego pochodzenia
Jerzego Spławę-Neymana.
Niech cecha X ma rozkład w populacji z nieznanym parametrem
. Z populacji wybieramy próby losowe (X1, X2, ..., Xn), na
podstawie których wyznaczmy przedział ufności ( - 1,  + 2) o
współczynniku ufności 1-ą. Przedział ( - 1,  + 2) spełnia
warunek:
P(1 <  < 2) = 1 - ą
gdzie 1 i 2 są funkcjami wyznaczonymi w oparciu o wyniki
otrzymane dla prób losowych.
Wzrost całej populacji studentów (cecha X) przybiera rozkład o
nieznanej wartości średniej (nieznany parametr ).
Na podstawie pomiarów przeprowadzonych na próbach można
wyznaczyć granice przedziału ufności (1 i 2).
W wyznaczonym przedziale prawdopodobieństwo występowania
nieznanego parametru  wynosi 1 - ą
Poziom ufności - (1  ą) określa prawdopodobieństwo, że
rzeczywista wartość parametru  w populacji znajduje się w
wyznaczonym przedziale ufności.
Im większa wartość tego współczynnika istotności ą, tym
szerszy przedział ufności, a więc mniejsza dokładność
estymacji parametru. Im mniejsza wartość 1 - ą, tym większa
dokładność estymacji, ale jednocześnie tym większe
prawdopodobieństwo popełnienia błędu.
Przyjmując poziom istotności 0.05, zakłada się, że w 95%
średnia z populacji mieści się w wyznaczonym na podstawie
analizy prób przedziale ufności (1 i 2).
Wybór odpowiedniego współczynnika jest więc kompromisem
pomiędzy dokładnością estymacji a ryzykiem błędu.
W praktyce poziom ufności 1 - ą przyjmuje zazwyczaj
wartości: 0.99; 0.95 lub 0.90, zależnie od parametru s.
Do wyznaczenia granic przedziału ufności przy zadanym
poziomie ufności 1- ą konieczna i wystarczająca jest
x

znajomość rozkładu estymatora .
Zgodnie z Centralnym Twierdzeniem Granicznym
Jeżeli pobieramy kolejno próby losowe o liczebności n z
populacji o wymiarze N i o rozkładzie normalnym, ze średnią ź
x
i wariancją s2, to rozkład średniej statystyki będzie
źx
rozkładem normalnym o średniej i wariancji s2/n, pod
warunkiem, że n/NŁ 0.05.
Estymacja przedziałowa średniej populacji
w przypadku dużej próby.
- Rozmiar próby jest ł30;
x
- Zgodnie z centralnym twierdzeniem granicznym wartość
przyjmuje rozkład normalny niezależnie od rozkładu w populacji;
- Na podstawie powyższego twierdzenia odchylenie standardowe
wartości wynosi s = s/ ;
n
x
x
s
- Jeżeli odchylenie standardowe populacji, tzn. jest wartością
nieznaną, w takiej sytuacji używa się odchylenia standardowego
n
próby s = s/ .
x
W tym przypadku s jest estymatorem punktowym s ;
x x
Przedział ufności parametru ź dla dużej próby
Dla (1-a)100% poziomu ufności przedział ufności wynosi:
jeżeli jest znane
ą
s x
x z
s
lub
jeżeli jest nieznane
ą
s x
x z
s
gdzie
s = s/ s x = s/
n n
x
Zacieniowana powierzchnia
0.6826
Zacieniowana powierzchnia
0.9544
Zacieniowana powierzchnia
0.9974
_
z.sx
mx
x
_
_
_
s
m x
x = + z
x
x-
m x
z=
s x
s x z s
s x
Wielkość z , lub jeżeli jest nieznane,
w wyrażeniu na przedział ufności nosi nazwę
maksymalnego błędu estymacji, E.
Jest to wielkość, o która jest pomniejszana i powiększana
x m.
wartość w celu uzyskania przedziału ufności dla zmiennej
Wartość z w wyrażeniu na przedział ufności pochodzi z tabeli
dystrybuanty rozkładu normalnego przy założonym poziomie
ufności 1-a.
m.
Sposób konstruowania 95% przedziału ufności dla parametru
95% przedział ufności oznacza, że całkowita powierzchnia
x
pod krzywa rozkładu normalnego dla estymatora
pomiędzy dwoma punktami wynosi 95%.
W celu obliczenia wartości z dla założonego przedział
ufności należy podzielić przez 2, tzn. 0.95/2=0.4750
Zmienną losową X zastępujemy
zmienną standaryzowaną z, która ma rozkład N(0,1)
-
m
x
-
m
x
x
u = x s z =
s x
s
2
2
1
1 z
= -
= -
( )
)
f ; , exp
f z;0 1 exp
,
2
2
2 p
2p
z = zmienna standaryzowana
Powierzchnia pod krzywa rozkładu normalnego N(0,1) od 0 do z
z
Z
Zacieniowana powierzchnia
wynosi 95% całkowitej powierzchni
N(0,1)
Powierzchnia na skrzydłach
Wydawnictwo planowało wydać nowy podręcznik akademicki. Zanim podjęto
decyzję o cenie postanowiono przeanalizować rynek. W tym celu pracownicy
wydawnictwa wybrali losowo 36 podręczników i przeprowadzili analizę ich ceny.
Wartość średnia wyniosła $70.50. Ponadto dotarli do informacji, że odchylenie
standardowe dla wszystkich podręczników wynosi $4.5.
x=$70.50; s=$4.50
n=36;
- Podaj estymator punktowy średniej ceny wszystkich podręczników. Ile wynosi
wartość maksymalnego błędu estymacji, przy założeniu 95% przedziale ufności?
s 4.50
sx = = = 0.75; margines blędu = ą1.96 *(0.75)
6
n
Wynik= $70.5 i $1.47
Podaj z 90% prawdopodobieństwem granice przedziału dla wartości średniej
wszystkich książek.
Wynik= od $69.26 do $71.74
Testowanie hipotez składa się z następujących etapów:
1. Przyjęcie założeń;
2. Otrzymanie rozkładu z próby;
3. Wyznaczenie poziomu istotności i obszaru krytycznego;
4. Wyliczenie statystyki testu;
5. Podjecie decyzji.


Wyszukiwarka

Podobne podstrony:
informatyka II w3
T II W5 Stale sprezynowe 27 10 2012
informatyka ii w1
STEROWANIE DOSTĘPEM DO SYSTEMU INFORMATYCZNEGO II
informator ii 1
Zagadnienia do zaliczenia przedmiotu Informatyka II
informatyka II w1
informatyka excel 2007 pl leksykon kieszonkowy wydanie ii curt frye ebook
informatyka internet ilustrowany przewodnik wydanie ii radoslaw sokol ebook
Tłumaczenia (80) Informacji Renault Scenic II
Baptystyczny Serwis Informacyjny www baptysci pl Prymat Rzymu z perspektywy historycznej (część I
Tłumaczenia Informacji Renault Scenic II(1)
mp informatyka styczeń 2009 II
Tłumaczenia Informacji Renault Scenic II
Zastosowania Informatyki w Medycynie czesc II
Informatyka arkusz rozsz cz II
Informatyka, sem II (lab komputerowe) wszystkie bloki na kolokwium (Więckiewicz)

więcej podobnych podstron