ROZKAADY STATYSTYK Z PRÓBY
Współautorką poni\szych
slajdów jest
dr Katarzyna Kocot-Górecka
Losowy dobór próby
" ka\da jednostka populacji generalnej ma dodatnie znane
prawdopodobieństwo znalezienia się w próbie,
" istnieje mo\liwość ustalenia prawdopodobieństwa znalezienia się
w próbie dla ka\dego zespołu elementów populacji.
Losowanie proste: wszystkie elementy mają jednakowe
prawdopodobieństwo dostania się do próby i
prawdopodobieństwo dostania się do próby poszczególnych
elementów nie zmienia się w trakcie losowania.
PRÓBA LOSOWA
Próbą losową prostą nazywamy ciąg n-zmiennych
losowych niezależnych i posiadających jednakowe rozkłady
takie jak rozkład zmiennej losowej X w populacji generalnej
Populacja generalna Próba losowa
STATYSTYKA
Statystyką (z próby) nazywamy zmienną losową Zn będącą
funkcją zmiennych losowych X , X , X ,& X stanowiących
1 2 3 n
próbę losową
Przykłady: wyznaczone z danych z próby losowej
średnia arytmetyczna,
częstość względna,
wariancja
Parametry
Statystyki
populacji
z próby
Średnia arytmetyczna Wartość oczekiwana- E(X)
X
Wariancja S2 Wariancja D2(X)
Odchylenie standardowe S Odchylenie standardowe
D(X)
Prawdopodobieństwo p
Częstość względna w = x/n
STATYSTYKA
Statystyka jako funkcja zmiennych losowych sama jest zmienną
losową, która posiada pewien rozkład
Rozkład statystyki Zn =z(X1 , X2 , X3,& Xn) nazywa się
rozkładem z próby
Rozkład statystyki z próby zale\y od:
" rozkładu zmiennej losowej X w populacji generalnej
" liczebności z próby
STATYSTYKA
Rozkład statystyki z próby przy ustalonym n nazywamy
dokładnym rozkładem statystyki.
Rozkłady dokładne są wykorzystywane w przypadku tzw.
małych prób.
Rozkład graniczny statystyki (o ile taki istnieje) jest
wykorzystywany, gdy nie mo\na znalezć dokładnego
rozkładu statystyki z próby.
Wymaga to tzw. du\ej próby.
ROZKAAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY
DLA POPULACJI NORMALNEJ ZE ZNANYM
ODCHYLENIEM STANDARDOWYM
Zało\enia
- cecha X ma w populacji rozkład normalny ze średnią m i
odchyleniem standardowym ,
- z populacji pobieramy n-elementową próbę losową prostą (X1,
X2,...,Xn).
X2,...,Xn).
n
1
Średnia arytmetyczna z próby X = Xi posiada przy powy\szych
"
n
i=1
zało\eniach rozkład normalny ze średnią E(X )= m i odchyleniem
standardowym D(X )= :
n
ł
X : Nłm;
ł ł
n
ł łł
ROZKAAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY
DLA POPULACJI NORMALNEJ ZE ZNANYM
ODCHYLENIEM STANDARDOWYM
ROZKAAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY
DLA POPULACJI NORMALNEJ ZE ZNANYM
ODCHYLENIEM STANDARDOWYM
yródło: A.D.Aczel, Statystyka w zarządzaniu, PWN, Warszawa, 2005
ROZKAAD ŚREDNIEJ ARYTMETYCZNEJ Z PRÓBY
DLA POPULACJI NORMALNEJ Z NIEZNANYM
ODCHYLENIEM STANDARDOWYM
William Sealy Gosset
(1876-1937).
W.S.Gosset odkrył w 1908r rozkład statystyczny zależny od
pomiarów xi, a niezależny od wariancji zwany rozkładem t-
Studenta.
Rozkład t-Studenta o liczbie stopni swobody v
gdzie
=n-1
Parametry:
E(t)= 0,
n -1
D(t)= =
- 2 n - 3
PRZYKAAD
W browarze butelki są napełniane zgodnie z rozkładem normalnym o wartością
oczekiwaną 500 [mln]. Jakie jest prawdopodobieństwo, że średnia zawartość w 16
losowo wybranych butelkach będzie wyższa niż 515 [mln], skoro w tak samo licznej
próbie odchylenie standardowe wyniosło 23[mln].
X: N(500 ; ) n=16 v=16-1
ką 0,2 0,1 0,05 0,02 0,01 0,002 0,001
Wartości krytyczne rozkładu t-Studenta
1 3,078 6,314 12,706 31,821 63,66 318,29 636,58
2 1,886 2,920 4,303 6,965 9,925 22,328 31,600
3 1,638 2,353 3,182 4,541 5,841 10,214 12,924
4 1,533 2,132 2,776 3,747 4,604 7,173 8,610
5 1,476 2,015 2,571 3,365 4,032 5,894 6,869
6 1,440 1,943 2,447 3,143 3,707 5,208 5,959
7 1,415 1,895 2,365 2,998 3,499 4,785 5,408
1-ą
8 1,397 1,860 2,306 2,896 3,355 4,501 5,041
9 1,383 1,833 2,262 2,821 3,250 4,297 4,781
10 1,372 1,812 2,228 2,764 3,169 4,144 4,587
-tą,v tą,v
11 1,363 1,796 2,201 2,718 3,106 4,025 4,437
12 1,356 1,782 2,179 2,681 3,055 3,930 4,318
13 1,350 1,771 2,160 2,650 3,012 3,852 4,221
14 1,345 1,761 2,145 2,624 2,977 3,787 4,140
15 1,341 1,753 2,131 2,602 2,947 3,733 4,073
16 1,337 1,746 2,120 2,583 2,921 3,686 4,015
16 1,337 1,746 2,120 2,583 2,921 3,686 4,015
17 1,333 1,740 2,110 2,567 2,898 3,646 3,965
18 1,330 1,734 2,101 2,552 2,878 3,610 3,922
P( t e" t ) = ą
P( t e" tą ,kv) = ą
19 1,328 1,729 2,093 2,539 2,861 3,579 3,883
20 1,325 1,725 2,086 2,528 2,845 3,552 3,850
21 1,323 1,721 2,080 2,518 2,831 3,527 3,819
22 1,321 1,717 2,074 2,508 2,819 3,505 3,792
23 1,319 1,714 2,069 2,500 2,807 3,485 3,768
24 1,318 1,711 2,064 2,492 2,797 3,467 3,745
v = 16-1=15
25 1,316 1,708 2,060 2,485 2,787 3,450 3,725
26 1,315 1,706 2,056 2,479 2,779 3,435 3,707
27 1,314 1,703 2,052 2,473 2,771 3,421 3,689
28 1,313 1,701 2,048 2,467 2,763 3,408 3,674
29 1,311 1,699 2,045 2,462 2,756 3,396 3,660
30 1,310 1,697 2,042 2,457 2,750 3,385 3,646
40 1,303 1,684 2,021 2,423 2,704 3,307 3,551
60 1,296 1,671 2,000 2,390 2,660 3,232 3,460
120 1,289 1,658 1,980 2,358 2,617 3,160 3,373
" 1,282 1,645 1,960 2,326 2,576 3,090 3,290
Rozkład różnicy średnich arytmetycznych dla dwóch prób z populacji
normalnych przy znanych odchyleniach
standardowych
Założenia
- cechy X1 i X2 mają w dwóch populacjach rozkłady normalne odpowiednio N(m1, 1)
oraz N(m2, 2) ze znanymi odchyleniami standardowymi,
- z populacji pobieramy niezależnie próby liczące odpowiednio n1 i n2 elementów.
Różnica średnich arytmetycznych z prób X - X ma rozkład
Różnica średnich arytmetycznych z prób X - X 2 ma rozkład
1
1 2
m1 - m2
normalny z wartością oczekiwaną
2
i odchyleniem standardowym 1 2
2
+ :
n1 n2
2 2
ł ł
1
2
ł
X1 - X2 : Nłm1 - m2, +
ł
n1 n2 ł
ł łł
PRZYKAAD
Rozkłady czasu kobiet i mężczyzn są rozkładami normalnymi o parametrach odpowiednio
N(7;1,5) i N(8; 2). Jakie jest prawdopodobieństwo, że w grupie losowo wybranych 25 kobiet i
tyle samo mężczyzn średni czas snu kobiet będzie o 15 minut (0,25 godz.) dłuższy niż
mężczyzn.
Xk: N(7 ; 1) nk =25, Xm: N(8 ; 1,5) nm =25,
Rozkład różnicy średnich arytmetycznych dla dwóch prób z populacji
normalnych przy nieznanych (ale jednakowych) odchyleniach standardowych
Założenia
- cechy X1 i X2 mają w dwóch populacjach rozkłady normalne odpowiednio N(m1, )
oraz N(m2, ) z nieznanym (jednakowym) odchyleniem standardowym,
- z populacji pobieramy niezależnie próby liczące odpowiednio n1 i n2 elementów.
Do wnioskowania o różnicy pomiędzy średnimi korzystamy ze statystyki t-
X - X
1 2
Studenta o postaci:
Studenta o postaci:
(X - X )- (m - m )
1 2 1 2
(n -1)s2 + (n -1)s2
t = 1 1 2 2
gdzie
s2 =
p
1 1
ł
n + n - 2
1 2
s2 ł +
p
ł ł
n n
ł 1 2 łł
v = n1 + n2 -2
Rozkłady graniczne statystyk z próby
1. Założenia:
zmienna losowa X ma rozkład dwumianowy z parametrami n i p,
X
przy wnioskowaniu o parametrze p korzystamy ze statystyki W =
n
(czyli obserwowanej przy n doświadczeniach częstości
sukcesów) posiadającej rozkład dwumianowy o parametrach
p(1- p)
D(W ) =
E(W) = p
n
Z twierdzenia de Moivre a-Laplace a wynika, że przy
n "
statystka W ma rozkład normalny ze średnią p i
odchyleniem standardowym
p(1- p)
n
Czyli:
ł ł
p(1- p)ł
ł
W : Nł p,
ł
n
ł łł
Rozkłady graniczne statystyk z próby
2. Założenia:
zmienne losowe X1 i X2 mają rozkłady dwumianowe z parametrami,
odpowiednio, n1 , p1 i n2 , p2
X X
1 2
Statystyka , czyli różnica częstości sukcesów z
W -W = -
1 2
n n
1 2
dwóch prób ma, przy i graniczny rozkład normalny
n1 " n2 "
p1(1- p1) p2(1- p2)
p1(1- p1) p2(1- p2)
p - p
p1 - p2
+
+
ze średnią i odchyleniem standardowym
n1 n2
Czyli:
ł ł
p1(1- p1) p2(1- p2)
ł
W1 -W2 : Nł p1 - p2; +
ł ł
n1 n2
ł łł
PRZYKAAD
Z badań przeprowadzonych przez Instytut Książki i Czytelnictwa Biblioteki Narodowej w
2002r wynika, że zdecydowanie częściej po książkę sięgają kobiety niż mężczyzni -
odpowiednio 60% oraz 51%, czyli o 9 punktów procentowych więcej. Jakie jest
prawdopodobieństwo, że w grupie losowo wybranych 200 kobiet i 200 mężczyzn różnica w
czytelnictwie będzie mniejsza niż 1 punkt procentowy na korzyść kobiet.
ł ł
p (1- p ) p (1- p )
1 1 2 2
ł ł
W -W : N p - p ; +
1 2 1 2
ł ł
n n
1 2
ł łł
Rozkłady graniczne statystyk z próby
3. Założenia:
Zmienna losowa X ma dowolny rozkład ze średnią m i odchyleniem
standardowym
Z twierdzenia Lindeberga-LŁvy go wynika, że rozkład
średniej z próby zmierza, przy , do rozkładu normalnego
n "
z wartością oczekiwaną m i odchyleniem standardowym :
n
Czyli :
ł
X : Nłm;
ł ł
n
ł łł
Rozkłady graniczne statystyk z próby
4. Założenia:
Zmienne losowe X1 i X2 mają dowolne rozkłady z parametrami,
odpowiednio, m1 i 1 oraz m2 i 2 .
Z twierdzenia Lindeberga-LŁvy go i własności addytywności rozkładów
X1 - X2
normalnych wynika, że różnica średnich z próby
n1 " n2 "
ma, przy oraz , graniczny rozkład normalny z parametrami
2 2
1 2
m1 - mi :
+
2
n n
1 2
Czyli :
2 2
ł ł
1
2
ł
X1 - X : Nłm1 - m2; +
2
ł
n1 n2 ł
ł łł
Wyszukiwarka
Podobne podstrony:
WYKLAD 6 stud 13wyklad 3 STUDWykład 4 studwyklad 7 STUDwyklad 1 STUDwyklad 2 STUDwyklad 9 STUDWyklad 1 CIAGI 12 wer studWyklad 8?LKA OZNACZONA Biol wer studochr srod wyklad 1 biologia dla studBiomedyka Pedagog 1 Wykład 04 studWYKŁAD 3 el aut3 studJBZ Wyklad2 dla studPsychopatologia UW Wykład III RS cz II dla studWyklad ZMIENNA LOSOWA Biol 2012 wer studArchKomp CISC RISC Wyklad Gotowy PKos SKoz StudWyklad 6?LKA NIEOZNACZONA Biol wer studwięcej podobnych podstron