4 Statystyka opisowa i rozkład normalny


Statystyka w jakości
1
zmienność
Losowe naturalne
PROCES
Losowe specjalne
- procesy masowe
- badania 100%
- procesy ciągłe
- badania statystyczne
- du\ych serii
2
MODELE
ZDETERMINOWANE
LOSOWE
zdarzenie B1
zdarzenie B
zdarzenie A
zdarzenie A
zdarzenie B2
zdarzenie B3
funkcja
funkcja
funkcja
funkcja
S=V*t
S=V*t
S=V*t
S=V*t
prawdopodobieństwa
prawdopodobieństwa
prawdopodobieństwa
prawdopodobieństwa
3
modele
właściwości procesu (cechy): średnica wałka, cię\ar puszki,
PROCES
%zawartości a w b
ANALIZA
POMIAR WNIOSKOWANIE
STATYSTYCZNA
4
Podział cech statystycznych:
cechy
cechy
cechy
cechy
jakościowe
jakościowe
jakościowe
jakościowe
mierzalne
mierzalne
mierzalne
mierzalne
(niemierzalne)
(niemierzalne)
(niemierzalne)
(niemierzalne)
skokowe
ciągłe porządkowe
(dyskretne)
nominalne
5
Prawdopodobieństwo w ujęciu klasycznym
&!  zbiór wszystkich zdarzeń elementarnych
A  zdarzenie
k  liczba zdarzeń sprzyjających zajściu A
m  liczba wszystkich mo\liwych zdarzeń
P(A) = k/m
Liczba wyra\ająca przekonanie, \e powtarzając proces
losowy wielokrotnie, otrzyma się określoną wartość
zmiennej losowej
6
Własności
1) P(A) e" 0
2) P(&!) = 1
3) Je\eli A-1 jest zdarzeniem przeciwnym
do A (dopełnieniem) to P(A) = 1  P(A-1)
7
Podstawowe pojęcia
Zdarzenie elementarne  konkretna realizacja zmiennej
losowej (np. wynik pomiaru)
Populacja  jest rozumiana jako zbiór wyników wszystkich
pomiarów, którymi jesteśmy zainteresowani.
Próba  jest podzbiorem wyników pomiarów pobranych z
populacji.
Próba losowa  pobieranie próby dokonuje się w sposób
losowy, tj. tak, aby ka\da mo\liwa próba składająca się z n
elementów miała taką samą szansę, \e zostanie wybrana.
Próba reprezentatywna  próbka, której struktura pod
względem badanej charakterystyki nie ró\ni się istotnie od
struktury populacji
8
Opracowanie próby
porządkowanie według wielkości
określenie charakterystycznych punktów
zbioru:
 wartości granicznych
 środkowej wartości
 kwartyli
9
Miary tendencji centralnej:
Mediana
 leży w centrum zbioru w tym sensie, że połowa wyników
znajduje się powyżej, a połowa poniżej jej wartości
(2. kwartyl)
(n+1)Pr/100
Dominanta
 wartość modalna - jest to wartość, która w tym zbiorze
występuje najczęściej
Średnia arytmetyczna (średnia klasyczna)
 zwaną także przeciętną jest sumą wartości wszystkich
wyników podzieloną przez liczebność tego zbioru
1
0
Mediana
dla zbioru o parzystej liczbie danych
xn + xn
+1
2 2
Me =
2
dla zbioru o nieparzystej liczbie danych
Me = xn
2
1,2,3,4,190 średnia = 40, mediana = 3
1
1
Średnia arytmetyczna
próba: populacja:
prób : populacj :
prób : populacj :
prób : populacj :
N  liczebność populacji
n  liczebność próby
 średnia z populacji
X  średnia z próby
  odchylenie standardowe
s  odchylenie standardowe
populacji
próby
PARAMETRY
STATYSTYKI
1
2
Średnia arytmetyczna
średnia prób : średnia populacji:
średnia prób : średnia populacji:
średnia prób : średnia populacji:
średnia próby: średnia populacji:
n N
xi
"x "
i
i=1 i=1
x = =
n N
1
3
interpretacja średniej arytmetycznej:
Średnia z danych streszcza wszystkie informacje w
nich zawarte:
 Mo\e ona być uwa\ana za punkt, w którym skoncentrowała
się cała masa wszystkich wyników obserwacji i który jest
środkiem cię\kości masy.
 Gdyby wszystkie wyniki obserwacji był jednakowe to ka\dy
z nich byłby równy średniej arytmetycznej.
 Wielkość abstrakcyjna.
1
4
Zadanie 1:
Rozpatrzmy dwa zbiory danych:
Zbiór 1: 1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11
Zbiór 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
Obliczyć: średnią zbiorów, medianę i dominantę
1
5
1
6
Miary rozrzutu
Rozstęp:
 w zbiorze wyników obserwacji rozstępem
nazywamy różnicę pomiędzy wartością
największą i najmniejszą
Wariancja:
 w zbiorze wyników wariancją nazywamy
przeciętne kwadratowe odchylenie
poszczególnych wyników od ich średniej
Odchylenie standardowe
 pierwiastek kwadratowy z wariancji
1
7
Wzory
Rozstęp
R = xmax  xmin
Wariancja
próby: populacji:
prób : populacji:
prób : populacji:
prób : populacji:
n N
"(x - x)2 "(x - )2
i i
2
i=1 i=1
s2 =  =
n -1 N
1
8
Odchylenie standardowe
w populacji:
populacji:
populacji:
populacji:
w prób :
próbie:
prób :
prób :
n N
"(x - x)2 "(x - )2
i i
2
i=1 i=1
 =  =
s = s2 =
N
n -1
Zadanie 2
Obliczyć odchylenia standardowe danych z zadania 1
1
9
Grupowanie danych - szeregi
Najczęś
ęściej grupujemy dane w tak zwane szeregi:
ęś
ęś
 Pozycyjny (n<30)
" (sortujemy dane rosnąco lub malejąco i zliczamy ile jest
elementów o tej samej wartości lub cesze)
 Rozdzielczy (ne"30)
" dane grupujemy w klasy, czyli przedziały o ustalonej
wielkości
" możemy w ten sposób określić rozkład częstości danych w
poszczególnych klasach.
" wykres obrazujący rozkład częstości nazywamy
histogramem (wykres słupkowy). Wysokość słupka
reprezentuje częstość, z jaką pojawiły się wyniki obserwacji
należące do klasy reprezentowanej przez słupek. Sąsiednie słupki
mają wspólne boki.
2
0
a b c d e f g
Częstość
Częstości odpowiadają
(liczebność)
prawdopodobieństwu wystąpienia
wartości danej cechy i sumują się
do jedności
Wartości
cechy
[1,4](4,7]
& (27,31]
Szerokość przedziału klasowego
2
1
jak dobrać liczbę klas?
Liczność próbki Ilość przedziałów
n k
30 50 6 10
51 100 7 11
101 200 8 12
201 500 9 15
k =1+3,32*logN
2
2
Zmienne losowe
cecha, którą obserwujemy (mierzymy) jest
zmienną losową (np. średnica, masa)
zmienna losowa - zmienna przyjmująca ró\ne
wartości liczbowe, wyznaczone przez los (30,6 ;
30,71 ; 30,78 ; 30,62 itd.)
rozkład prawdopodobieństwa zmiennej losowej
- przyporządkowanie prawdopodobieństw
wszystkim mo\liwym wartościom zmiennej
losowej
zmienne losowe  > model
 dyskretne  funkcja dyskretna (dwumianowy,
Poissona,& )
 ciągłe  funkcja ciągła (normalny, Weibula, itd.)
2
3
Zmienna losowa skokowa (dyskretna)
Rozkładem prawdopodobieństwa zmiennej losowej
skokowej jest tablica, wzór lub wykres, który
przyporządkowuje prawdopodobieństwa ka\dej
mo\liwej wartości zmiennej.
Np.
P(X=x) = p
P(X=1) = 0,1
P(X=2) = 0,4 1
P(X=6) = 0,5
2
4
Przykład
Liczba wad pojawiająca się na linii monta\owej A
F(x)
P(x)
x P(x) F(x)
1
0,3
0 0,1 0,1
1 0,2 0,3
0,2
2 0,3 0,6
0,1
3 0,2 0,8
4 0,1 0,9
0 1 2 3 4 5
0 1 2 3 4 5
5 0,1 1,0
Dystrybuanta
Gęstość prawdopodobieństwa
zmiennej losowej
zm. losowej
1,0
P(1d"xd"3) = P(X=1)+P(X=2)+P(X=3) =F(3)-F(0)
= 0,8-0,1 = 0,7
P(xd"3) = F(3) = 0,8
2
5
dystrybuanta:
 skumulowana funkcja rozkładu zmiennej losowej:
F(x) = P(Xd"x) = ŁP(i) dla id"x
2
6
Przykład rozkładu zmiennej losowej skokowej
Rozkład dwumianowy:
Ciąg identycznych doświadczeń spełniających
następujące warunki:
" Dwa mo\liwe wyniki ka\dego doświadczenia: sukces i
pora\ka
" Prawdopodobieństwo sukcesu (p) pozostaje takie samo od
doświadczenia do doświadczenia. Prawdopodobieństwo
pora\ki q = 1-p.
" Doświadczenia są od siebie niezale\ne
" Liczba sukcesów opisana jest zmienną losową
dwumianową
Zmienna losowa dwumianowa
2
7
Przykład rozkładu zmiennej losowej skokowej
Rozkład dwumianowy:
Doświadczenie polegające na 4 rzutach monetą.
1. Jakie jest prawdopodobieństwo otrzymania
P(X=3)
dokładnie 3 orłów?
2. Jakie jest prawdopodobieństwo, \e nie
P(X=0)
wypadnie \aden orzeł?
3. Jakie jest prawdopodobieństwo, \e wypadnie
P(Xe"1) = 1 - P(X<1)
co najmniej 1 orzeł?)
p - ?
x - ?
n - ?
2
8
Przykład rozkładu zmiennej losowej skokowej
Rozkład dwumianowy:
1. W statystycznej kontroli jakości partia wyrobów zostaje
zaakceptowana jako dobra tylko wtedy, gdy liczba sztuk wadliwych w
stosunku do liczebności całej partii nie przekracza pewnej z góry
ustalonej wartości. Przypuśćmy, \e w du\ej partii wyrobów jest 20%
sztuk wadliwych. Pobrano z niej próbę liczącą 20 sztuk. Procedura
kontrolna przewiduje zaakceptowanie partii wyrobów tylko wtedy, gdy
nie więcej ni\ 2 sztuki wśród 20 oka\ą się wadliwe. Jakie jest
prawdopodobieństwo, \e partia wyrobów nie zostanie zaakceptowana?
p = 0,2, q = 0,8
P(X>2) = 1 - P(Xd"2) = 1 - P(X=0) - P(X=1) - P(X=2) = 1  0,0115  0,0576  0,137 =
= 0,793
2
9
Przykład rozkładu zmiennej losowej skokowej
Rozkład dwumianowy:
2. Badania pracowników wykazały, \e 70% z nich jest przekonanych, \e
udział pracowników w zarządzaniu firmą podnosi jakość jej działania.
Je\eli wybierze się losowo 15 pracowników, jakie jest prawdopodo-
bieństwo, \e 3 spośród nich będzie podzielało przekonanie, i\ udział
pracowników w zarządzaniu firmą podnosi jakość działania firmy?
3. Zarząd turystyki na wyspie Barbados przeprowadza cotygodniowe
wywiady z sześcioma losowo wybranymi turystami, pytając ich o
wra\enia z pobytu na wyspie. Wra\enia ka\dego turysty klasyfikuje się
jako pozytywne lub negatywne. Odpowiedzi zamieszcza się w
czasopiśmie  Visitor . Przypuśćmy, \e 5% wszystkich turystów
odwiedzających Barbados jest niezadowolonych z pobytu. Jakie jest
prawdopodobieństwo, \e co najmniej dwóch spośród sześciu turystów, z którymi
przeprowadzono wywiady, wyrazi niezadowolenie?
3
0
Zmienna losowa ciągła
funkcja rozkładu (gęstości)
f(x0) = P(X=x0)
f(x0)
dystrybuanta
x0
Rozkład dyskretny  dystrybuanta = suma
F(x0) = P(Xd"x0)
prawdopodobieństw poszczególnych słupków
Rozkład ciągły  dystrybuanta = pole pod krzywą
gęstości
F(x0)
1
F(x0)
x0 x0
3
1
Funkcja gęstości prawdopodobieństwa
a dystrybuanta ciągłej zmiennej losowej
0,8
Odcinek =
prawdopodobieństwu
0,3
Pole pod krzywą =
całka oznaczona z
funkcji gęstości
prawdopodobieństwa
=
0,5
prawdopodobieństwu
3
2
Rozkł
ład normalny (Gaussa)
ł
ł
Rozkład normalny jest rozkładem, do którego dąży m.in.
rozkład dwumianowy gdy liczba doświadczeń n wzrasta
Okazuje się, że rozkład normalny jest rozkładem granicznym
wielu innych rozkładów, w sytuacjach gdy ujawniają się
skutki przypadkowych czynników pochodzących z różnych
zródeł
2
-( x-)
1
22
f(x) = e
 2Ą
3
3
Rozkład normalny o ró\nych wartościach
średniej i odchylenia standardowego
 = 1
x
Odległość od (0,0))
Parametry rozkładu:
= 40
 wartość oczekiwana
 = 5
  odchylenie
x
standardowe
= 15
 = 3
x
= 50
3
4
f(x)
f(x)
f(x)
STANDARYZOWANY ROZKAAD NORMALNY
Ponieważ istnieje nieskończenie wiele normalnych
zmiennych losowych, jedną z nich wybieramy aby
służyła jako pewien standard. Została ona stablicowana
i obliczono prawdopodobieństwa przyjmowania przez
nią określonych wartości.
=0,  = 1



z2
-
1
2
f (z) = "e
2Ą
3
5
standaryzacja
0 = 1,91
DLT
GLT
 = 1
P(XP(X>x2)
P(U>u2)
P(U>u1)
P(U0= -0,042
x1=2,5 x2=2,5 u1 = 0 u2
transformacja: (x - 0)/0
2
P(XP(X>x2) = P(U>u2)
3
6
Prawdopodobieństwo wystąpienia zmiennej losowej
standaryzowanej w określonych przedziałach
3
7
Tablice standaryzowanego rozkładu normalnego
 jak je czytać?
P(U>u)
Dopełnienie
dystrybuanty
3
8
Dodawanie zmiennych A i B o rozkładach
normalnych
A --- N(1, 1)
B --- N(2, 2)
Z = A+B --- N( 1+2, 12+ 22 )
3
9
zadanie 1:
Włoski producent samochodów jest przekonany, \e
liczba kilometrów, które mo\na przejechać na
jednym z jego silników, ma rozkład normalny ze
średnią 160 000 km i odchyleniem standardowym
30 000 km. Jakie jest prawdopodobieństwo, \e
silnik tego typu wytrzyma przebieg między 100 000
km a 180 000 km, zanim trzeba go będzie
wymienić?
P H" 0,72
4
0
zadanie 2:
Producent dostarcza kulki do myszy komputerowych
o średnicy charakteryzującej się rozkładem
normalnym o następujących parametrach
= 5,25 i  = 0,12.
Odbiorca jest zainteresowany kulkami o średnicy
mieszczącej się w przedziale: GLT (górna linia
tolerancji) = 5,30 i DLT (dolna linia tolerancji) =
5,00.
Jaka jest frakcja kulek nie spełniających wymagań
odbiorcy?
P H" 0,36
4
1
zadanie 3:
Tygodniowa wielkość sprzeda\y zupy w puszkach
firmy Winiary w sklepie spo\ywczym rozkłada się
normalnie ze średnią 2450 puszek i odchyleniem
standardowym 400 puszek.
Właściciel sklepu chce znalezć dwie takie liczby,
poło\one symetrycznie po obu stronach średniej, by
istniało prawdopodobieństwo 0.95, \e tygodniowa
sprzeda\ znajdzie się między tymi liczbami.
Tego rodzaju wiadomość będzie dla niego przydatna
przy ustalaniu wielkości zamówień i zapasów.
Właściciel mo\e mieć 95% pewności, \e wielkość sprzeda\y zup w
proszkach w dowolnym tygodniu będzie się mieściła w przedziale
1666 a 3234 puszki.
4
2
zadanie 4:
Część X powinna być wykonana z tolerancją
wymiaru A wynoszącą +/-20 jednostek. W wyniku
pomiarów du\ej próby okazało się, \e wymiar A ma
rozkład normalny N(-4, 4).
Jeśli warunki prowadzenia procesu wytwarzania
części A nie ulegną zmianie, jaka frakcja części X
ma wymiar A:
większy od wymaganego,
mniejszy od wymaganego,
w przedziale (-10, +10)
4
3
zadanie 5:
W województwach A i B zbadano roczną liczbę
opadów.
Okazało się, \e zarówno w jednym jak i w drugim ilość
opadów podlega rozkładowi normalnemu.
Dla województwa A: N(120, 12) , a dla B: N(180, 16).
Jakie jest prawdopodobieństwo, \e ciągu roku łączna
ilość opadów w obu województwach będzie ni\sza ni\
300?
4
4


Wyszukiwarka

Podobne podstrony:
Tablice statystyczne dystrybuanta rozkladu normalnego
Tablice statystyczne dystrybuanta rozkladu normalnego
6 Statystyka w badaniach Rozkład normalny
Tablice statystyczne wartości krytyczne rozkładu normalnego
Tablice statystyczne gęstość prawdopodobieństwa rozkładu normalnego
Tablice statystyczne całka z gestości prawdopodobieństwa rozkładu normalnego
Tablice Dystrybuanta rozkładu normalnego
1 wprowadzenie do statystyki statystyka opisowa
2 Statystyka opisowa S
02 ROZKŁAD NORMALNY, JEDNOSTANJY i DWUMIANOWY
Prawdopodobieństwo Rozkład dwumianowy Rozkład normalny
rozklad normalny nowe zadania
6 5 Rozkład normalny
Tablica dystrybuanty rozkladu normalnego 2011

więcej podobnych podstron