1
Statystyka w jakości
2
zmienność
PROCES
Losowe specjalne
Losowe
naturalne
- badania 100%
- badania statystyczne
- procesy masowe
- procesy ciągłe
- dużych serii
3
MODELE
ZDETERMINOWANE
LOSOWE
zdarzenie A
zdarzenie B
zdarzenie A
zdarzenie B1
zdarzenie B2
funkcja
funkcja
funkcja
funkcja
prawdopodobie
prawdopodobie
prawdopodobie
prawdopodobieńńńństwa
stwa
stwa
stwa
S=V*t
S=V*t
S=V*t
S=V*t
zdarzenie B3
4
modele
PROCES
POMIAR
ANALIZA
STATYSTYCZNA
WNIOSKOWANIE
właściwości procesu (cechy): średnica wałka, ciężar puszki,
%zawartości a w b
5
Podział cech statystycznych:
cechy
cechy
cechy
cechy
mierzalne
mierzalne
mierzalne
mierzalne
jako
jako
jako
jakośśśściowe
ciowe
ciowe
ciowe
(niemierzalne)
(niemierzalne)
(niemierzalne)
(niemierzalne)
ciągłe
skokowe
(dyskretne)
porządkowe
nominalne
6
Ω
– zbiór wszystkich zdarzeń elementarnych
A – zdarzenie
k – liczba zdarzeń sprzyjających zajściu A
m – liczba wszystkich możliwych
zdarze
ń
P(A) = k/m
Liczba wyrażająca przekonanie, że powtarzając proces
losowy wielokrotnie, otrzyma się określoną wartość
zmiennej losowej
Prawdopodobieństwo w ujęciu klasycznym
7
Własności
1) P(A) ≥ 0
2) P(Ω) = 1
3) Jeżeli A
-1
jest zdarzeniem przeciwnym
do A (dope
ł
nieniem) to P(A) = 1 – P(A
-1
)
8
Zdarzenie elementarne
– konkretna realizacja zmiennej
losowej (np. wynik pomiaru)
Populacja
– jest rozumiana jako zbiór wyników wszystkich
pomiarów, którymi jesteśmy zainteresowani.
Próba
– jest podzbiorem wyników pomiarów pobranych z
populacji.
Próba losowa
– pobieranie próby dokonuje się w sposób
losowy
,
tj. tak
,
aby każda możliwa próba składająca się z n
elementów miała taką samą szansę, że zostanie wybrana.
Próba reprezentatywna
– próbka, której struktura pod
względem badanej charakterystyki nie różni się istotnie od
struktury populacji
Podstawowe pojęcia
9
Opracowanie próby
porządkowanie według wielkości
określenie charakterystycznych punktów
zbioru:
– wartości granicznych
– środkowej wartości
– kwartyli
1
0
Mediana
– le
ży w centrum zbioru w tym sensie, że połowa wyników
znajduje si
ę powyżej, a połowa poniżej jej wartości
(2. kwartyl)
(n+1)Pr/100
Dominanta
– warto
ść
modalna - jest
to
warto
ść, która w tym zbiorze
wyst
ępuje najczęściej
Średnia arytmetyczna (średnia klasyczna)
– zwan
ą także przeciętną jest sumą wartości wszystkich
wyników podzielon
ą przez licz
ebno
ść tego zbioru
M
iary tendencji centralnej:
1
1
Mediana
dla zbioru o parzystej liczbie danych
dla zbioru o nieparzystej liczbie danych
1,2,3,4,190
ś
rednia = 40, mediana = 3
2
1
2
2
+
+
=
n
n
x
x
Me
2
n
x
Me
=
1
2
Średnia arytmetyczna
pr
pr
pr
próóóóbbbb
a
::::
populacj
populacj
populacj
populacj
a
::::
n – liczebność próby
X – średnia z próby
s – odchylenie standardowe
próby
STATYSTYKI
N – liczebność populacji
µ – średnia z populacji
σ – odchylenie standardowe
populacji
PARAMETRY
1
3
Średnia arytmetyczna
n
x
x
n
i
i
∑
=
=
1
N
x
N
i
i
∑
=
=
1
µ
śśśśrednia pr
rednia pr
rednia pr
rednia próóóóbbbby::::
śśśśrednia populacji:
rednia populacji:
rednia populacji:
rednia populacji:
1
4
interpretacja średniej arytmetycznej:
Średnia z danych streszcza wszystkie informacje w
nich zawarte:
– Może ona być uważana za punkt, w którym skoncentrowała
się cała masa wszystkich wyników obserwacji i który jest
środkiem ciężkości masy.
– Gdyby wszystkie wyniki obserwacji był jednakowe to każdy
z nich byłby równy średniej arytmetycznej.
– Wielkość abstrakcyjna.
1
5
Zadanie 1:
Rozpatrzmy dwa zbiory danych:
Zbiór 1:
1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11
Zbiór 2:
4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8
Obliczyć: średnią zbiorów, medianę i dominantę
1
6
1
7
Miary rozrzutu
Rozstęp:
– w zbiorze wyników obserwacji rozstępem
nazywamy ró
żnicę pomiędzy wartością
najwi
ększą i najmniejszą
Wariancja:
– w zbiorze wyników wariancją nazywamy
przeci
ętne kwadratowe odchylenie
poszczególnych wyników od ich
średniej
Odchylenie standardowe
– pierwiastek kwadratowy z wariancji
1
8
Wzory
Rozstęp
Wariancja
1
)
(
1
2
2
−
−
=
∑
=
n
x
x
s
n
i
i
N
x
N
i
i
∑
=
−
=
1
2
2
)
(
µ
σ
R = x
max
– x
min
pr
pr
pr
próóóóbbbby::::
populacji:
populacji:
populacji:
populacji:
1
9
Odchylenie standardowe
1
)
(
1
2
2
−
−
=
=
∑
=
n
x
x
s
s
n
i
i
N
x
N
i
i
∑
=
−
=
=
1
2
2
)
(
µ
σ
σ
w
pr
pr
pr
próóóóbbbbie::::
w
populacji:
populacji:
populacji:
populacji:
Zadanie 2
Obliczyć odchylenia standardowe danych z zadania 1
2
0
Grupowanie danych - szeregi
Najczęś
ęś
ęś
ęściej grupujemy dane w tak zwane szeregi:
–
Pozycyjny (n<30)
• (sortujemy dane rosnąco lub malejąco i zliczamy ile jest
elementów o tej samej wartości lub cesze)
–
Rozdzielczy (n≥30)
• dane grupujemy w klasy, czyli przedzia
ły o ustalonej
wielko
ści
• mo
żemy w ten sposób określić rozkład częstości danych w
poszczególnych klasach.
• wykres obrazuj
ący rozkład częstości nazywamy
histogramem
(wykres słupkowy).
Wysoko
ść słupka
reprezentuje cz
ęstość, z jaką pojawiły się wyniki obserwacji
nale
żące do klasy reprezentowanej przez słupek. Sąsiednie słupki
maj
ą wspólne boki.
2
1
a
b
c
d
e
f
g
[1
,
4](4
,
7] …
(27
,
31]
Częstość
(liczebność)
Szerokość przedziału klasowego
Częstości odpowiadają
prawdopodobieństwu wystąpienia
wartości danej cechy i sumują się
do jedności
Wartości
cechy
2
2
jak dobrać liczbę klas?
Liczność próbki
n
Ilość przedziałów
k
30
÷
50
6
÷
10
51
÷
100
7
÷
11
101
÷
200
8
÷
12
201
÷
500
9
÷
15
k
=1+3,32*logN
2
3
Zmienne losowe
cecha, którą obserwujemy (mierzymy) jest
zmienną losową
(np.
ś
rednica, masa)
zmienna losowa
- zmienna przyjmuj
ą
ca ró
ż
ne
warto
ś
ci liczbowe, wyznaczone przez los (30,6 ;
30,71 ; 30,78 ; 30,62 itd.)
rozkład prawdopodobie
ń
stwa zmiennej losowej
- przyporz
ą
dkowanie prawdopodobie
ń
stw
wszystkim mo
ż
liwym warto
ś
ciom zmiennej
losowej
zmienne losowe –> model
– dyskretne – funkcja dyskretna (dwumianowy,
Poissona,…)
– ciągłe – funkcja ciągła (normalny, Weibula, itd.)
2
4
Zmienna losowa skokowa (dyskretna)
Rozkładem prawdopodobieństwa zmiennej losowej
skokowej jest tablica, wzór lub wykres, który
przyporządkowuje prawdopodobieństwa każdej
możliwej wartości zmiennej.
Np.
P(X=x) = p
P(X=1) = 0,1
P(X=2) = 0,4
1
P(X=6) = 0,5
2
5
Przykład
Liczba wad pojawiająca się na linii montażowej A
x
P(x) F(x)
0
1
2
3
4
5
0,1
0,2
0,3
0,2
0,1
0,1
0,1
0,3
0,6
0,8
0,9
1,0
1,0
0 1 2 3 4 5
0,1
0,2
0,3
P(x)
0 1 2 3 4 5
1
F(x)
P(1≤x≤3) = P(X=1)+P(X=2)+P(X=3) =F(3)-F(0)
= 0,8-0,1 = 0,7
P(x≤3) = F(3)
= 0,8
Dystrybuanta
zmiennej losowej
Gęstość prawdopodobieństwa
zm. losowej
2
6
dystrybuanta:
– skumulowana funkcja rozkładu zmiennej losowej:
F
(x) = P(X≤x) = ΣP(i) dla i≤x
2
7
Rozkład dwumianowy:
Ciąg identycznych doświadczeń spełniających
następujące warunki:
• Dwa możliwe wyniki każdego doświadczenia: sukces i
porażka
• Prawdopodobieństwo sukcesu (p) pozostaje takie samo od
doświadczenia do doświadczenia. Prawdopodobieństwo
porażki q = 1-p.
• Doświadczenia są od siebie niezależne
• Liczba sukcesów opisana jest zmienną losową
dwumianową
Przykład rozkładu zmiennej losowej skokowej
Zmienna losowa dwumianowa
2
8
Rozkład dwumianowy:
Doświadczenie polegające na 4 rzutach monetą.
1. Jakie jest prawdopodobieństwo otrzymania
dokładnie 3 orłów?
2. Jakie jest prawdopodobieństwo, że nie
wypadnie żaden orzeł?
3. Jakie jest prawdopodobieństwo, że wypadnie
co najmniej 1 orzeł?)
p - ?
x - ?
n - ?
Przykład rozkładu zmiennej losowej skokowej
P(X=3)
P(X=0)
P(X≥1) = 1 - P(X<1)
2
9
Rozkład dwumianowy:
1.
W statystycznej kontroli jakości partia wyrobów zostaje
zaakceptowana jako dobra tylko wtedy, gdy liczba sztuk wadliwych w
stosunku do liczebności całej partii nie przekracza pewnej z góry
ustalonej wartości. Przypuśćmy, że w dużej partii wyrobów jest 20%
sztuk wadliwych. Pobrano z niej próbę liczącą 20 sztuk. Procedura
kontrolna przewiduje zaakceptowanie partii wyrobów tylko wtedy, gdy
nie więcej niż 2 sztuki wśród 20 okażą się wadliwe. Jakie jest
prawdopodobieństwo, że partia wyrobów
nie
zostanie zaakceptowana?
Przykład rozkładu zmiennej losowej skokowej
p = 0,2, q = 0,8
P(X>2) = 1 - P(X≤2) = 1 - P(X=0) - P(X=1) - P(X=2) = 1 – 0,0115 – 0,0576 – 0,137 =
= 0,793
3
0
Rozkład dwumianowy:
2. Badania pracowników wykazały, że 70% z nich jest przekonanych, że
udział pracowników w zarządzaniu firmą podnosi jakość jej działania.
Jeżeli wybierze się losowo 15 pracowników, jakie jest prawdopodo-
bieństwo, że 3 spośród nich będzie podzielało przekonanie, iż udział
pracowników w zarządzaniu firmą podnosi jakość działania firmy?
3. Zarząd turystyki na wyspie Barbados przeprowadza cotygodniowe
wywiady z sześcioma losowo wybranymi turystami, pytając ich o
wrażenia z pobytu na wyspie. Wrażenia każdego turysty klasyfikuje się
jako pozytywne lub negatywne. Odpowiedzi zamieszcza się w
czasopiśmie „Visitor”. Przypuśćmy, że 5% wszystkich turystów
odwiedzających Barbados jest niezadowolonych z pobytu. Jakie jest
prawdopodobieństwo, że co najmniej dwóch spośród sześciu turystów, z którymi
przeprowadzono wywiady, wyrazi niezadowolenie?
Przykład rozkładu zmiennej losowej skokowej
3
1
Zmienna losowa ciągła
funkcja rozkładu
(gęstości)
f(x
0
) = P(X=x
0
)
dystrybuanta
F(x
0
) = P(X≤x
0
)
x
0
f(x
0
)
x
0
F(x
0
)
x
0
F(x
0
)
1
Rozkład dyskretny – dystrybuanta = suma
prawdopodobieństw poszczególnych słupków
Rozkład ciągły – dystrybuanta = pole pod krzywą
gęstości
3
2
Funkcja gęstości prawdopodobieństwa
a dystrybuanta ciągłej zmiennej losowej
Odcinek =
prawdopodobieństwu
0,8
0,3
0,5
Pole pod krzywą =
całka oznaczona z
funkcji gęstości
prawdopodobieństwa
=
prawdopodobieństwu
3
3
Rozk
łłłład normalny (Gaussa)
Rozkład normalny jest rozkładem, do którego dąży m.in.
rozk
ład dwumianowy gdy liczba doświadczeń n wzrasta
Okazuje się, że rozkład normalny jest rozkładem granicznym
wielu innych rozk
ładów, w sytuacjach gdy ujawniają się
skutki przypadkowych czynników pochodz
ących z różnych
źródeł
2
σ
2
)
µ
x
(
e
π
2
σ
1
)
x
(
f
−
−
=
2
3
4
Rozkład normalny o różnych wartościach
średniej i odchyleni
a standardowego
x
f(
x
)
x
f(
x
)
x
f(
x
)
1
=
σ
40
=
µ
15
=
µ
50
=
µ
5
=
σ
3
=
σ
Parametry rozkładu:
µ – wartość oczekiwana
σ – odchylenie
standardowe
Odległość od (0,0))
3
5
STANDARYZOWANY ROZKŁAD NORMALNY
Ponieważ istnieje nieskończenie wiele normalnych
zmiennych losowych, jedn
ą z nich wybieramy aby
s
łużyła jako pewien standard. Została ona stablicowana
i obliczono prawdopodobie
ństwa przyjmowania przez
ni
ą określonych wartości.
µµµµ
=0,
σσσσ
= 1
2
2
2
1
)
(
z
e
z
f
−
⋅
=
π
3
6
standaryzacja
µ
= 0
σ
= 1
µ
0
= -0,042
σ
0
= 1,91
GLT
DLT
x
2
=2,5
x
1
=2,5
u
1
u
2
P(X>x
2
)
P(X<x
1
)
transformacja: (x
2
-
µ
0
)/
σ
0
P(U>u
2
)
P(U>u
1
)
P(X<x
1
) = P(U<u
1
)
P(X>x
2
) = P(U>u
2
)
P(U<u
1
)
3
7
Prawdopodobieństwo wystąpienia zmiennej losowej
standaryzowanej w określonych przedziałach
3
8
Tablice standaryzowanego rozkładu normalnego
– jak je czytać?
P(U>u)
Dopełnienie
dystrybuanty
3
9
Dodawanie zmiennych A i B o rozkładach
normalnych
A --- N(µ
1
,
σ
1
)
B --- N(µ
2
,
σ
2
)
Z = A+B --- N( µ
1
+µ
2
,
σ
1
2
+
σ
2
2
)
4
0
zadanie 1:
Włoski producent samochodów jest przekonany, że
liczba kilometrów, które można przejechać na
jednym z jego silników, ma rozkład normalny ze
średnią 160 000 km i odchyleniem standardowym
30 000 km. Jakie jest prawdopodobieństwo, że
silnik tego typu wytrzyma przebieg między 100 000
km a 180 000 km, zanim trzeba go będzie
wymienić?
P ≈ 0,72
4
1
zadanie 2:
Producent dostarcza kulki do myszy komputerowych
o średnicy charakteryzującej się rozkładem
normalnym o następujących parametrach
µ
= 5,25 i
σ
= 0,12.
Odbiorca jest zainteresowany kulkami o średnicy
mieszczącej się w przedziale: GLT (górna linia
tolerancji) = 5,30 i DLT (dolna linia tolerancji) =
5,00.
Jaka jest frakcja kulek nie spełniających wymagań
odbiorcy?
P ≈ 0,36
4
2
zadanie 3:
Tygodniowa wielkość sprzedaży zupy w puszkach
firmy Winiary w sklepie spożywczym rozkłada się
normalnie ze średnią 2450 puszek i odchyleniem
standardowym 400 puszek.
Właściciel sklepu chce znaleźć dwie takie liczby,
położone symetrycznie po obu stronach średniej, by
istniało prawdopodobieństwo 0.95, że tygodniowa
sprzedaż znajdzie się między tymi liczbami.
Tego rodzaju wiadomość będzie dla niego przydatna
przy ustalaniu wielkości zamówień i zapasów.
Właściciel może mieć 95% pewności, że wielkość sprzedaży zup w
proszkach w dowolnym tygodniu będzie się mieściła w przedziale
1666 a 3234 puszki.
4
3
zadanie 4:
Część X powinna być wykonana z tolerancją
wymiaru A wynoszącą +/-20 jednostek. W wyniku
pomiarów dużej próby okazało się, że wymiar A ma
rozkład normalny N(-4, 4).
Jeśli warunki prowadzenia procesu wytwarzania
części A nie ulegną zmianie, jaka frakcja części X
ma wymiar A:
większy od wymaganego,
mniejszy od wymaganego,
w przedziale (-10, +10)
4
4
zadanie 5:
W województwach A i B zbadano roczną liczbę
opadów.
Okazało się, że zarówno w jednym jak i w drugim ilość
opadów podlega rozkładowi normalnemu.
Dla województwa A: N(120, 12) , a dla B: N(180, 16).
Jakie jest prawdopodobieństwo, że ciągu roku łączna
ilość opadów w obu województwach będzie niższa niż
300?