ZJ w5 2013


Zarządzanie jakością
Instrumentarium zarządzania
- statystyczne metody sterowania jakościa
dr inż. Anna Olszewska
a.olszewska@pb.edu.pl
Narzędzia statystyczne
Zbieranie danych
Pobieranie
próbek
Charakterystyka populacji
Statystyki Rozkłady Przedziały
ufności
Wnioskowanie
Hipotezy Analiza Analiza regresji
wariancji i korelacji
Pobieranie próbek
Zanim dane do analizy zostaną pobrane, należy podjąć decyzję o
sposobie doboru, jak też liczebności próby. Przede wszystkim
wybierana próba powinna być reprezentatywna, czyli z przyjętą z góry
dokładnością opisująca strukturę zbiorowości. Reprezentatywność
można osiągnąć poprzez dobór celowy lub losowy. Ponieważ wybór
celowy jest decyzją badacza, nie podlega działaniu praw wielkich liczb,
większość badań oparta jest na doborze próby w sposób losowy.
Losowanie może się odbywać w sposób zwrotny (mówimy wówczas o
losowaniu niezależnym) lub bez zwracania (losowanie zależne).
Statystyki wykorzystywane w pomiarze jakości
Zbiorowość można opisywać za pomocą różnych statystyk, nazywanych
charakterystykami, takich jak:
" średnia
" wariancja
" odchylenie standardowe
" współczynniki asymetrii
" współczynnik koncentracji
" współczynnik korelacji
" współczynnik regresji
" frakcja
Rozkłady przy różnych wartościach miary
asymetrii (g 1)
f(x)
g =0
1
g =1,1
1
g = -0,9
1
x
Rozkłady przy różnych wartościach
miary koncentracji (g 2)
f(x)
g2=3,0
g2=4,6
g2=2,2
x
Podstawowe rozkłady zmiennej losowej
skokowej
Funkcja gęstości Wykres
Rozkład zero jedynkowy określony jest
p
następującymi prawdopodobieństwami:
p =0,2
0,8
P(X = 0) = 1- p P(X = 1) = p
,
0,6
gdzie p jest prawdopodobieństwem
0,4
wylosowania sztuki wadliwej (nazywane także
prawdopodobieństwem sukcesu,
0,2
0 < p <
1
).
0
x
0 1
Podstawowe rozkłady zmiennej losowej
skokowej
Podstawowe rozkłady zmiennej losowej
skokowej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe rozkłady zmiennej losowej
ciągłej
Podstawowe pojęcia
Pojęciem populacji określana jest zbiorowość (skończona lub nie)
poddawana obserwacji. Ze zbiorowości tej wybierana jest w określony
sposób (najczęściej losowy) próba. Wybór taki dokonywany jest
wówczas, gdy niemożliwe jest całościowe przeprowadzenie analizy
populacji. Zebrane dane (populacji lub próby) grupowane są w szereg
rozdzielczy.
Szereg rozdzielczy składa się przynajmniej z dwóch kolumn (lub
wierszy), z których pierwsza reprezentuje wartości cech lub przedziały
klasowe, zaś druga  liczba ich wystąpień (liczebność). Liczebność
można zastąpić częstością, co ma miejsce zwłaszcza przy znacznych
wielkościach liczebności.
Szereg rozdzielczy
Odsetek braków Liczba partii
[xi0  xi1) towaru ni
0,00  0,02 15
0,02  0,04 25
n
i
0,04  0,06 12
25
0,06  0,08 6
20
0,08  0,10 2
15
10
5
0
x
0 0,02 0,04 0,06 0,08 0,10
Estymacja
Z pojęciem populacji i próby ściśle związane jest pojęcie estymatora.
Estymator jest to statystyka wyznaczona na podstawie próby przybliżająca
nieznany parametr populacji.
Estymatory powinny posiadać przynajmniej trzy własności: zgodność,
nieobciążoność i efektywność.
Pierwsza oznacza, że zwiększając liczebności próby wzrasta dokładność
szacunków. Symbolicznie zapis ten można przedstawić następująco:
"lim P(Tn - Q < e)= 1

e >0
Tn
gdzie oznacza estymator,  szacowany parametr, n  liczebność próby.
Q
Nieobciążonością nazywana jest własność zgodnie, z którą estymator jest
pozbawiony błędu systematycznego, czyli wartość oczekiwana jest równa
E(Tn ) = Q
szacowanemu parametrowi ( ). Jeżeli natomiast estymator ma
możliwie małą wariancję, to nazywany jest on efektywnym.
Estymatory
Na podstawie próby wyznaczana jest pewna statystyka. Może nią być
np. średnia, odchylenie standardowe lub wskaznik struktury. Jest ona
oszacowaniem punktowym odpowiedniego parametru całej zbiorowości.
Estymator punktowy średniej procesu wyznaczany jest jako średnia z
próby. Jeżeli jest to szereg punktowy, wówczas wzór średniej przyjmuje
n
1
postać:
x =
x
i
n
i=1
gdzie oznacza i-ty pomiar, natomiast n to liczebność próby.
W przypadku szeregów rozdzielczych, gdy dane pogrupowane zostały w
przedziały, wykorzystywany jest wzór:
n
o
1
x =
i
x ni
n
i=1
o
x
i
gdzie to środek przedziału, zaś jego liczebność.
Estymatory
Wariancja z próby jest estymatorem punktowym wariancji zbiorowości.
Wyznaczana jest ona zgodnie z następującym wzorem dla szeregu
n
1
2
punktowego:
s2 =
(x - x)
i
n
i=1
lub przedziałowego:
2
n
o
1
s2 =
i

ć x - x ni
n
Ł ł
i=1
Wariancja podana powyższymi wzorami jest wariancją obciążoną. Chcąc
otrzymać wariancję pozbawioną błędu systematycznego należy
n
zastosować następujące przekształcenie:
%5ń2 = s2
n -1
Estymatorem punktowym wskaznika struktury jest frakcja wyznaczona
na podstawie próby:
m
p =
n
gdzie m jest liczbą elementów wyróżnionych z n-elementowej próby.
Estymatory
Chcąc podać parametr zbiorowości z dużym, określonym z góry
prawdopodobieństwem należy wyznaczyć przedział ufności.
Prawdopodobieństwo, z jaką podejmuje się taką decyzję jest określane
mianem współczynnika ufności i oznaczane 1-a (a to poziom
istotności).
Estymatory przedziałowe
Hipotezy statystyczne
Hipoteza może być związana z wartością parametru rozkładu lub z
postacią rozkładu zmiennej, czy losowością pomiarów. Pierwszą
grupę nazywa się hipotezami (testami) parametrycznymi, zaś dwie
pozostałe  nieparametrycznymi.
Proces weryfikacji hipotez rozpoczyna się od postawienia hipotezy
zerowej, oznaczanej jako H0
Jeżeli Q oznacza parametr populacji, a Q0 jego wartość, to hipoteza
zerowa przyjmuje postać:
H0 : Q = Q0
W odniesieniu do hipotezy zerowej, jako jej zaprzeczenie stawiana jest
hipoteza alternatywna H1. Hipoteza alternatywna przy teście
parametrycznym może przybrać jedną z postaci:
H1 : Q < Q0
H1 : Q > Q0
H1 : Q ą Q0
Błąd I i II rodzaju
Weryfikując hipotezy można popełnić jeden z dwóch rodzajów
błędów. Błąd pierwszego rodzaju podlega na odrzuceniu hipotezy
prawdziwej i oznaczany jest jako a, zaś błąd drugiego rodzaju
polegający na przyjęciu hipotezy fałszywej i oznaczany jest jako b.
Pierwszy z błędów jest nazywany ryzykiem producenta, zaś drugi
ryzykiem konsumenta.
W odniesieniu do kontroli procesu produkcyjnego, a oznacza
prawdopodobieństwo błędnej regulacji w przypadku, gdy proces
działa poprawnie, natomiast b  prawdopodobieństwo
niezauważenia powstałego rozregulowania.
Prawdopodobieństwo popełnienia błędu I rodzaju (nazywane też
poziomem istotności) uznawane jest jako bardziej niebezpieczne
dla badań, dlatego podczas konstrukcji testu jest ono brane pod
uwagę. Najczęściej jest to wartość wynosząca 0,05
Decyzje i ich konsekwencje w teście
sprawdzającym hipotezę H0:
Decyzje
Sytuacje
przyjęcie H0 odrzucenie H0
Hipoteza zerowa
decyzja prawidłowa błąd I rodzaju
prawdziwa
Hipoteza zerowa
błąd II rodzaju decyzja prawidłowa
fałszywa
Weryfikacja hipotez statystycznych
Reguła postępowania podczas weryfikacji hipotez statystycznych nosi
nazwę testu statystycznego. Praktyczne zastosowanie ma grupa testów
nazywanych testami istotności, które pozwalają na odrzucenie hipotezy
sprawdzanej z małym prawdopodobieństwem popełnienia błędu I
rodzaju. Przy tej konstrukcji nie podejmuje się decyzji o przyjęciu
hipotezy zerowej, a jedynie o braku podstaw do jej odrzucenia.
Weryfikacja hipotez statystycznych
Konstrukcja testu przebiega następująco:
1. stawiana są hipotezy: zerowa, będąca hipotezą sprawdzaną i
alternatywna, będąca jej zaprzeczeniem lub związana z celem
badania.
2. wybór sprawdzianu hipotezy (Zn) i obliczenie go na podstawie próby
losowej.
3. podjęcie decyzji o odrzuceniu hipotezy lub braku podstaw do jej
odrzucenia na podstawie obszaru krytycznego Q, dla którego
spełniona jest relacja:
P(Zn Q | H0) = a
Jeżeli wartość statystyki znajdzie się w obszarze krytycznym
podejmowana jest decyzja o odrzuceniu sprawdzanej hipotezy, zaś w
przeciwnym przypadku o braku podstaw do jej odrzucenia.
Testy parametryczne
Testy nieparametryczne
Przy zdecydowanej większości testów istotne jest założenie o zgodności
pomiarów z rozkładem normalnym, jak też o ich losowości i
niezależności. Niespełnienie jednego z tych założeń uniemożliwia
korzystanie z podanych powyżej testów istotności. Jeżeli jednak test
taki mimo niespełnienia założeń jest przeprowadzany, konstruowane
wnioski mogą prowadzić do błędnych decyzji. Stąd ważność i
konieczność korzystania z nieparametrycznych testów zgodności.
Jednymi z częściej wykonywanych z tej grupy są testy zgodności
pomiarów z rozkładem normalnym. W literaturze i praktyce
stosowanych jest wiele testów weryfikujących normalność pomiarów.
Wśród nich najczęściej stosowane są testy zgodności
chi-kwadrat, czy testy Kołmogorowa.
Testy zgodności  test chi-kwadrat
Za pomocą testu zgodności chi-kwadrat można zweryfikować czy
obserwowana cecha posiada rozkład zgodny z określonym
rozkładem teoretycznym. Aby wykonać ten test dane muszą być
pogrupowane i przedstawione w postaci szeregu rozdzielczego.
Symboliczny zapis hipotez jest następujący:
H0 : F(x) = F0 (x)
H1 : F(x) ą F0 (x)
F (x)
gdzie 0  jest dystrybuantą rozkładu teoretycznego. Zatem
sprawdzana jest hipoteza zgodności dystrybuanty analizowanego
rozkładu, z którego pobrano próbę losową z rozkładem
teoretycznym, najczęściej z rozkładem normalnym.
Testy zgodności  test chi-kwadrat
Sprawdzianem hipotezy H0 jest statystyka podlegająca rozkładowi chi-
kwadrat o stopniach swobody:
r
2
i
c =
(n - npi )2
npi
i=1
gdzie
r  liczba przedziałów klasowych,
l  liczba parametrów, które należy wstępnie wyznaczyć na podstawie
próby (jeżeli średnia i odchylenie standardowe było szacowane,
to l = 2),
ni  liczebność empiryczna i-tego przedziału,
pi  prawdopodobieństwo odpowiadające wartości badanej cechy w i-
tej klasie,
npi  liczebność teoretyczna w i-tym przedziale.
Testy zgodności  test chi-kwadrat
Aby wnioski z wykonanego testu zgodności chi-kwadrat były
wiarygodne, liczebności w przedziałach, jak i liczba przedziałów
powinna być większa lub równe 5.
Wyznaczoną zgodnie ze wzorem statystykę należy porównać z
2
ck ;a
wartością krytyczna zmiennej losowej chi-kwadrat o k stopniach
swobody, spełniającą warunek:
2 2
P(c > ck;a ) = a
Testy zgodności  test chi-kwadrat
W teście zgodności Kołmogorowa weryfikowane są hipotezy identyczne,
jak w testach zgodności c2.
Test ten stosuje się w celu porównania danych rozkładów z wybranymi
rozkładami ciągłymi. Sprawdzianem testu jest charakterystyka:
l = D n
gdzie:
D to statystyka wyznaczona wzorem: D = sup Fn (x) - F0 (x)
x
F n ( )  dystrybuanta empiryczna.
x
Wartość krytyczną potrzebną do weryfikacji hipotezy otrzymuje się z
rozkładu Kołmogorowa, tak aby spełniony był warunek:
P(l > la ) = a
Testy losowości  test serii
Zgodność pomiarów z rozkładem normalnym jest jedynie jednym z
założeń stosowania testów parametrycznych czy estymacji
przedziałowej. Drugim jest losowość pomiarów. Założenie to możne być
sprawdzone np. testem serii.
Serią nazywany jest podciąg identycznych elementów jednego rodzaju
znajdujący się w ciągu składającym się z dwóch rodzajów elementów. W
teście serii z populacji o dowolnym rozkładzie pobrana jest próba n-
elementowa. Z próby tej wyznaczana jest mediana (wartość środkowa 
oznaczona jako Me). Następnie nie zmieniając kolejności pobierania
pomiarów, każdemu pomiarowi xi przypisywana jest określona litera
(np. a) jeżeli i , zaś gdy xi >
Me inna (np. b) bądz też pomiar jest
x < Me
pomijany, gdy .
xi = Me
Testy losowości  test serii
W tak utworzonym ciągu wyznaczana jest liczba serii oznaczana jako k.
Zakładając, że hipoteza zerowa dotycząca losowości pomiarów jest
prawdziwa, to liczba serii ma rozkład nazwany rozkładem serii. Jest on
zależy od dwóch parametrów: n1 i n2 oznaczających liczebności
odpowiednio elementów a i b. Jeżeli wyznaczona liczba serii k znajduje
się pomiędzy wartościami k1, k2 będącymi odczytem z tablic serii,
spełniającymi relacje:
a
a
P(k Ł k1) =
P(k ł k1) = 1-
2
2
gdzie a jest poziomem istotności, wówczas formułowany jest wniosek o
braku podstaw do odrzucenia hipotezy zerowej dotyczącej losowości
k ł k2
pomiarów. Jeżeli k Ł k lub , wówczas hipotezę o losowości należy
1
odrzucić, a zatem liczba serii jest zbyt mała lub zbyt duża by dobór
można było uznać za losowy.
Analiza wariancji (ANOVA)
Analiza wariancji (ANOVA  ang. Analysis of Variance) jest jednym
z zaawansowanych narzędzi statystycznych, wykorzystywanych do
porównywania różnic w poziomie średniej w kilku populacjach.
Założeniami jej stosowania są: niezależność doboru prób i normalność
pomiarów z nich pochodzących (są to próby o rozkładzie normalnym z
identyczną wariancją, ale o dowolnych średnich).
W jednoczynnikowej wariancji, przyjmuje się, że każdy z pomiarów jest
postaci:
yij = m +ti + eij
gdzie
jest średnią ogólną, identyczną dla wszystkich populacji, z których
m
pobierane są próby,
t ) zaś
jest efektem i  tgo zabiegu (
i = 1,2,...,a
i
eij jest składnikiem losowym dla
j =1,2,...,ni
Przykładowa tabela danych
w jednoczynnikowej analizie wariancji
Analiza wariancji (ANOVA)
Analiza oparta została na następujących hipotezach zerowej i
alternatywnej:
t1 = t = L = t = 0
H0 :
2 a
dla przynajmniej jednego i
ti ą 0
H1 :
Sprawdzaną hipotezą jest, iż wpływ wszystkich zabiegów jest zerowy,
czyli wszystkie populacje mają taką samą średnią równą średniej
ogólnej m. Hipoteza alternatywna, informuje, że istnieje taki zabieg,
który jest istotnie różny od zera, czyli przynajmniej jedna średnia różni
się od pozostałych.
Analiza wariancji (ANOVA)
Analiza wariancji opiera się na zasadzie sum kwadratów, zgodnie z
którą całkowita suma kwadratów odchyleń (SST) równa jest sumie
składników: sumy kwadratów odchyleń wynikających z zabiegu, czyli
między populacjami (SSTR) i sumy kwadratów błędów (SSE).
Sprawdzianem hipotezy zerowej jest statystyka F, która przy
prawdziwości hipotezy zerowej posiada rozkład F-Snedekcora o (a-1) i
(n-a) stopniach swobody.
Analiza wariancji (ANOVA)
Jeżeli nie ma podstaw do odrzucenia H0, co w efekcie prowadzi do
zakończenia działania testu ANOVA stwierdzeniem, iż na podstawie
zgromadzonych danych nie można wskazać na wyraznie widoczny,
różny od zera wpływ jednego z czynników.
W przeciwnym przypadku, gdy H0 jest odrzucana, czyli przynajmniej
jedna średnia różni się od pozostałych, wykonywana jest w kolejnym
kroku klasyfikacja szczegółowa. Jej celem jest wskazanie grup, dla
których zachodzi różnica pomiędzy średnimi i dla których nie jest ona
zauważalna przy przyjętym poziomie istotności a.
Analiza wariancji (ANOVA)
Brak podstaw
Dane
ANOVA
do odrzucenia H0
STOP
Odrzuć H0
Dalsza
analiza
Test NIR
Funkcjonuje kilka testów sprawdzających istotność różnic, jednym z
nich jest test NIR (najmniejszej istotnej różnicy). Przyjmuje on postać:
ć
1 1

NIR =| ta ,n-1 | MSE -

ni n
j
Ł ł
i ą j ta 1
dla prób i-tej i j-tej ( ), gdzie ,n- jest odczytem z tablic rozkładu
t-Studenta o (n-1) stopniach swobody.
Jeżeli bezwzględna różnica pomiędzy średnimi i-tej i j-tej próby jest
mniejsza od NIR, wówczas średnie nie różnią się istotnie między sobą.
Analogicznie, jak jednoczynnikowa przebiega dwu- lub
wieloczynnikowa analiza wariancji. Podstawowa różnica polega na tym,
że w dwuczynnikowej weryfikowanych jest jednocześnie nie jedna, ale
trzy hipotezy zerowe, zaś w wieloczynnikowej odpowiednio więcej.
Hipotezy te dotyczą zarówno czynników, jak też zachodzącej między
nimi interakcji.
Założenia analizy wariancji
1. Analizowana zmienna i wydzielone podpopulacje podlegają
rozkładowi normalnemu
Testy nieparametryczne
2. Spełniona jest hipoteza o równości warunkowych wariancji na
wszystkich poziomach czynnika
Test jednorodności wariancji


Wyszukiwarka

Podobne podstrony:
zj w5
ZJ w4 13
W5 13 Percepcja2
ZJ w2 13
Deming do wykładu ZJ 2015 13,04
EZNiOS Log 13 w5 system slajdy
EZNiOS Log 13 w5 system
UAS 13 zao
er4p2 5 13
Budownictwo Ogolne II zaoczne wyklad 13 ppoz
ch04 (13)
model ekonometryczny zatrudnienie (13 stron)

więcej podobnych podstron