Na wykładzie w dniu 6.03.2015r. został omówiony
wstęp do oceny zgodności rozrzutu wyników
obserwacji z rozkładem normalnym zmiennej
losowej.
Przykład należy wykonać na ćwiczeniach i
zastosować w projekcie „normy czasowej „ czynności
technologicznej.
Po 6.03.2015 zrobić na
ćwiczeniach
BADANIE ROZKŁADU ODCHYLEŃ
WYNIKÓW OD WARTOŚCI
NAJPRAWDOPODOBNIEJSZEJ
Kolejną
analizą
przeprowadzaną
w
badaniu
czasu
trwania
czynności
technologicznej jest ustalenie charakteru
rozkładu odchyleń (błędów) od wartości
najbardziej
prawdopodobnej
(średniej).
Badanie to można przepro-wadzić testem
„chi kwadrat”.
UWAGA ! JEŚLI ROZKŁAD ODCHYLEŃ NIE MA
ROZKŁADU NORMALNEGO TO ŚREDNIA
(ARYTMETYCZNA LUB WAŻONA) NIE JEST
WARTOŚCIĄ NAJPRADOPODOBNIEJSZĄ !!!
Test chi-kwadrat analizuje różnice pomiędzy
liczebnością teoretyczną wyników w danej klasie
wartości (przedziale wartości) a liczbą wyników
uzyskanych z pomiarów, które przypadają
do danej klasy.
W celu przeanalizowania tych różnic
musimy „zbudować” dwa rozkłady:
-
pierwszy – empiryczny
, reprezentujący
wyniki
uzyskane z
przeprowadzonego pomiaru,
-
drugi – teoretyczny
, będący obrazem
teoretycznego
rozkładu normalnego.
W
celu
uzyskania
wiarygodnych
wyników takiego porównania należy
posiadać stosunkowo dużą „próbę” z
badanej populacji.
Za dużą próbę uważa się już 30
wyników
(to jest raczej minimum dużej
próby w tym badaniu). Dla mniejszej
nie powinno budować się histogramu
wyników świadczącego o ich rozkładzie
(rozrzucie).
Dane z tych wyników
grupuje się w przedziały klasowe, przy
czym:
- liczba przedziałów klasowych
r
powinna być
dostatecznie duża - przyjmuje
się, że
r
≥ 5,
- liczebności teoretyczne w
poszczególnych
przedziałach klasowych nie
mogą być zbyt małe;
zazwyczaj przyjmuje się
np
I
≥ 5,
gdzie i = 1,2,…r.
- oba rozkłady muszą być ze sobą
porównywalne
co uzyskuje się poprzez
zestandaryzowanie
rozkładu empirycznego; tablice
rozkładu
teoretycznego odnoszą się już do
rozkładu
zestandaryzowanego - N(0,1).
Rozkład zestandaryzowany to taki, w
którym wartość
oczekiwana E(x) = 0, a odchylenie
standardowe σ = 1;
co zapisujemy N(0;1).
W celu standaryzacji, po
obliczeniu wartości oczekiwanej i
odchylenia standardowego badanego
rozkładu, obliczamy poniższą statystykę
dla zmiennej standaryzowanej Z:
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0
0,2
0,4
0,6
0,8
1
1,2
Serie1
-4
-3
-2
-1
0
1
2
3
4
Zmienna standaryzowana Z
F
u
n
kc
ja
g
ęs
to
śc
i
f
(X
)
0,13% 2,15% 13,59% 34,13%
POWIERZCHNIA CAŁEGO POLA POD FUNKCJĄ GĘSTOŚCI
RÓWNA SIĘ 1
Statystyka ta pozwala obliczać teoretyczną
liczność danych w określonych przedziałach
zmiennej. Rysunek prezentuje gęstości dla
krotności odchylenia standardowego σ
DOTAD ZROBIŁEM NA
WYKŁADZIE
W DNIU 6.03.2015R,.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0
0,2
0,4
0,6
0,8
1
1,2
Serie1
-4
-3
-2
-1
0
1
2
3
4
Zmienna standaryzowana Z
F
u
n
kc
ja
g
ęs
to
śc
i
f
(X
)
34,13% 13,59%
2,15% 0,13%
Taki sam procent liczności znajduje się w
klasach prawej części rozkładu.
W celu wyznaczenia gęstości dla dowolnego Z
należy korzystać z tablicy dystrybuanty tego
rozkładu.
UWAGA – dla zestandaryzowanej
funkcji opracowano różne rodzaje
tablic, w tym:
- tablicę funkcji gęstości (określa
wysokość krzywej (liczność zdarzeń) w
punkcie z
i
na osi Z),
- tablicę dystrybuanty (zawiera
skumulowaną wartość liczności
zdarzeń od -∞ do miejsca z
i
na osi Z).
Tablica gęstości
(rozpoznaje się ją
po wartości 0,3989!)
z 0 1 2... 9
0,0
0,1
0,2
0,3
...
1,0
2,0
3,0
4,0
3989
3970
3910
3814
...
2420
0540
0044
0001
3989 ... 3973
f(Z
)
Z
0,00
0,01 ... 0,09
0,0
0,1
...
0,5
0,6
...
1,0
1,5
2,0
3,0
4,0
0,0000
0,0398
...
0,1915
0,2257
...
0,3413
0,4332
0,4772
0,49865
0,4999683
... ... ...
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0
0,2
0,4
0,6
0,8
1
1,2
Serie1
-4
-3
-2
-1
0
1
2
3
4
Zmienna standaryzowana Z
F
u
n
kc
ja
g
ęs
to
śc
i
f(
X
)
Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z
i
, to w przedziale od -1 do -2 będziemy
mieli liczność równą 0,4772 − 0,3413 =
0,1359, co oznacza, że w tym przedziale
znajduje się 13,59% całej liczności
wyników. W przedziale od -1,5 do +1,5
będzie dwa razy 0,4332, tj. 86,64%
wszystkich liczności.
F
*
(
Z)
Tablica dystrybuanty
Dla mało licznej próby, gęstości
wyznacza się z tablicy Studenta
uwzględniającej przyjęty poziom
istotności oraz określoną liczbę stopni
swobody.
PRZYKŁAD
Zbadano 200 osób pod względem
czasu wykonania pewnego zadania. Na
poziomie istotności α = 0,05 należy
zweryfikować hipotezę, że rozkład
czasu
wykonania
zadania
jest
rozkładem normalnym (Gaussa).
Czas
[min]
71,0 –
71,4
71,4 –
71,8
71,8 –
72,2
72,2 –
72,6
72,6 –
73,0
Liczebn
ość
15
45
70
50
20
Rozwią zanie przykładu sprawdzenia
zgodności rozkładu wyników pomiaru z
rozkładem normalnym
Obliczanie średniej
Lp przedział
Środek
przedzia
łu
x
i
Liczność
w
przedzia
le
n
i
n
i
∙ x
i
1
1,0 –1,4
1,2
15
18,0
0,09
2
1,4 –1,8
1,6
45
72,0
0,36
3
1,8 –2,2
2,0
70
140,0
0,70
4
2,2 –2,6
2,4
50
120,0
0,60
5
2,6 –3,0
2,8
20
56,0
0,280
N = 200
∑ =
406,0
=
2,03
Ze względu na dokładność pomiaru rzędu
0,1 do dalszych obliczeń przyjęto średnią
= 2,0 minuty
Obliczanie odchylenia standardowego z
próbki
Lp
Środek
przedzia
łu
x
i
Liczność
w
przedzial
e
n
i
1
1,2
- 0,8
15
0,64
9,60
2
1,6
- 0,4
45
0,16
7,20
3
2,0
- 0,0
67
0,00
0,0
4
2,4
+ 0,4
50
0,16
8,00
5
2,8
+ 0,8
20
0,64
12,8
=
2,0
−
N =
200
−
37,60
Standaryzacja rozkładu z danych
pomiarowych
Statystyki z próby:
= 2,0
oraz
S = 0,4336
L
p
przedz
iał
Liczno
ść
danyc
h z
pomiar
u
n
i
dla
prawe
go
krańc
a klas
z
i
dla
prawe
go
krańc
a klas
F(z
i
)
z tablic
dla
praweg
o
krańca
klas
p
i
=
F(z
i
)
minu
s
F(z
i-
1
)
Liczno
ść
teoret.
n
teor
=
N
i
∙p
i
1
1,0 –
1,4
15
- 0,6
- 1,38
0,084
0,08
4
16,8
0,19
2
1,4 –
1,8
45
- 0,2
- 0,46
0,323
0,23
9
47,8
0,16
3
1,8 –
2,2
70
+ 0,2
+
0,46
0,677
0,35
4
70,8
0,01
4
2,2 –
2,6
50
+ 0,6
+
1,38
0,916
0,23
9
47,8
0,10
5
2,6 –
3,0
20
+ 1,0
nie
trzeb
a
0,08
4
16,8
0,61
∑ =
200
= 1,07
Wartość krytyczną odczytujemy z
tablic rozkładu przy poziomie
istotności
α = 0,05
dla stopni
swobody równej (r-k-1)=(5-2-1)=
2
,
gdzie r – liczba klas, k – liczba
szacowanych parametrów rozkładu
(w omawianej analizie k = 2 bo
rozkład normalny opisany jest przez
dwa parametry - średnią oraz
odchylenie standardowe).
Z tablic mamy: co
oznacza, że
wobec nie ma
podstaw do odrzucenia hipotezy
zerowej, zatem rozkład badanej
cechy jest rozkładem normalnym
(Gaussa).
KONIEC