2Wb Wykład 03 03 2015 ROZKŁAD ZMIENNEJ

background image

BADANIE ROZKŁADU ODCHYLEŃ

WYNIKÓW OD WARTOŚCI

NAJPRAWDOPODOBNIEJSZEJ

Kolejną

analizą

przeprowadzaną

w

badaniu

czasu

trwania

czynności

technologicznej jest ustalenie charakteru
rozkładu odchyleń (błędów) od wartości
najbardziej

prawdopodobnej

(średniej).

Badanie to można przepro-wadzić testem
„chi kwadrat”.

UWAGA ! JEŚLI ROZKŁAD ODCHYLEŃ NIE MA
ROZKŁADU NORMALNEGO TO ŚREDNIA
(ARYTMETYCZNA LUB WAŻONA) NIE JEST
WARTOŚCIĄ NAJPRADOPODOBNIEJSZĄ !!!

background image

Test chi-kwadrat analizuje różnice pomiędzy

liczebnością teoretyczną wyników w danej klasie
wartości (przedziale wartości) a liczbą wyników
uzyskanych z pomiarów, które przypadają
do danej klasy.

W celu przeanalizowania tych różnic
musimy „zbudować” dwa rozkłady:

-

pierwszy – empiryczny

, reprezentujący

wyniki
uzyskane z
przeprowadzonego pomiaru,

-

drugi – teoretyczny

, będący obrazem

teoretycznego
rozkładu normalnego.

W

celu

uzyskania

wiarygodnych

wyników takiego porównania należy
posiadać stosunkowo dużą „próbę” z
badanej populacji.

background image

Za dużą próbę uważa się już 30

wyników

(to jest raczej minimum dużej

próby w tym badaniu). Dla mniejszej
nie powinno budować się histogramu
wyników świadczącego o ich rozkładzie
(rozrzucie).

Dane z tych wyników

grupuje się w przedziały klasowe, przy
czym:
- liczba przedziałów klasowych

r

powinna być
dostatecznie liczna - przyjmuje
się, że

r

≥ 5,

- liczebności teoretyczne w
poszczególnych
przedziałach klasowych nie
mogą być zbyt małe;
zazwyczaj przyjmuje się

np

I

≥ 5,

gdzie i = 1,2,…r.

background image

- oba rozkłady muszą być ze sobą
porównywalne
co uzyskuje się poprzez
zestandaryzowanie
rozkładu empirycznego; tablice
rozkładu
teoretycznego odnoszą się już do
rozkładu
zestandaryzowanego - N(0,1).
Rozkład zestandaryzowany to taki, w
którym wartość
oczekiwana E(x) = 0, a odchylenie
standardowe σ = 1;
co zapisujemy N(0;1).
W celu standaryzacji, po
obliczeniu wartości oczekiwanej i
odchylenia standardowego badanego
rozkładu, obliczamy poniższą statystykę
dla zmiennej standaryzowanej Z
:

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f

(X

)

0,13% 2,15% 13,59% 34,13%

POWIERZCHNIA CAŁEGO POLA POD FUNKCJĄ GĘSTOŚCI
RÓWNA SIĘ 1

Statystyka ta pozwala obliczać teoretyczną
liczność danych w określonych przedziałach
zmiennej. Rysunek prezentuje gęstości dla
krotności odchylenia standardowego σ

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f

(X

)

34,13% 13,59%
2,15% 0,13%

Taki sam procent liczności znajduje się w
klasach prawej części rozkładu.

W celu wyznaczenia gęstości dla dowolnego Z

należy korzystać z tablicy dystrybuanty tego
rozkładu.

background image

UWAGA – dla zestandaryzowanej
funkcji opracowano różne rodzaje
tablic, w tym:

- tablicę funkcji gęstości (określa
wysokość krzywej (liczność zdarzeń) w
punkcie z

i

na osi Z),

- tablicę dystrybuanty (zawiera
skumulowaną wartość liczności
zdarzeń od -∞ do miejsca z

i

na osi Z).

Tablica gęstości
(rozpoznaje się ją
po wartości 0,3989!)

z 0 1 2... 9

0,0

0,1

0,2

0,3

...

1,0

2,0

3,0

4,0

3989

3970

3910

3814

...

2420

0540

0044

0001

3989 ... 3973

f(Z
)

background image

Z

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

0,0000

0,0398

...

0,1915

0,2257

...

0,3413

0,4332

0,4772

0,49865

0,4999683

... ... ...

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f(

X

)

Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z

i

, to w przedziale od -1 do -2 będziemy

mieli liczność równą 0,4772 − 0,3413 =
0,1359, co oznacza, że w tym przedziale
znajduje się 13,59% całej liczności
wyników. W przedziale od -1,5 do +1,5
będzie dwa razy 0,4332, tj. 86,64%
wszystkich liczności.

F

*

(

Z)

Tablica dystrybuanty

background image

Dla mało licznej próby, gęstości
wyznacza się z tablicy Studenta
uwzględniającej przyjęty poziom
istotności oraz określoną liczbę stopni
swobody.

background image

PRZYKŁAD

Zbadano 200 osób pod względem
czasu wykonania pewnego zadania
. Na
poziomie istotności α = 0,05 należy
zweryfikować hipotezę, że rozkład
czasu

wykonania

zadania

jest

rozkładem normalnym (Gaussa).

Czas

[min]

71,0 –

71,4

71,4 –

71,8

71,8 –

72,2

72,2 –

72,6

72,6 –

73,0

Liczebn

ość

15

45

70

50

20

background image

Rozwią zanie przykładu sprawdzenia
zgodności rozkładu wyników pomiaru z
rozkładem normalnym

Obliczanie średniej

Lp przedział

Środek

przedzia

łu

x

i

Liczność

w

przedzia

le

n

i

n

i

∙ x

i

1

1,0 –1,4

1,2

15

18,0

0,09

2

1,4 –1,8

1,6

45

72,0

0,36

3

1,8 –2,2

2,0

70

140,0

0,70

4

2,2 –2,6

2,4

50

120,0

0,60

5

2,6 –3,0

2,8

20

56,0

0,280

N = 200

∑ =

406,0

=

2,03

Ze względu na dokładność pomiaru rzędu
0,1 do dalszych obliczeń przyjęto średnią

= 2,0 minuty

background image

Obliczanie odchylenia standardowego z

próbki

Lp

Środek

przedzia

łu

x

i

Liczność

w

przedzial

e

n

i

1

1,2

- 0,8

15

0,64

9,60

2

1,6

- 0,4

45

0,16

7,20

3

2,0

- 0,0

67

0,00

0,0

4

2,4

+ 0,4

50

0,16

8,00

5

2,8

+ 0,8

20

0,64

12,8

=

2,0

N =

200

37,60

background image

Standaryzacja rozkładu z danych
pomiarowych

Statystyki z próby:

= 2,0

oraz

S = 0,4336

L

p

przedz

iał

Liczno

ść

danyc

h z

pomiar

u

n

i

dla

prawe

go

krańc

a klas

z

i

dla

prawe

go

krańc

a klas

F(z

i

)

z tablic

dla

praweg

o

krańca

klas

p

i

=

F(z

i

)

minu

s

F(z

i-

1

)

Liczno

ść

teoret.

n

teor

=

N

i

∙p

i

1

1,0 –

1,4

15

- 0,6

- 1,38

0,084

0,08

4

16,8

0,19

2

1,4 –

1,8

45

- 0,2

- 0,46

0,323

0,23

9

47,8

0,16

3

1,8 –

2,2

70

+ 0,2

+

0,46

0,677

0,35

4

70,8

0,01

4

2,2 –

2,6

50

+ 0,6

+

1,38

0,916

0,23

9

47,8

0,10

5

2,6 –

3,0

20

+ 1,0

nie

trzeb

a

0,08

4

16,8

0,61

∑ =

200

= 1,07

background image

Wartość krytyczną odczytujemy z
tablic rozkładu przy poziomie
istotności

α = 0,05

dla stopni

swobody równej (r-k-1)=(5-2-1)=

2

,

gdzie r – liczba klas, k – liczba
szacowanych parametrów rozkładu
(w omawianej analizie k
= 2 bo
rozkład normalny opisany jest przez
dwa parametry - średnią oraz
odchylenie standardowe).

Z tablic mamy: co
oznacza, że
wobec nie ma
podstaw do odrzucenia hipotezy
zerowej, zatem rozkład badanej
cechy jest rozkładem normalnym
(Gaussa).

background image

KONIEC


Document Outline


Wyszukiwarka

Podobne podstrony:
3Wa Wykład 13 03 2015 ROZKŁAD ZMIENNEJ
z 2Ca Wykład 13 03 I 20 03 2015 ROZKŁAD ZMIENNEJ
z 2Wc Wykład 06 03 2015 ROZKŁAD ZMIENNEJ
planowanie wykład 03 2015
wykład 3& 03 2015
NORDIC WALKING WYKŁAD 3 03 2015
03 Wykład 3 Podstawowe rozkłady zmiennych losowychid 4224
Fundusze inwestycyjne i emerytalne wykład 6 23 03 2015
Fundusze inwestycyjne i emerytalne wykład 7 30 03 2015
1 Sylabus Metodologia Nauk Spolecznych wyklad studia stacjonarne dzienne II stopnia I rok30 03 2015
Zajęcia 03 2015 r Makroekonomia wykłady 3 4
Antropologia, wykład 3 (19 03 2015)
Planowanie finansowe wyklad 6 23 03 2015
Fundusze inwestycyjne i emerytalne wykład 6 23 03 2015
Fundusze inwestycyjne i emerytalne wykład 6 23 03 2015

więcej podobnych podstron