3Wa Wykład 13 03 2015 ROZKŁAD ZMIENNEJ

background image

BADANIE ROZKŁADU ODCHYLEŃ

WYNIKÓW OD WARTOŚCI

NAJPRAWDOPODOBNIEJSZEJ

Kolejną analizą jest ustalenie charakteru

rozkładu odchyleń (błędów) od wartości
najbardziej prawdo-podobnej (średniej).
Badanie

to

zostanie

przeprowadzone

testem „chi kwadrat”.

UWAGA ! JEŚLI ROZKŁAD ODCHYLEŃ NIE MA
ROZKŁADU NORMALNEGO TO ŚREDNIA
(ARYTMETYCZNA LUB WAŻONA) NIE JEST
WARTOŚCIĄ NAJPRADOPODOBNIEJSZĄ !!!

background image

Test chi-kwadrat analizuje różnice pomiędzy

licznością teoretyczną a liczbą praktycznie
uzyskanych wyników z pomiarów, które
przypadają do tego samego przedziału wartości.

W celu przeanalizowania tych różnic
musimy „zbudować” dwa histogramy
rozkładów:

-

pierwszy – empiryczny

, reprezentujący

wyniki z badania,

-

drugi – teoretyczny

, reprezentujący

rozkład normalny.

background image

Można je zbudować mając dużą liczbę

danych. Za dużą liczbę danych (próbę)
uważa się już 30 wyników

(to jest

minimum dużej próby).

Dane z tych

wyników grupuje się w przedziały
klasowe, przy czym:
- dla liczby przedziałów klasowych

r

przyjmuje

się by

r

≥ 5,

- dla liczebności danych w
poszczególnych
przedziałach klasowych
przyjmuje by

np

I

≥ 5,

gdzie i = 1,2,…r,
- oba rozkłady muszą być ze sobą
porównywalne
co uzyskuje się poprzez
zestandaryzowanie
rozkładu empirycznego;

background image

Uwaga: tablice rozkładu
teoretycznego odnoszą
się już do rozkładu
zestandaryzowanego - N(0,1).
Rozkład zestandaryzowany to taki, w
którym wartość
oczekiwana E(x) = 0, a odchylenie
standardowe σ = 1;
co zapisujemy N(0;1).
W celu standaryzacji, po
obliczeniu wartości oczekiwanej i
odchylenia standardowego badanego
rozkładu, obliczamy poniższą statystykę
dla zmiennej standaryzowanej Z
:

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f

(X

)

34,13% 13,59%
2,15% 0,13%

Taki sam procent liczności znajduje się w
klasach prawej części rozkładu.

W celu wyznaczenia gęstości dla dowolnego

Z korzysta się z tablicy dystrybuanty tego
rozkładu. Zawiera ona skumulowaną wartość
liczności zdarzeń od -∞ do miejsca z

i

na osi Z).

background image

Z

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

0,0000

0,0398

...

0,1915

0,2257

...

0,3413

0,4332

0,4772

0,49865

0,4999683

... ... ...

Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z

i

, to w przedziale od -1 do -2 będziemy

mieli liczność równą 0,4772 − 0,3413 =
0,1359, co oznacza, że w tym przedziale
znajduje się 13,59% całej liczności
wyników. W przedziale od -1,5 do +1,5
będzie dwa razy 0,4332, tj. 86,64%
wszystkich liczności.

F

*

(

Z)

Tablica dystrybuanty

background image

Dla mało licznej próby, gęstości
wyznacza się z tablicy Studenta
uwzględniającej przyjęty poziom
istotności oraz określoną liczbę stopni
swobody.

PRZYKŁAD BĘDZIE

LICZONY NA ĆWICZENIACH

13.03 I 20.03.2015R

background image

PRZYKŁAD

Zbadano 200 osób pod względem
czasu wykonania pewnego zadania
. Na
poziomie istotności α = 0,05 należy
zweryfikować hipotezę, że rozkład
czasu

wykonania

zadania

jest

rozkładem normalnym (Gaussa).

Czas

[min]

71,0 –

71,4

71,4 –

71,8

71,8 –

72,2

72,2 –

72,6

72,6 –

73,0

Liczebn

ość

15

45

70

50

20

background image

Rozwią zanie przykładu sprawdzenia
zgodności rozkładu wyników pomiaru z
rozkładem normalnym

Obliczanie średniej

Lp przedział

Środek

przedzia

łu

x

i

Liczność

w

przedzia

le

n

i

n

i

∙ x

i

1

1,0 –1,4

1,2

15

18,0

0,09

2

1,4 –1,8

1,6

45

72,0

0,36

3

1,8 –2,2

2,0

70

140,0

0,70

4

2,2 –2,6

2,4

50

120,0

0,60

5

2,6 –3,0

2,8

20

56,0

0,280

N = 200

∑ =

406,0

=

2,03

Ze względu na dokładność pomiaru rzędu
0,1 do dalszych obliczeń przyjęto średnią

= 2,0 minuty

background image

Obliczanie odchylenia standardowego z

próbki

Lp

Środek

przedzia

łu

x

i

Liczność

w

przedzial

e

n

i

1

1,2

- 0,8

15

0,64

9,60

2

1,6

- 0,4

45

0,16

7,20

3

2,0

- 0,0

67

0,00

0,0

4

2,4

+ 0,4

50

0,16

8,00

5

2,8

+ 0,8

20

0,64

12,8

=

2,0

N =

200

37,60

background image

Standaryzacja rozkładu z danych
pomiarowych

Statystyki z próby:

= 2,0

oraz

S = 0,4336

L

p

przedz

iał

Liczno

ść

danyc

h z

pomiar

u

n

i

dla

prawe

go

krańc

a klas

z

i

dla

prawe

go

krańc

a klas

F(z

i

)

z tablic

dla

praweg

o

krańca

klas

p

i

=

F(z

i

)

minu

s

F(z

i-

1

)

Liczno

ść

teoret.

n

teor

=

N

i

∙p

i

1

1,0 –

1,4

15

- 0,6

- 1,38

0,084

0,08

4

16,8

0,19

2

1,4 –

1,8

45

- 0,2

- 0,46

0,323

0,23

9

47,8

0,16

3

1,8 –

2,2

70

+ 0,2

+

0,46

0,677

0,35

4

70,8

0,01

4

2,2 –

2,6

50

+ 0,6

+

1,38

0,916

0,23

9

47,8

0,10

5

2,6 –

3,0

20

+ 1,0

nie

trzeb

a

0,08

4

16,8

0,61

∑ =

200

= 1,07

background image

Wartość krytyczną odczytujemy z
tablic rozkładu przy poziomie
istotności

α = 0,05

dla stopni

swobody równej (r-k-1)=(5-2-1)=

2

,

gdzie r – liczba klas, k – liczba
szacowanych parametrów rozkładu
(w omawianej analizie k
= 2 bo
rozkład normalny opisany jest przez
dwa parametry - średnią oraz
odchylenie standardowe).

Z tablic mamy: co
oznacza, że
wobec nie ma
podstaw do odrzucenia hipotezy
zerowej, zatem rozkład badanej
cechy jest rozkładem normalnym
(Gaussa).

background image

KONIEC

background image
background image

Z

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

0,0000

0,0398

...

0,1915

0,2257

...

0,3413

0,4332

0,4772

0,49865

0,4999683

... ... ...

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f(

X

)

Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z

i

, to w przedziale od -1 do -2 będziemy

mieli liczność równą 0,4772 − 0,3413 =
0,1359, co oznacza, że w tym przedziale
znajduje się 13,59% całej liczności
wyników. W przedziale od -1,5 do +1,5
będzie dwa razy 0,4332, tj. 86,64%
wszystkich liczności.

F

*

(

Z)

Tablica dystrybuanty

background image

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0

0,2

0,4

0,6

0,8

1

1,2

Serie1

-4

-3

-2

-1

0

1

2

3

4

Zmienna standaryzowana Z

F

u

n

kc

ja

g

ęs

to

śc

i

f

(X

)

0,13% 2,15% 13,59% 34,13%

POWIERZCHNIA CAŁEGO POLA POD FUNKCJĄ GĘSTOŚCI
RÓWNA SIĘ 1

Statystyka ta pozwala obliczać teoretyczną
liczność danych w określonych przedziałach
zmiennej. Rysunek prezentuje gęstości dla
krotności odchylenia standardowego σ


Document Outline


Wyszukiwarka

Podobne podstrony:
3Wa Wykład 13 03 2015 NORMY CZASU PRACY
z 2Wc Wykład 06 03 2015 ROZKŁAD ZMIENNEJ
z 2Ca Wykład 13 03 I 20 03 2015 ROZKŁAD ZMIENNEJ
2Wb Wykład 03 03 2015 ROZKŁAD ZMIENNEJ
3Wb Wykład 13 03 2015 NORMY MATERIAŁOWE I SPRZĘTU
Fundusze inwestycyjne i emerytalne wykład 6 23 03 2015
FIiE-13.03.2015, UEK FIR, licencjat, 6 semestr, fundusze inwestycyjne i emerytalne Kania
Fundusze inwestycyjne i emerytalne wykład 8 13 04 2015
wyklad 4 13.03.2008, Administracja UŁ, Administracja I rok, Ustrój organów ochrony prawnej
ADMINISTRACJA PUBLICZNA - WYKŁAD - 13.03.2009
Fundusze inwestycyjne i emerytalne wykład 7 30 03 2015
Wykład 3 (13.03.2009) montaż, Kulturoznawstwo
Zarządzanie przez partycypację referat (wykład 13.03.2010 r.), ZZL
9 bankowosc wyklad 9 13 01 2015
Wykład V 13 03 2012
wyklad 13 03

więcej podobnych podstron