BADANIE ROZKŁADU ODCHYLEŃ

WYNIKÓW OD WARTOŚCI

NAJPRAWDOPODOBNIEJSZEJ

Kolejną analizą jest ustalenie charakteru

rozkładu odchyleń (błędów) od wartości
najbardziej prawdo-podobnej (średniej).
Badanie

zostanie

przeprowadzone

testem „chi kwadrat”.

UWAGA ! JEŚLI ROZKŁAD ODCHYLEŃ NIE MA
ROZKŁADU NORMALNEGO TO ŚREDNIA
(ARYTMETYCZNA LUB WAŻONA) NIE JEST
WARTOŚCIĄ NAJPRADOPODOBNIEJSZĄ !!!

Test chi-kwadrat analizuje różnice pomiędzy

licznością teoretyczną a liczbą praktycznie
uzyskanych wyników z pomiarów, które
przypadają do tego samego przedziału wartości.

W celu przeanalizowania tych różnic
musimy „zbudować” dwa histogramy
rozkładów:

pierwszy – empiryczny

, reprezentujący

wyniki z badania,

drugi – teoretyczny

, reprezentujący

rozkład normalny.

Można je zbudować mając dużą liczbę

danych. Za dużą liczbę danych (próbę)
uważa się już 30 wyników

(to jest

minimum dużej próby).

Dane z tych

wyników grupuje się w przedziały
klasowe, przy czym:
- dla liczby przedziałów klasowych

przyjmuje

się by

≥ 5,

         - dla liczebności danych w
poszczególnych
           przedziałach klasowych
przyjmuje  by

≥ 5,

           gdzie  i = 1,2,…r,
         - oba rozkłady muszą być ze sobą
porównywalne
            co uzyskuje się poprzez
zestandaryzowanie
            rozkładu empirycznego;

               Uwaga: tablice rozkładu
teoretycznego odnoszą
               się już do rozkładu
zestandaryzowanego - N(0,1).
   Rozkład zestandaryzowany to taki, w
którym wartość
   oczekiwana E(x) = 0, a odchylenie
standardowe σ = 1;
   co zapisujemy N(0;1).
          W  celu standaryzacji,  po
obliczeniu  wartości oczekiwanej i
odchylenia standardowego badanego
rozkładu, obliczamy poniższą statystykę
dla zmiennej standaryzowanej Z:

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,2

0,4

0,6

0,8

1,2

Serie1

-4

-3

-2

-1

Zmienna standaryzowana Z

ęs

śc

)

34,13% 13,59%
2,15% 0,13%

Taki sam procent liczności znajduje się w
klasach prawej części rozkładu.

W celu wyznaczenia gęstości dla dowolnego

Z korzysta się z tablicy dystrybuanty tego
rozkładu. Zawiera ona skumulowaną wartość
liczności zdarzeń od -∞ do miejsca z

na osi Z).

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

0,0000

0,0398

...

0,1915

0,2257

...

0,3413

0,4332

0,4772

0,49865

0,4999683

... ... ...

Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z

, to w przedziale od -1 do -2 będziemy

mieli liczność równą 0,4772 − 0,3413 =
0,1359, co oznacza, że w tym przedziale
znajduje się 13,59% całej liczności
wyników. W przedziale od -1,5 do +1,5
będzie dwa razy 0,4332, tj. 86,64%
wszystkich liczności.

(

Tablica dystrybuanty

Dla mało licznej próby, gęstości
wyznacza się z tablicy Studenta
uwzględniającej przyjęty poziom
istotności oraz określoną liczbę stopni
swobody.

PRZYKŁAD BĘDZIE

LICZONY NA ĆWICZENIACH

13.03 I 20.03.2015R

PRZYKŁAD

Zbadano  200  osób  pod  względem
czasu wykonania pewnego zadania. Na
poziomie  istotności  α  =  0,05    należy
zweryfikować  hipotezę,  że  rozkład
czasu

wykonania

zadania

jest

rozkładem normalnym (Gaussa).

Czas

[min]

71,0 –

71,4

71,4 –

71,8

71,8 –

72,2

72,2 –

72,6

72,6 –

73,0

Liczebn

ość

Rozwią zanie przykładu sprawdzenia
zgodności rozkładu wyników pomiaru z
rozkładem normalnym

Obliczanie średniej

Lp przedział

Środek

przedzia

łu

Liczność

przedzia

∙ x

1,0 –1,4

1,2

18,0

0,09

1,4 –1,8

1,6

72,0

0,36

1,8 –2,2

2,0

140,0

0,70

2,2 –2,6

2,4

120,0

0,60

2,6 –3,0

2,8

56,0

0,280

N = 200

∑ =

406,0

2,03

Ze względu na dokładność pomiaru rzędu
0,1 do dalszych obliczeń przyjęto średnią

= 2,0 minuty

Obliczanie odchylenia standardowego z

próbki

Środek

przedzia

łu

Liczność

przedzial

1,2

- 0,8

0,64

9,60

1,6

- 0,4

0,16

7,20

2,0

- 0,0

0,00

0,0

2,4

+ 0,4

0,16

8,00

2,8

+ 0,8

0,64

12,8

2,0

−

N =

200

−

37,60

Standaryzacja rozkładu z danych
pomiarowych

Statystyki z próby:

= 2,0

oraz

S = 0,4336

przedz

iał

Liczno

ść

danyc

h z

pomiar

dla

prawe

krańc

a klas

dla

prawe

krańc

a klas

F(z

)

z tablic

dla

praweg

krańca

klas

F(z

)

minu

F(z

)

Liczno

ść

teoret.

teor

∙p

1,0 –

1,4

- 0,6

- 1,38

0,084

0,08

16,8

0,19

1,4 –

1,8

- 0,2

- 0,46

0,323

0,23

47,8

0,16

1,8 –

2,2

+ 0,2

0,46

0,677

0,35

70,8

0,01

2,2 –

2,6

+ 0,6

1,38

0,916

0,23

47,8

0,10

2,6 –

3,0

+ 1,0

nie

trzeb

0,08

16,8

0,61

∑ =

200

= 1,07

Wartość krytyczną odczytujemy z
tablic rozkładu przy poziomie
istotności

α = 0,05

dla stopni

swobody równej (r-k-1)=(5-2-1)=

gdzie r – liczba klas, k – liczba
szacowanych parametrów rozkładu
(w omawianej analizie k = 2 bo
rozkład normalny opisany jest przez
dwa parametry - średnią oraz
odchylenie standardowe).

Z tablic mamy: co
oznacza, że
wobec nie ma
podstaw do odrzucenia hipotezy
zerowej, zatem rozkład badanej
cechy jest rozkładem normalnym
(Gaussa).

KONIEC

0,00

0,01 ... 0,09

0,0

0,1

...

0,5

0,6

...

1,0

1,5

2,0

3,0

4,0

0,0000

0,0398

...

0,1915

0,2257

...

0,3413

0,4332

0,4772

0,49865

0,4999683

... ... ...

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,2

0,4

0,6

0,8

1,2

Serie1

-4

-3

-2

-1

Zmienna standaryzowana Z

ęs

śc

)

Ponieważ tablice dystrybuanty zawierają
skumulowane liczności od z=0 do miejsca
z

, to w przedziale od -1 do -2 będziemy

(

Tablica dystrybuanty

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,2

0,4

0,6

0,8

1,2

Serie1

-4

-3

-2

-1

Zmienna standaryzowana Z

ęs

śc

)

0,13% 2,15% 13,59% 34,13%

POWIERZCHNIA CAŁEGO POLA POD FUNKCJĄ GĘSTOŚCI
RÓWNA SIĘ 1

Statystyka ta pozwala obliczać teoretyczną
liczność danych w określonych przedziałach
zmiennej. Rysunek prezentuje gęstości dla
krotności odchylenia standardowego σ

Document Outline