Łukasz Nykiel st_MP_d08

ROZKŁAD GAUSSA (NORMALNY) Opracowanie danych statystycznych metodą graficzną 1. Wprowadzenie i obróbka danych: dane  READPRN("dane08.txt" ) data

daneT



 

data  data 1

n  length(data)

n  30

i  0  n  1

data  sort(data)

2.Określenie prawdopodobieństwa z próby (i  1)

p 

i

(n  1)

3. Oszacowanie punktowe:

- średnia i mediana

- odchylenie standardowe skorygowane i nieskorygowane μ  mean(data)

μ  471.95

σ  Stdev(data)

σ  198.864

Σ  stdev(data)

Σ  195.522

M  median(data)

M  434.3

WNIOSEK 1: Ponieważ średnia nie jest równa medianie więc hipoteza o rozkładzie normalnym może być fałszywa..

4. Obliczenie standaryzowanych wartości zmiennej zależnej (określenie miana osi rzędnych): y  qnorm p 0

 1







i

i

5. Obliczenie współczynników prostej regresji y = a + b * x : a  intercept(data y

 )

a  2.138



b  slope(data y

 )

 3

b  4.531  10

6. Obliczenie parametrów rozkładu:

 a 

1

μ1 







σ1 

 b 

b

μ1  471.95

σ1  220.696

7. Porównanie z oszacowaniem punktowym: 1

0.8

0.6

p

0.4

0.2

0

0

200

400

600

800

1 103



data

2

1

y

0

 1

 2

0

200

400

600

800

1 103



data

WNIOSEK 2: Oszacowanie graficzne i punktowe dają nieznacznie różniące się wyniki.

8. Wykres:

u  data

pr(x)  a  b  x

i

i

x  0  1100

2

1

yi

0

pr(x)

 1

 2

120

198

276

354

432

510

588

666

744

822

900

ui x



9. Sprawdzenie obliczeń według wzorów z wykładu: n1

n1

n1

n1

2

m 

u

 2



k 

y

l 

u

o 

u  y

   t  n  m  l

i

 i

 i

i

i

i  0

i  0

i  0

i  0

m  k  l  o

as 

as  2.138



as  2.138



t

n  o  k  l

 3

 3

bs 

bs  4.531  10

bs  4.531  10

t

 as 

1

μs 







μs  471.95

σs 

σs  220.696

 bs 

bs

μ  471.95

σ  198.864

WNIOSEK 3: Wynik zgodny z obliczeniami wykorzystującymi funkcje MathCad'a.

10. Testy zgodności

10.1. Test w2

pt  pnorm u

i

i μ

 σ







1

wt  n

 



[

  2  (i  1)  1]  ln pt



   [2  [n  (i  1)]  1]  ln 1  pt





n

i

i 

i

wt  0.507

Wartość krytyczna statystyki w2 na poziomie istotności  = 0.05 wynosi wk=2.4933

WNIOSEK 4: Wartość testowa Wt = 0.507 < od wartości krytycznej 2.4933

Hipotezy o rozkładzie normalnym na poziomie  = 0.05 odrzucić nie można.

dn  READPRN("DN.txt" ) 10.2. Test Kołmogorowa-Smirnowa delta  p  pt

dt  max(delta)

dt  0.111

dk  dn

dk  0.242

i

i

i

(n1)

Wartość krytyczna statystyki Dn na poziomie istotności  = 0.05 wynosi dk= 0.242

WNIOSEK 5: Wartość testowa 0.111 < od wartości krytycznej 0.242

Hipotezy o rozkładzie normalnym na poziomie  = 0.05 odrzucić nie można.

10.3. Test 2

1

ωt 



delta

 2



ωt  0.09236

12  n

i

i

Wartość krytyczna statystyki 2 na poziomie istotności  = 0.05 wynosi k=0.9814

WNIOSEK 6: Wartość testowa 0.09236 < od wartości krytycznej 0.4614

Hipotezy o rozkładzie normalnym na poziomie  = 0.05 odrzucić nie można.

11. Oszacowania przedziałowe

- obliczenie przedziałów ufności dla wartości oczekiwanej rozkładu na poziomie ufności 0.95

β  0.95

α  1  β

n  30



α



qt1 

n

  1



2



μd  μ 

 σ

μd  397.693

n



α



qt1 

n

  1



2



μg  μ 

 σ

μg  546.207

n

- obliczenie przedziału ufnosci dla odchylenia standardowego na poziomie ufności 0.95

2

σ (n  1)

σd 

σd  158.377



α



qchisq1 

n

  1



2



2

σ (n  1)

σg 

 α



σg  267.337

qchisq

n

  1

 2



12. Wynik końcowy:

μd  397.693

<

μ  471.95

< μg  546.207

σd  158.377 <

σ  198.864

<

σg  267.337

13. Obliczenie dwustronnych obszarów ufności dla dystrybuanty i wykres końcowy: 1  0.95

β 

m1  2  (n  i)

m2  2  (i  1)

2

i

i

Fd  qF 

m2







Fg  qF 

m1







i

β m1i

i

i

β m2i

i

1

Fgi

Fdd 

Fdg 

i



n  i



i

 n  i 

1

 

 Fd



  Fg



(i  1)

i

 i  1 

i

yd  qnorm Fdd 0

 1







yg  qnorm Fdg 0

 1







i

i

i

i

pr(x)  a  b  x

x  min(u)  max(u)

2.4

1.6

pr(x) 0.8

yi

0

ydi

ygi  0.8

 1.6

 2.4120

198

276

354

432

510

588

666

744

822

900

x u

 i u

 i u

 i

13. Obliczenie granic obszaru ufności dla prostej regresji i wynik końcowy.

Wprowadzamy nową zmienną

y  a

v 

b

co w praktyce jest równoznaczne z określeniem odciętych punktów powstałych z przecięcia prostych równoległych do osi odciętych przechodzących przez punkty pomiarowe z prostą regresji. Używając tych samych wzorów (na ydi i ygi ) jak powyżej otrzymamy granice obszaru ufności prostej regresji. Wzorów na ydi oraz ygi nie trzeba przytaczać raz jeszcze - gdy spo-rządzając wykres zmieni się ui na u1i ,obliczenia zostaną powtórzone dla nowej zmiennej nie-zależnej automatycznie.

x  0 46.5



 900

2.4

1.8

1.2

yi

0.6

pr(x)

0

ydi

yg  0.6

i

 1.2

 1.8

 2.40

90

180

270

360

450

540

630

720

810

900

ui x

 v

 i v

 i

14. Wykres funkcji Gaussa o obliczonych parametrach Należy wykreślić:

- teoretyczną dystrybuantę rozkładu F(x)

- teoretyczną krzywą gęstości prawdopodobieństwa f(x)

- empiryczną dystrybuantę rozkładu

- na dystrybuantę teoretczną nanieść punkty o rzędnej yyi F(x)  pnorm(x μ

 σ

 )

f (x)  dnorm(x μ

 σ

 )

x  100



 1100

min(u)  159.8

max(u)  847.4

1

0.9

0.8

0.7

F(x) 0.6

f(x)100.5

pi

0.4

0.3

0.2

0.1

0

 100

10

120

230

340

450

560

670

780

x x

 u

 i

15. Wnioski końcowe

Wy

W n

y i

n ki prz

przep

e ro

pr w

o a

w dz

adzon

o y

n c

y h

h tes

te tów

ó

w na

n

a po

p z

o iom

omie

e uf

u noś

fności =0

b

.9

=0 5

.9

5 ws

w kaz

a uj

ują, ż

ą, że

e ni

n e

e moż

o na

n

od

o rz

d ucić hi

h po

p t

o ezy

y o roz

ro kładz

a ie

e Gau

G s

um sa.

bel

a.

Pun

u k

n ty

y odp

o ow

dp

i

ow ada

a j

da ąc

ą e

e wa

w r

a t

r oś

o ciom

o zmienn

e ej

nn los

o ow

o e

w j

e znaj

na duj

d ą się

ę wew

w

ną

ew t

ną rz

r ob

o r

b z

r aru

ar

u ufno

n ś

o ci

dla =0

b= .9

0. 5

9

Kształty

y dy

d s

y try

r b

y u

b a

u n

a t

n y

y teo

e r

o et

r yc

y znej

n i em

e pi

p ry

r c

y znej

n są

ą podo

po bn

do e.

bn

Szacowan

ow i

an a

a gr

g a

r f

a iczne

n

e dał

d y

y podo

po bn

do e

bn wy

w ni

y ki do

d

o szacowań

ow

ań pu

p n

u k

n towy

ow c

y h.

h

890

1 103

