background image

Łukasz  Nykiel st_MP_d08

             

 ROZKŁAD GAUSSA (NORMALNY)

    Opracowanie danych statystycznych metodą graficzną

1. Wprowadzenie i obróbka danych:

dane

READPRN "dane08.txt"

(

)



data

dane

T



data

data

1

 



n

length data

(

)



n

30

i

0 n

1





data

sort data

(

)



2.Określenie prawdopodobieństwa z próby

p

i

i

1

(

)

n

1

(

)



3. Oszacowanie punktowe:
     - średnia i mediana
     - odchylenie standardowe skorygowane i nieskorygowane

μ

mean data

(

)



μ

471.95

σ

Stdev data

(

)



σ

198.864

Σ

stdev data

(

)



Σ

195.522

M

median data

(

)



M

434.3

background image

WNIOSEK 1: Ponieważ średnia  nie jest  równa medianie więc hipoteza o rozkładzie normalnym 
                    może  być fałszywa..

4. Obliczenie standaryzowanych wartości zmiennej zależnej (określenie miana osi rzędnych):

y

i

qnorm p

i

0

 1





5. Obliczenie współczynników prostej regresji y = a + b * x :

a

intercept data y



(

)



a

2.138

b

slope data y



(

)



b

4.531

10

3

6. Obliczenie parametrów rozkładu:

μ

1

a
b







σ

1

1
b



μ

1

471.95

σ

1

220.696

7. Porównanie z oszacowaniem punktowym:

0

200

400

600

800

1 10

3

0

0.2

0.4

0.6

0.8

1

p

data

background image

0

200

400

600

800

1 10

3

2

1

0

1

2

y

data

WNIOSEK 2: Oszacowanie graficzne i punktowe dają nieznacznie różniące się wyniki. 

8. Wykres:

u

i

data

i



pr x

( )

a

b x



120

198

276

354

432

510

588

666

744

822

900

2

1

0

1

2

y

i

pr x

( )

u

i

x



x

0 1100





9. Sprawdzenie obliczeń według wzorów z wykładu:

m

0

n 1

i

u

i

 

2



k

0

n 1

i

y

i



l

0

n 1

i

u

i



o

0

n 1

i

u

i

y

i

 



t

n m

l

2



as

m k

l o

t



as

2.138

as

2.138

bs

n o

k l


t



bs

4.531

10

3

bs

4.531

10

3

background image

μ

s

as
bs







μ

s

471.95

σ

s

1

bs



σ

s

220.696

μ

471.95

σ

198.864

WNIOSEK 3: Wynik zgodny z obliczeniami wykorzystującymi funkcje MathCad'a. 

10. Testy zgodności

10.1. Test w

2

pt

i

pnorm u

i

μ

 σ





wt

n

1
n

i

2

i

1

(

)

1

[

] ln pt

i

 

2

n

i

1

(

)

[

]

1

[

] ln 1

pt

i







wt

0.507

Wartość krytyczna statystyki w

2

 na poziomie istotności 

 = 0.05 wynosi wk=2.4933

WNIOSEK 4: Wartość testowa Wt = 

0.507

 < od wartości krytycznej 2.4933

               Hipotezy o rozkładzie normalnym na poziomie 

 = 0.05 odrzucić nie można. 

dn

READPRN "DN.txt"

(

)



10.2. Test Kołmogorowa-Smirnowa

delta

i

p

i

pt

i



dt

max delta

(

)



dt

0.111

dk

dn

n 1

(

)



dk

0.242

Wartość krytyczna statystyki Dn na poziomie istotności 

 = 0.05 wynosi dk= 0.242

WNIOSEK 5: Wartość testowa 

0.111

 < od wartości krytycznej 0.242

                     Hipotezy o rozkładzie normalnym na poziomie 

 = 0.05 odrzucić nie można. 

10.3. Test 

2

ω

t

1

12 n

i

delta

i

 

2



ω

t

0.09236

Wartość krytyczna statystyki 

2

 na poziomie istotności 

 = 0.05 wynosi k=0.9814

WNIOSEK 6: Wartość testowa 

0.09236

 < od wartości krytycznej 0.4614

                    Hipotezy o rozkładzie normalnym na poziomie 

 = 0.05 odrzucić nie można. 

11. Oszacowania przedziałowe
      - obliczenie przedziałów ufności dla wartości oczekiwanej rozkładu na poziomie ufności 0.95

β

0.95



α

1

β



n

30

background image

μ

d

μ

qt 1

α
2

n

1







n

σ



μ

d

397.693

μ

g

μ

qt 1

α
2

n

1







n

σ



μ

g

546.207

obliczenie przedziału ufnosci dla odchylenia standardowego na poziomie ufności 0.95

σ

d

σ

2

n

1

(

)

qchisq 1

α
2

n

1









σ

d

158.377

σ

g

σ

2

n

1

(

)

qchisq

α
2

n

1









σ

g

267.337

12. Wynik końcowy:

μ

d

397.693

<

μ

471.95

<

μ

g

546.207

σ

d

158.377

<

σ

198.864

<

σ

g

267.337

13. Obliczenie dwustronnych obszarów ufności dla dystrybuanty i wykres końcowy:

β

1

0.95

2



m1

i

2

n

i

(

)



m2

i

2

i

1

(

)



Fd

i

qF β m1

i



m2

i





Fg

i

qF β m2

i



m1

i





Fdd

i

1

1

n

i

i

1

(

)

Fd

i







Fdg

i

Fg

i

n

i

i

1





Fg

i



yd

i

qnorm Fdd

i

0

 1





yg

i

qnorm Fdg

i

0

 1





pr x

( )

a

b x



x

min u

( ) max u

( )





background image

120

198

276

354

432

510

588

666

744

822

900

2.4

1.6

0.8

0

0.8

1.6

2.4

pr x

( )

y

i

yd

i

yg

i

x u

i

 u

i

 u

i



13. Obliczenie granic obszaru ufności dla prostej regresji i wynik końcowy.

Wprowadzamy nową zmienną

v

y

a


b



co w praktyce jest równoznaczne z określeniem odciętych punktów powstałych z przecięcia
prostych równoległych do osi odciętych przechodzących przez punkty pomiarowe z prostą re-
gresji. Używając tych samych wzorów (na yd

i yg

i

 )

 

jak powyżej otrzymamy granice obszaru

ufności prostej regresji. Wzorów na yd

oraz yg

nie trzeba przytaczać raz jeszcze - gdy spo-

rządzając wykres zmieni się u

i

 na u1

i ,

obliczenia zostaną powtórzone dla nowej zmiennej nie-

zależnej automatycznie.

x

0 46.5



900





background image

0

90

180

270

360

450

540

630

720

810

900

2.4

1.8

1.2

0.6

0

0.6

1.2

1.8

2.4

y

i

pr x

( )

yd

i

yg

i

u

i

x

 v

i

 v

i



14. Wykres funkcji Gaussa o obliczonych parametrach

Należy wykreślić:
- teoretyczną dystrybuantę rozkładu F(x)
- teoretyczną krzywą gęstości prawdopodobieństwa f(x)
- empiryczną dystrybuantę rozkładu 
- na dystrybuantę teoretczną nanieść punkty o rzędnej yy

i

 

F x

( )

pnorm x μ

 σ



(

)



f x

( )

dnorm x μ

 σ



(

)



x

100

1100





min u

( )

159.8

max u

( )

847.4

background image

100

10

120

230

340

450

560

670

780

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

F x

( )

f x

( ) 10

p

i

x x

 u

i



15. Wnioski końcowe

Wyniki przeprowadzonych testów na poziomie ufności 

=0.95 wskazują, że nie można

odrzucić hipotezy o rozkładzie Gaussa. 

Punkty odpowiadające wartościom zmiennej losowej znajdują się wewnątrz obrzaru ufności
dla 

=0.95

Kształty dystrybuanty teoretycznej i empirycznej są podobne. 

Szacowania graficzne dały podobne wyniki do szacowań punktowych. 

Wyniki przeprowadzonych testów na poziomie ufności b=0.95 wskazują, że nie można
odrzucić hipotezy o rozkładzie Gumbela. 

Punkty odpowiadające wartościom zmiennej losowej znajdują się wewnątrz obrzaru ufności
dla b=0.95

Kształty dystrybuanty teoretycznej i empirycznej są podobne. 

Szacowania graficzne dały podobne wyniki do szacowań punktowych. 

background image

890

1 10

3