Łukasz Nykiel st_MP_d08
ROZKŁAD GAUSSA (NORMALNY)
Opracowanie danych statystycznych metodą graficzną
1. Wprowadzenie i obróbka danych:
dane
READPRN "dane08.txt"
(
)
data
dane
T
data
data
1
n
length data
(
)
n
30
i
0 n
1
data
sort data
(
)
2.Określenie prawdopodobieństwa z próby
p
i
i
1
(
)
n
1
(
)
3. Oszacowanie punktowe:
- średnia i mediana
- odchylenie standardowe skorygowane i nieskorygowane
μ
mean data
(
)
μ
471.95
σ
Stdev data
(
)
σ
198.864
Σ
stdev data
(
)
Σ
195.522
M
median data
(
)
M
434.3
WNIOSEK 1: Ponieważ średnia nie jest równa medianie więc hipoteza o rozkładzie normalnym
może być fałszywa..
4. Obliczenie standaryzowanych wartości zmiennej zależnej (określenie miana osi rzędnych):
y
i
qnorm p
i
0
1
5. Obliczenie współczynników prostej regresji y = a + b * x :
a
intercept data y
(
)
a
2.138
b
slope data y
(
)
b
4.531
10
3
6. Obliczenie parametrów rozkładu:
μ
1
a
b
σ
1
1
b
μ
1
471.95
σ
1
220.696
7. Porównanie z oszacowaniem punktowym:
0
200
400
600
800
1 10
3
0
0.2
0.4
0.6
0.8
1
p
data
0
200
400
600
800
1 10
3
2
1
0
1
2
y
data
WNIOSEK 2: Oszacowanie graficzne i punktowe dają nieznacznie różniące się wyniki.
8. Wykres:
u
i
data
i
pr x
( )
a
b x
120
198
276
354
432
510
588
666
744
822
900
2
1
0
1
2
y
i
pr x
( )
u
i
x
x
0 1100
9. Sprawdzenie obliczeń według wzorów z wykładu:
m
0
n 1
i
u
i
2
k
0
n 1
i
y
i
l
0
n 1
i
u
i
o
0
n 1
i
u
i
y
i
t
n m
l
2
as
m k
l o
t
as
2.138
as
2.138
bs
n o
k l
t
bs
4.531
10
3
bs
4.531
10
3
μ
s
as
bs
μ
s
471.95
σ
s
1
bs
σ
s
220.696
μ
471.95
σ
198.864
WNIOSEK 3: Wynik zgodny z obliczeniami wykorzystującymi funkcje MathCad'a.
10. Testy zgodności
10.1. Test w
2
pt
i
pnorm u
i
μ
σ
wt
n
1
n
i
2
i
1
(
)
1
[
] ln pt
i
2
n
i
1
(
)
[
]
1
[
] ln 1
pt
i
wt
0.507
Wartość krytyczna statystyki w
2
na poziomie istotności
= 0.05 wynosi wk=2.4933
WNIOSEK 4: Wartość testowa Wt =
0.507
< od wartości krytycznej 2.4933
Hipotezy o rozkładzie normalnym na poziomie
= 0.05 odrzucić nie można.
dn
READPRN "DN.txt"
(
)
10.2. Test Kołmogorowa-Smirnowa
delta
i
p
i
pt
i
dt
max delta
(
)
dt
0.111
dk
dn
n 1
(
)
dk
0.242
Wartość krytyczna statystyki Dn na poziomie istotności
= 0.05 wynosi dk= 0.242
WNIOSEK 5: Wartość testowa
0.111
< od wartości krytycznej 0.242
Hipotezy o rozkładzie normalnym na poziomie
= 0.05 odrzucić nie można.
10.3. Test
2
ω
t
1
12 n
i
delta
i
2
ω
t
0.09236
Wartość krytyczna statystyki
2
na poziomie istotności
= 0.05 wynosi k=0.9814
WNIOSEK 6: Wartość testowa
0.09236
< od wartości krytycznej 0.4614
Hipotezy o rozkładzie normalnym na poziomie
= 0.05 odrzucić nie można.
11. Oszacowania przedziałowe
- obliczenie przedziałów ufności dla wartości oczekiwanej rozkładu na poziomie ufności 0.95
β
0.95
α
1
β
n
30
μ
d
μ
qt 1
α
2
n
1
n
σ
μ
d
397.693
μ
g
μ
qt 1
α
2
n
1
n
σ
μ
g
546.207
-
obliczenie przedziału ufnosci dla odchylenia standardowego na poziomie ufności 0.95
σ
d
σ
2
n
1
(
)
qchisq 1
α
2
n
1
σ
d
158.377
σ
g
σ
2
n
1
(
)
qchisq
α
2
n
1
σ
g
267.337
12. Wynik końcowy:
μ
d
397.693
<
μ
471.95
<
μ
g
546.207
σ
d
158.377
<
σ
198.864
<
σ
g
267.337
13. Obliczenie dwustronnych obszarów ufności dla dystrybuanty i wykres końcowy:
β
1
0.95
2
m1
i
2
n
i
(
)
m2
i
2
i
1
(
)
Fd
i
qF β m1
i
m2
i
Fg
i
qF β m2
i
m1
i
Fdd
i
1
1
n
i
i
1
(
)
Fd
i
Fdg
i
Fg
i
n
i
i
1
Fg
i
yd
i
qnorm Fdd
i
0
1
yg
i
qnorm Fdg
i
0
1
pr x
( )
a
b x
x
min u
( ) max u
( )
120
198
276
354
432
510
588
666
744
822
900
2.4
1.6
0.8
0
0.8
1.6
2.4
pr x
( )
y
i
yd
i
yg
i
x u
i
u
i
u
i
13. Obliczenie granic obszaru ufności dla prostej regresji i wynik końcowy.
Wprowadzamy nową zmienną
v
y
a
b
co w praktyce jest równoznaczne z określeniem odciętych punktów powstałych z przecięcia
prostych równoległych do osi odciętych przechodzących przez punkty pomiarowe z prostą re-
gresji. Używając tych samych wzorów (na yd
i
i yg
i
)
jak powyżej otrzymamy granice obszaru
ufności prostej regresji. Wzorów na yd
i
oraz yg
i
nie trzeba przytaczać raz jeszcze - gdy spo-
rządzając wykres zmieni się u
i
na u1
i ,
obliczenia zostaną powtórzone dla nowej zmiennej nie-
zależnej automatycznie.
x
0 46.5
900
0
90
180
270
360
450
540
630
720
810
900
2.4
1.8
1.2
0.6
0
0.6
1.2
1.8
2.4
y
i
pr x
( )
yd
i
yg
i
u
i
x
v
i
v
i
14. Wykres funkcji Gaussa o obliczonych parametrach
Należy wykreślić:
- teoretyczną dystrybuantę rozkładu F(x)
- teoretyczną krzywą gęstości prawdopodobieństwa f(x)
- empiryczną dystrybuantę rozkładu
- na dystrybuantę teoretczną nanieść punkty o rzędnej yy
i
F x
( )
pnorm x μ
σ
(
)
f x
( )
dnorm x μ
σ
(
)
x
100
1100
min u
( )
159.8
max u
( )
847.4
100
10
120
230
340
450
560
670
780
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
F x
( )
f x
( ) 10
p
i
x x
u
i
15. Wnioski końcowe
Wyniki przeprowadzonych testów na poziomie ufności
=0.95 wskazują, że nie można
odrzucić hipotezy o rozkładzie Gaussa.
Punkty odpowiadające wartościom zmiennej losowej znajdują się wewnątrz obrzaru ufności
dla
=0.95
Kształty dystrybuanty teoretycznej i empirycznej są podobne.
Szacowania graficzne dały podobne wyniki do szacowań punktowych.
Wyniki przeprowadzonych testów na poziomie ufności b=0.95 wskazują, że nie można
odrzucić hipotezy o rozkładzie Gumbela.
Punkty odpowiadające wartościom zmiennej losowej znajdują się wewnątrz obrzaru ufności
dla b=0.95
Kształty dystrybuanty teoretycznej i empirycznej są podobne.
Szacowania graficzne dały podobne wyniki do szacowań punktowych.
890
1 10
3