ROZKŁAD GAUSSA (NORMALNY) Opracowanie danych statystycznych metodą graficzną 1. Wprowadzenie i obróbka danych: dane READPRN("dane08.txt" ) data
daneT
data data 1
n length(data)
n 30
i 0 n 1
data sort(data)
2.Określenie prawdopodobieństwa z próby (i 1)
p
i
(n 1)
3. Oszacowanie punktowe:
- średnia i mediana
- odchylenie standardowe skorygowane i nieskorygowane μ mean(data)
μ 471.95
σ Stdev(data)
σ 198.864
Σ stdev(data)
Σ 195.522
M median(data)
M 434.3
WNIOSEK 1: Ponieważ średnia nie jest równa medianie więc hipoteza o rozkładzie normalnym może być fałszywa..
4. Obliczenie standaryzowanych wartości zmiennej zależnej (określenie miana osi rzędnych): y qnorm p 0
1
i
i
5. Obliczenie współczynników prostej regresji y = a + b * x : a intercept(data y
)
a 2.138
b slope(data y
)
3
b 4.531 10
6. Obliczenie parametrów rozkładu:
a
1
μ1
σ1
b
b
μ1 471.95
σ1 220.696
7. Porównanie z oszacowaniem punktowym: 1
0.8
0.6
p
0.4
0.2
0
0
200
400
600
800
1 103
data
1
y
0
1
2
0
200
400
600
800
1 103
data
WNIOSEK 2: Oszacowanie graficzne i punktowe dają nieznacznie różniące się wyniki.
8. Wykres:
u data
pr(x) a b x
i
i
x 0 1100
2
1
yi
0
pr(x)
1
2
120
198
276
354
432
510
588
666
744
822
900
ui x
9. Sprawdzenie obliczeń według wzorów z wykładu: n1
n1
n1
n1
2
m
u
2
k
y
l
u
o
u y
t n m l
i
i
i
i
i
i 0
i 0
i 0
i 0
m k l o
as
as 2.138
as 2.138
t
n o k l
3
3
bs
bs 4.531 10
bs 4.531 10
t
1
μs
μs 471.95
σs
σs 220.696
bs
bs
μ 471.95
σ 198.864
WNIOSEK 3: Wynik zgodny z obliczeniami wykorzystującymi funkcje MathCad'a.
10. Testy zgodności
10.1. Test w2
pt pnorm u
i
i μ
σ
1
wt n
[
2 (i 1) 1] ln pt
[2 [n (i 1)] 1] ln 1 pt
n
i
i
i
wt 0.507
Wartość krytyczna statystyki w2 na poziomie istotności = 0.05 wynosi wk=2.4933
WNIOSEK 4: Wartość testowa Wt = 0.507 < od wartości krytycznej 2.4933
Hipotezy o rozkładzie normalnym na poziomie = 0.05 odrzucić nie można.
dn READPRN("DN.txt" ) 10.2. Test Kołmogorowa-Smirnowa delta p pt
dt max(delta)
dt 0.111
dk dn
dk 0.242
i
i
i
(n1)
Wartość krytyczna statystyki Dn na poziomie istotności = 0.05 wynosi dk= 0.242
WNIOSEK 5: Wartość testowa 0.111 < od wartości krytycznej 0.242
Hipotezy o rozkładzie normalnym na poziomie = 0.05 odrzucić nie można.
10.3. Test 2
1
ωt
delta
2
ωt 0.09236
12 n
i
i
Wartość krytyczna statystyki 2 na poziomie istotności = 0.05 wynosi k=0.9814
WNIOSEK 6: Wartość testowa 0.09236 < od wartości krytycznej 0.4614
Hipotezy o rozkładzie normalnym na poziomie = 0.05 odrzucić nie można.
11. Oszacowania przedziałowe
- obliczenie przedziałów ufności dla wartości oczekiwanej rozkładu na poziomie ufności 0.95
β 0.95
α 1 β
n 30
α
qt1
n
1
2
μd μ
σ
μd 397.693
n
α
qt1
n
1
2
μg μ
σ
μg 546.207
n
- obliczenie przedziału ufnosci dla odchylenia standardowego na poziomie ufności 0.95
2
σ (n 1)
σd
σd 158.377
α
qchisq1
n
1
2
2
σ (n 1)
σg
α
σg 267.337
qchisq
n
1
2
12. Wynik końcowy:
μd 397.693
<
μ 471.95
< μg 546.207
σd 158.377 <
σ 198.864
<
σg 267.337
13. Obliczenie dwustronnych obszarów ufności dla dystrybuanty i wykres końcowy: 1 0.95
β
m1 2 (n i)
m2 2 (i 1)
2
i
i
Fd qF
m2
Fg qF
m1
i
β m1i
i
i
β m2i
i
1
Fgi
Fdd
Fdg
i
n i
i
n i
1
Fd
Fg
(i 1)
i
i 1
i
yd qnorm Fdd 0
1
yg qnorm Fdg 0
1
i
i
i
i
pr(x) a b x
x min(u) max(u)
1.6
pr(x) 0.8
yi
0
ydi
ygi 0.8
1.6
2.4120
198
276
354
432
510
588
666
744
822
900
x u
i u
i u
i
13. Obliczenie granic obszaru ufności dla prostej regresji i wynik końcowy.
Wprowadzamy nową zmienną
y a
v
b
co w praktyce jest równoznaczne z określeniem odciętych punktów powstałych z przecięcia prostych równoległych do osi odciętych przechodzących przez punkty pomiarowe z prostą regresji. Używając tych samych wzorów (na ydi i ygi ) jak powyżej otrzymamy granice obszaru ufności prostej regresji. Wzorów na ydi oraz ygi nie trzeba przytaczać raz jeszcze - gdy spo-rządzając wykres zmieni się ui na u1i ,obliczenia zostaną powtórzone dla nowej zmiennej nie-zależnej automatycznie.
x 0 46.5
900
1.8
1.2
yi
0.6
pr(x)
0
ydi
yg 0.6
i
1.2
1.8
2.40
90
180
270
360
450
540
630
720
810
900
ui x
v
i v
i
14. Wykres funkcji Gaussa o obliczonych parametrach Należy wykreślić:
- teoretyczną dystrybuantę rozkładu F(x)
- teoretyczną krzywą gęstości prawdopodobieństwa f(x)
- empiryczną dystrybuantę rozkładu
- na dystrybuantę teoretczną nanieść punkty o rzędnej yyi F(x) pnorm(x μ
σ
)
f (x) dnorm(x μ
σ
)
x 100
1100
min(u) 159.8
max(u) 847.4
0.9
0.8
0.7
F(x) 0.6
f(x)100.5
pi
0.4
0.3
0.2
0.1
0
100
10
120
230
340
450
560
670
780
x x
u
i
15. Wnioski końcowe
Wy
W n
y i
n ki prz
przep
e ro
pr w
o a
w dz
adzon
o y
n c
y h
h tes
te tów
ó
w na
n
a po
p z
o iom
omie
e uf
u noś
fności =0
b
.9
=0 5
.9
5 ws
w kaz
a uj
ują, ż
ą, że
e ni
n e
e moż
o na
n
od
o rz
d ucić hi
h po
p t
o ezy
y o roz
ro kładz
a ie
e Gau
G s
um sa.
bel
a.
Pun
u k
n ty
y odp
o ow
dp
i
ow ada
a j
da ąc
ą e
e wa
w r
a t
r oś
o ciom
o zmienn
e ej
nn los
o ow
o e
w j
e znaj
na duj
d ą się
ę wew
w
ną
ew t
ną rz
r ob
o r
b z
r aru
ar
u ufno
n ś
o ci
dla =0
b= .9
0. 5
9
Kształty
y dy
d s
y try
r b
y u
b a
u n
a t
n y
y teo
e r
o et
r yc
y znej
n i em
e pi
p ry
r c
y znej
n są
ą podo
po bn
do e.
bn
Szacowan
ow i
an a
a gr
g a
r f
a iczne
n
e dał
d y
y podo
po bn
do e
bn wy
w ni
y ki do
d
o szacowań
ow
ań pu
p n
u k
n towy
ow c
y h.
h
1 103