Założenia Gaussa-Markowa
•Związek pomiędzy zmienną objaśnianą y a zmiennymi objaśniającymi x , x ,K, x ma charakter liniowy 1
2
k
•W
• a
W rto
t ści
c
i z
mi
m e
i nnyc
y h o
bja
j śnia
i ją
j cyc
y h s
ą u
sta
t lo
l ne (
nie
i s
ą l
o
l sowe)
.
•Składniki losowe ε dla poszczególnych wartości zmiennych objaśniających mają rozkład normalny o wartości oczekiwanej zero i stałej wariancji N ( , 0 δε )
•Składniki losowe nie są ze sobą skorelowane.
© Barbara Gładysz
Test normalności (test 6 – Davida-Hellwiga).
H : Składnik losowy ma rozkład ma rozkład normalny N ( ; 0 S )
0
ε
1) Konstruujemy cele, dzieląc odcinek [0,1] na n rozłącznych odcinków o długości 1/n.
2) Wyznaczamy wartości dystrybuanty hipotetycznej reszt modelu F(e ) i sprawdzamy, i
do których cel wpadają.
3) Wyznaczamy liczbę pustych cel k Obszar krytyczny testu jest dwustronny [0 , k ] U [k , n-1]
1
2
© Barbara Gładysz
Zużycie
surowca
x
y
1
8
2
13
yˆ = 7,4 + 1
,
2 4 ⋅ x
3
14
4
17
25
5
18
6
20
20
7
22
15
ciewrous 10
5
0
0
1
2
3
4
5
6
7
8
produkcja
© Barbara Gładysz
,
2 4 ⋅ x
Produkcja
Zużycie
Przewidywane
Reszty
Surowca
zużycie
surowca
Rozkład reszt
x
y
yê
2
1
8
9,57
-1,57
1
0
2
13
11,71
1,29
-1 0
2
4
6
8
3
14
13,86
0,14
-2
4
17
16,00
1,00
produkcja
5
18
18,14
-0,14
6
20
20,29
-0,29
7
22
22,43
-0,43
© Barbara Gładysz
Produkcja
Zużycie
Przewidywane
Reszty
reszty.
Dystrybuanta
Nr celi
Surowca
zużycie
surowca
e
e
=
e
F
x
y
yê
S
0
,
1 2
ε
Sε
1
8
9,57
-1,57
-1,65
0,049
1
2
13
11,71
1,29
1,35
0,912
7
3
14
13,86
0,14
0,15
0,56
4
4
17
16,00
1,00
1,05
0,853
6
5
18
18,14
-0
- ,14
-0
- ,15
0,44
4
6
20
20,29
-0,29
-0,30
0,382
3
7
22
22,43
-0,43
-0,45
0,326
3
1,001
0,858
0,715
tana 0,572
ub
try 0,429
syd 0,286
0,143
0
0
1
2
3
4
5
6
7
8
produkcja
© Barbara Gładysz
H : Składnik losowy ma rozkład ma rozkład normalny N ( , 0
1.02)
0
Liczba pustych cel: k=2
Dla α=0,05
Obszar krytyczny:
[0] U [4 , 6]
K=2 ∉ [0] U [4 , 6]
Nie ma podstaw do odrzucamy hipotezy H 0
© Barbara Gładysz
Test normalności dla dużej liczby obserwacji TEST 2
χ
H : Składnik losowy ma rozkład ma rozkład normalny N ( ; 0 S )
0
ε
r
2
(
)
2
χ = ∑ n n p
i −
⋅ i
2
- rozkład χ ( r − )
1
1
n p
i=
⋅ i
,r - liczba klas szeregu rozdzielczego, n
- ilość obserwacji w i-tej klasie, ni ≥
)
8
(
5
i
p
-prawdopodobieństwo hipotetyczne zaobserwowania wartości składnika losowego i
-w i-tej klasie.
Obszar krytyczny
© Barbara Gładysz
2
n
n
n p
Φ( xi ) p = Φ x − Φ x n ⋅
( i
i )
p
i
( i) ( i)
i
i
Klasa : od
do
n ⋅ pi
(−∞) -0,54903 16 0,290175 0,290175
15,08911
0,054989
-0,54903
0,254428
15
0,59292
0,302745
15,74273
0,035042
0,254428
1,05788
12
0,845346
0,252426
13,12617
0,096621
(+ ∞)
1,05788
7
1
0,154654
8,04199
0,135009
SUMA=
0,32166
© Barbara Gładysz
reszty
reszty
reszty
stand.
ni
stand.
ni
stand.
ni
stand.
ni
-1,94
-0,52
0,26
1,33
-1,90
-0,47
0,27
1,34
-1,75
-0,47
0,29
1,45
-1,22
-0,39
0,29
1,63
-1,12
-0,33
0,30
1,77
-0,97
-0,28
0,45
2,15
-0,88
-0,26
0,73
2,54
7
-0,86
-0,18
0,86
-0,83
-0,18
0,93
-0,
0 79
7
-0,
0 14
1
0,
0 96
9
Std. składniki resztowe
-0,73
0,08
1,02
-0,66
0,09
1,07
12
3
2,25
-0,63
0,16
1,5
-0,62
0,19
0,75
-0,60
0,24
15
0
-0,55
16
0
10
20
30
40
50
60
-0,75
-1,5
-2,25
© Barbara Gładysz
Test normalności dla dużej liczby obserwacji TEST 2
χ
H : Składnik losowy ma rozkład ma rozkład normalny N ( ; 0 S )
0
ε
r
( n
n p
i −
⋅ )2
2
χ = ∑
i
∑
= 3
,
0 2
2 (
)
- rozkład χ ( r −1
n p
i=
⋅
1
n
i
3
,
0 2
2
< χα (2) = 9
,
5 91
Nie ma podstaw do odrzucamy hipotezy H 0
© Barbara Gładysz
Symetria składnika losowego.
(test 12).
1
H : p+ =
0
2
1
H : p+ ≠
1
2
m
1
−
n
2
t =
rozkła
ł d t
-
t St
S u
t denta
t t(n-
n 1)
1
m
m
1 −
n
n
n −1
gdzie:
m – liczba dodatnich reszty modelu, n- liczba obserwacji.
Obszar krytyczny
© Barbara Gładysz
H : p+ =
Rozkład reszt
0
2
2
1
H : p
1
+ ≠
1
2
0
-1 0
2
4
6
8
m
1
3
1
−
−
-2
produkcja
n
2
7
2
t =
=
= 3
,
0 5
m
m
3
3
1−
1−
n
n
7
7
n −1
7 −1
t = 3
,
0 5 < t
=
0,05 (6)
Obszar krytyczny
,
2 45
Nie ma podstaw do odrzucamy hipotezy H 0
Reszty są symetryczne
© Barbara Gładysz
Losowość reszt modelu (test 3 - Liczby serii).
H :
Reszty modelu są losowe
0
1) Porządkujemy reszty chronologicznie lub według rosnących wartości pe
p w
e n
w e
n j
e
j zmie
i n
e n
n e
n j
e
j ob
o j
b a
j ś
a ni
n a
i j
a ą
j ce
ą
j
ce .
j
2) Wyznaczamy liczbę serii L reszt tych samych znaków.
Obszar krytyczny testu jest dwustronny [2 , l ] U [l , n]
1
2
Statystyka L ma asymptotyczny rozkład normalny
2 ⋅ m ⋅ ( n − m) 2 ⋅ m ⋅ ( n − m)⋅ (2 ⋅ m ⋅ ( n − m) − n)
N
+ ,
1
2
n
n ⋅ ( n − )
1
© Barbara Gładysz
1
H : Reszty modelu są losowe 0
0
-1 0
2
4
6
8
-2
produkcja
Liczbę serii L = 3
Dla α=0,05
Obszar krytyczny:
[-] U [7]
L=3 ∉ [-] U [7]
Nie ma podstaw do odrzucamy hipotezy H 0
© Barbara Gładysz