mp2 rozd3 id 781669 Nieznany

background image

25

3. ESTYMACJA PRZEDZIAŁOWA

3.1. Pojęcia podstawowe


Niech jak zwykle dana jest próbka

)

...,

,

(

1

n

x

x

x

z rozkładu absolutnie ciągłego

P

, dla którego parametr

R

jest nieznany. Do tej pory zajmowaliśmy esty-

macją punktową parametru nieznanego

, tj. wyznaczeniem liczby (estymatora), któ-

rą w pewnym sensie można zastąpić prawdziwą wartość parametru.

Istnieje inne podejście do estymacji, przy którym wyznacza się przedział pokry-

wający parametr z danym z góry prawdopodobieństwem. Wskazane podejście nazy-
wa się estymacją przedziałową. Zauważmy najpierw, że im większa jest pewność te-
go, iż znaleziony przedział pokrywa wartość prawdziwą parametru, tym większa jest
długość tego przedziału. Więc marzenia o znalezieniu przedziału pokrywającego pa-
rametr z prawdopodobieństwem 1 nigdy nie będą spełnione. Mianowicie,

z praw-

dopodobieństwem 1 znajduje się w obszarze

.

Definicja 1.

Niech

1

0

. Przedział

))

,

(

);

,

(

(

)

;

(

x

x

nazywa się

dokładnym przedziałem ufności dla parametru

z poziomem ufności

1

, gdy dla

dowolnego

mamy

1

}

{

P

.

Definicja 2. Niech

1

0

. Przedział

))

,

(

);

,

(

(

)

;

(

x

x

nazywa się

asymptotycznie dokładnym przedziałem ufności dla parametru

z (asymptotycznym)

poziomem ufności

1

, gdy dla dowolnego

mamy

1

}

{

inf

lim

P

n

.

W definicji 2 w rzeczywistości chodzi oczywiście nie o jeden przedział, lecz o

ciąg przedziałów zależnych od liczności próbki n.

Uwaga 1. Granicy przedziału

)

;

(

są losowe. Dlatego o prawdopodobień-

stwie

}

{

P

mówimy, iż jest to prawdopodobieństwo tego, że przedział

)

;

(

pokrywa parametr

, lecz nie prawdopodobieństwo tego, że

leży w tym

przedziale.

Na początku przeanalizujemy trzy przykłady, w których zbadamy sposoby es-

tymacji. Później postaramy się uzyskać z tych przykładów pewną ogólną filozofię
budowy dokładnych oraz asymptotycznie dokładnych przedziałów ufności. Zacznie-
my od najczęściej stosowanego w praktyce rozkładu normalnego.

background image

26

Przykład 1. Niech

n

x

x ...,

,

1

będzie próbką o liczności n z rozkładu normalnego

2

, 

a

N

, gdzie

R

a

jest parametrem nieznanym, natomiast parametr

0

jest zna-

ny. Należy zbudować PU dla parametru a na poziomie ufności

1

.

Zauważmy, że rozkład normalny jest stabilny względem sumowania, czyli za-

chodzi następująca własność

Własność 1. Niech ZL

1

ma rozkład normalny

2

1

1

, 

a

N

, ZL

2

ma rozkład

normalny

2
2

2

, 

a

N

i ZL te są niezależne. Wówczas ZL

d

c

b

2

1

ma rozkład

normalny z parametrami

d

ca

ba

2

1

E

,

2

2

2

2

1

2

c

b

D

.

Mamy stąd, że

n

i

i

x

1

ma rozkład

2

, 

n

na

N

,

na

x

n

i

i

1

ma rozkład

2

,

0

n

N

,

n

na

x

n

i

i

1

ma rozkład

1

,

0

N

.

Wynika stąd, że ZL

a

x

n

spełnia rozkład normalny standaryzowany.

Zakładając, że dana jest liczba

)

1

;

0

(

, znajdziemy taką liczbę

0

c

, że

1

}

{

c

c

P

(patrz rys. 3.1). Liczba c jest kwantylem rzędu

2

1 

rozkładu

normalnego standaryzowanego:

1

1

)

(

2

))

(

1

(

)

(

)

(

)

(

}

{

1

,

0

1

,

0

1

,

0

1

,

0

1

,

0

c

c

c

c

c

c

c

P

,

czyli

2

1

)

(

1

,

0

c

.

-3

-2

-1

0

1

2

3

ℇ/2

ℇ/2

Rys. 3.1

ℇ/2

ℇ/2

background image

27

Definicja 3. Niech rozkład

P

o dystrybuancie F jest absolutnie ciągły. Liczba

nazywa się kwantylem rzędu

rozkładu

P

, gdy

)

(

F

. Jeżeli funkcja F jest

ostro monotoniczna, to kwantyl określa się jednoznacznie.

Wówczas

2

1 

c

, czyli

2

c

(kwantyle rozkładu normalnego standary-

zowanego).

Rozwiązując nierówność

c

c

względem a, otrzymujemy dokładny prze-

dział ufności

n

c

x

a

n

c

x

c

a

x

n

c

c

c

a

a

a

P

P

P

}

{

1

.

Możemy tu podstawić

2

1 

c

:

1

2

1

2

1

n

x

a

n

x

a

P

.

Ostatecznie szukany przedział ufności na poziomie ufności

1

ma postać



n

x

n

x

2

1

2

1

;

.

Przykład 2. Niech

n

x

x ...,

,

1

będzie próbką o liczności n z rozkładu wykładni-

czego

E

, gdzie

0

. Należy zbudować asymptotycznie dokładny PU dla parame-

tru

na poziomie ufności

1

.

Wspominamy CTG:

)

1

(

1

1

1

1

1

x

n

x

n

x

n

x

n

x

n

i

i

D

E

,

gdzie ZL

ma rozkład normalny standaryzowany. Według definicji słabej zbieżno-

ści przy

n

mamy

1

}

{

)

1

(

c

c

c

x

n

c

P

P

, gdy

2

1 

c

.

Tj.

1

1

1

)

1

(

2

1

2

1

2

1

2

1

x

n

x

x

n

x

x

n

P

P

,

gdy

n

.

Ostatecznie asymptotycznie dokładny PU na poziomie ufności

1

ma postać



n

x

x

n

x

x

2

1

2

1

1

;

1

.


background image

28

Sformułujemy ogólną zasadę budowy dokładnych PU:

1.

Znaleźć funkcję

)

,

(

x

G

, której rozkład

P

nie zależy od parametru

.

Jest konieczne, by

)

,

(

x

G

miała funkcję odwrotną względem

dla do-

wolnego ustalonego x.

2.

Niech liczby

1

g

i

2

g

są kwantylami rozkładu

P

, takimi że

}

)

,

(

{

1

2

1

g

G

g

x

P

.

3.

Rozwiązując nierówność

2

1

)

,

(

g

G

g

x

względem

, otrzymujemy

dokładny PU.

Analogicznie wygląda zasada ogólna budowy asymptotycznie dokładnych PU:

1.

Znaleźć funkcję

)

,

(

x

G

, słabo zbieżną do rozkładu

P

nie zależnego od

parametru

. Jest konieczne, by

)

,

(

x

G

miała funkcję odwrotną wzglę-

dem

dla dowolnego ustalonego

x.

2.

Niech liczby

1

g

i

2

g

są kwantylami rozkładu

P

, takimi że

1

}

{

}

)

,

(

{

2

1

2

1

g

g

g

G

g

P

x

P

,

gdzie ZL

ma rozkład

P

.

3.

Rozwiązując nierówność

2

1

)

,

(

g

G

g

x

względem

, otrzymujemy

asymptotycznie dokładny PU.

Uwaga 2. Często w jakości

1

g

i

2

g

wybierane są kwantyle

2

i

2

1 

roz-

kładu

P

. Natomiast kwantyle należy wybrać w taki sposób, aby otrzymać najkrótszy

z możliwych PU.

Przykład 3. Spróbujmy, korzystając ze sformułowanego schematu, zbudować

dokładny PU dla parametru

0

rozkładu jednostajnego na odcinku

]

2

;

[

.

Jest wiadomo, że jeżeli ZL

i

x

mają rozkład

 2

,

U

, to ZL

1

i

i

x

y

mają roz-

kład

1

,

0

U

. Wówczas ZL

)

,

(

1

1

}

...,

,

max{

}

...,

,

max{

)

(

1

1

)

(

x

G

x

x

x

y

y

y

n

n

n

n

ma taki sam rozkład, jak maksimum n niezależnych ZL o rozkładzie jednostajnym na

]

1

;

0

[

, tj. ma nie zależną od

dystrybuantę

.

1

,

1

],

1

;

0

[

,

,

0

,

0

}

{

)

(

)

(

)

(

y

y

y

y

y

y

y

F

n

n

y

n

P

Dla dowolnych dodatnich

1

g

i

2

g

mamy

background image

29

1

1

1

}

)

,

(

{

1

)

(

2

)

(

2

)

(

1

2

1

g

x

g

x

g

x

g

g

G

g

n

n

n

P

P

x

P

.

Długość PU jest równa

))

1

)(

1

((

)

(

1

2

1

2

)

(

g

g

g

g

x

n

i zmniejsza się ze

wzrostem

1

g

i

2

g

oraz z ich zbliżeniem.

Gęstość rozkładu

)

(n

y

na odcinku

]

1

;

0

[

jest równa

1

n

ny

i jest funkcją ostro

rosnącą na tym odcinku. Dlatego największe wartości

1

g

i

2

g

w tym przypadku, gdy

odległość między nimi jest najmniejsza oraz pole pod krzywej gęstości jest ustalone,
osiąga się wyborem

1

2

g

, a

1

g

takiego, że

}

1

{

1

)

(

1

n

y

g

P

:

1

1

)

(

)

1

(

}

1

{

1

1

)

(

1

)

(

)

(

n

y

y

n

g

g

F

F

y

g

n

n

P

, tj.

n

g

1

.

Podstawmy znalezione kwantyle do wzoru (5.2):

n

n

n

n

n

x

x

y

1

2

}

1

{

1

)

(

)

(

)

(

P

P

.

Łatwo zauważyć, że funkcja G postaci

a

x

n

nie może być stosowana do

budowy dokładnego PU dla

przy znanym a. Z następnego przykładu, jak z przy-

kładu 2, widać, że CTG pozwala na uzyskanie postaci uniwersalnej funkcji G dla
zbudowania asymptotycznie dokładnych PU.

Przykład 4. Niech

n

x

x ...,

,

1

będzie próbką o liczności n z rozkładu Poissona

,

Π

gdzie

0

. Należy zbudować asymptotycznie dokładny PU dla parametru

z

poziomem ufności

1

.

Wspominamy CTG:

x

n

x

n

x

n

x

n

i

i

1

1

1

D

E

,

gdzie

ma rozkład normalny standaryzowany. Według określenia słabej zbieżności

przy

n

mamy

1

}

{

c

c

c

x

n

c

P

P

przy

2

1 

c

.

Natomiast rozwiązanie względem

nierówności pod znakiem prawdopodobieństwa

nie jest łatwe, ponieważ otrzymujemy nierówność kwadratową z powodu obecności
pierwiastka w mianowniku. Czy zachowuje się wskazana zbieżność, jeżeli zastąpimy

przez x ?

Z własności słabej zbieżności wynika, że jeżeli

1



p

n

oraz

n

, to

n

n

. Estymator

x

*

jest zgodny, dlatego

background image

30

1



p

x

.

Wówczas

x

x

n

x

n

x

.

Wynika stąd, że

1

}

{

2

1

2

1

2

1

2

1

P

P

x

x

n

.

Rozwiązując nierówność pod znakiem prawdopodobieństwa otrzymujemy

1

2

1

2

1

n

x

x

n

x

x

P

przy

n

.

Mamy, więc, że asymptotycznie dokładny PU na poziomie ufności

1

ma postać

n

x

x

n

x

x

2

1

2

1

;

.

Uwaga 3. Jeżeli

)

(

w mianowniku nam przeszkadza, to można ją zastąpić

przez estymator zgodny

*)

(

(jak w przykładzie 4). Wystarczy by funkcja

)

(

była ciągłą w całym obszarze

. Należy tylko odpowiedzieć na pytanie: czy

*

jest

estymatorem zgodnym dla

?

3.2. Rozkłady związane z rozkładem normalnym


W p. 3.1 było rozwiązane zagadnienie 1 budowy dokładnego PU dla parametru

a rozkładu normalnego, gdy drugi parametr

2

był znany. W tym celu stosowaliśmy

funkcję próbki i nieznanego parametru a

a

x

n

a

G

)

,

(x

,

która przy dowolnym a ma rozkład normalny standaryzowany.

Następujące zagadnienia jednak pozostały nierozwiązane:
2) zbudować dokładny PU dla

, gdy a jest znane,

3) zbudować dokładny PU dla a, gdy

jest nieznane,

4) zbudować dokładny PU dla

, gdy a jest nieznane.

Jak wiadomo, dla rozwiązania sformułowanych zagadnień należy znaleźć funk-

cje próbki i parametrów, których rozkłady są znane. W szczególności, w zagadnieniu
3 szukana funkcja musi być niezależną od nieznanego parametru

, a w zagadnieniu

4 – od parametru a.

background image

31

Takie szczególne zaciekawienie rozkładem normalnym związane oczywiście z

CTG – prawie wszystko w tym świecie jest normalne (albo jest bliskie tego).

Dlatego w tym rozdziale będziemy się zajmować rozkładami związanymi z roz-

kładem normalnym, zbadamy ich własności oraz własności próbek z rozkładu nor-
malnego.

1. Rozkład Gamma i jego własności. Rozkład Gamma

,

Γ

jest znany z kursu

rachunku prawdopodobieństwa. Mianowicie, gęstość tego rozkładu ma postać

,

0

gdy

,

)

(

,

0

gdy

,

0

)

(

1

,

y

e

y

y

y

f

y

gdzie

0

,

,

0

1

)

(

dt

e

t

t

jest funkcja Gamma, mająca w szczególności na-

stępujące własności:

)

1

(

)

1

(

)

(

;

1

)

1

( 

, skąd mamy

)!

1

(

)

(

n

n

dla

N

n

;

)

2

1

(

.

W ciągu dalszym nam będzie potrzebna własność stabilności tego rozkładu

względem sumowania.

Własność 1. Niech ZL

n

 ...,

,

1

będą niezależne oraz

i

ma rozkład Gamma

i

,

Γ

,

n

i

,

1

. Wówczas

n

i

i

n

S

1

ma rozkład

n

i

1

,

Γ

.

Własność 2. Jeżeli ZL

ma rozkład normalny standaryzowany, to ZL

2

ma

rozkład Gamma

2

1

,

2

1

Γ

.

2. Rozkład „chi-kwadrat” (χ

2

) i jego własności. Z własności 1 i 2 wynika bez-

pośrednio następujące stwierdzenie.

Wniosek 1. Jeżeli ZL

k

 ...,

,

1

są niezależne i mają rozkład normalny standary-

zowany, to ZL

2

2

1

2

...

k

k

ma rozkład

2

,

2

1

k

Γ

.

Definicja 4. Rozkład sumy k kwadratów niezależnych ZL mających rozkład

normalny standaryzowany nazywa się rozkładem „chi-kwadrat” (

2

) o k stopniach

swobody i oznacza się

k

H

. Na mocy wniosku 1 rozkład ten jest rozkładem

2

,

2

1

k

Γ

.

Na rys. 3.2 podany jest wykres gęstości rozkładu

2

,

2

1

k

k

Γ

H

dla k równego

1, 2, 4 i 8.

background image

32

My często będziemy oznaczali przez

2

k

ZL o rozkładzie

k

H

.

Podamy własności rozkładu ZL

2

k

.

1.

Stabilność względem sumowania. Niech ZL

2

k

ma rozkład

k

H

, ZL

2

m

ma rozkład

m

H

i ZL te są niezależne. Wówczas ich suma ma rozkład

m

k

H

.

2.

Momenty rozkładu

2

. Jeżeli ZL

2

k

ma rozkład

k

H

, to

k

k

2

E

i

k

k

2

2

D

.

3.

Niech

...

,

,

2

1

są niezależne i mają rozkład normalny

2

, 

a

N

. Wówczas

ZL

k

i

i

k

a

1

2

2

ma rozkład

2

(

k

H

) o k stopniach swobody.

Rys. 3.2

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0

2

4

6

8

10

12

14

16

y

H

1

2

H

4

H

8

H

background image

33

3. Rozkład Studenta i jego własności.

Definicja 5. Niech ZL

k

...,

,

,

1

0

są niezależne i mają rozkład normalny stan-

daryzowany. Rozkład ZL

k

k

t

k

k

k

2

0

2

2

1

0

)

...

(

1

nazywa się rozkładem Studenta o k stopniach swobody i oznacza się

k

T

.

Gęstość rozkładu Studenta (patrz rys. 3.3) o k stopniach swobody to

2

)

1

(

2

1

)

2

(

)

2

)

1

(

(

)

(



k

k

k

y

k

k

k

y

f

. (6.1)

Podamy własności rozkładu Studenta.

1.

Symetryczność. Jeżeli ZL

k

t

ma rozkład Studenta

k

T

o k stopniach swo-

body, to ZL

k

t

ma taki sam rozkład.

2.

Asymptotyczna normalność. Rozkład Studenta

k

T

jest słabo zbieżny do

rozkładu normalnego standaryzowanego przy

k

.

3. Dla rozkładu Studenta istnieją tylko momenty rzędu

k

m

i nie istnieje

momentów rzędu

k

m

, przy czym wszystkie momenty nieparzystych

rzędów są równe zero.

Podamy teraz wzory na charakterystyki ZL o rozkładzie Studenta.

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,4

-8

-4

0

4

8

Rozkład normalny

Rozkład Studenta k = 2

Rys 3.3

background image

34

0

1

2

n

k

t

E

,

)

2

(

)

2

1

(

)

2

(

2

k

n

n

k

k

t

n

n

k

E

,

k

n

2

;

.

2

gdy

,

,

2

gdy

,

2

k

k

k

k

t

k

D

Możemy, oczywiście, doprowadzić wzory na momenty rozkładu Studenta do

postaci nie zawierającej funkcji Gamma.

Zauważmy, że rozkłady

2

i Studenta są tablicowane, tak, że jeżeli będzie po-

trzebne zbudować jakiś PU przez obliczanie kwantylów, to kwantyle znajdziemy za
pomocą tablic.

Następny rozkład także jest związany z rozkładem normalnym, natomiast korzy-

stać z niego będziemy później w zagadnieniach weryfikacji hipotez.

4. Rozkład Fishera.

Definicja 6. Niech ZL

2

k

ma rozkład

k

H

, a ZL

2

m

ma rozkład

m

H

, przy czym

ZL te są niezależne. Rozkład ZL

2

2

2

2

,

m

k

m

k

m

k

k

m

m

k

f

nazywa się rozkładem Fishera (rozkładem F Snedecora) o k, m stopniach swobody i
oznacza się

m

k ,

F

.

Własności rozkładu Fishera:

1. Jeżeli ZL

m

k

f

,

ma rozkład

m

k ,

F

, to ZL

m

k

f

,

1

ma rozkład

k

m,

F

.

2. Rozkład

m

k ,

F

jest słabo zbieżny do rozkładu degeneratywnego w punkcie 1

(

1

I

), gdy k i m dążą do nieskończoności w sposób dowolny.

3.3. Dokładne przedziały ufności dla parametrów rozkładu
normalnego


Niech dana jest próbka

n

x

x ...,

,

1

z rozkładu normalnego

2

, 

a

N

. Przypomnijmy

oznaczenia

n

i

i

a

x

n

s

1

2

2

)

(

1

i

n

i

i

x

x

n

s

1

2

2

0

)

(

1

1

.

Można udowodnić, że spełnione są następujące stwierdzenia.

background image

35

1)

a

x

n

ma rozkład normalny standaryzowany (wykorzystaliśmy już ten

fakt do budowy PU dla a gdy

jest znane);

2)

n

i

i

a

x

1

2

ma rozkład

n

H

(z tego będziemy korzystać budując PU dla

2

gdy a jest znane);

3)

2

2

0

1

2

2

)

1

(

)

(

s

n

x

x

n

i

i

ma rozkład

1

n

H

; (z tego będziemy korzystać budu-

jąc PU dla

2

gdy a jest nieznane);

4)

0

2

0

s

a

x

n

s

a

x

n

ma rozkład

1

n

T

(z tego będziemy korzystać budując

PU dla a gdy

jest nieznane).


Ze stwierdzeń tych wynikają następujące wzory na PU dla parametrów rozkładu

normalnego.


1.
Dla a gdy

jest znane. Ten PU był przez nas zbudowany w przykładzie 1 z

p. 3.1:

1

2

1

2

1

n

x

a

n

x

a

P

, gdzie

2

1

)

(

2

1

1

,

0

.

2. Dla

2

gdy a jest znane. Według stwierdzenia 2 mamy

2

2

ns

ma rozkład

n

H

, gdzie

n

i

i

a

x

n

s

1

2

2

)

(

1

.

Niech

2

2

,

1

n

g

oraz

2

2

1

,

2

n

g

są kwantylami rozkładu

n

H

rzędu

2

i

2

1 

. Wówczas

1

2

2

2

2

,

2

2

2

1

,

2

2

1

g

ns

g

ns

g

ns

g

a

a

P

P

.

3. Dla

2

gdy a jest nieznane. Według stwierdzenia 3 mamy

2

2

0

)

1

(

s

n

ma rozkład

1

n

H

, gdzie

n

i

i

x

x

n

s

1

2

2

0

)

(

1

1

.

Niech

2

2

,

1

1

n

g

i

2

2

1

,

1

2

n

g

są kwantylami rozkładu

1

n

H

rzędu

2

i

2

1 

. Wówczas

background image

36

1

2

0

2

2

2

0

,

2

2

2

0

1

,

)

1

(

)

1

(

)

1

(

1

2

2

g

s

n

g

s

n

g

s

n

g

a

a

P

P

.


4. Dla a gdy

jest nieznane. Według stwierdzenia 4 mamy

0

s

a

x

n

ma rozkład

1

n

T

, gdzie

n

i

i

x

x

n

s

1

2

2

0

)

(

1

1

.

Niech

2

,

1

1

n

t

a

i

2

1

,

1

2

n

t

a

są kwantylami rozkładu

1

n

T

rzędu

2

i

2

1 

. Rozkład Studenta jest symetryczny, tj.

2

1

a

a

. Wówczas

2

1

,

1

0

2

1

,

1

,

2

1

n

n

a

t

s

a

x

n

t

P

n

s

t

x

a

n

s

t

x

n

n

a

0

2

1

,

1

0

2

1

,

1

,

2

P

.


Wyszukiwarka

Podobne podstrony:
mp2 rozd1 id 781667 Nieznany
mp2 rozd2 id 781668 Nieznany
mp2 zad3 id 309079 Nieznany
mp2 rozd4 id 781670 Nieznany
Abolicja podatkowa id 50334 Nieznany (2)
4 LIDER MENEDZER id 37733 Nieznany (2)
katechezy MB id 233498 Nieznany
metro sciaga id 296943 Nieznany
perf id 354744 Nieznany
interbase id 92028 Nieznany
Mbaku id 289860 Nieznany
Probiotyki antybiotyki id 66316 Nieznany
miedziowanie cz 2 id 113259 Nieznany
LTC1729 id 273494 Nieznany
D11B7AOver0400 id 130434 Nieznany
analiza ryzyka bio id 61320 Nieznany
pedagogika ogolna id 353595 Nieznany

więcej podobnych podstron