3307665879

3307665879



gdzie Xir jest i-tą obserwacją r-tej zmiennej niezależnej, p jest liczbą zmiennych niezależnych w modelu, 0r jest r-tym parametrem regresji. Stosując podstawienie #, = (1 — K,)p,i z równania (11) otrzymujemy model regresji GP-1

P(Yi = yi\xi,0, k) = ((1 - k)im + nyi)yi~l ^ exp(-(l-k)/^-^), y{ = 0,1,2,... (13) ze średnią E(Yi) — /i, = exp(xj o (3) i wariancją Var(Yi)

Drugą możliwą parametryzacją, wprowadzoną w pracy Wang and Famoye (1997), jest model regresji GP-2 postaci

P(Yi = yi\xi,/3,ip) =

f Hi \

( fji(l + tpyi)\

\l + (płli)

1 »! expl

\ i + m /

Vt = 0,1,2,...    (14)

ze średnią E(Yi) = pi exp(x* o0) i wariancją Var(Yi) = /i,(l + <ppi)2- W równaniu (14) tp jest stałą i jeżeli przyjmuje ona wartości mniejsze od zera (przypadek podrozproszenia), to musi ona spełniać nierówności 1 + <pp,i > 0 oraz 1 + pyi > 0, czyli na przykład spełniać warunek ip > min(—max^ p ~m<J(y.))- V5 nazywamy parametrem rozproszenia i może być on estymowany równocześnie ze współczynnikami modelu regresji GP-2 w równaniu (14). Dla tp = 0 model ten redukuje się do zwykłego modelu Poissona.

Oba modele regresji GP-1 i GP-2 są zatem naturalnymi rozszerzeniami modelu regresji Poissona. Główne różnice różnice między nimi to:

a)    zależność między wartością oczekiwaną i wariancją w modelu GP-1 jest liniowa, podczas gdy w modelu GP-2 zależność ta ma charakter sześcienny,

b)    parametr k jest stały w równaniu (13), ale jeżeli podstawimy k = i 0 — model regresji GP-1 przekształci się do postaci modelu GP-2.

Badanie występowania nadrozproszenia w analizowanych danych możemy zatem sprowadzić do porównania dwóch modeli regresji: Poissona i GP-1. Postawmy hipotezę zerową

O

II

£

£

(15)

przeciwko hipotezie alternatywnej

o

A

(16)

Statystyka do badania nadrozproszenia ma postać

l 9’)’

(17)

gdzie Ói jest estymatorem wyznaczonym z modelu Poissona. Powyższa statystyka ma rozkład A7(0,1). W celu jej wyprowadzenia posłużymy się nierównością Cramera - Rao.

9



Wyszukiwarka

Podobne podstrony:
img115 115 115 = f nT(t) gdzie nT(t) -jest liczbą impulsów występujących w przedziale czasu [t - T,t
gdzie sigtype jest liczbą całkowitą albo literałem określającym sygnał, którego akcja ma być
img075 (23) 80 gdzie p(G)= max W jest liczbą określaną jako promień spektralny macierzy G.
F(t) dystiybuanta zmiennej losowej T.F(t) = gdzie n, - ilość obserwacji w i-tej klasie uszkodzeń n -
wzory Page resize gdzie Y jest zmienną losową obserwowalną, at.i,®.a,..., x.p - zmiennymi determin
skanuj0496 (2) 514 PHP i MySQL dla każdego którego wynik jest przypisywany zmiennej count. Wartość t
img046 CAŁKOWANIE FUNKCJI WYMIERNYCH gdzie Wt jest wielomianem zmiennej rzeczywistej, stopnia /, o w
IMG79 38 gdzie a jest liczbą rzeczywistą lub zespoloną. 6. Twierdzenie o różniczkowaniu w dziedzini
PomMirx* typ rezultatu jest róZtty od typu tej zmiennej, więc zostanie zastosowana niejawna konwersj
CCF20090321032 Równość ta, gdzie A jest liczbą dowolną, stanowi zatem nieuchronną konsekwencję nasz

więcej podobnych podstron