gdzie Xir jest i-tą obserwacją r-tej zmiennej niezależnej, p jest liczbą zmiennych niezależnych w modelu, 0r jest r-tym parametrem regresji. Stosując podstawienie #, = (1 — K,)p,i z równania (11) otrzymujemy model regresji GP-1
P(Yi = yi\xi,0, k) = ((1 - k)im + nyi)yi~l ^ exp(-(l-k)/^-^), y{ = 0,1,2,... (13) ze średnią E(Yi) — /i, = exp(xj o (3) i wariancją Var(Yi) —
Drugą możliwą parametryzacją, wprowadzoną w pracy Wang and Famoye (1997), jest model regresji GP-2 postaci
P(Yi = yi\xi,/3,ip) =
f Hi \ |
( fji(l + tpyi)\ | |
\l + (płli) |
1 »! expl |
\ i + m / |
Vt = 0,1,2,... (14)
ze średnią E(Yi) = pi — exp(x* o0) i wariancją Var(Yi) = /i,(l + <ppi)2- W równaniu (14) tp jest stałą i jeżeli przyjmuje ona wartości mniejsze od zera (przypadek podrozproszenia), to musi ona spełniać nierówności 1 + <pp,i > 0 oraz 1 + pyi > 0, czyli na przykład spełniać warunek ip > min(—max^ p ~m<J(y.))- V5 nazywamy parametrem rozproszenia i może być on estymowany równocześnie ze współczynnikami modelu regresji GP-2 w równaniu (14). Dla tp = 0 model ten redukuje się do zwykłego modelu Poissona.
Oba modele regresji GP-1 i GP-2 są zatem naturalnymi rozszerzeniami modelu regresji Poissona. Główne różnice różnice między nimi to:
a) zależność między wartością oczekiwaną i wariancją w modelu GP-1 jest liniowa, podczas gdy w modelu GP-2 zależność ta ma charakter sześcienny,
b) parametr k jest stały w równaniu (13), ale jeżeli podstawimy k = i 0 — model regresji GP-1 przekształci się do postaci modelu GP-2.
Badanie występowania nadrozproszenia w analizowanych danych możemy zatem sprowadzić do porównania dwóch modeli regresji: Poissona i GP-1. Postawmy hipotezę zerową
O II £ £ |
(15) |
przeciwko hipotezie alternatywnej | |
o A sć |
(16) |
Statystyka do badania nadrozproszenia ma postać | |
l 9’)’ |
(17) |
gdzie Ói jest estymatorem wyznaczonym z modelu Poissona. Powyższa statystyka ma rozkład A7(0,1). W celu jej wyprowadzenia posłużymy się nierównością Cramera - Rao.
9