przewodnikPoPakiecieR 8

przewodnikPoPakiecieR 8



Wyl n mir procedury statystyczne


- log, h(p) = log(p).


Dostępno funkcje wiążące to:

-    l/mu‘2, h{p) = 4f,

-    inverse, h(p) = l/p,

-    identity, h(p) — p,

-    log, h(p) = log(/i).

• Rodzina rozkładów Poissona (family=poisson)

Y\X ~ V(\).

Ta rodzina rozkładów wykorzystywana jest, do modelowania zmiennych zlicza, jącycli występowanie różnycli zjawisk. Dostępne funkcje wiążąco to:

-    log, h(p) = log(/t),

-    identity, li(p) = p,

-    sqrt, h(p) = y/fi.

Jak już wspomnieliśmy wynikiem funkcji glmO jest obiekt klasy glm. Dla tej klasy obiektów opracowano przeciążone wersje znanych już nam funkcji, lista popu, larniejszych przedstawiona jest w tabeli 3.11.

Jak pamiętamy, dla gaussowskiego modelu liniowego mogliśmy wyznaczać współ, czynnik fi2 określający jak dobrze model dopasował się do danych. Dla uogólnię.


nycli modeli liniowych zaproponowano szereg uogólnień tego współczynnika (tzw. współczynników pseudo fi2). Kilka najpopularniejszych współczynników pseudo Rzaimplementowanych jest w funkcji pR2(pscl). Z użyciem tej funkcji wyznaczyć można m.in. współczynniki: McFaddena, Cragga i Uhlera oraz współczynnik oparty o funkcje wiarogodności. Poniżej przykład wywołania tej funkcji.


>    # konstruujemy model regresji logistycznej

>    modelN <- glm(Niapowodzenia~Nouotuor, daneO, faraily="binomial'')

>    # wyznaczamy różne uogólnienia współczynnika R~2 na przypadek regresji

logistycznej

>    pR2(modelN)

G2 McFadden r2ML r2CU


Uh llhNull


-31.035    -38.214    14.358    0.188    0.154    0.261

Podobnie jak w przypadku dopasowania modelu gaussowskiej regresji liniowej, tak też w przypadku dopasowania modelu ogólnego powinniśmy zbadać poprawność dopasowania analizując lip. wykresy diagnostyczne. Podobnie jak dla modeli gaussowskich, wykresy diagnostyczne można wyrysować korzystając z przeciążonej funkcji plot O. Możemy również skorzystać z funkcji glm. diag. plots(boot) lub leverage.plot.glm(car).

A NO VA, regresja liniowa i logistyczna

189


.glm(stats)

J’’jąddl .glm(stats)

(jropl .glm(atats)

Pi.


Tabela 3.11: Funkcje przeciążone dla obiektów klasy glm


anova.glm(stats)

: confint .giin(stats)


Wyznacza zbiór zmiennych objaśniających optymalny względem wybranego kryterium (domyślnie AIC). Ta funkcja wykorzystuje dwie opisane poniżej.

Ze zbioru dostępnych zmiennych dodaje do modelu glm nową zmienną, tę dla której otrzymuje się najwyższą wartość funkcji wiarogodności.

Usuwa jedną z modelu glm tą zmienną, po usunięciu której otrzymuje się najwyższą wartość funkcji wiaro-godności.


cooks distance.glmfstat!

1


Wykonuje analizę wariancji dla modelu glm. Wyznacza przedziały ufności dla dopasowanych współczynników modelu glm.


ef fects.glm(stats)


leverage.plot.glmfcar) j logLik glm(stats)


outlier.test.glm(stats) lict.glm(stats)


qq .plot.glm(car)


) Wyznacza odległości Cooka dla obserwacji w modelu glm.__

Wynikiem tej funkcji jest wektor współczynników dla dopasowanego modelu.

Rysuje wykres diagnostyczny dla modelu glm. Wyznacza wartość logarytmu z funkcji wiarogodności dla dopasowanego modelu.

Funkcja do identyfikacji obserwacji odstających. Wyznacza predykcje dla zadanych obserwacji na podstawie dopasowanego modelu liniowego. Można wybrnę, czy oceniana ma być oczekiwana wartość zmiennej Y, wartość funkcji link czy Xfi


residuals.glm(stats), rstandard.glm(stats), rstudent.glm(stats) summary.glm(stats)


Rysuje wykres diagnostyczny dla modelu glm. Wynikiem tej funkcji jest wektor residuów, standary


zowanych residuów oraz studentyzowanych residuów dla dopasowanego modelu.

Opisuje dopasowany model glm. Przedstawia rozkład residuów, oceny współczynników modelu i informacje o zbieżności algorytmu wyznaczającego oceny współczynników.


3.4.5.2 Regresja nieliniowa

Powyżej przedstawiliśmy różne funkcje dostępne w R ze wsparciem dla procedur statystycznych używanych w modelach regresji liniowej i logistycznej. W obu przypadkach fragment modelu uwzględniający zmienne objaśniające miał liniową postać X0. Jeżeli spodziewamy się nieliniowych oddziaływań zmiennych objaśniających na zmienną objaśnianą Y to możemy, albo zastosować transformacje zmiennych (przykładowo dzięki transformacji logarytmicznej możemy z modelu addytywnego przejść na model multiplikatywny), albo rozważyć i przeanalizować model regresji nieliniowej. Model gaussowskiej regresji nieliniowej ma postać

(315)


Y\X ~Af(,j.o-2), /i = E(Y\X) = f(X,fi)t

gdzie f(X, fi) to parametryczna funkcja o znanej postaci. Interesuje nas wyznaczenie Jceti wektora parametrów fi.


Wyszukiwarka

Podobne podstrony:
przewodnikPoPakiecieR4 140 Wybrane procedury statystyczne >    U ustawiamy ziarno
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: Bewarc
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
75190 przewodnikPoPakiecieR 1 I m 174 Wybrane procedury statystyczne. P So good «dvice here is: B
przewodnikPoPakiecieR7 166 Wybrane procedury statystyczne mezczyzna piec Niepowodzenia Rysunek 3.23
przewodnikPoPakiecieR 3 I 178 Wybrane procedury statystyczno W powyższym przykładzie wygląda na to,
przewodnikPoPakiecieR7 126 Wybrane procedury statystyczne Statystyki opisowe127 Tabela 3.1: Statyst
przewodnikPoPakiecieR8 128 Wybrane procedury statystyczne 128 Wybrane procedury statystyczne 3.1.1.
przewodnikPoPakiecieR9 130 Wybrane procedury statystyczne Histogram zmiennej wiek Histogram zmienne
przewodnikPoPakiecieR1 134 Wybrane procedury statystyczne Domyślnie, przedział ufności dla med
przewodnikPoPakiecieR3 138 Wybrane procedury statystyczne 138 Wybrane procedury statystyczne Za aut
przewodnikPoPakiecieR4 —■4 140 Wybrane proceduiy statystyczne >    # ustawiamy zi

więcej podobnych podstron