Deviance Residuals:
Min 1Q Median 3Q Max
-1.3475 -0.4597 -0.2263 -0.1132 2.3991
Coefficients: (Dispersion parameter for binomial family taken to be 1)
Nuli deviance: 73.052 on 85 degrees of freedom Residual deviance: 47.152 on 83 degrees of freedom (11 observations deleted due to missingness)
AIC: 53.152
Number of Fisher Scoring iteratlons: 6
Wmiowa oznacza wznowienie Hię
objawów
nowotworowych, np. przerzuty. Jest też okre^lu na jako niepowodzenie leczenia.
Jeżeli nie chcemy usuwać wierszy, w którycłi pojawiają się brakujące obserwacje możemy skorzystać z metody imputacji, omówionej w podrozdziale 3.3.1.
Estimate Std. Error z value Pr(>lzl)
(Intercept) -17.3914 |
4.3757 |
-3.975 |
7.05e-05 *** | |
Nowotwor 2.2586 |
0.7657 |
2.950 |
0.00318 ** | |
log(VEGF) 1.3293 |
0.4250 |
3.128 |
0.00176 ** | |
Signif. codes: 0 '***’ |
0.001 ‘ |
**’ 0.01 |
■*’ 0.05 0.1 ' |
• 1 |
Obie zmienne ilościowe (logarytm z VBGF oraz zaawansowanie nowotworu) wydają się mieć związek z prawdopodobieństwem pojawienia się wznowy, ponieważ odpowiadające im p-wartości są małe. Na rysunku 3.30 przedstawiliśmy funkcje logit charakteryzującą zależność pomiędzy wartością zmiennej ciągłej a prawdopodobieństwem wystąpienia określonego czynnika (w tym przykładzie prawdopodobieństwa wystąpienia wznowy).
Podobnie jak dla regresji liniowej, także w przypadku regresji logistycznej możemy korzystać z funkcji step(stats) (do wyboru zmiennych w modelu) oraz z funkcji predict(stats) (do predykcji wartości p, dla zadanego A'). Korzystając z funkcji step O należy pamiętać, by uprzednio pozbyć się wierszy z brakującymi obserwacjami. W przeciwnym przypadku nic będzie można porównywać modeli z różnymi liczbami obserwacji. Poniżej wykorzystujemy funkcję predictO do oszacowania prawdopodobieństwa wznowy dla różnych poziomów zmiennej opisującej rodzaj nowotworu.
Tabela 3.9: Wybrane pola obiektu klasy sv.mmary.glm
$coefficients |
Macierz wymiarów p X 4 z informacjami o ocenie współczynników w modelu (pierwsza kolumna $Estimate), odchyleniu standardowym tych ocen (druga kolumna $Std. Error), wartościami statystyk testowej z (kolumna $z value) oraz p-wartościom wyznaczonym dla hipotezy zerowej o nieistot-ności danego parametru przy dwustronnej hipotezie alternatywnej (kolumna $Pr(>lzl)). |
$df |
Trójelementowy wektor z rangą modelu, liczbą stopni swobody oraz liczbą parametrów. |
$cov.unscaled |
Macierz kowariancji dla ocen współczynników. |
Rysunek 3.30: Wykres rozrzutu dla zmiennej VKGF i zmiennej Niepowodzenie. Szanj linią przedstawiono dopasowaną funkcję logit, kółeczka odpowiadają pacjentkom
Tabela 3.10: Pola (właściwości) obiektu klasy glrn
$coefficients |
Oceny współczynników w modelu. |
$fitted.values |
Wartości dopasowane, przekształcone przez funkcję wiążącą, w przypadku regresji logistycznej odpowiadają ocenom prawdopodobieństw fi. |
$linear.predictors |
Wartości dopasowane, przed przekształceniem przez funkcję wiążącą. Używając powyższych oznaczeń wartości te odpowiadają ln |
$residuals |
Robocze residua z ostatniej iteracji procesu dopasowania modelu. Zamiast korzystać z tego pola zaleca się korzystanie z funkcji residuals.glm(), która umożliwia wskazanie jakie residua nas interesują (parametr type, do wyboru jest wiele różnych typów' residuów, w zależności od tego do czego ich potrzebujemy). |
$family |
Wykorzystana funkcja wiążąca. |
$aic |
Wartość kryterium AIC dla dopasowanego modelu. |
$iter |
Liczba iteracji wykonanych do uzyskania ostatecznej postaci modelu. |
$df.residual |
Liczba stopni swobody dla residuów. |
$converged |
Wartość logiczna, określająca czy wykorzystywany algorytm IWLS (ang. ite.rntively reweighted least sguares) zakończył iterowanie ponieważ uznał, że znaleziono maksimum (wartość TR.UE) czy też wykonał więcej iteracji niż założono (wartość FALSE). |