głównych powodów ta kwestia badawcza nie może być przedmiotem prostych technik regresji wielokrotnej. Po pierwsze, interesująca zmienna zależna (czas przeżycia) przeważnie nie ma rozkładu zbliżonego do normalnego. Po drugie, występuje problem wykorzystania obserwacji cenzurowanych, co oznacza, że pewne obserwacje będą niekompletne.
Model proporcjonalnego hazardu Coxa. Model proporcjonalnego hazardu Coxa jest najbardziej ogólnym z modeli regresji, ponieważ nie jest on oparty na jakichkolwiek założeniach dotyczących natury lub kształtu rozkładu czasu przeżycia. Model zakłada, że hazard (ryzyko zajścia zdarzenia) jest funkcją zmiennych objaśniających. Funkcja przeżycia jest pewną transformacja funkcji hazardu. Model można zapisać jako:
h{(t), (zi, z2, zm)> = h0(t)*exp(bi*Zi + ... + bm*zm) gdzie h(t,...) oznacza funkcję hazardu przy danych wartościach zmiennych objaśniających (złf z*, ..., Zn). Składnik h0(t) nazywa się hazardem bazowym. Jest to hazard dla przypadku, gdy wszystkie wartości zmiennych niezależnych są równe zero.
Założenie proporcjonalności. Zakłada się, że dla dwóch obserwacji o różnych wartościach zmiennych niezależnych stosunek funkcji hazardu dla tych dwóch obserwacji nie zależy od czasu.
+ Modele parametryczne - ochotnicy?
Poniższy przykład dotyczy analizy czasu pozostawania na bezrobociu w oparciu o dane zgromadzone od 275 osób. Dla każdej osoby odnotowano czas przebywania na bezrobociu (w tym kontekście zdarzeniem jest znalezienie pracy). Osoby, które w momencie gromadzenia danych pozostawały nadal bez pracy stanowią tzw. obserwacje cenzurowane. Takie osoby dostarczają tylko częściowej informacji niezbędnej do oszacowania modeli przeżycia. Dlatego też niezbędne jest aby znaczna część próby doświadczyła zdarzenia.
Dodatkowo zarejestrowano informację o miejscu zamieszkania bezrobotnego (wieś, miasto), płci oraz wykształceniu.
1)
2)
3)
Otwieramy plik „Analiza przeżycia bezrobocie.sta".
Z menu Statystyka -> Zaawansowane modele liniowe i nieliniowe wybieramy polecenie Analiza przeżycia.
Na początek rozważmy moduł Porównanie wielu prób. Postaramy się odpowiedzieć na pytanie czy występuje istotna statystycznie różnica w czasie pozostawania na bezrobociu pomiędzy mężczyznami i kobietami.
rs-iuz
Analiza czasu przeżycia i bezawaryjności: Analiza
Podli awovre
0 !ok
I abcte przeżycia i rozkłady |Metoda Kaplane-Meiera {rtg Po«6wnj%*ran** dwóch prób
m
rie wielu piób
|/v~ Modele regres
l.y Zmienne objaśniające zalezre od czasu
Anulu
£] Opcj? -
(l? Ojwóizdane
4)
Określamy zmienne modelu (zmienna oznaczająca czas pozostawania na bezrobociu to Czas do zatrudnienia, wskaźnik obserwacji cenzurowanych to Obserwacja kompletna, natomiast zmienna grupująca to Kobieta), a następnie klikamy OK.
2