U'i brane procedury statystyczne
> Luimmary(model) formula: y ~ sin(a + b * x)
Parameters:
Estimate Std. Error t value Pr(>ltl) a 1.4786 0.2838 5.21 1.le-06 **»
b 1.9776 0.0813 24.34 < 2e-16 *«*
• lin 1.0779 0.1574 6.85 6.9e-10 ♦**
Signif. codes: 0 '***’ 0.001 '**’ 0.01 0.05 0.1 ‘ ’ 1
Residual standard error: 1.13 on 97 degrees of freedora
Number of iterations to convergence: 5 Achieved convergence tolerance: 1.43e-06
3.4.5.3 Inne modele rcgresyjne
Poza wymienionymi powyżej modelami gaussowskiej regresji liniowej, nieliniowej, regresji logistycznej rozważyć można wiele innych modeli regresyjnyeh. Poniżej skrótowo przedstawiamy inne popularne modele wraz z informacją w jakiej funkcji R . i w jakiej bibliotece są one dostępne.
• Regresja metodą składowych głównych i regresja metodą cząstkowych najmniejszych kwadratów (ang. Principal Components Reyression i Partial Least Sguares Reyression).
W sytuacji, gdy zmiennych objaśniających jest bardzo dużo, nie chcemy (a czar sem wręcz nie możemy z uwagi na osobliwość macierzy' XTX) umieszczać J wszystkich istotnych zmiennych w modelu. W tym przypadku można wykiy rzystać technikę redukcji wymiaru, np. PCA, do wybrunia ze zbioru wszyst-. kich zmiennych objaśniających kombinacji liniowych, które będą dobrymi pre-dyktorami i będą reprezentować istotną informację o zmienności oryginalnych zmiennych w modelu regresji.
Model regresji PCR jest dwupoziomowy. W pierwszym kroku na bazie wszystkich zmiennych objaśniających wyznaczając macierz wag dla poszczególnych zmiennych objaśniających określa się dobre predykt.ory. W drugim kroku na bazie tych predyktorów wykonuje się standardową regresję. Model regresji PCR -opisać można następująco:
Yi ~ A/"(^,,cr2),
gdzie Wi to wektor predyktorów dla obserwacji «tej, 0 to wektor kolumnowy.sś dla współczynników modelu, a 7 to macierz opisująca transformacje zmiennych' objaśniających na predyktory.
Regresja metodą składowych głównych i regresja metodą cząstkowych naj-: . mniejszych kwadratów zaimplementowana jest w pakiecie pis. Do budowy ;, oraz estymacji modelu służą funkcje mvr(pls) i svdpc.fit(pls).
Liniowe i nieliniowe modele losowe i modele mieszano (ang mntlotn
modelu i mixed modela).
W przypadkach opisywanych przy okazji omawiania analizy wariancji /.mlnmin objaśniające typu jakościowego były traktowane jak zmienne z iiilnnuai jaliil
o wszystkich interesujących nas poziomach czynnika. Dla każdego pnzl.....u
takiej zmiennej mogliśmy i chcieliśmy wyznaczyć średnią wartość' /mlnmin) objaśnianej, charakterystyczną dla danej wartości czynnika. Przykładowo m teresowai nas wpływ choroby, więc- analizowaliśmy zmienną jakościową o dwóch poziomach: zdrowy, chory.
Nie zawsze jednak dla zmiennej jakościowej interesuje nas ocena eh Idów po szczególnych poziomów tej zmiennej. Przypuśćmy, że chcemy modelowm i ni lig związaną z wielkością jabłek. Mamy cały sad, zbieramy dane z owm ów 11 wliąa cych na 10 wybranych jabłoniach. Sensownym jesl uwzględnienie w anall/ni li efektu jabłoni jako zmiennej jakościowej. Jednak w końcowym wyniku ulu In* teresują nas efekty tych konkretnych 10 jabłoni, ale informacja o zinlcnnoiti I badanej cechy pomiędzy jabłoniami.
Wcześniej omawiane modele to tzw. modele z efektami dcteimliilfilyoznyin! (nazywane również efektami stałymi). Są one przydatne w sytuacji, gdy ma* my zmienną jakościową (np. zdrowy/chory), której poszczególne podomy ną dla nas interesujące (chcemy znać różnicę pomiędzy poziomem i lun y u |iimIih
mern zdrowy) oraz dla tej zmiennej mamy pomiary dla wszystkich ....... \ i h
poziomów w całej populacji.
Jabłonka z przykładu powyżej odpowiadała tzw. efektowi losowemu Nic IiiIin restije nas różnica w jabłkach pomiędzy jabłonką najbliż.szą furtki a tą z limit gu sadu, nie mamy też danych pochodzących od wszystkich jabłonek W lyhl przypadku interesuje nas zmienność efektu pojedynczej jabłonki, ale ule |ngit wartość dla każdej z jabłonek. Takie efekty modelowane będą |ako miłemu* losowe, stąd też nazwa model z efektami losowymi. Jeżeli w modelu wynlg|iu|ą efekty losowe i efekty stałe, to taki model nazywamy mieszanym luli ino* na odgadnąć z powyższych przykładów modele mieszane są Imrdzo populnlllfl w rolnictwie.
W R. funkcjo do analizy modeli losowych i mieszanych są zaimpIrmculnwiiMA w pakiecie nlrae. Do formułowania i estymacji modelu służą funkcje I ma ( ii I ma) (dla modeli liniowych) i nlme(nlme) (dla modeli nieliniowych).
Uogólniona nieliniowa regresja GNLS (ang. Geneinlizcd Non l.mnn I en W
Squares).
Postać ogólnego nieliniowego modelu regresji można przedstawić następująi o
Y\X ~JT(0), h{E(Y\X)) = f(X,0).
W uogólnionych modelach liniowych przyjmuje się, że zmienne objaśnlająiv wpływają liniowo na wartość h(E{Y\X)). Model GNLS jest naturalnym rnwi szerzeniem, w którym dopuszcza się nieliniowy wpiyw zmiennych objaśniają* cych X na wartość h(E(Y\X)). Funkcje pozwalające na budowę oraz iienng tego modelu znajdują się w pakiecie nlme, podstawową funkcją do budowy takiego modelu jest gnls(nlme).