Analiza wielowymiarowa
Zagadnienia.
1.
Testowanie wartości średnich dla wektora losowego.
Zadanie
W pliku statedata wybrać zmienne Income, Life. Exp, HS.Grad i sprawdzić, czy średnie tych
trzech zmiennych są równe wektorowi (5555, 71, 40)…
2.
Testowane równości średnich w n-populacjach. Założenia: ,Analiza kontrastów,
Interakcje, Testy post hoc
3.
Regresja liniowa:
•
Budowa modelu (regresja krokowa, postępująca, wsteczna)
•
Ocena modelu (miary dopasowania, analiza reszt)
•
Analiza obserwacji odstających (odległość Cooka, „reszta usunięta”)
•
Interpretacja parametrów modelu
•
Predykcja na podstawie modelu
Zadanie:
Otworzyć plik danych statedata,
•
zbudować model regresji, w którym zmienną objaśnianą jest oczekiwana długość
ż
ycia, wszystkie zmienne są statystycznie istotne przy 8% poziomie istotności
•
Przeprowadzić regresję krokową wsteczną
•
Zinterpretować parametr przy „najbardziej istotnej zmiennej”
•
Sprawdzić czy występują obserwacje odstające – wykorzystać odległość Cooka
•
Wyznaczyć „prognozę” dla stanu, w którym zmienne przyjmują wartości
Population Income
Illiteracy Life.Exp
Murder
HS.Grad Frost
Area
3000
4000
2,1
15,1
41,3
20
50708
4.
modele dla danych binarnych (model logitowy, model probitowy) – budowa modelu,
ocena interakcji, interpretacje parametrów modelu, ocena modelu – procent trafnych
prognoz, predykcja
Zadanie:
W pliku praca bezrobocie, zbudować model logitowy, zinterpretować parametry modelu,
ilorazy szans, ocenić jego jakość dopasowania – procent trafnych prognoz
5.
Analiza dyskryminacyjna – budowa modelu – ustalenie ważności zmiennych,
założenia, klasyfikacja