Informatyka w Selekcji Ćwiczenie nr 2 (Regresja liniowa)
1. Na podstawie danych zamieszczonych na stronie http://theta.edu.pl (dane z ćwiczeń nr 1) zaproponować dwa proste modele regresji liniowej, w których zmienną zależną (objaśnianą) będzie mleczność krów a zmiennymi niezależnymi (objaśniającymi):
i. w pierwszym modelu stado;
ii. w drugim modelu rok urodzenia.
Następnie wykonać następujące polecenia i odpowiedzieć na poniższe pytania:
a) Podać interpretację otrzymanych estymatorów.
b) Jaką mleczność będą miały krowy ze stada nr 2?
c) Czy estymatory parametrów są statystycznie istotne na poziomie istotności a = 0.05? Jak zmieni się istotność estymatorów jeśli zmienimy poziom istotności na 0.01?
d) Jak prezentuje się współczynnik R2 dla każdego z modeli?
e) Wykonać wykres na którym znajdą się zarówno obserwacje jak i wyznaczona prosta regresji.
f) Wyznaczyć 95c/c przedziały ufności dla otrzymanych estymatorów (zadanie dodatkowe).
g) Który model jest „lepszy" ze względu na kryterium AIC, a który ze względu na kryterium BIC? Na podstawie jakich innych kryteriów możemy wybrać „lepszy" model (zadanie dodatkowe)?
2. Utworzyć wieloczynnikowy model regresji liniowej, w której zmienną zależną będzie mleczność, a zmiennymi niezależnymi: rok urodzenia, stado oraz genotyp genu. Następnie wykonać następujące polecenia i odpowiedzieć na poniższe pytania:
a) Jak powinniśmy zakodować zmienną genotyp, a jak zmienną rok urodzenia?
b) Podać interpretację otrzymanych estymatorów.
c) Jaką mleczność będą miały krowy urodzone w 2000 roku ze stada nr 3 z genotypem AA?
d) Wykonać metodę krokową typu „backward" wyboru istotnych zmiennych do modelu przy wykorzystaniu kryterium AIC i BIC. Czy dla obydwu kryteriów otrzymujemy ten sam model? Jakie inne typy metody krokowej są możliwe?
(zadanie dodatkowe)
e) Czy residua modelu mają rozkład normalny? Do rozwiązania tego zadania należy użyć zarówno procedur graficznych jak i odpowiednich testów statystycznych (zadanie dodatkowe).
f) Wyznaczyć 99c/c przedziały ufności dla otrzymanych estymatorów (zadanie dodatkowe).