Wykład 4 kurs zaawansowany
niedziela
Proszę:
1. przeczytać s.286-299 ( bez kowariancji i testowania istotności r)
2. wykonać ćwiczenie 8.1, 8.2, 8.3
Notatki ze slajdów wykładowych
Cel nauki:
Opis zróżnicowania zmiennej Y
Wyjaśnianie zróżnicowania zmiennej Y za pomocą zmiennej X
Przewidywanie wartości zmiennej Y za pomocą zmiennej X
Zależność dwóch zmiennych ilościowych
Gdy zmienna niezależna przyjmowała niewiele wartości (zmienna nominalna) zależność między X i Y
testowaliśmy za pomocą analizy wariancji
Gdy X jest zmienną ciągłą to szukamy zależności liniowej
Linia regresji
odelu regresji
Związek funkcyjny- wszystkie punkty leżą na linii prostej
Związek korelacyjny ( statystyczny)
Związek zmiennych ilościowych możemy przedstawić na wykresie rozrzutu/korelacyjnym.
Do zbioru punktów na wykresie możemy zawsze dopasować NAJLEPSZĄ linię prostą
Dla wartości surowych ( niestandaryzowanych) przecina oś OY w punkcie (0,a)
Dla wartości standaryzowanych przecina os OY w punkcie (0,0)
Związek liniowy między X i Y
symbole
X- predyktor /zmienna niezależna/ wyjaśniająca/ objaśniająca/ EGZOgeniczna
Y- zmienna zależna wyjaśniana/ objaśniana/ ENDOgeniczna
Y’ – wartość przewidywana na podstawie linii regresji
synonimy
Linia regresji, Prosta regresji, Równanie regresji, Y=bX + a
Współczynniki /wagi regresji - a, b
Zróżnicowanie, zmienność (SS)
łąd predykcji= reszta regresji
Możemy rozważać różne proste, różne predykcje dla Y. Jak wybrać najlepszą?
Dobrą miarą dobroci predykcji może być błąd predykcji, mówiący nam ile się pomyliliśmy, czyli jak
bardzo rzeczywiste wartości Y różnią się od wartości przewidywanych.
RESZTA = Y -Y’.
Odchylenie całkowite, zróżnicowanie,
wariancja Y
Odchylenie całkowite - (Y-M
Y
) – różnica między wartością zmiennej a średnią
Po podniesieniu do kwadratu i zsumowaniu po wszystkich Y – zróżnicowanie całkowite
Po podzieleniu przez df- wariancja
Odchylenie regresyjne, zróżnicowanie,
wariancja Y wyjaśniona przez X
Odchylenie regresyjne - (Y’-M
Y
) – różnica między wartością przewidywaną a średnią
Po podniesieniu do kwadratu i zsumowaniu po wszystkich Y – zróżnicowanie regresyjne
Po podzieleniu przez df- wariancja Y wyjaśniona przez X
Błąd /reszta regresji/ zróżnicowanie,
wariancja Y niewyjaśniona przez X
Reszta/błąd regresji - (Y- Y’) – różnica między wartością przewidywaną a wartością zmiennej
Po podniesieniu do kwadratu i zsumowaniu po wszystkich Y – błąd regresji
Po podzieleniu przez df- wariancja Y NIEwyjaśniona przez X
Współczynnik determinacji
Stosunek zmienności Y wyjaśnionej przez X do zmienności całkowitej
Współczynnik korelacji
to pierwiastek z współczynnika determinacji
Liczenie współczynnika korelacji
Ćwiczenie 8.2. s. 298
Wniosek z tabeli s .299
Uwzględnianie płci przy liczeniu korelacji BMI z wiekiem czy wykształceniem konieczne
Zależność między wiekiem a BMI dużo silniejsza u …….
r=0,41 vs r=0,24
Porównujemy współczynniki determinacji
r
2
=(0,41)
2
= - prawie ====zróznicowania BMI wyjaśnione przez wiek w grupie =====
r
2
=(0,24)
2
= - prawie ===zróznicowania BMI wyjaśnione przez wiek w grupie ======
Zależność między wiekiem a wykształceniem dużo silniejsza u …….
r=-0,55 vs r=- 0,25
Porównujemy współczynniki determinacji
r
2
=(-0,55)
2
= - ==== zróżnicowania wykształcenia wyjaśnione przez wiek w grupie ====
r
2
=(-0,25)
2
===== - ===% zróżnicowania wykształcenia wyjaśnione przez wiek w grupie====
Podsumowując:
StaWspółczynniki (wagi) regresji
Standaryzowane i niestandaryzowane
współczynniki regresji
Równanie linii prostej /regresji można zapisać w postaci NIEstandaryzowanej ( współczynniki
regresji b) lub STANDARYZOWANEJ ( współczynniki β).
Na podstawie równania NIEstandaryzowanego możemy powiedzieć, że jeżeli X wzrośnie o JEDNĄ
jednostkę, to Y ====== o b jednostek.
( wzrośnie gdy b>0, zmaleje gdy b<0)
Na podstawie równania standaryzowanego możemy powiedzieć, że jeżeli X wzrośnie o JEDNO
ODCHYLENIE STANDARDOWE , to Y ====== o BETA odchyleń standardowych
( wzrośnie gdy β>0, zmaleje gdy β <0)