W5 zaawansowany
niedziela .
" 1. Ograniczenia współczynnika korelacji
" 2. Regresja wielozmiennowa
" - interpretacja współczynnika korelacji,
determinacji, standaryzowanych i
niestandaryzowanych współczynników
regresji
" Przeczytaj rozdział 8 bez strony 300 i stron 309-324
Wielkość współczynnika korelacji a wielkość próby
" Tabela 8.3. strona 301
" Hipoteza zerowa brak zwiÄ…zku liniowego
w populacji
" Aby odrzucić H0
" |r| > & & . gdy n=22
" |r|> & & . gdy n=92
Dobroć dopasowania
modelu liniowego
" Związek zmiennych ilościowych możemy przedstawić na wykresie
rozrzutu/korelacyjnych.
" Do zbioru punktów na wykresie możemy zawsze dopasować NAJLEPSZ
liniÄ™ prostÄ…
" Najlepsza linia nie musi być dobra
O tym, na ile jest DOBRA informuje nas:
1. współczynnik determinacji
2. kwadrat współczynnika korelacji
3. stosunek zróżnicowania wyjaśnionego przez regresję do całkowitego
1, 2, 3 to synonimy!
To może jednak nie wystarczyć - patrz rys. 8.5 s.296 współczynnik korelacji
jest identyczny a dopasowanie prostej do rozkładu na diagramie b nie ma
sensu. WNIOSEK trzeba starannie oglądać rozkłady.
Współczynniki (wagi) regresji
Równanie linii prostej /regresji można zapisać w postaci
NIEstandaryzowanej ( współczynniki regresji b) lub
STANDARYZOWANEJ ( współczynniki ²).
Na podstawie równania NIEstandaryzowanego możemy
powiedzieć, że
jeżeli X wzrośnie o JEDN jednostkę,
to Y ====== o b jednostek.
" ( wzrośnie gdy b>0, zmaleje gdy b<0)
Na podstawie równania standaryzowanego możemy powiedzieć,
że jeżeli X wzrośnie o JEDNO ODCHYLENIE STANDARDOWE ,
to Y ====== o BETA odchyleÅ„ standardowych ( wzroÅ›nie gdy ²>0,
zmaleje gdy ² <0)
Standaryzowane i nie
współczynniki regresji
Zmiana X Zmiana Y
niestandaryzowane O jednÄ… jednostkÄ™ X O b jednostek Y
standaryzowane O jedno odchylenie O BETA odchyleń
standardowe X standardowych Y
Proste współczynniki korelacji
nie wystarczajÄ… aby& .
" Porównaj korelację BMI z wiekiem/ wykształceniem
liczonÄ… ( s.302)
" W całej próbie
" Tylko dla mężczyzn
" Tylko dla kobiet
Zależność między wiekiem a BMI dużo silniejsza
dla kobiet niż dla mężczyzn
" r=0,41 vs r=0,24
" Porównujemy współczynniki determinacji
" r2=(0,41)2=0,1681 - prawie 17% zróżnicowania
BMI wyjaśnione przez wiek w grupie kobiet
" r2=(0,24)2=0,0576 - prawie 6% zróżnicowania
BMI wyjaśnione przez wiek w grupie mężczyzn
Zależność między wiekiem a wykształceniem
dużo silniejsza u & & .
" r=-0,55 vs r=- 0,25
" Porównujemy współczynniki determinacji
" r2=(-0,55)2=0,3025 - 30% zróżnicowania
wykształcenia wyjaśnione przez wiek w grupie
kobiet
" r2=(-0,25)2=0,0625 - 6% zróżnicowania
wykształcenia wyjaśnione przez wiek w grupie
mężczyzn
Przewidywanie Y za pomocÄ…
więcej niż jednego predyktora
" Przykład 8.2 s.304 Warto publikować? Warto się
starzeć?
" Wagi ( współczynniki) regresji zależą od towarzystwa
(jakie inne predyktory zostały uwzględnione w równaniu)
" Porównaj współczynniki dla liczby publikacji w
równaniach
" Y =$566X2+ & .
" Y =$88X2+& &
Modele wielozmiennowe
" Kontrolowanie zmiennych ubocznych które nie są
wyspecyfikowane w modelu ( naszych głównych
hipotezach) ale mogą wpływać na wyniki
" Mówimy wtedy o zależności Y od X1 przy
kontrolowanym statystycznie ( ceteris paribus) wpływie
zmiennych X2, X3& &
Inne sposoby kontrolowania zmiennych
ubocznych:
" Losowy dobór do grup porównawczych
" Zamiana zmiennych w stałe ( analizy prób
homogenicznych )
" Kontrola statystyczna jeśli zostały zmierzone
Regresja wieloraka
" Aączny rozkład X i Y
" Najlepsza kombinacja liniowa Y=a +bX
" Najlepsza nie musi być dobra ( r2)
" Aączny rozkład X1, X2 i Y
" Najlepsza kombinacja liniowa Y=a
+b1X1+b2X2
" Najlepsza nie musi być dobra ( R2)
Przewidywanie Y
za pomocÄ… 3 zmiennych
" Y=10X1+200X2-30X3-800
Y zarobki
X1- wiek
X2- lata nauki
X3- liczba dzieci
Y=10X1+200X2-30X3-800
Y zarobki
X1- wiek
X2- lata nauki
X3- liczba dzieci
Pani Kowalska ma po 40 lat, średnie wykształcenie (14 lat
nauki) i dwoje dzieci.
X1=40 X2=14 X3=2
Przewidywane zarobki pani Kowalskiej
=40*10+14*200 +2*(-30)-800=400+2800-60-800=2340
Y=10X1+200X2-30X3-800
Y zarobki
X1- wiek
X2- lata nauki
X3- liczba dzieci
Pani Zielińska ma 30 lat, wyższe wykształcenie (17 lat nauki) i
jest bezdzietna
Przewidywane zarobki pani Zielińskiej
X1=30 X2=17 X3=0
=30*10+17*200 +0*(-30)-800=300+3400-0-800=2900
Przewidywanie zarobków
" PGSS s. 306
" Osobne analizy dla kobiet i meżczyzn
" Wprowadzanie interakcji predyktorów do
analizy regresji ( do tego tematu wrócimy
jeszcze póżniej)
Analiza wariancji a analiza
regresji
ANOVA
" pozwala badać wpływ wielowartościowych
jakościowych/nominalnych zmiennych wyjaśniających (
czynniki) np.. Województwo, kraj, wykształcenie
" Wymaga aby zmienne niezależne nie przyjmowały zbyt
wielu wartości ( ograniczenia związane z wielkością
próby). Konieczna redukcja liczby wartości zmiennej (np.
wynik w teście IQ) oznacza utratę informacji
" Pozwala łatwo badać interakcyjny wpływ czynników
" Daje te same wyniki, co analiza regresji ( oparta na tym
samym modelu)
Wyszukiwarka
Podobne podstrony:
met4zn korelacje regresja studentregresja empirycznastudentcanpoststudentwyklad z analizy matematycznej dla studentow na kierunku automatyka i robotyka aghapril 09 uppersecondary studentscw16 krata student3? EXAM LANGUAGE ELEMENTSfor studentsstudent10 2niezbednik studenta cz 2regresjaDla studentów administracjiWspomnienia z sesji regresingu Wojna w Wietnamiecele regresingunotatek pl materiały dla studentów (repetytorium) sem1student wniosek osw dochodywięcej podobnych podstron