a-4 = -13,363 + 1.004*3
Do badania jakości uzyskanego równania regresji wielokrotnej można podejść także w nieco inny sposób. Na podstawie obserwacji cechy Y w próbie (>',) możemy obliczyć łączną sumę kwadratów Syy, a w wyniku dopasowania równania regresji wielokrotnej możemy obliczyć resztową sumę kwadratów Se. Różnica między nimi, mierzącą wielkość redukcji sumy kwadratów w wyniku dopasowania (umożliwiająca obliczenie wartości przewidywanych informuje o dokładności przewidywania. A zatem
suma kwadratów' |
"suma kwadratów^1 |
'suma kwadratów' | ||
poza średnicą |
= |
w regresji |
+ |
poza regresją |
l J |
redukcja |
^ / |
Jak widać z powyższego schematu, stwierdzenie „dobroci” regresji (czyli stwierdzenie, jak dalece dany model odzwierciedla rzeczywisty, uzyskany empirycznie układ punktów) sprowadza się do stwierdzenia, jak duża część sumy kwadratów w regresji (redukcji) pokrywa się z łączną sumą kwadratów (tzn. poza średnią). Użyteczną miarą tak rozumianej „dobroci" modelu regresji jest wielkość:
R = R
(12.16)
nosząca nazwę współczynnika korelacji wielokrotnej. Jest to współczynnik korelacji wartości obserwowanych iy), oraz wartości obliczonych (przewidywanych (y,), z równania regresji wielokrotnej, w którym uwzględniono zmienne niezależne *lt x2, .... xp.
Można więc inaczej zapisać, że
Jak wynika ze wzoru (12.16) współczynnik korelacji wielokrotnej R jest liczbą nie-ujemną przyjmującą wartości z przedziału <0, 1>.
Osiąga on wartość 0, gdy Syy = St, a zatem gdy w wyniku dopasowania równania regresji nie nastąpiła redukcja sumy kwadratów; natomiast wartość 1, gdy 5C = 0, a więc gdy cała suma kwadratów została zredukowana.
Bezpośrednio ze wzoru (12.12) uzyskujemy jeszcze jeden wzór określający współczynnik korelacji wielokrotnej:
262