wprowadzenie odpowiednich mierników, określających globalna dokładność predykcji oraz szacujących istotność cząstkowych współczynników regresji.
Dokładność danego równania regresji wielokrotnej możemy określić za pomocą „odległości” między y, oraz yh czyli za pomocą różnic (y, - y,-), a ściślej — kwadratów tych różnic.
Sumę
gdzie n oznacza liczebność próby, nazywa się suma kwadratów odchyleń od regresji lub resztowa suma kwadratów. Natomiast wielkość
(12.9)
nazywa się błędem standardowym predykcji; jest ona miara dokładności przewidywania na podstawie równania
y = b0 + b]xl+b2x2 + ... + bpxp .
Im wartość se jest mniejsza, tym mniejsze różnice występują między przewidywanymi na podstawie równania regresji i obserwowanymi wartościami cechy Y. Można również wykazać, że j; jest estymatorem wariancji zmiennej losowej e, występującej w równaniu (12.1).
Określanie błędu standardowego predykcji na podstawie wartości Se danej wzorem (12.8), jest o tyle niewygodne, że najpierw należy uzyskać oceny cząstkowych współczynników regresji b0, b{.....bp, następnie wyliczyć z równania regresji wartości prze
widywane y, i dopiero wtedy zastosować wzór (12.8). Prościej jest obliczyć Se ze wzoru:
n
(12.10)
S' = 2y}-R0o,b bp) ,
1=1
w którym pierwszy składnik oznacza sumę kwadratów obserwacji cechy Y (czyli zmiennej
zależnej), natomiast drugi składnik R (b0. bt.....bp) to tzw. redukcja sumy kwadratów
w wyniku dopasowania wymienionych w nawiasach stałych.
Wiclkoć redukcji oblicza się ze wzoru:
(12.11)
K (V h\ v = bTw = b0lyi + />, +... + bp 'Lxpiyi
258