Zalety stosowania analizy wariancji do problemów związanych z regresją widać dopiero wówczas, gdy dysponujemy kilkoma wartościami obserwacji zmiennej y dla pewnego x = Każdą taką grupę obserwacji dla danego x) nazywamy serią. Niech liczebność /'-tej serii będzie oznaczona przez nh całkowita liczba obserwacji przez N, zaś liczba serii pr/.ez k. J-tą obserwację w i-tej serii oznaczymy przez y\j. Pozostałe oznaczenia pokazano w tabeli 8.2.
Przeanalizujemy teraz sytuację przedstawioną na rysunku 8.4.B. Odchylenie wartości obserwacji od wartości teoretycznej rozbijemy na dwa składniki: odchylenie wartości obserwacji y{j od średniej serii y, oraz odchylenie średniej serii od wartości teoretycznej Yj. Całkowitą sumę kwadratów odchyleń od wartości średniej y można zatem rozbić na trzy składniki
Tabela 8.2
Oznaczenia stosowane w teście na liniowość funkcji regresji wykorzystującym
analizę wariancji
Xi |
•'i |
• Xi •• |
■ xk |
Ogółem | |
>11 |
>21 |
>n |
>*i | ||
>12 |
>22 |
>i2 |
>« | ||
>* | |||||
* |
k | ||||
T, |
T2 |
ri |
Tk |
t=Żt i=i | |
j=l V | |||||
n |
* | ||||
S; = ży2. |
S\ |
s2 |
Si |
h |
5=^5; 1-1 |
T: |
T | ||||
'\* II |
>1 |
>2 |
li |
lk |
y = N |
k | |||||
"l |
n2 |
ni |
nk |
N=Źn{ | |
i= 1 |
150