ANALIZA STATYSTYCZNA
z wykorzystaniem techniki komputerowej
5.4 Analiza wariancji
Analizę wariancji wykorzystujemy do porównywania wartości średnich w wielu zbiorowościach.
5.4.1 Model jednoczynnikowy (klasyfikacja pojedyncza, jednokierunkowa analiza wariancji)
W wielu przypadkach praktycznych wyniki obserwacji generowane są w następujący sposób:
gdzie  jest wspólną dla wszystkich pomiarów wartością oczekiwaną, i jest składową wyniku obserwacji wynikającą z działania i-tego czynnika zewnętrznego (przyczyny głównej), zaś ij jest losowym zakłóceniem (błędem), zazwyczaj przyjmowany jako jednakowy dla wszystkich obserwacji.
Powyższy model opisuje - na przykład - sytuację, gdy dokonujemy pomiaru k obiektów, z których każdy mierzony jest ni (i=1,...,k) razy.
Jedną z możliwych hipotez jest taka, że czynniki zewnętrzne (przyczyny główne) nie mają systematycznego wpływu na wynik obserwacji. Hipoteza ta jest równoważna hipotezie
a sposób jej weryfikacji nazywany jest analizą wariancji.
Aby zweryfikować powyższą hipotezę, musimy najpierw zweryfikować hipotezę o stałej wartości odchylenia standardowego
σσσk= σ
Jeżeli nie ma podstaw do zakwestionowania hipotezy o stałości odchylenia standardowego możemy przejść do weryfikacji hipotezy o jednakowych wartościach oczekiwanych (analizy wariancji).
Niech
oraz
gdzie
, ,
Weryfikowaną hipotezę odrzucamy gdy
gdzie ,
zaś F(,k-1,n-k) jest kwantylem rzędu  w rozkładzie F-Snedecora o parze stopni swobody (k-1,n-k).
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy
Wykorzystanie Excela do obliczeń jednoczynnikowej analizy wariancji.
Narzędzia | Analiza danych | Analiza wariancji: jednoczynnikowa
Dane do analizy wprowadzamy kolumnami lub wierszami. W przypadku wprowadzania kolumnami, w każdej kolumnie podane są wyniki obserwacji odpowiadające jednej zbiorowości (jednego czynnika zewnętrznego). Na przykład:
Czynnik 1  | 
Czynnik 2  | 
Czynnik 3  | 
19  | 
40  | 
32  | 
45  | 
28  | 
26  | 
26  | 
26  | 
30  | 
23  | 
15  | 
17  | 
36  | 
24  | 
23  | 
23  | 
26  | 
24  | 
26  | 
36  | 
29  | 
33  | 
27  | 
20  | 
22  | 
28  | 
  | 
  | 
19  | 
  | 
Należy podać poziom istotności testu, np. 0.05 i wykonać obliczenia.
Wynik obliczeń jest następujący:
PODSUMOWANIE  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
Grupy  | 
Licznik  | 
Suma  | 
Średnia  | 
Wariancja  | 
  | 
  | 
|||||||||||||
Kolumna 1  | 
9  | 
253  | 
28,11111  | 
69,11111  | 
  | 
  | 
|||||||||||||
Kolumna 2  | 
10  | 
269  | 
26,9  | 
52,32222  | 
  | 
  | 
|||||||||||||
Kolumna 3  | 
8  | 
201  | 
25,125  | 
26,41071  | 
  | 
  | 
|||||||||||||
  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
ANALIZA WARIANCJI  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
Źródło wariancji  | 
SS  | 
df  | 
MS  | 
F  | 
Wartość-p  | 
Test F  | 
|||||||||||||
Pomiędzy grupami  | 
38,00278  | 
2  | 
19,00139  | 
0,377304  | 
0,689703  | 
3,402832  | 
|||||||||||||
W obrębie grup  | 
1208,664  | 
24  | 
50,361  | 
  | 
  | 
  | 
|||||||||||||
  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
Razem  | 
1246,667  | 
26  | 
  | 
  | 
  | 
  | 
|||||||||||||
  | 
  | 
  | 
  | 
  | 
  | 
  | 
|||||||||||||
Interpretacja:
Pomiędzy grupami :
SS - suma w ![]()
 ,   df - liczba stopni swobody (mianownik w ![]()
 ),
MS - ![]()
W obrębie grup
SS - suma w ![]()
 ,  df - liczba stopni swobody (mianownik w ![]()
 ),
MS - ![]()
F - wartość statystyki testowej
Test F - wartość krytyczna [F(,k-1,n-k) - kwantyl rzędu  w rozkładzie F-Snedecora o parze stopni swobody (k-1,n-k)]
5.4.2 Model dwuczynnikowy (klasyfikacja podwójna, dwukierunkowa analiza wariancji)
W bardziej ogólnym wyniki obserwacji generowane są w następujący sposób:
![]()
gdzie  jest wspólną dla wszystkich pomiarów wartością oczekiwaną, i jest i-tą składową (poziomem) jednego czynnika zewnętrznego, j jest j-tą składową (poziomem) drugiego czynnika zewnętrznego, symbolem (ij oznaczamy wpływ interakcji obu czynników zewnętrznych, K jest liczbą obserwacji dla każdej kombinacji poziomów pierwszego i drugiego czynnika zewnętrznego, zaś ijk jest losowym zakłóceniem (błędem), zazwyczaj przyjmowany jako jednakowy dla wszystkich obserwacji.
Możliwa jest weryfikacja różnych hipotez. Na przykład, gdy K=1 korzystamy z opcji:
Narzędzia | Analiza danych | Analiza wariancji: dwuczynnikowa bez powtórzeń
Dane czytane kolumnami odpowiadają poziomom jednego czynnika, a dane czytane wierszami odpowiadają poziomom drugiego czynnika. Na przykład:
  | 
Kolumna 1  | 
Kolumna 2  | 
Kolumna 3  | 
Wiersz 1  | 
10  | 
14  | 
18  | 
Wiersz 2  | 
15  | 
19  | 
24  | 
Wiersz 3  | 
8  | 
14  | 
21  | 
Wynik obliczeń jest następujący:
PODSUMOWANIE  | 
Licznik  | 
Suma  | 
Średnia  | 
Wariancja  | 
  | 
  | 
Wiersz 1  | 
3  | 
42  | 
14  | 
16  | 
  | 
  | 
Wiersz 2  | 
3  | 
58  | 
19,33333  | 
20,33333  | 
  | 
  | 
Wiersz 3  | 
3  | 
43  | 
14,33333  | 
42,33333  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Kolumna 1  | 
3  | 
33  | 
11  | 
13  | 
  | 
  | 
Kolumna 2  | 
3  | 
47  | 
15,66667  | 
8,333333  | 
  | 
  | 
Kolumna 3  | 
3  | 
63  | 
21  | 
9  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
ANALIZA WARIANCJI  | 
  | 
  | 
  | 
  | 
  | 
  | 
Źródło wariancji  | 
SS  | 
df  | 
MS  | 
F  | 
Wartość-p  | 
Test F  | 
Wiersze  | 
53,55556  | 
2  | 
26,77778  | 
15,0625  | 
0,01374  | 
6,944276  | 
Kolumny  | 
150,2222  | 
2  | 
75,11111  | 
42,25  | 
0,002043  | 
6,944276  | 
Błąd  | 
7,111111  | 
4  | 
1,777778  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Razem  | 
210,8889  | 
8  | 
  | 
  | 
  | 
  | 
Można weryfikować hipotezy:
o braku wpływu czynnika reprezentowanego przez kolumny;
o braku wpływu czynnika reprezentowanego przez wiersze.
Gdy K=1 korzystamy z opcji:
Narzędzia | Analiza danych | Analiza wariancji: dwuczynnikowa z powtórzeniami
Dane czytane kolumnami odpowiadają poziomom jednego czynnika, a dane czytane wierszami odpowiadają poziomom drugiego czynnika. Kolejne powtórzenia zaznaczane są jako kolejne próby.
Przykładowe dane:
  | 
  | 
Czynnik A1  | 
Czynnik A2  | 
Czynnik A3  | 
Próba 1  | 
Czynnik B1  | 
14  | 
19  | 
18  | 
Próba 2  | 
  | 
16  | 
20  | 
22  | 
Próba 1  | 
Czynnik B2  | 
15  | 
23  | 
20  | 
Próba 2  | 
  | 
17  | 
21  | 
20  | 
Próba 1  | 
Czynnik B3  | 
12  | 
21  | 
23  | 
Próba 2  | 
  | 
15  | 
19  | 
21  | 
Wyniki obliczeń:
Analiza wariancji: dwuczynnikowa z powtórzeniami  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
PODSUMOWANIE  | 
Czynnik A1  | 
Czynnik A2  | 
Czynnik A3  | 
Razem  | 
  | 
  | 
Czynnik B1  | 
  | 
  | 
  | 
  | 
  | 
  | 
Licznik  | 
2  | 
2  | 
2  | 
6  | 
  | 
  | 
Suma  | 
30  | 
39  | 
40  | 
109  | 
  | 
  | 
Średnia  | 
15  | 
19,5  | 
20  | 
18,16667  | 
  | 
  | 
Wariancja  | 
2  | 
0,5  | 
8  | 
8,166667  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Czynnik B2  | 
  | 
  | 
  | 
  | 
  | 
  | 
Licznik  | 
2  | 
2  | 
2  | 
6  | 
  | 
  | 
Suma  | 
32  | 
44  | 
40  | 
116  | 
  | 
  | 
Średnia  | 
16  | 
22  | 
20  | 
19,33333  | 
  | 
  | 
Wariancja  | 
2  | 
2  | 
0  | 
8,266667  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Czynnik B3  | 
  | 
  | 
  | 
  | 
  | 
  | 
Licznik  | 
2  | 
2  | 
2  | 
6  | 
  | 
  | 
Suma  | 
27  | 
40  | 
44  | 
111  | 
  | 
  | 
Średnia  | 
13,5  | 
20  | 
22  | 
18,5  | 
  | 
  | 
Wariancja  | 
4,5  | 
2  | 
2  | 
17,5  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Razem  | 
  | 
  | 
  | 
  | 
  | 
  | 
Licznik  | 
6  | 
6  | 
6  | 
  | 
  | 
  | 
Suma  | 
89  | 
123  | 
124  | 
  | 
  | 
  | 
Średnia  | 
14,833333  | 
20,5  | 
20,6666667  | 
  | 
  | 
  | 
Wariancja  | 
2,9666667  | 
2,3  | 
3,06666667  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
ANALIZA WARIANCJI  | 
  | 
  | 
  | 
  | 
  | 
  | 
Źródło wariancji  | 
SS  | 
df  | 
MS  | 
F  | 
Wartość-p  | 
Test F  | 
Próbka  | 
4,3333333  | 
2  | 
2,16666667  | 
0,847826  | 
0,459895  | 
4,256492  | 
Kolumny  | 
132,33333  | 
2  | 
66,1666667  | 
25,8913  | 
0,000185  | 
4,256492  | 
Interakcja  | 
14,333333  | 
4  | 
3,58333333  | 
1,402174  | 
0,308413  | 
3,63309  | 
W obrębie  | 
23  | 
9  | 
2,55555556  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
  | 
Razem  | 
174  | 
17  | 
  | 
  | 
  | 
  | 
O.Hryniewicz: Analiza statystyczna - komputery (8 godz.) 34