ANALIZA STATYSTYCZNA
z wykorzystaniem techniki komputerowej
5.4 Analiza wariancji
Analizę wariancji wykorzystujemy do porównywania wartości średnich w wielu zbiorowościach.
5.4.1 Model jednoczynnikowy (klasyfikacja pojedyncza, jednokierunkowa analiza wariancji)
W wielu przypadkach praktycznych wyniki obserwacji generowane są w następujący sposób:
gdzie jest wspólną dla wszystkich pomiarów wartością oczekiwaną, i jest składową wyniku obserwacji wynikającą z działania i-tego czynnika zewnętrznego (przyczyny głównej), zaś ij jest losowym zakłóceniem (błędem), zazwyczaj przyjmowany jako jednakowy dla wszystkich obserwacji.
Powyższy model opisuje - na przykład - sytuację, gdy dokonujemy pomiaru k obiektów, z których każdy mierzony jest ni (i=1,...,k) razy.
Jedną z możliwych hipotez jest taka, że czynniki zewnętrzne (przyczyny główne) nie mają systematycznego wpływu na wynik obserwacji. Hipoteza ta jest równoważna hipotezie
a sposób jej weryfikacji nazywany jest analizą wariancji.
Aby zweryfikować powyższą hipotezę, musimy najpierw zweryfikować hipotezę o stałej wartości odchylenia standardowego
σσσk= σ
Jeżeli nie ma podstaw do zakwestionowania hipotezy o stałości odchylenia standardowego możemy przejść do weryfikacji hipotezy o jednakowych wartościach oczekiwanych (analizy wariancji).
Niech
oraz
gdzie
, ,
Weryfikowaną hipotezę odrzucamy gdy
gdzie ,
zaś F(,k-1,n-k) jest kwantylem rzędu w rozkładzie F-Snedecora o parze stopni swobody (k-1,n-k).
W przeciwnym przypadku nie mamy podstaw do odrzucenia hipotezy
Wykorzystanie Excela do obliczeń jednoczynnikowej analizy wariancji.
Narzędzia | Analiza danych | Analiza wariancji: jednoczynnikowa
Dane do analizy wprowadzamy kolumnami lub wierszami. W przypadku wprowadzania kolumnami, w każdej kolumnie podane są wyniki obserwacji odpowiadające jednej zbiorowości (jednego czynnika zewnętrznego). Na przykład:
Czynnik 1 |
Czynnik 2 |
Czynnik 3 |
19 |
40 |
32 |
45 |
28 |
26 |
26 |
26 |
30 |
23 |
15 |
17 |
36 |
24 |
23 |
23 |
26 |
24 |
26 |
36 |
29 |
33 |
27 |
20 |
22 |
28 |
|
|
19 |
|
Należy podać poziom istotności testu, np. 0.05 i wykonać obliczenia.
Wynik obliczeń jest następujący:
PODSUMOWANIE |
|
|
|
|
|
|
|||||||||||||
Grupy |
Licznik |
Suma |
Średnia |
Wariancja |
|
|
|||||||||||||
Kolumna 1 |
9 |
253 |
28,11111 |
69,11111 |
|
|
|||||||||||||
Kolumna 2 |
10 |
269 |
26,9 |
52,32222 |
|
|
|||||||||||||
Kolumna 3 |
8 |
201 |
25,125 |
26,41071 |
|
|
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||
ANALIZA WARIANCJI |
|
|
|
|
|
|
|||||||||||||
Źródło wariancji |
SS |
df |
MS |
F |
Wartość-p |
Test F |
|||||||||||||
Pomiędzy grupami |
38,00278 |
2 |
19,00139 |
0,377304 |
0,689703 |
3,402832 |
|||||||||||||
W obrębie grup |
1208,664 |
24 |
50,361 |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|||||||||||||
Razem |
1246,667 |
26 |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
Interpretacja:
Pomiędzy grupami :
SS - suma w
, df - liczba stopni swobody (mianownik w
),
MS -
W obrębie grup
SS - suma w
, df - liczba stopni swobody (mianownik w
),
MS -
F - wartość statystyki testowej
Test F - wartość krytyczna [F(,k-1,n-k) - kwantyl rzędu w rozkładzie F-Snedecora o parze stopni swobody (k-1,n-k)]
5.4.2 Model dwuczynnikowy (klasyfikacja podwójna, dwukierunkowa analiza wariancji)
W bardziej ogólnym wyniki obserwacji generowane są w następujący sposób:
gdzie jest wspólną dla wszystkich pomiarów wartością oczekiwaną, i jest i-tą składową (poziomem) jednego czynnika zewnętrznego, j jest j-tą składową (poziomem) drugiego czynnika zewnętrznego, symbolem (ij oznaczamy wpływ interakcji obu czynników zewnętrznych, K jest liczbą obserwacji dla każdej kombinacji poziomów pierwszego i drugiego czynnika zewnętrznego, zaś ijk jest losowym zakłóceniem (błędem), zazwyczaj przyjmowany jako jednakowy dla wszystkich obserwacji.
Możliwa jest weryfikacja różnych hipotez. Na przykład, gdy K=1 korzystamy z opcji:
Narzędzia | Analiza danych | Analiza wariancji: dwuczynnikowa bez powtórzeń
Dane czytane kolumnami odpowiadają poziomom jednego czynnika, a dane czytane wierszami odpowiadają poziomom drugiego czynnika. Na przykład:
|
Kolumna 1 |
Kolumna 2 |
Kolumna 3 |
Wiersz 1 |
10 |
14 |
18 |
Wiersz 2 |
15 |
19 |
24 |
Wiersz 3 |
8 |
14 |
21 |
Wynik obliczeń jest następujący:
PODSUMOWANIE |
Licznik |
Suma |
Średnia |
Wariancja |
|
|
Wiersz 1 |
3 |
42 |
14 |
16 |
|
|
Wiersz 2 |
3 |
58 |
19,33333 |
20,33333 |
|
|
Wiersz 3 |
3 |
43 |
14,33333 |
42,33333 |
|
|
|
|
|
|
|
|
|
Kolumna 1 |
3 |
33 |
11 |
13 |
|
|
Kolumna 2 |
3 |
47 |
15,66667 |
8,333333 |
|
|
Kolumna 3 |
3 |
63 |
21 |
9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ANALIZA WARIANCJI |
|
|
|
|
|
|
Źródło wariancji |
SS |
df |
MS |
F |
Wartość-p |
Test F |
Wiersze |
53,55556 |
2 |
26,77778 |
15,0625 |
0,01374 |
6,944276 |
Kolumny |
150,2222 |
2 |
75,11111 |
42,25 |
0,002043 |
6,944276 |
Błąd |
7,111111 |
4 |
1,777778 |
|
|
|
|
|
|
|
|
|
|
Razem |
210,8889 |
8 |
|
|
|
|
Można weryfikować hipotezy:
o braku wpływu czynnika reprezentowanego przez kolumny;
o braku wpływu czynnika reprezentowanego przez wiersze.
Gdy K=1 korzystamy z opcji:
Narzędzia | Analiza danych | Analiza wariancji: dwuczynnikowa z powtórzeniami
Dane czytane kolumnami odpowiadają poziomom jednego czynnika, a dane czytane wierszami odpowiadają poziomom drugiego czynnika. Kolejne powtórzenia zaznaczane są jako kolejne próby.
Przykładowe dane:
|
|
Czynnik A1 |
Czynnik A2 |
Czynnik A3 |
Próba 1 |
Czynnik B1 |
14 |
19 |
18 |
Próba 2 |
|
16 |
20 |
22 |
Próba 1 |
Czynnik B2 |
15 |
23 |
20 |
Próba 2 |
|
17 |
21 |
20 |
Próba 1 |
Czynnik B3 |
12 |
21 |
23 |
Próba 2 |
|
15 |
19 |
21 |
Wyniki obliczeń:
Analiza wariancji: dwuczynnikowa z powtórzeniami |
|
|
|
|
|
|
|
|
|
|
|
|
|
PODSUMOWANIE |
Czynnik A1 |
Czynnik A2 |
Czynnik A3 |
Razem |
|
|
Czynnik B1 |
|
|
|
|
|
|
Licznik |
2 |
2 |
2 |
6 |
|
|
Suma |
30 |
39 |
40 |
109 |
|
|
Średnia |
15 |
19,5 |
20 |
18,16667 |
|
|
Wariancja |
2 |
0,5 |
8 |
8,166667 |
|
|
|
|
|
|
|
|
|
Czynnik B2 |
|
|
|
|
|
|
Licznik |
2 |
2 |
2 |
6 |
|
|
Suma |
32 |
44 |
40 |
116 |
|
|
Średnia |
16 |
22 |
20 |
19,33333 |
|
|
Wariancja |
2 |
2 |
0 |
8,266667 |
|
|
|
|
|
|
|
|
|
Czynnik B3 |
|
|
|
|
|
|
Licznik |
2 |
2 |
2 |
6 |
|
|
Suma |
27 |
40 |
44 |
111 |
|
|
Średnia |
13,5 |
20 |
22 |
18,5 |
|
|
Wariancja |
4,5 |
2 |
2 |
17,5 |
|
|
|
|
|
|
|
|
|
Razem |
|
|
|
|
|
|
Licznik |
6 |
6 |
6 |
|
|
|
Suma |
89 |
123 |
124 |
|
|
|
Średnia |
14,833333 |
20,5 |
20,6666667 |
|
|
|
Wariancja |
2,9666667 |
2,3 |
3,06666667 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ANALIZA WARIANCJI |
|
|
|
|
|
|
Źródło wariancji |
SS |
df |
MS |
F |
Wartość-p |
Test F |
Próbka |
4,3333333 |
2 |
2,16666667 |
0,847826 |
0,459895 |
4,256492 |
Kolumny |
132,33333 |
2 |
66,1666667 |
25,8913 |
0,000185 |
4,256492 |
Interakcja |
14,333333 |
4 |
3,58333333 |
1,402174 |
0,308413 |
3,63309 |
W obrębie |
23 |
9 |
2,55555556 |
|
|
|
|
|
|
|
|
|
|
Razem |
174 |
17 |
|
|
|
|
O.Hryniewicz: Analiza statystyczna - komputery (8 godz.) 34