Analiza wariancji.
Opracowana przez R.A. Fishera w 20
latach XX w.
Analiza wariancji
Analiza wariancji jest metodą
statystyki matematycznej bazującej
na porównaniu wariancji, która w
najprostszym przypadku jest
rozszerzeniem testu do weryfikacji
hipotezy o równości wartości
przeciętnych w dwóch populacjach na
większą ich ilość.
Analiza wariancji
Analiza wariancji jest techniką
badania obserwacji (wyników), które
zależą od jednego lub więcej
czynników działających równocześnie.
Za pomocą tej techniki określa się,
czy wyodrębnione czynniki wywierają
wpływ na obserwowane wyniki.
Zmienną, która takiej obserwacji
podlega nazywamy zmienną
objaśnianą.
Analiza wariancji
W przypadku, gdy np. obserwujemy
ilość wydzielanej substancji podczas
doświadczenia chemicznego przy
różnych temperaturach, wtedy mamy
do czynienia z klasyfikacją
jednoczynnikową.
Można stosować klasyfikację wg
dwóch albo kilku kryteriów i wtedy
mamy do czynienia z klasyfikacją
wielokrotną.
Klasyfikacja
jednoczynnikowa
Weryfikacja hipotezy o równości k>2
wartości przeciętnych w przypadku
klasyfikacji jednoczynnikowej :
Niech badana cecha X ma w każdej
populacji taki sam rozkład N(m,s).
Z każdej populacji wybieramy próbę o
liczebności n
i
(i=1,2 …, k)
odpowiednio.
Niech x
ij
będzie j-tym wynikiem w i-
tej próbce
Klasyfikacja
jednoczynnikowa
Średnia i-tej próbki
Średnia ogólna
i
n
j
ij
i
i
x
n
x
1
1
k
i
i
i
n
j
ij
k
i
n
x
n
x
n
x
i
1
1
1
1
1
Klasyfikacja
jednoczynnikowa
Sumę kwadratów odchyleń
poszczególnych obserwacji x
ij
od
średniej ogólnej można przedstawić w
postaci sumy dwóch składników
Pierwszy jest sumą kwadratów
wewnątrz grup lub sumą resztkową,
Drugi jest sumą kwadratów między
grupami.
k
i
i
i
k
i
i
n
j
ij
n
j
ij
k
i
n
x
x
x
x
x
x
i
i
1
2
1
2
1
1
2
1
)
(
)
(
)
(
Klasyfikacja
jednoczynnikowa
Dla potrzeb weryfikacji hipotez
wprowadzamy oznaczenia
Q – suma kwadratów całkowita,
Q
R
– resztkowa
Q
G
– międzygrupowa.
Statystyka F= Q
G
/(k-1): Q
R
/(n-k) ma
rozkład F Snedecora o (k-1,n-k)
stopniach swobody.
Klasyfikacja
jednoczynnikowa
Zbiorem krytycznym testu F jest
przedział <F(1-
a
;k-1;n-k) , +oo).
Ponieważ warunkiem koniecznym
weryfikowania hipotezy F jest
równość wariancji, musimy najpierw
zweryfikować hipotezę
H0:
o równości wariancji przy pomocy
testu Bartletta
2
2
2
2
1
....
k
Test Bartletta
Korzystamy ze statystyki Bartletta
gdzie
k
i
i
n
j
i
ij
i
obl
n
x
x
n
s
k
n
c
i
1
1
2
2
2
]
1
)
(
log
)
1
(
log
)
[(
303
,
2
k
i
i
n
j
ij
x
x
k
n
s
i
1
2
1
2
)
(
1
)
1
(
3
)
1
1
1
(
1
1
k
k
n
n
c
k
i
i
Test Bartletta
Zbiorem krytycznym testu Bartletta
jest przedział
<Chi
2
(1-
a
,k-1), +oo),
gdzie Chi
2
(1-
a
,k-1) jest kwantylem
rzędu (1-
a
) odczytanym z tablic
rozkładu Chi
2
o (k-1) stopniach
swobody.
Klasyfikacja podwójna
Weryfikacje hipotez dotyczące
wartości przeciętnych w przypadku
klasyfikacji podwójnej można
zastosować do następującego typu
zadań:
Badania skuteczności procesu
biologicznego oczyszczania ścieków
przy wykorzystaniu:
r odmian bakterii (czynnik A)
p rodzajów napowietrzania (czynnik
B).
Klasyfikacja podwójna
W tego rodzaju badaniach wszystkie
obserwacje będą podzielone na r*p
grup.
Dla uproszczenia zapisów możemy
założyć, że w każdej grupie
przeprowadza się jednakową liczbę l
pomiarów.
Badaną cechą jest skuteczność
oczyszczania.
Klasyfikacja podwójna
Przy pomocy tego modelu możemy
weryfikować następujące hipotezy:
dotyczącą równości wartości
przeciętnej badanej cechy we
wszystkich r*p populacjach,
H
01
:
m
ij
=
m
dla i=1,..,r; j=1,…,p.
Klasyfikacja podwójna
dotyczącą równość wszystkich
wartości przeciętnych badanej cechy
poddanej działaniu czynnika A w r
wariantach bez względu na wpływ
czynnika B.
H
02
:
m
1.
=
m
2.
=…=
m
r.
Klasyfikacja podwójna
dotyczącą równość wszystkich
wartości przeciętnych badanej cechy
poddanej działaniu czynnika B w p
wariantach bez względu na wpływ
czynnika A.
H
03
:
m
.1
=
m
.2
=…=
m
.p
Klasyfikacja podwójna
Mówiąca, że odchylenie wartości
przeciętnej we wszystkich rp
populacjach od ogólnej wartości
przeciętnej jest równe sumie efektów
czynnika A i B.
H
04
:
m
ij
-
m
=(
m
i.
-
m
)+(
m
.j
-
m
)
Gdy H
04
nie jest spełniona, czyli gdy
nie zachodzi addytywność
oddziaływania A i B, to mówimy, że
zachodzi współdziałanie tych
czynników