2008-05-09 11:23
Wykład: Analiza wariancji prosta (jednoczynnikowa)(ANOVA) Analiza zmienności została opracowana przez uczonego angielskiego, biologa i genetyka Ronalda A. Fishera. Istota jego teorii opiera się na podziale zmienności głównej na pewne frakcje i na analizowaniu tych poszczególnych zmienności.
W oparciu o pogląd Fishera wyróżniamy 3 rodzaje zmienności: a) zmienność ogólna - wyraża się zróżnicowaniem wszystkich kolejnych wartości zmiennej w stosunku do ogólnej średniej (obliczonej dla całej zbiorowości) b) zmienność międzygrupowa - występuje na skutek różnic powstałych między grupami doświadczalnymi, wywołana jest działaniem czynnika doświadczalnego na poszczególne grupy doświadczalne, wyraża się zróżnicowaniem średnich poszczególnych grup doświadczalnych w stosunku do ogólnej średniej
c) zmienność wewnątrzgrupowa - istnieje między poszczególnymi wartościami zmiennej wewnątrz każdej grupy, wywołana jest czynnikami osobniczymi czyli indywidualnymi cechami poszczególnych osobników, wyraża się zróżnicowaniem poszczególnych zmiennych wewnątrz każdej grupy w stosunku do średniej dla tej grupy Analizą wariancji posługujemy się przy badaniu istotności różnic między grupami doświadczalnymi. W tym celu wykorzystujemy wykryte przez Fishera prawo, że stosunek kwadratów odchyleń międzygrupowych do wewnątrzgrupowych kształtuje się według określonego rozkładu (rozkład F) i stąd możliwa jest ocena prawdopodobieństwa wystąpienia pewnych wartości F. Sytuację tę można wyobrazić sobie w następujący sposób. Jeśli z populacji o rozkładzie normalnym wybieralibyśmy losowo po dwie próby i badalibyśmy wzajemne relacje ich wariancji (iloraz), to ten stosunek miałby rozkład zgodny z rozkładem F. Jest to rozkład prawoskośny, tj.
średnia arytmetyczna jest większa od mediany.
Hipoteza zerowa i alternatywna: H0: Wszystkie średnie są równe.
H0: µ1=µ2=µ3=µ4=µ5=µ6...
H1: Istnieje co najmniej jedna para średnich, które różnią się ze sobą.
H1: µ1≠µ2 lub µ1≠µ3 lub µ2≠µ3 itd....
Autor: Dariusz Piwczyński
1
Kolejność obliczeń (Analiza wariancji prosta) 1. O
bliczanie stopni swobody (rodzaj zmienności) (D
F)
a) Ogólna
N-1
(N – liczebność populacji)
b) Międzygrupowa
k-1
(k - liczba grup doświadczalnych) c) Wewnątrzgrupowa
N-k
2. S
umy kwadratów odchyleń (S
KO)
a) Ogólna
2
( x)2
So = ∑
∑
x −
N
b) Międzygrupowa
( x
∑ )2 ∑
∑
∑
∑
1
( x )2
2
( x )2
3
( x 2
2
i )
( x)
S =
+
+
+ ... +
−
m
n
n
n
n
N
1
2
3
i
c) Wewnątrzgrupowa: Sw=So - Sm 3. Ś
rednie kwadraty odchyleń (Ś
KO)
a) zmienność międzygrupowa: S 2
m =Sm/(k-1)
b) zmienność wewnątrzgupowa: S 2
w =Sw/(N-k)
2
Sm
4. F empiryczne F
=
emp
2
Sw
Tabela analizy zmienności
Rodzaj zmienności
Liczba
Suma
Średni
Femp
Ftab
stopni
kwadratów
kwadrat
swobody
odchyleń
odchyleń
DF
SKO
ŚKO
0,05
0,01
Ogólna
N-1
So
Międzygrupowa
k-1
S
2
m
Sm
Femp
Wewnątrzgrupowa
N-k
S
2
w
Sw
Obliczoną wartość statystyki F (tzw. F empiryczne - Femp.) odnosimy do wartości krytycznej z rozkładu F-Snedecora dla założonego poziomu istotności (α) i określonej liczby stopni swobody (ν1=k-1 oraz ν2=N-k) (F tabelaryczne - Ftab.). Jeżeli Femp. ≥ Ftab. - to mamy podstawę do odrzucenie hipotezy zerowej i stwierdzenia, iż istnieje co najmniej jedna para średnich, które różnią się ze sobą. Zatem czynnik doświadczalny wpływa statystycznie na cechę. W przeciwnym przypadku, nie mamy podstaw do odrzucenia H0.
Autor: Dariusz Piwczyński
2
Wynik analizy wariancji jednoczynnikowej w SAS
Zmienna zależna: nGat
Źródło
St.
Suma
Średnia
Wartość
Pr > F
sw.
kwadratów
kwadratów
F
Model
6
3729.08593
621.51432
42.95
<.0001
Błąd
990
14327.22500
14.47194
Razem
996
18056.31093
skorygowane
R-kwadrat Wsp. war. Pierwiastek MSE Średnia nGat 0.206525
26.69850
3.804201
14.24875
Źródło St. sw. Type III Suma kw. Średnia kwadratów Wartość F
Pr > F
Zaklad 6
3729.085933
621.514322
42.95
<.0001
Autor: Dariusz Piwczyński
3