2008-05-09 11:23

Wykład: Analiza wariancji prosta (jednoczynnikowa)(ANOVA) Analiza zmienności została opracowana przez uczonego angielskiego, biologa i genetyka Ronalda A. Fishera. Istota jego teorii opiera się na podziale zmienności głównej na pewne frakcje i na analizowaniu tych poszczególnych zmienności.

W oparciu o pogląd Fishera wyróżniamy 3 rodzaje zmienności: a) zmienność ogólna - wyraża się zróżnicowaniem wszystkich kolejnych wartości zmiennej w stosunku do ogólnej średniej (obliczonej dla całej zbiorowości) b) zmienność międzygrupowa - występuje na skutek różnic powstałych między grupami doświadczalnymi, wywołana jest działaniem czynnika doświadczalnego na poszczególne grupy doświadczalne, wyraża się zróżnicowaniem średnich poszczególnych grup doświadczalnych w stosunku do ogólnej średniej

c) zmienność wewnątrzgrupowa - istnieje między poszczególnymi wartościami zmiennej wewnątrz każdej grupy, wywołana jest czynnikami osobniczymi czyli indywidualnymi cechami poszczególnych osobników, wyraża się zróżnicowaniem poszczególnych zmiennych wewnątrz każdej grupy w stosunku do średniej dla tej grupy Analizą wariancji posługujemy się przy badaniu istotności różnic między grupami doświadczalnymi. W tym celu wykorzystujemy wykryte przez Fishera prawo, że stosunek kwadratów odchyleń międzygrupowych do wewnątrzgrupowych kształtuje się według określonego rozkładu (rozkład F) i stąd możliwa jest ocena prawdopodobieństwa wystąpienia pewnych wartości F. Sytuację tę można wyobrazić sobie w następujący sposób. Jeśli z populacji o rozkładzie normalnym wybieralibyśmy losowo po dwie próby i badalibyśmy wzajemne relacje ich wariancji (iloraz), to ten stosunek miałby rozkład zgodny z rozkładem F. Jest to rozkład prawoskośny, tj.

średnia arytmetyczna jest większa od mediany.

Hipoteza zerowa i alternatywna: H0: Wszystkie średnie są równe.

H0: µ1=µ2=µ3=µ4=µ5=µ6...

H1: Istnieje co najmniej jedna para średnich, które różnią się ze sobą.

H1: µ1≠µ2 lub µ1≠µ3 lub µ2≠µ3 itd....

Autor: Dariusz Piwczyński

1

2008-05-09 11:23

Kolejność obliczeń (Analiza wariancji prosta) 1. O

bliczanie stopni swobody (rodzaj zmienności) (D

F)

a) Ogólna

N-1

(N – liczebność populacji)

b) Międzygrupowa

k-1

(k - liczba grup doświadczalnych) c) Wewnątrzgrupowa

N-k

2. S

umy kwadratów odchyleń (S

KO)

a) Ogólna

2

( x)2

So = ∑

∑

x −

N

b) Międzygrupowa

( x

∑ )2 ∑

∑

∑

∑

1

( x )2

2

( x )2

3

( x 2

2

i )

( x)

S =

+

+

+ ... +

−

m

n

n

n

n

N

1

2

3

i

c) Wewnątrzgrupowa: Sw=So - Sm 3. Ś

rednie kwadraty odchyleń (Ś

KO)

a) zmienność międzygrupowa: S 2

m =Sm/(k-1)

b) zmienność wewnątrzgupowa: S 2

w =Sw/(N-k)

2

Sm

4. F empiryczne F

=

emp

2

Sw

Tabela analizy zmienności

Rodzaj zmienności

Liczba

Suma

Średni

Femp

Ftab

stopni

kwadratów

kwadrat

swobody

odchyleń

odchyleń

DF

SKO

ŚKO

0,05

0,01

Ogólna

N-1

So

Międzygrupowa

k-1

S

2

m

Sm

Femp

Wewnątrzgrupowa

N-k

S

2

w

Sw

Obliczoną wartość statystyki F (tzw. F empiryczne - Femp.) odnosimy do wartości krytycznej z rozkładu F-Snedecora dla założonego poziomu istotności (α) i określonej liczby stopni swobody (ν1=k-1 oraz ν2=N-k) (F tabelaryczne - Ftab.). Jeżeli Femp. ≥ Ftab. - to mamy podstawę do odrzucenie hipotezy zerowej i stwierdzenia, iż istnieje co najmniej jedna para średnich, które różnią się ze sobą. Zatem czynnik doświadczalny wpływa statystycznie na cechę. W przeciwnym przypadku, nie mamy podstaw do odrzucenia H0.

Autor: Dariusz Piwczyński

2

2008-05-09 11:23

Wynik analizy wariancji jednoczynnikowej w SAS

Zmienna zależna: nGat

Źródło

St.

Suma

Średnia

Wartość

Pr > F

sw.

kwadratów

kwadratów

F

Model

6

3729.08593

621.51432

42.95

<.0001

Błąd

990

14327.22500

14.47194

Razem

996

18056.31093

skorygowane

R-kwadrat Wsp. war. Pierwiastek MSE Średnia nGat 0.206525

26.69850

3.804201

14.24875

Źródło St. sw. Type III Suma kw. Średnia kwadratów Wartość F

Pr > F

Zaklad 6

3729.085933

621.514322

42.95

<.0001

Autor: Dariusz Piwczyński

3

Document Outline

  • Kolejność obliczeń (Analiza wariancji prosta)