Elżbieta Wach 14.12.2010 Rzeszów
II CC DI
Statystyka i opracowanie wyników
Ćwiczenie nr 4
SPRAWOZDANIE Z LABORATORIUM NR 4
WNIOSKOWANIE STATYSTYCZNE. JEDNOCZYNNIKOWA ANALIZA WARIANCJI (ANOVA). PROGRAM STATISTICA (STATSOFT).
1. Wstęp teoretyczny
Celem analizy wariancji jest zazwyczaj testowanie istotności różnic pomiędzy średnimi. W przypadku porównywania dwóch średnich ANOVA daje takie same wyniki jak test t- Studenta dla prób niezależnych lub test t- Studenta dla prób zależnych. Nazwa analizy wzięła się stad, ze ocena istotności różnic miedzy średnimi odbywa się przez porównanie wariancji. Najprostsza i zarazem najbardziej popularna jest jednoczynnikowa analiza wariancji , czyli analiza wpływu tylko jednego czynnika na wyniki prowadzonego badania.
Założenia jednoczynnikowej ANOVA:
analizowana zmienna jest mierzalna
każda z k- tych porównywanych populacji ma rozkład normalny
rozkłady te mają jednakową wariancję σ12=σ22=…σk2=σ2
Jednoczynnikowa analiza wariancji weryfikuje hipotezę że średnie w grupach są jednakowe
H0:m1=m2=…=mk, , wobec hipotezy alternatywnej H1:co najmniej dwie średnie różnią się między sobą
Podstawa analizy wariancji jest możliwość rozbicia sumy kwadratów wariancji całkowitej dla wszystkich n wyników obserwacji na dwa składniki:
sumę kwadratów opisującą zależność wewnątrz grup, SK reszta, błąd, której wielkość jest zdeterminowana przez czynniki losowe; wewnętrzna suma kwadratów
sumę kwadratów opisującą zmienność miedzy grupami, SK pomiędzy grupami, której wielkość jest związana z badanym czynnikiem wpływającym na wynik obserwacji; międzygrupowa suma kwadratów
SK całkowita =SK reszta+ SK pomiędzy grupami
Zakładając brak różnic średnich miedzy grupami (tj. hipotezę zerową w analizie wariancji), oczekuje się że wariancja oszacowana w oparciu o zmienność miedzy grupami powinna być w przybliżeniu równa wariancji oszacowanej w oparciu o zmienność wewnątrzgrupową
Jeśli hipoteza zerowa jest prawdziwa tj. wartości średniej nie różnią się istotnie, wówczas ŚK pomiędzy grupami i ŚK reszt powinny się różnic od siebie w granicach losowych odchyleń
Jeśli ŚK pomiędzy grupami rośnie i jest wyższy od ŚK reszt, wówczas można się spodziewać że wartości średniej istotnie się różnią, a więc hipotezę zerowa należy odrzucić. Stwierdza się wówczas że dany czynnik wpływa na zmienną.
Do porównania ŚK pomiędzy grupami i ŚK reszt stosuje się statystykę F o k-1 i n-k stopniach swobody. Statystyka ta jest podstawa wyznaczania obszaru krytycznego dla hipotezy zerowej o równości wszystkich średnich porównywanych grup.
Wartości F bliskie jedności potwierdzają założona hipotezę zerową, a wartości znacznie większe od jeden sugerują jej odrzucenie.
W przypadku gdy test F wykaże , ze średnie z grup różnią się istotnie można przeprowadzić bardziej szczegółowa analizę:
sprawdzającą które konkretnie pary średnich różnią się miedzy sobą oraz
analizę prowadząca do utworzenia tzw. Jednorodnych grup średnich tzn. podział wszystkich średnich na klasy, w ramach których średnie różnią się istotnie
Taka analizę można przeprowadzić stosując różne testy np. Duncana.
2. Wykonanie ćwiczenia
I. Sprawdzić czy dane spełniają założenia ANOVA, sformułować tezę rzeczową i ustalić hipotezy H0i Hα, wybrać test F do weryfikacji hipotez, przyjąć poziom istotności α=0,05, przeprowadzić weryfikację hipotez korzystając z opcji programu Statistica.
Otwieramy pliki ANOVA_fenol_1 oraz ANOVA_fenol_2
Stawiamy hipotezy : H0:dane maja rozkład normalny oraz H1:dane nie mają rozkładu normalnego
Przeprowadzamy test Shapiro- Wilka
Wniosek: nie ma podstaw do odrzucenia hipotezy zerowej że dane maja rozkład normalny
statystyka / ANOVA / jednoczynnikowa ANOVA / ok. / zmienne zależne(pierwsza kolumna-fenol, druga kolumna -laborant) / ok. / kody czynników / wszystko /ok. / średnie wykresy /ok.
ANOVA wyniki / więcej wyników /zakładka: założenia /test Levene'a(ANOVA).
Stawiamy hipotezy: zerową
H0:σ12=σ22 - wariancje wszystkich grup są równe oraz hipotezę alternatywną
H1: σ12≠σ22 - co najmniej dwie wariancje różnią się od siebie
W: nie ma powodów do odrzucenia hipotezy zerowej że wariancje są równe
ANOVA wyniki /podsumowanie /wszystkie efekty
P=0
W: odrzucamy hipotezę zerowa i przyjmujemy hipotezę alternatywną
Przeprowadzamy test Duncana
ANOVA wyniki /Post-hoc / pokaż(jednorodne grupy) /testy dla rozstępów Duncana
Test ten podzielił średnie na dwa zbiory:
Zbiór 1 - dane nie różnią się w sposób istotny (różnice spowodowane czynnikami losowymi)
Zbiór 2 - dane nie różnią się w sposób istotny (różnice spowodowane czynnikami losowymi)
Zbiór 1 i zbiór 2 -dane różnią się w sposób istotny(różnice są spowodowane czynnikami systematycznymi)
Kolejność zmiennych: 1, 2, 3, 4, 6- Zbiór 1
5, 7-Zbiór 2
ANOVA wyniki / pokaż (istotne różnice ) /testy dla rozstępów(test Duncana)
W: Wielkość prawdopodobieństwa jest miara wielkości odchylenia od siebie średnich
H0: średnie od 1-4 i 6 są sobie równe
H1: średnie od 1-4 i 6 nie są sobie równe
ANOVA wyniki /zmień / kody wyników 1-4.6 /ok. / wszystkie efekty
P=0,5
W: nie ma podstaw do odrzucenia hipotezy zerowej że średnie od 1-4 i 6 są sobie równe, różnice spowodowane są czynnikami losowymi.