BLOK I
ANOVA jako statystyczna
podstawa prowadzenia eksperymentów w psychologii
ANOVA-A ANOVA-AB
Reguły sumowania
Osoby |
Grupa a1 |
Grupa a2 |
Sumy |
1 |
2 |
4 |
|
2 |
3 |
6 |
|
3 |
1 |
5 |
|
Sumy |
|
|
|
|
Grupa a1 |
Grupa a2 |
Sumy |
1 |
Y11 = 2 |
Y21 = 4 |
Y.1 = 6 |
2 |
Y12 = 3 |
Y22 = 6 |
Y.2 = 9 |
3 |
Y13 = 1 |
Y23 = 5 |
Y.3 = 6 |
Sumy |
Y1. = 6 |
Y2. = 15 |
Y.. = 21 |
Osoby |
a1 |
a2 |
Sumy |
||
|
b1 |
b2 |
b1 |
b2 |
|
1 |
Y111 = 2 |
Y121 = 3 |
Y211 = 1 |
Y221 = 4 |
Y..1 = 10 |
2 |
Y112 = 1 |
Y122 = 2 |
Y212 = 1 |
Y222 = 3 |
Y..2 = 7 |
3 |
Y113 = 2 |
Y123 = 4 |
Y213 = 2 |
Y223 = 4 |
Y..3 = 12 |
Sumy |
Y11. = 5 |
Y12. = 9 |
Y21. = 4 |
Y22. = 11 |
Y... = 29 |
Osoby |
a1 |
a2 |
Sumy |
||
|
b1 |
b2 |
b1 |
b2 |
|
1 |
Y111 = 2 |
Y121 = 3 |
Y211 = 1 |
Y221 = 4 |
Y..1 = 10 |
2 |
Y112 = 1 |
Y122 = 2 |
Y212 = 1 |
Y222 = 3 |
Y..2 = 7 |
3 |
Y113 = 2 |
Y123 = 4 |
Y213 = 2 |
Y223 = 4 |
Y..3 = 12 |
Sumy |
Y11. = 5 |
Y12. = 9 |
Y21. = 4 |
Y22. =11 |
Y... = 29 |
Osoby |
a1 |
a2 |
Sumy |
||
|
b1 |
b2 |
b1 |
b2 |
|
1 |
Y111 = 2 |
Y121 = 3 |
Y211 = 1 |
Y221 = 4 |
Y..1 = 10 |
2 |
Y112 = 1 |
Y122 = 2 |
Y212 = 1 |
Y222 = 3 |
Y..2 = 7 |
3 |
Y113 = 2 |
Y123 = 4 |
Y213 = 2 |
Y223 = 4 |
Y..3 = 12 |
Sumy |
Y11. = 5 |
Y12. = 9 |
Y21. = 4 |
Y22. = 11 |
Y... = 29 |
Osoby |
a1 |
a2 |
Sumy |
||
|
b1 |
b2 |
b1 |
b2 |
|
1 |
Y111 = 2 |
Y121 = 3 |
Y211 = 1 |
Y221 = 4 |
Y..1 = 10 |
2 |
Y112 = 1 |
Y122 = 2 |
Y212 = 1 |
Y222 = 3 |
Y..2 = 7 |
3 |
Y113 = 2 |
Y123 = 4 |
Y213 = 2 |
Y223 = 4 |
Y..3 = 12 |
Sumy |
Y11. = 5 |
Y12. = 9 |
Y21. = 4 |
Y22. = 11 |
Y... = 29 |
Osoby |
a1 |
a2 |
Sumy |
||
|
b1 |
b2 |
b1 |
b2 |
|
1 |
Y111 = 2 |
Y121 = 3 |
Y211 = 1 |
Y221 = 4 |
Y..1 = 10 |
2 |
Y112 = 1 |
Y122 = 2 |
Y212 = 1 |
Y222 = 3 |
Y..2 = 7 |
3 |
Y113 = 2 |
Y123 = 4 |
Y213 = 2 |
Y223 = 4 |
Y..3 = 12 |
Sumy |
Y11. = 5 |
Y12. = 9 |
Y21. = 4 |
Y22. = 11 |
Y... = 29 |
ANOVA - A
Tabela wyników w eksperymencie jednoczynnikowym (A): p = 3; n = 3; n1 + n2 + n3 = 9
Osoby |
A |
||
|
a1 |
a2 |
a3 |
1 |
5 |
3 |
9 |
2 |
6 |
2 |
8 |
3 |
4 |
1 |
7 |
Y.. |
15 |
6 |
24 |
Yi. |
5 |
2 |
8 |
Y.. = 45; Y.. = 5
Sumaryczna tabela ANOVA dla planu jednoczynnikowego (A): n = 3, p = 3
źródło zmienności (wariancji) |
SS |
df |
MS |
F |
F0,05 |
F0,01 |
MIĘDZY (A) |
54 |
2 |
27 |
27∗∗ |
5,14 |
10,9 |
WEWNĄTRZ (błąd eksperyment.) |
6 |
6 |
1 |
|
|
|
CAŁA |
60 |
8 |
|
|
|
|
∗ p < 0,05 ∗∗ p < 0,01
Wewnątrzgrupowa liczba stopni swobody (dfwewnątrz):
Grupa 1: df1 = n - 1, dla: Y1k - Y1. , k = 1,...,n
..........................................................................
Grupa p: df1 = n - 1, dla: Ypk - Yp. , k = 1,...,n
_____________________________________
Dla p grup: df = p(n - 1), czyli:
dfwewnątrz = p(n - 1)
Średnia ogólna (Y..) jest średnią z p średnich grupowych (Yi.). Obliczając sumę p odchyleń średnich grupowych od średniej ogólnej (sumy międzygrupowej) dysponujemy następującą międzygrupową liczbą stopni swobody:
dfmiędzy = p - 1
Obliczamy odchylenia każdego wyniku (Yik) od średniej ogólnej (Y..), a więc: Yik - Y.. W każdej grupie porównawczej mieliśmy n - 1 stopni swobody. W całej próbie złożonej z p grup, po n osób mamy: pn - 1 = N - 1 całkowitą liczbę stopni swobody:
dfcała = pn - 1
Stopnie swobody są addytywne !!!:
pn - 1 = (p - 1) + p(n - 1) = p - 1 + pn - p = pn - 1
Przykład: p = 3, n = 3. Zatem:
dfcała = dfmiędzy + dfwewnątrz
(3)(3) - 1 = 3 - 1 + 3(3 - 1)
8 = 2 + 6
|
Cała SScała |
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
Między osobami SSmiędzy |
|
|
|
Wewnątrz osób SSwewnątrz |
||
|
|
|
|
|
||
|
|
|
|
|
||
|
|
|
|
|
Sumy kwadratów
Sumy kwadratów są addytywne
|
Całkowita liczba stopni swobody pn - 1 |
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
Między p - 1 |
|
|
|
Wewnątrz p(n - 1) |
||
|
|
|
|
|
||
|
|
|
|
|
||
|
|
|
|
|
Stopnie swobody
Stopnie swobody są addytywne
Podział całkowitej sumy kwadratów (SS) i całkowitej liczby stopni swobody (df)
w planie jednoczynnikowym (A)
Wynik takiej, k-tej (k = 1,..., n) osoby przypisanej (losowo!)
do i-tej (i = 1,..., p) grupy składa się z trzech elementów:
średniej ogólnej (Y..), która jest średnią z próby, pobranej losowo z populacji o średniej μ
odchylenia średniej z i-tej grupy (Yi.) od średniej ogólnej) (Y..), czyli: Yi. - Y..
Odchylenia wyniku k-tej osoby z i-tej grupy (Yik) od średniej z i-tej grupy (Yi.), czyli: Yik - Yi.
założenia:
Y.. jest oszacowaniem średniej populacyjnej μ
Yi. - Y.. = yi. jest oszacowaniem odchylenia w populacji: μi - μ = αi - efekt główny i-tego poziomu A
Yik - Yi. = yik jest oszacowaniem parametru εik, zwanego błędem eksperymentalnym
Model strukturalny wyniku Yik:
Yik = μ + αi + εi
= Y.. μ
= Yi. - Y.. α
= Yik - Yi. ε
Na poziomie próby model strukturalny wyniku Yik:
Yik = Y.. + (Yi. - Y..) + (Yik - Yi.)
transformacja
Transformacja pierwiastkowa - tę już wyżej objaśniliśmy. Kiedy się nią posłużyć? Jedna tylko uwaga techniczna, gdy w zbiorze danych występują wyniki mniejsze od 10, to wówczas posłużymy się nieco zmodyfikowanym wzorem:
Y'k =
. Stosujemy ją, gdy rozkład Y jest rozkładem Poissona, jaki ma np. liczba błędów popełnianych przez osoby badane w trakcie rozwiązywania jakiegoś zadania. Stosujemy je także wtedy, gdy wariancje w grupach porównawczych są proporcjonalne do średnich grupowych - gdy między s2i i Yi zachodzi, rzecz jasna, że w przybliżeniu, zależność liniowa.
Transformacja logarytmiczna:
Y'k = log Yk , a gdy wśród danych występują wyniki zerowe lub bardzo małe, to: Y'k = log (Yk + 1). Jest ona szczególnie przydatna, gdy wynikami są czasy reakcji (dość chętnie przez psychologów mierzone) i gdy ich rozkład jest wyraźnie dodatnio skośny. Posłużymy się nią, gdy wariancje są proporcjonalne do kwadratów średnich grupowych.
Transformacja ilorazowa:
Y'k = 1/Y'k , a gdy wśród danych występują wyniki zerowe, to stosujemy wzór:
Y'k= 1/(Yk + 1).
Znajduje ona zastosowanie, gdy zmienną zależną jest czas reakcji czy czas rozwiązywania problemów. Stosujemy przekształcenie ilorazowe, gdy odchylenia standardowe są proporcjonalne do kwadratów średnich.
D. Transformacja arcsin: Y' = 2arcsin
, gdzie Y wyrażony jest pod postacią proporcji.
W miejsce 0 i 1 wstawiamy, odpowiednio,
„1/4n” i „1 - 1/4n”
(n - liczba obserwacji).
Ta transformacja jest zalecana, gdy wyniki wyrażone są pod postacią proporcji, np. proporcja poprawnych odpowiedzi w jakimś teście.
ANOVA - AB
Sumaryczna tabela ANOVA dla planu dwuczynnikowego (AB): p = 3, n = 3, q = 2
źródło zmienności (wariancji) |
SS |
df |
MS |
F |
F0,05 |
F0,01 |
A |
1,78 |
2 |
0,89 |
0,84 |
3,49 |
5,95 |
B |
5,55 |
1 |
5,55 |
5,24∗ |
4,75 |
9,33 |
AB |
101,78 |
2 |
50,89 |
48,00∗∗ |
3,49 |
5,95 |
WEWNĄTRZ (błąd eksper.) |
12.67 |
12 |
1,06 |
|
|
|
CAŁA |
121,78 |
17 |
|
|
|
|
∗ p < 0,05 ∗∗ p < 0,01
Tabela ANOVA dla prostych efektów głównych: A | bj oraz B | ai - dla danych z eksperymentu dwuczynnikowego AB:
Źródło zmienności |
SS |
df |
MS |
F |
F0,05;df1;df2 |
|
|
|
|
|
|
0,05 |
0,01 |
A | b1 |
48,66 |
2 |
24,33 |
22,95∗∗ |
3,49 |
5,95 |
A | b2 |
54,89 |
2 |
27,44 |
25,58∗∗ |
|
|
B | a1 |
42,67 |
2 |
42,67 |
40,25∗∗ |
4,75 |
9,33 |
B | a2 |
10,67 |
1 |
10,67 |
10,06∗∗ |
|
|
B | a3 |
54 |
1 |
54 |
50,94∗∗ |
|
|
Wewnątrz |
12,67 |
12 |
1,06 |
|
|
|
∗ p < 0,05 ∗∗ p < 0,01
Oszacowaniami:
jest ၠY...
= ၭi.. - ၭ... czyli efektu i-tego poziomu czynnika A jest różnica: ၠYi.. - ၠY...
= ၭ.j. - ၭ... czyli efektu j-tego poziomu czynnika B jest różnica: ၠY.j. - ၠY...
(4)
= ၭij. - ၭ... - ၡi - ၢj =
ၭij. - ၭ... - (ၭi.. - ၭ... ) - (ၭ.j. - ၭ...) =
ၭij. - ၭi.. - ၭ.j. + ၭ...
czyli efektu interakcyjnego i-tego poziomu czynnika A z j-tym poziomem czynnika B jest wyrażenie: Yij. - ၠYi.. - ၠY.j. + ၠY...
(5) ၥijk czyli błędu eksperymentalnego jest różnica: Yijk - ၠYij.
Model ijk-tego wyniku - na poziomie populacji:
Yijk = ၭ + ၡi + ၢj + ၡiၢj + ၥijk
Wynik ijk-tej osoby, na poziomie próby:
Yijk = ၠY... + [(ၠYi.. - ၠY...) + (ၠY.j. - ၠY...) +
(ၠYij. - ၠYi.. - ၠY.j. + ၠY...) + (Yijk - ၠYij.)]
Odchylenie pojedynczego wyniku od średniej ogólnej:
Yijk - ၠY... = [(ၠYi.. - ၠY...) + (ၠY.j. - ၠY...) +
(ၠYij. - ၠYi.. - ၠY.j. + ၠY...) + (Yijk - ၠYij.)]
Podnosząc obie strony równania do kwadratu:
SScała = SSA + SSB + SSAB + SSbłąd
SScała =
SSA =
SSB =
SSAB =
SSbłąd =
Procentowo
wyrażone wielkości
wariancji cząstkowej wyjaśnionej
wpływem na Y
czynników: A i B oraz interakcji AB
Przykład I - ANOVA-A
Wariancja wyjaśniona Y równa się:
ω2A =
100% =
= 85,25%
Wariancja błędu Y (błędu) równa się:
100% - 85,25% = 14,75% Przykład II - ANOVA-AB
ω2A =
100% =
=
-0,0028 ≈ 0%
ω2B =
100% =
= 3,65%
ω2AB =
100% =
= 81,13%
Wariancja wyjaśniona Y: 0% + 3,65% + 81,13% = 84,78%
Wariancja błędu Y: 100% - 84,78% = 15,22%
Literatura
Brzeziński, J. (2008). Badania eksperymentalne w psychologii i pedagogice (wyd. 2). Warszawa: Wydawnictwo Naukowe Scholar.
Jerzy Brzeziński SWPS-Wrocław - metodologia - kurs zaawansowany; BLOK I - 2008
2
Badanie empiryczne
kontekst
teorii
Natura zmiennych
Postać związku
Y ze zmiennymi niezależnymi: A, B, ...
kontekst
modelu statystycznego
ANOVA
Model ANOVA/MR
Lin. vs. ~lin.
Addytywność
Trafność modelu:
I., II., III.
kontekst modelu
pomiarowego Y
1. Skala pomiarowa Y
2. Model psychometryczny:
A - Gulliksen
B - SEM
C - Estymacja przedziałowa
D - Trafność teoretyczna
kontekst interakcji:
„badacz - OB”
Oczekiwania badacza
Wskazówki (zmienne) sugerujące hipotezę
Lęk przed oceną
Status motywacyjny OB
Etyczność badania
b1
b1
b2
1
2
3
4
5
6
7
8
Yij.
a2
a1
1
2
3
4
5
6
7
8
Yij.
a2
a1
Profil efektów prostych:
A | b1 oraz A | b2 - występowanie interakcji AB
Profile efektów prostych:
A | b1 oraz A | b2 - brak interakcji AB
b2