Metodologia ze statystyką:
kurs podstawowy
wyklad 6
Analiza wariancji z powtarzanymi
pomiarami: dwie odmiany
Multivariate solution (Testy
wielu zmiennych)
Univariate solution (Testy
efektów
wewnątrzobiektowych)
W przypadku gdy zmienna
ma tylko dwa poziomy wyniki
takie same
Analiza wariancji z powtarzanymi
pomiarami: Multivariate solution
(Testy
wielu zmiennych)
Najczęściej używany testy to Lambda
Wilksa i Ślad Pillai
Analiza wariancji z powtarzanymi
pomiarami: Univariate solution (Testy
efektów wewnątrzobiektowych)
Sferyczność założona-najmniej
konserwatywny test istotności, można
używać tylko jeśli test sferyczności jest
nieistotny
The Huynh-Feldt - najmniej konserwatywny
test istotności jeśli nie można utrzymać
założenia o sferyczności
The Greenhouse-Geisser - bardziej
konserwatywny test istotności
The lower-bound - najbardziej
konserwatywny test istotności
Analiza wariancji z powtarzanymi
pomiarami: Którego testu użyć?
Jeśli żadna zmienna nie występuje na
więcej niż dwóch poziomach to wyniki są
identyczne
Jeśli wyniki nie są identyczne to nie ma
reguł ale....
Trzeba zwracać uwagę na istotność testu
sferyczności: jeśli test ten jest istotny to
nie można użyć univariate solution z
założeniem sferyczności
Trzeba zachować konsekwencję w wyborze
testu (nie można przerzucać się od
jednego testu do drugiego, chyba że
uzasadnione jest to wynikami testu
sferyczności)
Nietypowe zastosowania testu
Chi - kwadrat
Może być używany zamiast testu Studenta dla
prób niezależnych (np. dzielimy badanych na 4
grupy w zależności od manipulacji
eksperymentalnej i od uzyskania w zmiennej
zależnej wyniku powyżej lub poniżej mediany)
Może być używany zamiast współczynnika
korelacji Pearsona (np. dzielimy badanych na 4
grupy w zależności od uzyskania wyników
powyżej lub poniżej mediany w każdej z dwóch
mierzonych zmiennych)
Zaletą takich zastosowań jest prostota, wadą jest
mniejsza moc testu (większe
prawdopodobieństwo błędu drugiego rodzaju)
Chi - kwadrat:
Informacje dodatkowe
Jest tzw. testem nieparametrycznym,
nie opiera się na założeniu o
normalności rozkładu
Może być używany do tabel
większych niż 2 x 2 (więcej niż dwa
poziomy zmiennej lub / i więcej niż
dwie zmienne)
Dane w poszczególnych kratkach
tabeli muszą być od siebie
niezależne!
Niektóre inne testy
nieparametryczne
Test U Manna-Whitney’a – podobny do
testu t Studenta dla prób niezależnych ale
zmienna zależna ma postać rang
Test Wilcoxona oraz test znaków - podobne
do testu t Studenta dla prób zależnych ale
zmienna zależna ma postać rang
Współczynnik korelacji rang Spearmana –
podobny do współczynnika korelacji
Pearsona ale obie zmienne mają postać
rang
W przeciwieństwie do testu Chi – kwadrat,
inne testy nieparametryczne są obecnie
stosunkowo rzadko używane
Testy nieparametryczne są z reguły
prostsze w użyciu
Mają zwykle niższą moc niż odpowiednie
testy parametryczne
Gdy odstępstwa od założeń testów
parametrycznych są bardzo znaczne,
testy nieparametryczne mogą mieć
wyższą moc niż odpowiednie testy
parametryczne
Czynniki zakłócające trafność
wewnętrzna
8 rzeczy, które trzeba
sprawdzić zanim uzna się,
że zależność ma charakter
przyczynowy
Osiem czynników
zakłócających trafność
wewnętrzną
Historia
Dojrzewanie
Testowanie
Instrumentarium
Regresja
Selekcja
Ubytek osob
badanych
Interakcja
selekcji i innych
czynnikow
Historia:
Zmiany zachodzące pod wpływem
czynników zewnętrznych innych niż
zmienna niezależna.
Przykład: Uzyskanie lepszej pracy po
studiach (w porównaniu z pracą,
którą można było uzyskać zaraz po
maturze) może być spowodowane
polepszeniem się rynku pracy
26 grudnia, Rudolph nie przejmuje się już kolorem
swego nosa!
Dojrzewanie:
Zmiany zachodzące pod wpływem
czynników wewnątrzosobniczych
innych niż zmienna niezależna
(zmęczenie, choroba, rozwój
fizyczny)
Przykład: Uzyskanie lepszej pracy po
studiach (w porównaniu z pracą,
którą można było uzyskać zaraz po
maturze) może być spowodowane
większą dojrzałością psychologiczna,
która przychodzi z wiekiem
Dojrzewanie: brzydkie kaczątko przeistoczyło się w łabędzia
Testowanie:
Sam akt bycia testowanym wywołuje zmiany w
osobach badanych. Zmiany te mogą się ujawnić
przy ponownym testowaniu (np, pomiar postaw
może wpłynąć na zmianę postaw, pomiar
wiadomości może sprzyjać zdobyciu nowych
wiadomości)
Powtórne przystąpienie do testu wiadomości,
może prowadzić do uzyskania wyższych wyników
z powodu lepszego obeznania się z naturą tych
testów.
Ponowny pomiar agresji może prowadzić do
uzyskania wyższych wyników z powodu oswojenia
się z sytuacją badania
Instrumentarium:
Instrument pomiarowy ulega zmianom w
toku badania i zmiany te powodują zmianę
w wynikach uzyskiwanych przez osoby
badane.
Uzyskanie lepszego wyniku przy
powtórnym przystąpieniu do egzaminu
ponieważ egzamin jest teraz łatwiejszy
Osoby oceniające wyniki egzaminu z
pytaniami otwartymi mogą stać się
bardziej lub mniej wymagające wraz z
upływem czasu.
Regresja:
Osoby, które uzyskały ekstremalne
wyniki za pierwszym razem, przez
przypadek (na skutek błędu
losowego) uzyskają prawdopodobnie
mniej ekstremalne wyniki za drugim
razem.
Przykłady regresji
Jeśli trener zarządzi przerwę w meczu w momencie gdy jego
drużyna przegrywa 0:20, po przerwie sytuacja prawdopodobnie
Trochę się poprawi
Osoby, które uzyskały bardzo wysokie lub bardzo niskie wyniki
podczas pierwszego egzaminu, w drugim egzaminie uzyskają
prawdopodobnie wyniki nieco bliższe średniej grupowej .
Selekcja:
Grupy różniły się od siebie już na
początku badania.
Prześwietlanie powoduje łamanie kości! Mogiły zabijają!
Palacze vs. niepalący
Palacze jedzą więcej białego
pieczywa.
Palacze używają więcej cukru.
Palacze jedzą więcej mięsa.
Palacze piją więcej tłustego mleka.
Palacze jedzą mniej warzyw i
owoców.
To tylko niektóre spośród różnic
między palącymi a niepalącymi
Ubytek osob badanych
(smiertelnosc)
Średnie wyniki ulegają zmianie gdyż
część badanych odpada i zmienia się
skład grupy.
Interakcja selekcji i
dojrzewania:
Grupy, które na początku badania są
do siebie podobne (ale nie
identyczne) mogą w sposób
naturalny oddalać się od siebie wraz
z upływem czasu.
Przykład: Wśród czwartoklasistów
chłopcy i dziewczynki mogą nie
różnić sie siłą fizyczną ale po kilku
latach różnice będą już znaczne.
Interakcja selekcji i innych
czynnikow:
Selekcja moze tez wchodzic w
interakcje z innymi czynnikami np: z
historia (lokalna historia), z regresja
(uprzednio omawiane badania nad
Head Start), z testowaniem, ze
smiertelnoscia, itd.
Problemy trafnosci, ktorych nie
eliminuja nawet eksperymenty
Poza 8 rodzajami problemow trafnosci,
ktore sa (w zasadzie) eliminowane w
schematach eksperymentalnych i moga
byc eliminowane w badaniach quasi-
eksperymentalnych istnieja tez czynniki
zaklocajace trafnosc, ktore moga pojawic
sie w kazdym badaniu
Efekty zwiazane z wymienianiem
informacji miedzy osobami badanymi
Efekty zwiazane z oczekiwaniami
Efekty zwiazane z wymienianiem
informacji miedzy osobami
badanymi
Niezadowolenie osob, ktore otrzymaly
mniej zadawalajace oddzialywanie
Rywalizacja miedzy grupami
otrzymujacymi rozne oddzialywania
Rozproszenie oddzialywan miedzy
grupami
Efekty zwiazane z
oczekiwaniami
Efekt badacza
Badany postepuje zgodnie z oczekiwaniami
badacza (moze to prowadzic do efektu
placebo)
Badany postepuje wbrew oczekiwaniom
badacza(reaktancja)
Badacz popelnia pomylki i interpretuje dane
zgodnie z wlasnymi oczekiwaniami
Efekt placebo
Badania Greenwalda nad skutecznoscia
oddzialywan podprogowych
Efekt Hawthorne’a
Quasi-eksperymentalne
schematy badawcze
“Quasi”-znaczy “niby”
Quasi-experymenty to badania
nieeksperymentalne, ktore
wprowadzaja jakas forme
zabezpieczen przeciwko czynnikom
zaklocajacym trafnosc wewnetrzna
Kiedy prowadzi sie badania
quasi-eksperymentalne
gdy eksperyment bylby niemozliwy
do przeprowadzenia ze wzgledow
praktycznych lub etycznych
Gdy zalezy nam na wyzszej trafnosci
konstruktow lub/i wyzszej trafnosci
zewnetrznej niz to by bylo do
uzyskania w prawdziwym
eksperymencie
Jednogrupowe badanie z
pretestem i posttestem
O
1
x O
2
O
1
-pomiar poczatkowy
O
2
-pomiar koncowy
x-oddzialywanie bedace
przedmiotem zainteresowania
badacza
Pytanie: Czy x wplywa na O?
Jednogrupowe badanie z pretestem i
posttestem (O
1
x O
2
)
Przyklad 1: Pomiar poziomu depresji
u tych samych pacjentow przed i po
poddaniu ich psychoterapii
Przyklad 2: Pomiar produktywnosci
pracownikow przed i po szkoleniu
kierownikow
Badanie jednogropowe z
pretestem i posttestem
Historia?
problem
Dojrzewanie
problem
Testowanie?
problem
Instrumentacja?
problem
Regresja?
Problem
Śmiertelność?
problem
Selekcja?
ok
Interakcje z selekcja
ok
Badanie z niezrownowazona
grupa kontrolna z pretestem i
posttestem
G1: (O
1
x O
2
)
G2: (O
1
x
O
2
)
Grupy G1 i G2 niezrownowazone (brak
losowego doboru do grup)
Badanie z niezrownowazona
grupa kontrolna z pretestem i
posttestem
Przyklad
Firma A: Pomiar produktywnosci
pracownikow przed i po szkoleniu
kierownikow
Firma B: Dwukrotny pomiar
produktywnosci ale bez szkolenia
kierownikow.
Problem: interakcje z selekcją (np selekcja
x testowanie)
Konieczność dwukrotnego użycia tego
samego narzedzia może prowadzić do
odgadniecia celu badania (szczególnie w
grupie eksperymentalnej)
Badanie z niezrownowazona grupa
kontrolna z pretestem i posttestem
przy uzyciu roznych metod
G1: (O
A1
x O
B2
)
G2: (O
A1
O
B2
)
Grupy G1 i G2 niezrownowazone (brak
losowego doboru do grup)
Narzedzia pomiarowe A i B podobne ale
nie identyczne
Badanie z niezrownowazona grupa
kontrolna z pretestem i posttestem
przy uzyciu roznych metod
Przyklad: Firma biznesowa oferuje swoim
pracownikom roczny kurs umiejetnosci
kierowniczych. Niektorzy pracownicy zapisuja sie i
koncza kurs (G1) inni nie zapisuja sie lub nie
koncza (G2). Po roku wszyscy pracownicy
testowani sa testem zdolnosci kierowniczych.
Grupa G1 uzyskuje istotnie wyzsze wyniki. W celu
sprawdzenia wyjsciowego podobienstwa grup
badacze porownuja obie grupy pod wzgledem
wysokosci ocen zdolnosci kierowniczych, ktore
znajduja sie w ich aktach personalnych. Okazuje
sie, ze oceny te koreluja z wynikami testu
zdolnosci kierowniczych ale nie roznicuja grup.
Problem selekcji oraz interakcji selekcji i
testowania (czesciowo) rozwiazany
Badanie z niezrownowazona
grupa kontrolna z wiecej niz
jednym pretestem
G1: (O
1
O
2
x
O
3
)
G2: (O
1
O
2
O
3
)
Rozwiazuje problem interakcji miedzy
selekcja a dojrzewaniem, selekcja a
testowaniem oraz (w mniejszym stopniu)
selekcja a instrumentacja
Przerywane szeregi czasowe
G1: (O
1
O
2
O
3
O
4
x
O
5
O
6
O
7
O
8
)
Przerywane szeregi czasowe
G1: (O
1
O
2
O
3
O
4
x
O
5
O
6
O
7
O
8
)
Historia?
problem !
Dojrzewanie
ok
Testowanie?
ok
Instrumentacja?
ok
Regresja?
ok
Śmiertelność?
ok
Selekcja?
ok
Interakcje z selekcja
ok
Przerywane szeregi czasowe z
nierownowazna grupa
kontrolna
G1: (O
1
O
2
O
3
O
4
x
O
5
O
6
O
7
O
8
)
G2: (O
1
O
2
O
3
O
4
O
5
O
6
O
7
O
8
)
Rozwiazuje problem historii ALE……
Pozostaje mozliwosc interakcji
selekcji i historii
Dwa dodatkowe przyklady
schematow (analiz)
quasieksperymentalnych
Schemat nieciągłości regresji
Korelacje z opóżnieniem
Schemat nieciągłości regresji
(regression-discontinuity
design)
Czy uzyskanie dyplomu z wyróżnieniem
ma związek z przyszłymi zarobkami?
Porównując osoby które otrzymały dyplom
z wyróżnieniem i takie, które nie otrzymały
dyplomu z wyróżnieniem spotykamy się z
problemem selekcji (osoby te różnią się
także pod innymi względami np pod
względem średniej ocen)
Czy związek ten da się sprowadzić do
związku miedzy średnią ocen a przyszłymi
zarobkami?
Problemy etyczne w badaniach
psychologicznych: troche
historii
Milgram, 1965- posłuszenstwo wobec
autorytetu
Zimbardo, 1970 – więzienie Stanford
Rosenhan, 1973 – pseudopacjenci
Powołanie do życia Institutional
Review Boards, 1974
Etyczne aspekty decyzji
dotyczących publikowania i
rozpowszechniania wyników
badań
Psychological Bulletin
© 1998 by the American Psychological Association
July 1998 Vol. 124, No. 1, 22-53
For personal use only--not for distribution.
A Meta-Analytic Examination of Assumed Properties of
Child Sexual Abuse Using College Samples
Bruce Rind
Department of Psychology Temple University
Philip Tromovitch
Graduate School of Education University of Pennsylvania
Robert Bauserman
Department of Psychology University of Michigan
Przykłady badań
publikowanych w New England
Journal of Medicine
Cobb, 1959 - udawane operacje na
naczyniach wieńcowych (8 pacjentów
w grupie eksperymentalnej i 8 w
grupie placebo)
Freed, 2001 - udawane operacje na
mózgu (leczenie choroby Parkinsona:
20 pacjentów w grupie placebo)
Wray, 2002 - udawane operacje
kolana: 90 pacjentów w grupie
placebo
Korelacje z opóżnieniem
czasowym (time-lag
correlations)
KONIEC!