Tytus Sosnowski
Kurs 004 (2008 / 2009)
METODOLOGIA BADAŃ PSYCHOLOGICZNYCH
Wykład obligatoryjny dla I roku studiów wieczorowych
Wydziału Psychologii UW
PLANOWANIE I ANALIZA BADAŃ EMPIRYCZNYCH
Część E:
badania ex post facto:
porównania międzygrupowe
Badania eksperymentalne
a badania ex-P0st Facto
W badaniach NIEEKSPERYMENTALNYCH (EX-POST FACTO) badacz nie manipuluje zmiennymi ani nie oddziałuje w żaden sposób na badanych (na zmienna zależną) lecz jedynie dokonuje POMIARU zmiennych. Na podstawie analizy statystycznej staramy się ustalić relacje między mierzonymi zmiennymi a niekiedy -zależności przyczynowe. Ponieważ oddziaływania przyczynowe musiały mieć miejsce przed rozpoczęciem badań, mówimy o analizie ex-post facto („po fakcie”).
Zalety badań eksperymentalnych
możliwość celowego wywoływania zjawisk
lepsza kontrola zmiennych
łatwiejsza interpretacji przyczynowa
Ograniczenia badań eksperymentalnych
Nie wszystkie hipotezy dają się badać eksperymentalnie:
* nie wszystkie zmienne są manipulowalne;
* manipulacja może być niemożliwa lub trudna
ze względów technicznych;
* manipulacja może być niedopuszczalna ze względów
etycznych;
Istnieje problem generalizacji wyników badań eksperymentalnych (zwłaszcza laboratoryjnych)
na warunki naturalne.
Porównanie badań eksperymentalnych i ex-post facto
na przykładzie porównań międzygrupowych
Plan eksperymentalny
Grupy zrandomizowane |
Zmienna niezależna manipulowalna |
Zmienna zależna |
Grupa 1 |
X |
Y1 |
Grupa 2 |
|
Y2 |
KONTROLA zmiennych ubocznych. Jeśli porównujemy grupy zrandomizowane (i potrafimy wyeliminować zmienne zakłócające) to możemy przyjąć, że przed manipulacją grupy eksperymentalne nie różnią się między sobą systematycznie* pod względem ŻADNEJ ZMIENNEJ. Jeśli więc stwierdzimy w pomiarze końcowym różnicę między grupami, to nie da się jej wyjaśnić systematycznym wpływem żadnej zmiennej za wyjątkiem zmiennej którą manipulujemy.
Wyjaśnianie PRZYCZYNOWE: jeśli nie było różnicy między grupami na początku badania (randomizacja!)
a pojawiła się w pomiarze końcowym, to przyczyną tej różnicy może być tylko wpływ zmiennej X - przesądza
o tym sam plan badania.
* tzn. wartość oczekiwana każdej zmiennej jest taka sama
dla wszystkich grup; im mniejsze grupy jednak, tym
większe prawdopodobieństwo pojawienia się znacznych
odchyleń średnich grupowych od wartości oczekiwanych.
Plan ex-post facto
Przykład: badamy uprzedzenia etniczne (Y) w grupach różniących się pod względem zmiennej osobowościowej - autorytaryzmu (X).
Grupy kryterialne, dobrane pod względem zmiennej X |
Druga mierzona zmienna: Y |
Grupa 1 (X1) |
Y1 |
Grupa 2 (X2) |
Y2 |
KONTROLA zmiennych ubocznych. Grupy różniące się pod względem zmiennej X mogą się też różnić pod względem innych zmiennych, skorelowanych z X (np. grupy różniące się autorytaryzmem mogą się też różnić pod względem sposobu wychowania, statusu społecznego, poziomu lęku, itp.).
Wyjaśnianie PRZYCZYNOWE. Jeśli nawet istnieje związek statystyczny między X i Y, to ani plan badania ani sposób analizy danych nie przesądza o tym, czy X jest przyczyną Y, czy Y przyczyną X, czy też, być może, istnieje inna zmienna -- Z , która wpływa zarówno na X jak i na Y. Zależność statystyczną która nie jest zależnością przyczynową nazywa się „zależnością pozorną”. Dla interpretacji przyczynowej wyników badań ex-post facto konieczne są dodatkowe przesłanki natury zarówno statystycznej (kontrola ważnych zmiennych ubocznych) jak i merytorycznej.
Zależność pozorna
Zależnością pozorną nazywamy zależność statystyczną, która nie ma charakteru przyczynowego.
Np. stwierdzono zależność statystyczna między liczbą bocianów i liczbą urodzeń (w gminach, w których żyje więcej bocianów rodzi się więcej dzieci). Zależność ta znika gdy uwzględnimy rodzaj gminy (miejska/wiejska): w gminach wiejskich jest więcej dzieci i więcej bocianów niż w gminach miejskich.
liczba bocianów (X)
rodzaj gminy (Z)
liczba urodzeń (Y)
Zależności między Z i X oraz między Z i Y są zależnościami przyczynowymi. Zależność między X i Y jest zależnością pozorną.
Aby wykazać że zależność między zmiennymi X i Y jest pozorna należy znaleźć odpowiednią zmienną kontrolną (Z) której uwzględnienie w analizie eliminuje zależność statystyczną między X i Y (por. przykład na następnych stronach).
Przykład (fikcyjny) zależności pozornej
(dane liczbowe z pracy Jahoda, Deutsch i Cook, 1955)
Mierzymy liczbę dzieci i liczbę bocianów w 480 gminach.
Tabela 1. Dane pierwotne
|
Duża liczba bocianów |
Mała liczba bocianów |
Razem |
Duża liczba dzieci |
110 |
90 |
200 |
Mała liczba dzieci |
90 |
190 |
280 |
Razem |
200 |
280 |
480 |
Analiza danych w tabeli 1 wskazuje na istnienie zależności statystycznej między liczbą dzieci i liczbą bocianów.
Tabela 2. Uwzględnienie zmiennej kontrolnej (charakter gminy)
|
Gmina wiejska |
|
Gmina miejska |
||||
Liczba dzieci |
Duża liczba bocia-nów |
Mała liczba bocia-now |
Razem |
|
Duża liczba bocia-nów |
Mała liczba bocia-nów |
Razem |
Duża |
90 |
30 |
120 |
|
20 |
60 |
80 |
Mała |
30 |
10 |
40 |
|
60 |
180 |
240 |
Razem |
120 |
40 |
160 |
|
80 |
240 |
320 |
Po uwzględnieniu w analizie dodatkowej zmiennej (gmina (miejska / wiejska), czyli zmiennej KONTROLNEJ, stwierdzona wcześniej zależność znika. Jeśli analizujemy dane oddzielnie dla gmin miejskich i oddzielnie dla gmin wiejskich nie stwierdzamy zależności między liczbą bocianów a liczbą dzieci. Stwierdzona wcześnie zależność statystyczna nie jest więc zależnością przyczynową, ale zależnością POZORNĄ
Jeśli nie uda się wykazać że zależność między X i Y jest zależnością pozorną, może to wskazywać że:
* mamy do czynienia z zależnością przyczynową;
* nie uwzględniliśmy w analizie właściwej zmiennej kontrolnej (w momencie zbierania danych musimy wiedzieć jakie zmienne uboczne są ważne dla analizowanego problemu).
Aby wykazać że zależność statystyczna jest rzeczywiście zależnością przyczynową potrzebne są przesłanki merytoryczne (np. wyjaśniające jaki jest mechanizm zaobserwowanej zależności między zmiennymi).
PLANY EX-POST FACTO
1. Porównania międzygrupowe
2. Analiza korelacyjna (i pochodne od niej)
Inne, na przykład:
-- badania podłużne (longitudinal)
-- studium przypadku (case study)
PORÓWNANIA MIĘDZYGRUPOWE
Tworzymy grupy kryterialne w oparciu o jedną zmienną obserwowalną (mierzalną) lub kombinację kilku zmiennych
a następnie porównujemy grupy pod względem innej zmiennej.
W badaniach ex-post facto grupy kryterialne mogą być tworzone zarówno w oparciu o zmienne NIEZALEŻNE jak i zmienne ZALEŻNE. Przykładowo, jeśli interesuje nas wpływ inteligencji na osiągnięcia szkolne uczniów możemy:
stworzyć grupy różniące się poziomem inteligencji i porównać ich osiągnięcia szkolne
stworzyć grupy różniące się osiągnięciami szkolnymi i porównać ich wyniki w teście inteligencji.
O wyborze schematu analizy decyduje często wygoda a nie kierunek zależności. Na przykład, łatwiej jest dobrać grupy uczniów różniących się osiągnięciami szkolnymi i następnie przebadać ich testem inteligencji niż zastosować procedurę odwrotną.
Rodzaje analizy danych
Plan 1. Dwie zmienne nominalne (klasyfikacyjne) - tabela kontyngencji
|
B1 (palą) |
B2 (nie palą) |
Razem |
A1 (kobiety) |
20 |
30 |
50 |
A2 (mężczyźni) |
60 |
10 |
70 |
Razem |
80 |
40 |
120 |
Do oszacowania istotności zależności między zmiennymi w takiej postaci (dane maja postać liczebności grup) możemy użyć test
, a do oceny siły związku między zmiennymi - współczynnik korelacji ϕ (dla tablicy 2 x 2) , lub C wielodzielcze (dla tablicy większej, np. 2 x 3); oba współczynniki korelacji oblicza się na podstawie
.
Plan 2. Jedna zmienna niezależna - nominalna (klasyfikacyjna), druga zmienna - ciągła:
Zmienna 1 (płeć) |
Zmienna 2 |
grupa 1 (kobiety) grupa 2 (mężczyźni) |
|
Test: porównywanie średnich (np. test t-studenta),
lub jakiś test nieparametryczny (np. U Manna-Whitneya)
Plan 3. Jedna zmienna niezależna ciągła, wtórnie
zdychotomizowana, druga zmienna ciągła.
Dzielimy badanych na dwie lub więcej grup na podstawie wartości jednej zmiennej ciągłej (np. mierzonej testem psychometrycznym) a następnie porównujemy utworzone grupy pod względem rozkładu drugiej zmiennej.
Zmienna 1 Zmienna 2 |
Grupa 1 (wyniki testu T1 wyższe od a) |
Grupa 2 (wyniki testu T1 niższe od b) |
Czy dychotomizować zmienne ciągłe czy analizować je w postaci oryginalnej (jako zmienne ciągłe)?
Dychotomizowanie zmiennych ciągłych ma poważne wady:
utrata części informacji - zamieniamy mocniejszą skalę pomiarową (interwałową lub porządkową) na słabszą, (nominalną);
eliminowanie z analizy części próby (analizujemy tylko grupy skrajne a eliminujemy środek rozkładu) .
Za dychotomizacją przemawia tylko jeden argument:
pozwala ona ograniczyć liczbę osób badanych (ważne, jeśli pomiar zmiennej zależnej jest bardzo pracochłonny (np. badania metodą rezonansu magnetycznego grupy ekstrawertyków i introwertyków).
Plan 4. Plany wieloczynnikowe w badaniach ex-post facto.
Załóżmy, że w badaniach ex-post facto mamy dwie lub więcej zmiennych niezależnych (np. płeć i poziom wykształcenia) a zmienna zależna jest zmienną interwałową. Czy możemy użyć analizy wariancji? np. jak niżej
|
B1 |
B2 |
A1 |
A1B1 |
A1B2
|
A2 |
A2B2 |
A2B2
|
- Powodem stosowania ANOVA-y jest to, że pozwala ona analizować interakcję zmiennych niezależnych (jeśli nie ma interakcji, plan n-czynnikowy może być zastąpiony przez n planów jednoczynnikowych).
- Argumentem „przeciw” jest to, że ANOVA opiera się na założeniu, że zmienne niezależne są nieskorelowane (ortogonalne). W badaniach eksperymentalnych założenia to jest spełnione automatycznie (pod warunkiem że grupy są równoliczne). W badaniach nie-eksperymentalnych założenie to rzadko jest spełnione. W związku z tym wyniki analizy statystycznej będą obciążone trudnym do oszacowania błędem.
Jeśli w badaniach nie-eksperymentalnych (zwłaszcza:
ex post facto) analizujemy bezpośredni wpływ kilku zmiennych niezależnych na zmienną zależną, właściwą metodą analizy będzie analiza regresji wielokrotnej (multiple regression analysis). Jeśli analizujemy bardziej skomplikowane zależności między zmiennymi można skorzystać z takich metod jak LISREL czy AMOS.
Zalety analizy regresji
dopuszcza istnienie korelacji między zmiennymi niezależnymi.
daje możliwość jednoczesnego analizowania zmiennych niezależnych kategorialnych i ciągłych oraz interakcji między nimi. Jeśli zmienna kategorialna ma dwie wartości (0 i 1), może być wprost włączona do analizy. Jeśli ma więcej niż dwie wartości musi być w odpowiedni sposób zakodowana (w postaci odpowiednich wektorów).”
jest metodą znacznie prostszą niż AMOS i LISREL
mtd5E (2008 / 2009) - 1