Metody badawcze w naukach społecznych
Chava Frankfort-Nachmias
David Nachmias
(Rozdział 5)
Plany badawcze: eksperymenty
Kim są biali? To pytanie kierowało przeprowadzonymi w 1992 roku badaniami dotyczącymi sposobu klasyfikowania ludzi ze względu na kolor skóry, przeprowadzanymi podczas spisu ludności, który odbył się w Brazylii w 1980 roku. W Brazylii bowiem, inaczej niż w Stanach Zjednoczonych, gdzie pojęcie rasy jest definiowane poprzez pochodzenie, ludzie określają własną rasę, biorąc pod uwagę kombinację cech fizycznych i społeczno-ekonomicznych. Dlatego też dzieci mogą zostać sklasyfikowane inaczej niż ich rodzice czy rodzeństwo. Zdaniem osób prowadzących to badanie czterokategorialne pytanie z wymuszonym wyborem dotyczące koloru skóry, które zostało zastosowane w brazylijskim spisie ludności, zawierało niejasny termin określający kategorię mieszaną, czyli ludzi o „brązowym" kolorze skóry. Ich zdaniem wykorzystanie tej kategorii sprawiło, że ludzie odrzucali opcję mieszaną i identyfikowali się albo jako biali, albo jako czarni, zwiększając tym samym liczbę osób w tych kategoriach (kategoria czwarta, tj. żółty kolor skóry rzadko była wykorzystywana). Badacze założyli, że gdyby ten niejasny termin został zastąpiony terminem powszechniej używanym, to więcej osób widziałoby siebie jako ludzi o mieszanym kolorze skóry i dzięki temu zmniejszyłaby się liczba osób określających siebie jako białych lub czarnych. Lepiej by to również obrazowało, jak ludzie klasyfikowaliby siebie wtedy, kiedy pytanie dotyczące koloru skóry byłoby pytaniem otwartym. Aby to sprawdzić, przebadano próbę osób wylosowanych z populacji, wykorzystując plan z pomiarem początkowym i pomiarem końcowym. Otrzymane wyniki przemawiały na rzecz przyjętej hipotezy. Dlatego też - zdaniem badaczy - dokonywanie porównań doświadczeń życiowych czarnych i białych Brazylijczyków na podstawie danych ze spisu ludności z 1980 roku jest nieuprawnione, albowiem zarówno w kategorii „biali", jak i „czarni" znaleźli się ludzie o mieszanym kolorze skóry. Z tego powodu również badacze, którzy w swoich badaniach wykorzystali dane ze spisu ludności, powinni - aby określić trafność wyprowadzanych przez siebie wniosków - przeanalizować zarówno zastosowany plan badawczy, jak i sposób wykorzystania danych dotyczących klasyfikowania ludzi ze względu na kolor skóry. Rozdział ten jest poświęcony problematyce planów eksperymentalnych, sposobom wykorzystywania wyników badań eksperymentalnych oraz zagadnieniu ich trafności.
W rozdziale tym omawiamy zagadnienia dotyczące planu badawczego traktowanego jako logiczny model wnioskowania przyczynowo-skutkowego oraz przedstawiamy różne rodzaje planów badawczych. W pierwszej części prezentujemy przykład zastosowania konkretnego planu eksperymentalnego. W części drugiej omawiamy strukturę planów eksperymentalnych. Następnie analizujemy cztery cechy charakteryzujące plan badawczy, tj. porównywanie, manipulowanie, kontrolowanie i uogólnianie. Na koniec przedstawiamy wybrane, powszechnie stosowane plany eksperymentalne.
Kiedy ustalimy już cel naszych badań, określimy hipotezy i zdefiniujemy zmienne, stajemy wobec problemu opracowania takiego planu badawczego, który pozwoli na przetestowanie interesującej nas hipotezy. Plan badawczy, mówiąc najprościej, to program, zgodnie z którym badacz zbiera, analizuje oraz interpretuje wyniki. Jest to logiczny model wnioskowania pozwalający badaczowi na wyprowadzanie wniosków dotyczących relacji przyczynowo-skutkowych pomiędzy badanymi zmiennymi. Plan badawczy określa również zakres uogólniania wniosków, tj. określa, czy uzyskane wyniki można uogólnić na większą populację albo na inne warunki badania.
■ Plan badawczy: przykład
Każdy badacz zamierzający przetestować hipotezę badawczą staje wobec podstawowych problemów wymagających rozwiązania, zanim będzie można rozpocząć właściwe badanie: Kogo należy badać? Co powinniśmy obserwować? Kiedy należy dokonać obserwacji? W jaki sposób należy zbierać dane? Plan badawczy to rodzaj „projektu" kierujący badaczem na różnych etapach badania i pomagający mu rozwiązać te właśnie problemy.
Naszym celem jest opisanie procesów uruchamianych w trakcie projektowania badania i przedstawienie, w jaki sposób konkretne plany badawcze wykorzystywane przez badacza pomagają mu ustrukturować proces zbierania, analizowania i interpretowania danych. Zaprezentujemy też badanie wykorzystujące plan eksperymentalny, przedstawione w pracy Roberta Rosenthala i Lenory Jacobson Pygmalion in the Classroom. Badanie to było próbą sprawdzenia efektu, jaki wywierają oczekiwania innych na zachowanie danej osoby. Podstawowa koncepcja tych badań opierała się na założeniu, że czyjeś oczekiwania wobec zachowania innej osoby mogą działać jako samospełniające się proroctwo. Pomysł ten nie jest nowy i można wskazać na wiele zarówno anegdotycznych opowieści, jak i teorii, które za nim przemawiają. Najbardziej znanym przykładem jest sztuka George'a Bernarda Showa Pigmalion, przerobiona następnie na musical My Fair Lady. Używając słów samego Shawa:
Widzi pan, mówiąc szczerze, poza tym wszystkim, czego każdy może się nauczyć - jak się ubierać, poprawnie mówić i tak dalej - różnica między damą a kwiaciarką nie polega na tym, jak się zachowują, tylko, jak są traktowane. Dla profesora Higginsa pozostanę kwiaciarką, bo tak mnie traktuje i zawsze będzie traktował. Ale wiem, że dla pana mogę być damą, bo pan mnie traktował jak damę i zawsze będzie się tak do mnie odnosił.
Obserwacja Shawa została potwierdzona przez liczne badania nad zwierzętami. Okazało się, że jeżeli eksperymentatorzy wierzyli, iż badane przez nich zwierzęta są genetycznie gorsze, to zwierzęta te zachowywały się gorzej. Kiedy natomiast sądzono, że zwierzęta są genetycznie lepsze, to osiągały one zdecydowanie lepsze wyniki. W rzeczywistości zaś pomiędzy dwiema grupami zwierząt nie było żadnych różnic genetycznych.
Zdaniem Rosenthala i Jacobson można przyjąć, że to samo, co stwierdzono o badanych zwierzętach, da się również stwierdzić w odniesieniu do dzieci w szkole. I tak jak zwierzęta, o których sądzono, że są lepsze, okazały się lepsze ze względu na oczekiwania swoich opiekunów, tak też dzieci, o których nauczyciele sądzą, że są mądrzejsze, okażą się rzeczywiście mądrzejsze właśnie z powodu oczekiwań nauczycieli.
Aby sprawdzić te hipotezę, badacze wybrali jedną szkołę - Oak School -jako laboratorium, w którym przeprowadzony został eksperyment. Oak to państwowa szkoła podstawowa mieszcząca się w dzielnicy zamieszkanej przez niższe klasy społeczne. Na poziomie teoretycznym oczekiwano, że badanie ujawni efekt oddziaływania pozytywnych lub negatywnych oczekiwań nauczycieli na intelektualną sprawność ich uczniów. Ze względu na problemy natury etycznej przetestowano jednak tylko hipotezę mówiącą o tym, że pozytywne oczekiwania nauczycieli zwiększą sprawność intelektualną.
Zmienną niezależną w tym badaniu były oczekiwania nauczycieli. Oczekiwaniami tymi manipulowano, odwołując się do wyników rzekomego standardowego, bezsłownego testu inteligencji. Nauczycielom przedstawiono ten test jako metodę pozwalającą przewidzieć intelektualny „rozwój" ucznia. Na początku roku szkolnego, po wstępnym przebadaniu wszystkich uczniów, przedstawiono nauczycielom nazwiska dzieci z ich klasy, które znalazły się pośród 20% uczniów mających szansę rozwinąć się intelektualnie w trakcie najbliższego roku szkolnego. Prognozy te zostały sformułowane na podstawie wyników domniemanego testu na „rozwój intelektualny". W rzeczywistości nazwiska tych dzieci zostały wybrane w sposób losowy. W efekcie różnica między dziećmi mającymi szansę rozwoju intelektualnego a ich rówieśnikami pojawiła się jedynie w umysłach nauczycieli.
Zmienną zależną były tu zdolności intelektualne dzieci. Mierzono je za pomocy standardowego testu inteligencji, który rzekomo miał pozwolić na ocenę rozwoju intelektualnego. Wszystkie dzieci chodzące do Oak School zostały ponownie przebadane .po zakończeniu roku szkolnego. Rosenthal i Jacobson obliczyli różnicę ilorazu inteligencji (IQ) pomiędzy pierwszym i drugim testowaniem zarówno dla tych dzieci, które miały się rozwinąć intelektualnie, jak i dla pozostałych dzieci. Badacze zdefiniowali korzyści wynikające z pozytywnych oczekiwań nauczycieli jako stopień, w jakim wzrost IQ u dzieci „specjalnych" przewyższył wzrost IQ u reszty dzieci. Po roku prowadzenia eksperymentu zanotowano istotny wzrost IQ u dzieci, które miały się rozwinąć intelektualnie, i to zwłaszcza wśród uczniów klasy pierwszej i drugiej.
Interpretując wyniki eksperymentu, Rosenthal i Jacobson stwierdzili, że pozytywne oczekiwania nauczycieli w stosunku do dzieci mających rozwinąć się intelektualnie wpłynęły na istotny wzrost ich IQ. Podsumowując wyniki, wyjaśniali oni to, co się stało:
Możemy powiedzieć, że za pomocą tego, co powiedziała i jak to powiedziała. za pomocą wyrazu twarzy, postawy ciała i być może za pomocą dotyku nauczycielka mogła komunikować dzieciom z grupy eksperymentalnej, że oczekuje od nich poprawy funkcjonowania intelektualnego. Te komunikaty oraz ewentualne zmiany technik nauczania mogły pomagać dziecku w trakcie nauki, zmieniając jego poczucie własnej wartości, jego oczekiwania dotyczące własnego zachowania, jego motywację oraz jego styl poznawczy i umiejętności.
Dalej przedstawimy najpierw podstawowe terminy wykorzystywane przy omawianiu planów badań eksperymentalnych, a następnie na podstawie eksperymentu Pigmaliona przedyskutujemy strukturę klasycznego badania eksperymentalnego, wskazując na podstawowe cechy takiego badania. Na koniec przedstawimy klasyczny plan eksperymentalny jako model, z którym można porównywać inne plany badawcze.
■ Klasyczny plan eksperymentalny
Klasyczny plan eksperymentalny składa się z dwóch, porównywanych ze sobą grup: grupy eksperymentalnej i grupy kontrolnej. Grupy te są takie same z jednym wyjątkiem - otóż grupa eksperymentalna poddawana jest działaniu zmiennej niezależnej, a grupa kontrolna nie. Przyporządkowanie osób badanych czy to do grupy eksperymentalnej, czy do grupy kontrolnej oparte jest na doborze losowym. Aby oszacować wpływ zmiennej niezależnej, badacze dwukrotnie dokonują pomiarów zmiennej zależnej (traktowanych jako wyniki) w każdej grupie. Pierwszy pomiar, pomiar początkowy, przeprowadzany jest dla wszystkich osób badanych przed wprowadzeniem zmiennej niezależnej w grupie eksperymentalnej; drugi pomiar, pomiar końcowy, przeprowadzany jest dla wszystkich osób badanych po zadziałaniu zmiennej niezależnej w grupie eksperymentalnej. Następnie dokonuje się porównania wielkości różnicy miar między pomiarem początkowym i pomiarem końcowym. Jeżeli różnica jest istotnie wyższa w grupie eksperymentalnej w porównaniu z grupą kontrolną, to można wyciągnąć wniosek, że zmienna niezależna jest przyczynowo powiązana ze zmienną zależną.
Struktura klasycznego planu eksperymentalnego
Klasyczny plan jest często przedstawiany w postaci tabeli jak tabela 5.1, w której X oznacza zmienną niezależną; O1, O2, O3 i O4 oznaczają pomiary zmiennej zależnej; R to losowe przyporządkowanie osób do grupy eksperymentalnej i grupy kontrolnej, a de i dc oznaczają różnicę pomiędzy pomiarem początkowym i pomiarem końcowym w każdej grupie.
Aby zilustrować strukturę i zastosowanie klasycznego planu eksperymentalnego w badaniach społecznych, przeanalizujmy ponownie badanie nad samospełnia-jącym się proroctwem przeprowadzone przez Rosenthala i Jacobson. W eksperymencie brały udział wszystkie dzieci z Oak School. Te, które badacze określili jako mające szansę na rozwój intelektualny, stanowiły grupę eksperymentalną. Pozostałe dzieci tworzyły grupę kontrolną. To, które z dzieci znalazło się w danej grupie, zostało ustalone w sposób losowy (zaznaczono to jako R w tabeli 5.1). Grupę eksperymentalną stanowiło 20% dzieci z Oak School, reszta zaś stanowiła grupę kontrolną. Wszystkie dzieci poddano pomiarowi początkowemu (O1 i O3) za pomocą standardowego, bezsłownego testu inteligencji. Po przeprowadzeniu pomiaru początkowego wszyscy nauczyciele uczestniczący w eksperymencie otrzymali nazwiska dzieci, które rzekomo miały się rozwinąć intelektualnie. Prognoza ta, oparta na domniemanym teście rozwoju intelektualnego, wytworzyła określone oczekiwania u nauczycieli - jest to zmienna niezależna w tym eksperymencie. Po roku wszystkie dzieci z obu grup zostały zbadane ponownie (pomiar końcowy) tym samym testem inteligencji (O2 i O4) i określono u nich wielkość wzrostu IQ. Zmiany w poziomie inteligencji zostały zdefiniowane jako zmienna zależna. Badacze stwierdzili istotną różnicę pomiędzy pomiarem początkowym i pomiarem końcowym jedynie wśród dzieci z grupy eksperymentalnej. Na tej podstawie wyprowadzili wniosek, że pozytywne oczekiwania nauczycieli spowodowały intelektualny rozwój dzieci z grupy eksperymentalnej.
Tabela 5.1. Klasyczny plan eksperymentalny
Grupa Pomiar Pomiar Różnica
początkowy koficowy
Eksperymentalna R O1- X O2 O2 -O1=de
Kontrolna R O3 O4 O4 - O3=dc
Innym interesującym przykładem wykorzystania klasycznego planu eksperymentalnego, tym razem w dziedzinie polityki, jest „Manhattan Bail Project", zainicjowany przez Vera Institute w Nowym Jorku4. Vera Institute postanowił dostarczyć sędziom sądów kryminalnych dowodów wskazujących na to, że wiele osób mogłoby zostać zwolnionych z aresztu przed procesem, i to bez konieczności wpłacania kaucji. Osoby te bowiem są silnie powiązane ze społecznością więzami rodzinnymi, zawodowymi, przyjacielskimi oraz mieszkaniowymi. W zbadanej populacji znaleźli się ludzie oskarżeni o przestępstwa i nieobyczajne zachowanie. Osoby oskarżone o cięższe zbrodnie zostały z eksperymentu wyłączone. Studenci prawa uniwersytetu w Nowym Jorku oraz pracownicy Vera Institute przeanalizowali akta oskarżonych pod kątem danych dotyczących ich zatrudnienia, rodziny, miejsca zamieszkania, referencji, aktualnego oskarżenia ewentualnie oskarżeń wcześniej szych, aby na tej podstawie zdecydować, czy można sądowi zarekomedować zwolnienie przed procesem danej osoby, bez konieczności zapłacenia kaucji. Osoby, które mogły uzyskać taką rekomendację, zostały losowo podzielone na grupę eksperymentalną i kontrolną, a rzeczywistą rekomendację otrzymały tylko osoby znajdujące się w grupie eksperymentalnej. Zmienną niezależną stanowiło tu zwolnienie z aresztu przed procesem, a zmienną zależną odsetek osób, które się nie stawiły na proces.
W odniesieniu do większości osób z grupy eksperymentalnej sędziowie zaakceptowali rekomendacje przedprocesowego zwolnienia bez płacenia kaucji. Wyniki eksperymentu były uderzające. W latach 1961-1964, kiedy to eksperyment się zakończył, mniej niż 1% osób z grupy eksperymentalnej nie pojawiło się w sądzie, aby wziąć udział w procesie - odesetek zdecydowanie niższy w porównaniu z osobami, które zostały zwolnione po opłaceniu kaucji. Wyniki te wskazują, że zwolnienie z zapłacenia kaucji nie przyczynia się do niestawiania się w sądzie. Powołując się na wyniki tego eksperymentu, New York Probation Department wprowadził taki system działania we wszystkich pięciu dzielnicach miasta.
Dlaczego warto analizować eksperymenty
Klasyczny plan eksperymentalny był najczęściej wykorzystywany w badaniach prowadzonych w zakresie biologii i fizyki. Jesteśmy skłonni wiązać eksperymenty raczej z badaniami prowadzonymi w ramach nauk przyrodniczych niż z badaniami dotyczącymi zjawisk społecznych takich, jak: dyskryminacja, zachowanie się członków gangów, religia czy atrakcyjność społeczna. Dlaczego zatem poświęcamy tyle czasu na omówienie badań eksperymentalnych prowadzonych w naukach społecznych? Przyczyny są dwojakie. Po pierwsze, klasyczny plan eksperymentalny pozwala zrozumieć logikę wszystkich innych planów badawczych; jest to rodzaj modelu, z którym możemy porównywać pozostałe plany. Po drugie, eksperyment pozwala badaczowi na wyprowadzanie wniosków o zależnościach przyczynowo-skutkowych, a także stosunkowo łatwo badać, czy zmienna niezależna rzeczywiście spowodowała zmiany zmiennej zależnej. Stosując inne plany badawcze, nie zawsze da się łatwo wyprowadzić wnioski o zależnościach przyczynowo-skutkowych. Dlatego też jeżeli zrozumiemy strukturę i logikę klasycznego planu eksperymentalnego, to zrozumiemy również ograniczenia wynikające ze stosowania innych planów.
Generalnie rzecz biorąc, badacze w naukach społecznych w porównaniu z naukowcami z nauk przyrodniczych stosują badania eksperymentalne w znacznie mniejszym zakresie. Dzieje się tak dlatego, że bardzo rygorystyczna struktura planu nie pozwala na łatwe zaadaptowanie jej do badań prowadzonych w ramach nauk społecznych. Z tego powodu badacze z nauk społecznych często wykorzystują plany, które są słabsze, jeżeli chodzi o możliwości wyprowadzania wniosków przyczynowo-skutkowych, ale są bardziej przydatne do rodzaju problemów, którymi się oni zajmują. Plany, które będziemy określać mianem quasi-eksperymentów (omawiane w rozdziale 6) są w naukach społecznych powszechniej stosowane.
Jak widzieliśmy na przykładzie „Pigmaliona" i „The Manhattan Bail Project", eksperymenty są z całą pewnością stosowane w naukach społecznych. Rzeczywiście, w niektórych dziedzinach nauk społecznych, takich jak psychologia społeczna, badania eksperymentalne są dominującym rodzajem badań. Co więcej, badania eksperymentalne są coraz częściej stosowane w badaniach dotyczących polityki i oceny skutków jej działania.
■ Wyprowadzanie wniosków o charakterze przyczynowo-skutkowym
Zarówno eksperyment, który nazwaliśmy „Pigmalionem", jak i „Manhattan Bail Project", to eksperymenty pozwalające sprawdzić hipotezę o zależnościach przyczynowo-skutkowych. Idea przyczynowości jest rzeczywiście sercem wszystkich naukowych wyjaśnień. Dotyczy ona naszych oczekiwań, że zmienna zależna spowoduje zmiany wartości zmiennej zależnej w kierunku i w stopniu, jaki określa to teoria. Jeżeli jednak naukowcy stwierdzą, że zmiany wartości zmiennej niezależnej są zawsze związane ze zmianami wartości zmiennej zależnej, to nie musi to oznaczać, że pomiędzy tymi zmiennymi istnieje relacja przyczynowo-skutkowa.
Rozważmy na przykład politykę rządu dotyczącą walki z wykroczeniami przeciw prawu. Podstawowym celem takich działań jest zmniejszanie przestępczości. Czy w takim razie fakt. że ktoś nie popełnił zbrodni, oznacza, że to polityka rządu skutecznie go od tego powstrzymała? Odpowiedź zależy przede wszystkim od tego, czy jednostka była skłonna do podejmowania działań przestępczych. Co więcej, jeżeli dana osoba miała skłonności w tym kierunku, to czy powstrzymała ją możliwość złapania i ukarania, czy też inne czynniki takie, jak brak możliwości popełnienia przestępstwa czy wpływ grupy rówieśniczej? Jeżeli zatem badacze ustalą nawet, że ustanowienie przez rząd bardziej drastycznych metod walki z przestępczością przyczynia się do spadku liczby popełnianych przestępstw, to nie można jeszcze z całą pewnością stwierdzić, że zjawiska te były ze sobą przyczynowo powiązane.
W praktyce stwierdzenie przyczynowości wymaga przeprowadzenia trzech niezależnych operacji: wykazania kowariancji, wyeliminowania relacji pozornych oraz określenia czasowego porządku występowania zjawisk.
Kowariancja
Kowariancja oznacza, że dwa zjawiska się współzmieniają. Na przykład, jeżeli zmianie poziomu wykształcenia towarzyszy zmiana wielkości dochodów, to możemy powiedzieć, że wykształcenie współzmienia się wraz z dochodami. Innymi słowy, osoby o wyższym wykształceniu mają większe dochody niż osoby o mniejszym wykształceniu. Z kolei odwrotnie, jeżeli zmianom poziomu wykształcenia nie towarzyszy zmiana wielkości dochodów, to wykształcenie nie współzmienia się wraz z dochodami. W badaniach naukowych pojęcie kowariancji wyrażane jest w postaci miar związku między zmiennymi, czyli korelacji lub inaczej siły powiązania. Aby stwierdzić, że jedno zjawisko powoduje drugie, należy udowodnić istnienie korelacji pomiędzy tymi zjawiskami. Jeżeli na przykład ubóstwo nie koreluje (nie współzmienia się) z przestępczością, to nie można go traktować jako przyczyny przestępczości.
Brak związków pozornych
Drugą operacją, którą należy przeprowadzić, jest wykazanie, że stwierdzona kowariancja nie jest związkiem pozornym. Jak przedstawiliśmy to w rozdziale 3, danego związku nie będziemy traktować jako związku pozornego, jeżeli nie istnieje taka trzecia zmienna, za pomocą której można by ten związek wyjaśnić. Jeżeli kontrolujemy efekty oddziaływania wszystkich istotnych zmiennych i oryginalny związek między dwiema zmiennymi zostaje utrzymany, to związek ten nie jest związkiem pozornym. Stwierdzenie, że dany związek nie jest związkiem pozornym, stwarza mocne podstawy wnioskowania, że pomiędzy zmiennymi istnieje relacja przyczynowo-skutkowa, a stwierdzona kowariancja nie jest wynikiem przypadkowego powiązania między zmiennymi. Na rycinie 3.1 pokazaliśmy, że kowariancja pomiędzy liczbą wozów strażackich, które przyjechały na miejsce pożaru, a wielkością strat w wyniku tego pożaru jest związkiem pozornym, ponieważ istnieje trzecia zmienna - wielkość pożaru - która wyjaśnia ten związek.
Porządek czasowy
Trzecią istotną operacją jest wykazanie porządku czasowego, tj. wykazanie, że zakładana przyczyna pojawia się lub zmienia pierwsza, przed zakładanym skutkiem.
Logiczny model wnioskowania: trzy niezbędne elementy
+Kowariancja. Dwa zjawiska lub więcej zjawisk współzmieniają się. +Brak związków pozornych. Kontrolujemy efekty oddziaływania wszystkich istotnych zmiennych i oryginalny związek między dwiema zmiennymi zostaje utrzymany. +Porządek czasowy. Zakładana przyczyna pojawia się lub zmienia pierwsza przed zakładanym skutkiem.
|
I tak na przykład zgodnie z wynikami wielu badań kowariancja pomiędzy stopniem urbanizacji i rozwojem demokratycznych struktur politycznych nie jest związkiem pozornym. Aby ustalić, że urbanizacja jest przyczynowo powiązana z rozwojem struktur demokratycznych, badacz musi wykazać, że pierwszy czynnik poprzedza drugi. Milcząco przyjmuje się tu założenie, że zjawiska mogące występować w przyszłości nie powinny powodować zjawisk występujących aktualnie bądź w przeszłości. Ustalenie porządku czasowego zazwyczaj nie jest trudne. Status rodziców wpływa na oczekiwania edukacyjne ich dzieci, a nie odwrotnie; zainteresowania polityką wyprzedzają udział w życiu politycznym; depresja wyprzedza samobójstwo. Czasami jednakże porządek czasowy zjawisk bywa trudny do ustalenia. Czy urbanizacja wyprzedza rozwój struktur politycznych, czy też może to rozwój struktur politycznych wyprzedza urbanizację? Czy osiągnięcia następują po motywacji, czy też poziom motywacji zmienia się po osiągnięciach? W rozdziale 6 i 17 omówimy metody wykorzystywane do ustalania porządku czasowego. W tym miejscu chcemy jedynie podkreślić istotność kryterium porządku czasowego w sytuacji, kiedy formułuje się wyjaśnienia o charakterze przyczynowo-skutkowym.
■ Podstawowe cechy planu badawczego
Klasyczny plan badawczy ma cztery podstawowe cechy: możliwość porównywania, manipulowania, kontrolowania i uogólniania. Pierwsze trzy cechy są niezbędne wtedy, kiedy chcemy ustalić zależności przyczynowo-skutkowe pomiędzy zmienną niezależną i zmienną zależną. Porównywanie pozwala wykazać istnienie kowariancji, manipulowanie pomaga ustalić porządek czasowy badanych zjawisk, a kontrolowanie umożliwia określenie, czy badany związek nie jest związkiem pozornym. Uogólnianie natomiast jest związane z ustalaniem zakresu, w jakim wyniki badań można odnieść do całej populacji lub do innych warunków społecznych.
Porównywanie
Proces porównywania leży u podstaw pojęcia kowariancji czy korelacji. Porównywanie jest operacją wymaganą wtedy, kiedy chcemy wykazać, że dwie zmienne ze sobą korelują. Przypuśćmy, że chcemy wykazać, że istnieje korelacja pomiędzy paleniem papierosów a rakiem płuc, tj. że palenie papierosów jest związane z większym ryzykiem zachorowania na raka płuc. Aby to sprawdzić, badacz może porównać częstość występowania przypadków raka wśród palaczy i niepalaczy lub porównać częstość występowania przypadków raka w populacji palaczy przed paleniem i po tym, kiedy zaczęli palić. Przypuśćmy z kolei, że jesteśmy przekonani, iż oglądanie telewizji wpływa na zjawisko seksizmu w postrzeganiu roli kobiety i mężczyzny wśród ludzi dorosłych. Powinniśmy zatem oczekiwać kowariancji pomiędzy oglądaniem telewizji i postawami seksistowskimi. Innymi słowy, ludzie dorośli spędzający więcej czasu na oglądaniu telewizji będą ujawniali tradycyjne stereotypy dotyczące płci. Aby oszacować kowariancję pomiędzy oglądaniem telewizji i postawami, moglibyśmy porównać ludzi rzadko i bardzo często oglądających telewizję. Moglibyśmy też porównać, jak zmieniają się poglądy dotyczące roli związanej z płcią po obejrzeniu programu telewizyjnego przedstawiającego te role w tradycyjnym ujęciu. Mówiąc jeszcze inaczej, aby oszacować kowariancję, należy ustalić wynik, jaki uzyskają badani dorośli na wymiarze zmiennej zależnej przed wprowadzeniem i po wprowadzeniu zmiennej niezależnej, czy też porównać grupę osób poddanych oddziaływaniu zmiennej niezależnej z grupą osób, które temu oddziaływaniu nie zostały poddane. W pierwszym wypadku dana grupa jest porównywana sama ze sobą, w drugim porównuje się grupę eksperymentalną z grupą kontrolną.
Manipulowanie
W pojęciu przyczynowości przyjmuje się, że jeżeli Y jest spowodowane przez X, to znaczy, że zmiany wartości X będą wyprzedzać zmiany wartości Y. Innymi słowy, przyjmuje się, że relacja ta jest relacją niesymetryczną: jedna zmienna jest siłą wywołującą, a druga zmienna jest wywołaną reakcją. Aby stwierdzić przyczynowość, zmiana wartości X musi się zdarzyć, zanim wystąpi zmiana Y, gdyż w przeciwnym wypadku zmiennej X nie będzie można uznać za przyczynę. Jeżeli badacz chciałby na przykład wykazać, że uczestniczenie w grupach terapeutycznych dla alkoholików zmniejsza zjawisko niedostrzegania własnych problemów związanych z piciem, to należy wykazać, że liczba aktywnych zaprzeczeń spadła po uczestniczeniu w takiej grupie. Badacz musi również określić metody kontrolowania (tj. manipulowania) sposobu przyporządkowywania do grupy badawczej po to, aby można było dokonać pomiaru liczby zaprzeczeń problemom alkoholowym przed udziałem i po uczestniczeniu w takiej grupie. W badaniach eksperymentalnych, zwłaszcza laboratoryjnych, badacze sami mogą wprowadzić oddziaływanie badawcze. W warunkach naturalnych jednakże taki poziom kontroli zazwyczaj nie jest możliwy. W obu sytuacjach jednak podstawowym dowodem pozwalającym określić sekwencję czasową zdarzeń - tj. że zmienna niezależna wyprzedziła zmienną zależną -jest to, że zmiany zmiennej zależnej pojawiły się dopiero po zadziałaniu zmiennej niezależnej.
Kontrolowanie: trafność wewnętrzna planu badawczego
Kontrolowanie, trzecie kryterium przyczynowości, wymaga wyeliminowania innych czynników, które mogłyby dostarczyć konkurencyjnych wyjaśnień stwierdzonego związku pomiędzy badanymi zmiennymi. Czynniki te mogłyby zmniejszyć trafność wnioskowania, że zmienne te są ze sobą przyczynowo powiązane. Donald Campbell i Julian Stanley nazwali to problemem trafności wewnętrznej. Aby określić trafność wewnętrzną, badacz musi odpowiedzieć na pytanie, czy określone zmiany wartości zmiennej niezależnej rzeczywiście spowodowały zmiany wartości zmiennej zależnej. Wysiłek związany z zapewnieniem trafności wewnętrznej jest czynnikiem, od którego zależy plan i wdrożenie projektu badawczego.
Czynniki zakłócające trafność wewnętrzną można podzielić na takie, które pojawiają się, zanim wystąpi operacja badawcza - czynniki poza planem - i takie, które są związane z planem badawczym i wpływają na wyniki w trakcie trwania badania.
Czynniki poza planem. W badaniach prowadzonych w ramach nauk społecznych, problemy natury etycznej i kwestie praktyczne mogą nie pozwolić na losowe przyporządkowanie badanych osób do grupy eksperymentalnej i kontrolnej. Kiedy trzeba zastosować inne metody przyporządkowania, musimy się liczyć ze stronniczością, czyli efektem doboru. Przyczyną tego zjawiska jest powstawanie różnic pomiędzy grupą eksperymentalną i grupą kontrolną, zanim wystąpi operacja badawcza; różnice te są spowodowane czynnikami pojawiającymi się poza planem badawczym. Jeżeli dwie grupy różnią się między sobą na początku eksperymentu, to trudno będzie później oddzielić efekt doboru od efektu oddziaływania zmiennej niezależnej. I tak na przykład, instytucja Manpower Demonstration Research Corporation, badając skuteczność programu zatrudnienia dla osób otrzymujących zasiłek z opieki społecznej, porównywała ze sobą osoby objęte pomocą społeczną i uczestniczące w federalnym programie zatrudnienia z innymi osobami objętymi pomocą społeczną. Okazało się, że wśród osób objętych tym programem zanotowano wyższy stopień zatrudnienia i wyższe zarobki, co z kolei wpłynęło na zmniejszenie kosztów opieki społecznej ponoszonych przez podatników. Można jednak sformułować konkurencyjne wyjaśnienie zarejestrowanych zmian w poziomie zatrudnienia i w wysokości zarobków. Zgodnie z tym wyjaśnieniem osoby biorące udział w programie różniły się od pozostałych osób objętych opieką społeczną jeszcze przed rozpoczęciem badania. Mogła to być różnica w poziomie motywacji tych osób do poszukiwania pracy i to ona mogła wpłynąć na wyższy stopień zatrudnienia i większe zarobki.
Efekt doboru jest szczególnie istotny wtedy, gdy osoby badane same decydują, czy wziąć udział w eksperymencie. W takich wypadkach bowiem badacz nie jest w stanie stwierdzić, czy różnice pomiędzy grupą eksperymentalną i kontrolną zostały spowodowane wyłącznie przez zmienną niezależną, czy też obserwowane efekty należy przypisać innym czynnikom związanym z procedurą selekcyjną. Spora liczba programów społecznych jest dostępna dla wielu osób na zasadzie wolnego wyboru. Dlatego też trudno ocenić skuteczność takich programów, między innymi ze względu na efekt doboru. Czynniki związane z procedurą selekcji należy zatem kontrolować, zanim badacz zdecyduje się je wyeliminować jako konkurencyjne wyjaśnienie. Dalej w tym rozdziale omówimy metody kontrolowania czynników związanych z doborem do próby badawczej.
Czynniki związane z planem badawczym. Czynniki te obejmują te zmienne, które pojawiły się w trakcie prowadzenia badania i mogły spowodować zmiany w badanych osobach lub w obiektach oraz zmiany w narzędziu pomiarowym. Do czynników tych zaliczamy również efekt oddziaływania samego badania. Poniżej przedstawiamy podstawowe czynniki związane z planem eksperymentalnym, które mogą wpłynąć zakłócająco na trafność interpretowania zależności przyczynowych na podstawie zebranych danych.
1. Historia to zmienna dotycząca wszelkich zdarzeń zewnętrznych pojawiających się w trakcie badania, które mogą wpłynąć na osoby badane i stworzyć podstawy konkurencyjnego wyjaśnienia zmian wartości zmiennej zależnej. Na przykład w badaniu, którego celem jest oszacowanie wpływu kampanii przedwyborczej na zachowania wyborcze, można sformułować następującą hipotezę: informacje o kandydacie pojawiające się w czasie kampanii mogą wpłynąć na sposób głosowania wyborców. Badanie polega na porównaniu zamiarów wyborców przed ukazaniem się i po pojawieniu się takich informacji. Różnice w przewidywanych głosach między dwiema grupami -jednej, której przedstawiono informacje o kandydatach, i drugiej, która takich informacji nie miała - mogą być wynikiem posiadanych informacji, ale również mogą być wynikiem wydarzeń, które nastąpiły w tym czasie. Mogło na przykład dojść do konfliktu z rządem, mogły się pojawić kryzysy międzynarodowe, mogła się zwiększyć stopa inflacji lub mogły zostać wprowadzone nowe podatki. Im dłuższy czas upłynie między pomiarem początkowym a pomiarem końcowym, tym większe prawdopodobieństwo, że przy formułowaniu alternatywnego wyjaśnienia hipotezy badawczej powinny być uwzględnione wydarzenia inne niż zmienna niezależna.
2. Dojrzewanie obejmuje procesy biologiczne, psychologiczne lub społeczne, które mogą -wraz z upływem czasu - przyczynić się do powstawania zmian w badanych osobach lub obiektach. Zmiany te mogą wpłynąć na zmienną zależną i prowadzić do błędnych wniosków. Przypuśćmy, że interesuje nas ocena wpływu określonej metody uczenia na osiągnięcia uczniów. Rejestrujemy zatem ich osiągnięcia przed wprowadzeniem i po wprowadzeniu tej metody. Jednakże w czasie pomiędzy pomiarem początkowym i pomiarem końcowym uczniowie stali się starsi i być może mądrzejsi. Te zmiany zaś, nie związane z metodą uczenia, mogą wyjaśniać różnice pomiędzy dwoma pomiarami. Dojrzewanie, tak jak historia, stanowi zagrożenie dla trafności wnioskowania o charakterze przyczynowo-skutkowym.
3. Utrata osób badanych to czynnik opisujący problemy związane ze zmniejszeniem próby, który powoduje, iż badacz nie jest w stanie zebrać kompletu danych dla wszystkich badanych przypadków. Jeżeli osoby badane wypadają selektywnie z próby eksperymentalnej i z próby kontrolnej, to końcowa próba osób, dla których zebrano wszystkie dane, może być stronnicza. Jeżeli w badaniu wpływu środków masowego przekazu na uprzedzenia okaże się, że większość osób, które wypadły, to osoby uprzedzone, to możemy stwierdzić, że media zmniejszają uprzedzenia. W rzeczywistości jednak jest to efekt utraty osób badanych i to było przyczyną sformułowanej opinii.
4. Instrumentacja opisuje zmiany w narzędziu pomiarowym w okresie między pomiarem początkowym a pomiarem końcowym. Aby powiązać różnicę pomiędzy wynikami w pomiarze początkowym i w pomiarze końcowym ze zmienną niezależną, należy wykazać, że powtórny pomiar dokonany za pomocą identycznego narzędzia, w nie zmienionych warunkach, dostarczy takich samych wyników. Jeżeli wyniki nie będą takie same, to obserwowane różnice można przypisać zmianom w narzędziu pomiarowym, a nie jedynie zmiennej niezależnej. Brak stabilności narzędzia pomiarowego, określanej też jako rzetelność, może być zagrożeniem dla trafności badań eksperymentalnych (por. rozdział 7). Jeżeli na przykład program zwiększania umiejętności poznawczych został oceniony przez porównanie ocen psychologów wystawionych przed wdrożeniem programu i po jego zakończeniu, to
każda zmiana standardowego sposobu oceny stosowanego przez psychologów, która nastąpiła w okresie badania, wpłynie stronniczo na wyniki.
5. Testowanie - możliwość uwrażliwienia przez pomiar jest podstawowym problemem nauk społecznych. Innymi słowy, sam proces testowania może zmienić badane zjawisko. Poddanie pomiarowi początkowemu może uwrażliwić osoby badane i zwiększyć ich wyniki w pomiarze końcowym. Różnica pomiędzy wynikami w pomiarze początkowym i w pomiarze końcowym może zatem zostać przypisana nie tyle zmiennej niezależnej, ile raczej doświadczeniu zdobytemu przez osobę badaną w trakcie pomiaru początkowego. Wiadomo na przykład, że osoby badane mogą poprawić swoje wyniki w testach inteligencji przez ich częste rozwiązywanie. Podobnie osoby badane, które poddano pomiarowi początkowemu, mogą się nauczyć odpowiedzi społecznie akceptowanych czy to przez zadawanie pytań, czy
przez omawianie odpowiedzi z przyjaciółmi. Następnie w fazie pomiaru końcowego mogą one udzielać takich odpowiedzi, jakich się od nich oczekuje.
6. Niekorzystne zjawisko artefaktu regresji pojawia się wówczas, kiedy osoby badane zostały przyporządkowane do grupy eksperymentalnej na podstawie skrajnie wysokich wyników zmiennej zależnej, uzyskanych przez nie w pomiarze początkowym. Gdy się to zdarzy i zebrane miary nie będą rzetelne, to osobom, które uzyskały wyniki poniżej średniej w pomiarze początkowym, będzie się wydawało, że uzyskają lepsze wyniki w powtórnym badaniu. I odwrotnie osoby, które uzyskały wyniki powyżej średniej w pomiarze początkowym, będą - w powtórnym badaniu - wypadać gorzej. Wszyscy znamy ten problem z własnego doświadczenia w wypełnianiu testów. Niektórzy z nas wypadali w testach szkolnych poniżej własnych oczekiwań. Powodem były czynniki leżące poza naszą kontrolą, nie mające nic wspólnego z naszymi szkolnymi osiągnięciami. Tuż przed egzaminem testowym mogła się nam na przykład przydarzyć bezsenna noc lub też inne ważne sprawy nie pozwalały nam się skupić w trakcie egzaminu. Istnieje duże prawdopodobieństwo, że nie ucząc się dodatkowo i rozwiązując ten test po raz drugi, wypadlibyśmy znacznie lepiej. Generalnie rzecz biorąc, zjawisko artefaktu regresji jest czynnikiem zakłócającym trafność badania wtedy, kiedy postępowanie eksperymentalne może spowodować zmianę wyników tych osób, które w pomiarze początkowym zmiennej zależnej uzyskały skrajne wyniki.
I tak na przykład korpusy pracy są uważane za skuteczny program przeznaczony dla nie uczącej się młodzieży z wadami fizycznymi. Program ten zapewnia nauczanie wyrównawcze, kształcenie zawodowe oraz opiekę medyczną. Jeżeli jednak rekrutacja kandydatów na kurs byłaby dokonywana na podstawie skrajnie niskich wyników uzyskanych w nierzetelnym teście, to może się zdarzyć, że osoby te w powtórnym testowaniu uzyskają znacznie lepsze wyniki, mimo że w ich wypadku program ten okazał się nieskuteczny. Jest to możliwe dlatego, że uzyskane niskie wyniki nie mogły być już gorsze, a nierzetelny test wykazał poprawę. Istnieje zatem ryzyko, że stwierdzona poprawa funkcjonowania zostanie błędnie przypisana efektom oddziaływania programu.
7. Interakcje z selekcją. Wiele czynników związanych z planem badawczym, wpływających zakłócąjąco na trafność wewnętrzną badań eksperymentalnych może wchodzić w interakcję z czynnikiem selekcji i dodatkowo zmniejszać trafność badań eksperymentalnych. Do najczęściej wymienianych czynników należą czynnik interakcji selekcji z historią i dojrzewaniem.
Czynnik interakcji selekcji z historią wpływa zakłócąjąco na trafność planu wtedy, gdy grupa eksperymentalna i grupa kontrolna zostały wybrane z różnych środowisk. Tym samym środowisko może wpływać na sposób reagowania osób badanych w trakcie postępowania eksperymentalnego. Przypuśćmy, że chcemy sprawdzić skuteczność oddziaływania programu szkolenia pokazującego bezrobotnym, jak szukać pracy. Uczestnicy tego programu (grupa eksperymentalna) zostali niestarannie dobrani. Pochodzili z rejonów, w których zamknięto kilkanaście zakładów przemysłowych w momencie zakończenia programu. W efekcie jego uczestnicy mieli ogromne trudności ze znalezieniem pracy. Mogło się zatem wydawać, że program ten nie przyniósł żadnych skutków, a tymczasem to interakcja czynnika selekcji ze specyficznymi warunkami ekonomicznymi w regionie, z którego pochodziły osoby badane, była przyczyną takich wyników.
Interakcja czynnika selekcji z dojrzewaniem pojawia się wtedy, kiedy grupa eksperymentalna i grupa kontrolna podlegają procesowi dojrzewania w różnym tempie. Załóżmy, że w pomiarze początkowym i w pomiarze końcowym porównujemy ze sobą rozwój poznawczy kobiet i mężczyzn. Może się okazać, że kobiety dojrzewają szybciej niż mężczyźni i dlatego w pomiarze końcowym uzyskają lepsze wyniki.
Procedury kontroli
Czynniki związane z planem i pojawiające się poza planem, które wpływają zakłócąjąco na trafność wewnętrzną wnioskowania o zależnościach przyczynowo-skutkowych, można kontrolować za pomocą różnych procedur. Naukowcy korzystają z dwóch metod kontroli czynników zewnętrznych w stosunku do planu badawczego. Po pierwsze, stosują dobór wiązany pozwalający kontrolować zmienne znane badaczowi przed rozpoczęciem postępowania eksperymentalnego. Po drugie, stosują randomizację, która pomaga wyrównać działanie czynników nie dających się z góry ustalić. Stosowanie grupy kontrolnej pomaga z kolei wyrównać działanie czynników związanych z planem badawczym.
Dobór wiązany jest sposobem wyrównywania grupy eksperymentalnej i grupy kontrolnej ze względu na czynniki nie związane z planem badawczym, o których można założyć, że mają związek z hipotezą badawczą. W celu wyrównania grupy eksperymentalnej i grupy kontrolnej można zastosować dwie metody: dopasowywanie dokładne i dopasowywanie rozkładów częstości. Dopasowywanie dokładne (znane również jako dopasowywanie parami) polega na przyporządkowywaniu każdej osobie z grupy eksperymentalnej jednej osoby z grupy kontrolnej w taki sposób, aby posiadały one identyczne wyróżnione cechy. Kontrolując na przykład efekt wieku, powinniśmy zapewnić, aby każdej osobie wpadającej do określonego przedziału wiekowego w jednej grupie odpowiadała osoba wpadająca do identycznego przedziału wiekowego w drugiej grupie, jak przedstawiono to na rycinie 5.1. Dopasowując osoby badane ze względu na czynniki zewnętrzne w stosunku do planu, badacz może wyciągać wnioski, że zmienne, ze względu na które grupy zostały dopasowane, nie są przyczyną stwierdzanych różnic pomiędzy grupą eksperymentalną i grupą kontrolną.
Główną wadą tej metody jest trudność w dopasowywaniu osób, gdy liczba czynników jest duża. Jeżeli chcemy kontrolować wiek, płeć, rasę i wykształcenie, to dla każdego Azjaty, mężczyzny w wieku 30 lat z wykształceniem wyższym w grupie eksperymentalnej musimy znaleźć osobę o takiej samej kombinacji cech, która wejdzie do grupy kontrolnej. Dlatego też w sytuacji, w której chcemy kontrolować wiele cech, trudno znaleźć dopasowane do siebie pary. Badacze stosujący metodę dopasowania dokładnego często tracą około 90% przypadków, dla których nie można znaleźć odpowiadającej im pary.
Alternatywną i bardzo skuteczną metodą dopasowywania jest odwołanie się do rozkładu częstości. Dzięki tej metodzie grupa eksperymentalna i grupa kontrolna są do siebie podobne niezależnie pod względem każdej istotnej zmiennej, a nie pod względem ich określonej kombinacji. Dlatego też, zamiast dobierać osoby badane na zasadzie osoba do osoby, dwie grupy dopasowuje się do siebie ze względu na podstawowe charakterystyki. I tak, jeżeli interesuje nas dopasowanie ze względu na wiek, to średni wiek w jednej grupie powinien odpowiadać średniej wieku w grupie drugiej. Jeżeli kontrolujemy płeć, to należy się upewnić, że w obu grupach jest taka sama proporcja kobiet i mężczyzn. Jak pokazano na rycinie 5.2, dwie grupy dopasowano do siebie niezależnie ze względu na każdą zmienną nie związaną z planem. Chociaż dopasowanie ze względu na rozkład częstości jest mniej precyzyjne, to bywa o wiele łatwiejsze do zrealizowania niż dopasowanie dokładne. Pozwala też badaczowi kontrolować kilka czynników, bez niebezpieczeństwa utraty dużej liczby przypadków.
Podstawowy problem związany ze stosowaniem metody dopasowywania jako formy kontroli wynika z tego, że badacz zazwyczaj nie wie, które z wszystkich ważnych czynników są najbardziej istotne z punktu widzenia wyjaśniania związku pomiędzy zmienną niezależną i zmnienną zależną. Co więcej, badacz nigdy nie jest pewien, czy uwzględnił wszystkie istotne czynniki.
Randomizacja. Dopasowywanie jest metodą pozwalającą kontrolować ograniczoną liczbę wcześniej zdefiniowanych czynników zewnętrznych w stosunku do planu. Jeżeli jednak możliwe byłoby wyeliminowanie efektów działania nawet wszystkich zdefiniowanych czynników, to badacz i tak nigdy nie byłby pewien, czy udałoby mu się zidentyfikować wszystkie czynniki. Te czynniki, których badacz nie byłby świadom, mogłyby się stać powodem błędnych wniosków o zależnościach przyczynowo-skutkowych. Problem ten można ominąć, stosując inną procedurę przyporządkowywania osób badanych do grupy eksperymentalnej i grupy kontrolnej, a mianowicie procedurę randomizacji. Randomizację można zrealizować, rzucając monetą, posługując się tablicami liczb losowych czy wykorzystując jakąkolwiek inną metodę gwarantującą, że każda osoba będzie miała jednakowe szansę znalezienia się w grupie eksperymentalnej lub w grupie kontrolnej.
Przypuśćmy, że badacz chce sprawdzić hipotezę o tym, że udział pracowników w procesie podejmowania decyzji dotyczących ich miejsca pracy wpływa na proces produkcji. Pracownicy zostali podzieleni na grupę eksperymentalną i kontrolną. Osobom z grupy eksperymentalnej umożliwiono udział w decyzjach dotyczących planu pracy i jej organizowania. Poziom produkcji w obu grupach mierzono na początku i na końcu eksperymentu. Celem badania było stwierdzenie, czy pracownicy, którzy uczestniczą w procesie decyzyjnym, wytwarzają istotnie więcej w porównaniu z pracownikami z grupy kontrolnej. Poziom produkcji jednakże jest wyznaczony licznymi czynnikami innymi niż udział w procesie decyzyjnym, tj. innymi niż czynnik bezpośrednio włączony do badania. Czynnikami wyjaśniającymi obserwowane różnice mogą być czynniki charakteryzujące jednostkę, takie jak: wiek, sprawność fizyczna, inteligencja czy motywacja. Być może osoby najbardziej wydajne to osoby o wysokiej motywacji, większej inteligencji, bardziej sprawne fizycznie i młodsze. Brak kontrolowania sposobu przydzielania pracowników do grup może spowodować, że do grupy eksperymentalnej zgłoszą się na ochotnika osoby spośród młodszych pracowników, o największej motywacji, bardziej inteligentne i sprawne fizycznie. A to może stanowić wyjaśnienie zwiększonego poziomu produkcji.
Jednym ze sposobów wykluczenia działania tych zmiennych jest dobór parami (por. ryc. 5.1). Innym sposobem jest randomizacja, czyli losowy przydział pracowników do grupy eksperymentalnej i kontrolnej, przeprowadzony za pomocą rzutu monetą lub tablicy liczb losowych (por. dodatek D). Rzut monetą jest prostą metodą - wypadnięcie orła to przydzielenie do jednej grupy, wypadnięcie reszki -do drugiej. Tablicą liczb losowych można się natomiast posługiwać z wielu powodów i na wiele różnych sposobów - na stronie 209 opisujemy, w jaki sposób należy z takich tablic korzystać. Procedura randomizacji zapewnia, że motywacja, inteligencja, sprawność fizyczna i przeciętny wiek będą wykazywały podobne rozkłady w dwóch grupach. W efekcie każdą różnicę w poziomie produkcji pomiędzy grupami będzie można wyjaśnić tym, że pracownicy z grupy eksperymentalnej brali udział w procesie decyzyjnym. Innymi słowy, randomizacja znosi efekty oddziaływania stałego błędu spowodowanego czynnikami zewnętrznymi w stosunku do planu eksperymentalnego, które mogą być powiązane albo ze zmienną zależną (poziom produkcji), albo ze zmienną niezależną (udział w procesie decyzyjnym). Korzyści tej metody polegają na tym, że pozwala ona na jednoczesną kontrolę wielu czynników nawet wtedy, gdy badacz nie jest świadomy ich oddziaływania. Stosując tę metodę, badacz może wyrównać grupę eksperymentalną i kontrolną pod kątem wszystkich wyjściowych różnic pomiędzy nimi.
Grupa kontrolna. Tworząc grupę kontrolną, która nie jest poddawana oddziaływaniom czynnika eksperymentalnego, badacze kontrolują czynniki związane z planem eksperymentalnym. W sytuacji idealnej grupa eksperymentalna i grupa kontrolna powinny zostać wybrane w sposób losowy lub dopasowane w taki sposób, aby obie miały dokładnie takie same cechy charakterystyczne. Obie grupy są poddawane również identycznym oddziaływaniom w trakcie eksperymentu, z wyjątkiem różnego oddziaływania zmiennej niezależnej. W efekcie cechy sytuacji eksperymentalnej czy zdarzenia zewnętrzne zachodzące w czasie trwania eksperymentu będą wpływać w jednakowy sposób na obie grupy i nie będą mylnie utożsamiane z efektem oddziaływania zmiennej niezależnej.
Tworząc grupę kontrolną, badacz kontroluje większość czynników związanych z planem badawczym, które mogłyby wpłynąć zakłócająco na trafność eksperymentu. Czynnik historii nie stanowi konkurencyjnej hipotezy, ponieważ te same wydarzenia zachodzące w czasie eksperymentu wpływają zarówno na grupę eksperymentalną, jak i na grupę kontrolną. Czynnik dojrzewania jest również neutralizowany, ponieważ obie grupy przechodzą te same zmiany. Stworzenie grupy kontrolnej nie chroni jednak przed utratą osób badanych. Może bowiem zdarzyć się tak, że z jednej grupy wypadnie więcej przypadków niż z drugiej, co sprawi, że wyniki eksperymentu będą stronnicze. Procedurą dopuszczalną jest włączanie przez badaczy do końcowej próby jedynie tych przypadków, dla których zebrano komplet danych, dostarczenie informacji o liczbie utraconych osób badanych i omówienie konsekwencji tego faktu. Stosowanie grupy kontrolnej pozwala badaczom również na uniknięcie efektu oddziaływania zmian w narzędziu pomiarowym. Jeżeli zmiana wyników w pomiarze początkowym i końcowym została spowodowana przez brak rzetelności narzędzia pomiarowego, to ujawni się to w jednakowy sposób w obu grupach. Metoda ta jest jednakże rozwiązaniem problemu zmian w narzędziu pomiarowym jedynie wtedy, kiedy warunki testowania w obu grupach są identyczne. Posługiwanie się grupą kontrolną jest również odpowiedzią na problem testowania. Ewentualny, uwrażliwiający wpływ procedury pomiarowej dotyczy obu grup i nie jest przyczyną błędnych interpretacji.
Posługiwanie się grupą kontrolną jest również pomocne przy wyrównywaniu efektów działania tych czynników, które wchodzą w interakcje z czynnikiem selekcji (np. selekcja-dojrzewanie, selekcja-historia czy podobne interakcje), jednak jedynie wtedy, gdy badacz stosuje również inne metody kontroli czynników zewnętrznych w stosunku do planu eksperymentalnego, takie jak dobór wiązany czy rando-mizację. Metody te gwarantują, że grupa, która zostanie potraktowana jako grupa kontrolna, będzie miała te same właściwości i obie grupy będą obowiązywać identyczne warunki w trakcie eksperymentu.
Uogólnianie: trafność zewnętrzna
Trafność zewnętrzna stanowi zasadniczy problem w badaniach społecznych. Można jednakże postawić inne istotne pytanie dotyczące zakresu, w jakim wyniki badań można uogólniać na większe zbiorowości osób i przenosić na inne warunki społeczne czy polityczne. Większość badań koncentruje się nie tylko na analizowaniu wpływu jednej zmiennej na drugą w określonych warunkach, lecz także stawia pytanie o to, jakie jest to oddziaływanie w innych warunkach społecznych i czy da się je przenieść na większe zbiorowości osób. Odpowiedź na to pytanie mieści się w pojęciu trafności zewnętrznej planu badawczego. Podstawowymi zagadnieniami związanymi z trafnością zewnętrzną są problemy reprezentatywności próby oraz uwrażliwiający wpływ warunków badania.
Reprezentatywność próby. Aby zapewnić trafność zewnętrzną badania, należy zadbać o to, aby cechy charakteryzujące osoby badane odzwierciedlały cechy charakteryzujące badaną populacje. Chociaż procedura randomizacji gwarantuje trafność wewnętrzną planu badawczego, to nie gwarantuje całkowicie, że badana próba będzie reprezentatywna dla interesującej badacza populacji. Może bowiem zdarzyć się tak, że wyniki, które są wewnętrznie trafne, mogą być specyficzne dla określonej grupy osób, które wzięły udział w badaniu. Taki efekt może się pojawić wtedy, kiedy mamy trudności z doborem osób badanych. Rozważmy przykład badań eksperymentalnych prowadzonych na grupie studentów college'u, dobrze zaplanowanych, jednak opartych na doborze ochotniczym. Badacz nie może przyjąć, że ta! grupa jest reprezentatywna dla całej populacji studentów. Aby można było uogólnić wyniki poza ograniczony zakres konkretnego badania, badacz musi starannie wybrać próbę, posługując się taką metodą doboru, która zapewnia reprezentatywność. Metody oparte na rachunku prawdopodobieństwa, takie jak dobór losowy, pozwalają dokonywać generalizacji na większe, wyraźnie zdefiniowane populacje (por. rozdział 8). Od strony teoretycznej zarówno grupa eksperymentalna, jak i grupa kontrolna powinny stanowić próbę wylosowaną z populacji. W praktyce jednakże tworzenie próby losowej dla potrzeb eksperymentu napotyka trudności takie jak wysokie koszty i dużą liczbę osób, które odmówiły współpracy.
Elementy klasycznego planu badawczego + Porównywanie. Operacja, która pozwala określić, czy dwie zmienne współzmieniają się (korelują ze sobą). + Manipulowanie. Operacja, której celem jest kontrolowanie sposobu przyporządkowywania do grupy badawczej po to, aby badacz mógł określić sekwencję czasową zdarzeń i upewnić się, że zmiany wartości zmiennej niezależnej wyprzedziły zmiany wartości zmiennej zależnej. + Kontrolowanie. Operacja, która umożliwia badaczowi wyeliminowanie konkurencyjnych wyjaśnień zmian wartości zmiennej zależnej. Badacze muszą w tym celu kontrolować zarówno czynniki zewnętrzne w stosunku do planu badawczego, tj. czynniki selekcji, jak i czynniki wewnętrzne, takie jak historia i dojrzewanie. + Uogólnianie. Zakres, w jakim wyniki badań mogą zostać uogólnione na większe zbiorowości osób i przeniesione na inne warunki społeczne czy polityczne.
|
Uwrażliwiający wpływ warunków badania. Problem zmniejszenia trafności zewnętrznej powstaje wówczas, kiedy warunki eksperymentu lub sytuacja eksperymentalna nie odzwierciedlają rzeczywistych warunków czy sytuacji, na które badacz chciałby uogólnić swoje wyniki. Kiedy badanie jest realizowane w sztucznych warunkach czy w wymyślonej sytuacji (np. laboratoryjnej), to cechy tej sytuacji mogą wpłynąć na sposób reagowania osób badanych. Dla przykładu przypomnijmy tu głośne badanie Muzafera Sherifa, którego celem było zbadanie, w jaki sposób normy grupowe - wskazówki, jak się zachować - wpływają na jednostkę znajdującą się w sytuacji, w której nie ma żadnych zewnętrznych punktów odniesienia.
Sherif eksperymentalnie stworzył sytuację pozbawioną zewnętrznych punktów odniesienia, wykorzystując w tym celu efekt autokinetyczny, powstający wówczas, gdy w całkowicie ciemnym pokoju pojawia się promień światła. Z powodu braku zewnętrznych punktów odniesienia promień światła wydaje się chaotycznie przesuwać z miejsca na miejsce. Sherif stwierdził, że na relacje uczestników dotyczące ruchów światła wpływały odpowiedzi udzielane przez innych członków grupy. Można jednakże sądzić, że sytuacja eksperymentalna, w której osoby badane znajdują się w ciemnym pokoju i udzielają odpowiedzi na temat promieni świetlnych, nie przypomina codziennych sytuacji społecznych. Dlatego też otrzymane wyniki mogą być po prostu specyficzne jedynie dla tej sztucznej sytuacji.
Wiele innych czynników związanych z warunkami badania może oddziaływać uwrażliwiająco i wpływać na trafność zewnętrzną badania. Pomiar początkowy może na przykład wpływać na sposób, w jaki jednostka reaguje na bodźce eksperymentalne. Efekt tego oddziaływania będzie zatem specyficzny dla populacji, która została poddana pomiarowi początkowemu. Postawy czy zachowanie eksperymentatora mogą wpływać na sposób, w jaki reaguje osoba badana ze względu na to, że osoby badane starają się reagować tak, jak oczekuje eksperymentator. Jest to szczególnie ważne w badaniach sondażowych, w których należy neutralnie formułować pytania, aby uniknąć sugerowania odpowiedzi (por. rozdział 11).
■ Rodzaje planów badawczych
Plany badawcze można sklasyfikować w zależności od tego, w jakim zakresie spełniają one wymienione dotąd kryteria. Niektóre z planów pozwalają badaczom na manipulowanie zmiennymi, jednak nie umożliwiają stosowania metod kontroli czy zastosowania adekwatnych metod doboru grup. Inne plany z kolei zawierają grupę kontrolną, jednak nie pozwalają badaczowi na kontrolowanie zabiegu manipulowania zmienną niezależną. Biorąc to pod uwagę, możemy wyróżnić cztery podstawę rodzaje planów badawczych: eksperymentalny, quasi-eksperymentalny, przekrojowy i preeksperymentalny. W planach eksperymentalnych osoby czy inne badane obiekty są losowo przyporządkowywane do grupy eksperymentalnej i grupy kontrolnej, a zmienna niezależna oddziałuje jedynie w grupie eksperymentalnej. Plany te umożliwiają porównywanie, kontrolowanie, manipulowanie i zazwyczaj uogólnianie. Plany quasi-eksperymentalne i przekrojowe mają kilka - choć nie wszystkie - z wymienionych cech. Najczęściej plany te nie spełniają wymogu manipulacji i randomizacji. Plany preeksperymentalne zawierają jeszcze mniej zabezpieczeń niż plany quasi-eksperymentalne oraz przekrojowe i w tym sensie są najmniej wiarygodne w procesie stwierdzania zależności przyczynowo-skutkowych między dwiema lub więcej zmiennymi. W rozdziale tym prezentujemy najczęściej stosowane plany eksperymentalne. Plany preeksperymentalne, quasi-eksperymentalne oraz przekrojowe przedstawimy w rozdziale 6.
Eksperyment kontrolowany
Klasyczny plan eksperymentalny przedstawiony w tabeli 5.1 jest jednym z najsilniejszych modeli logicznych pozwalających na dokonywanie wnioskowania o charakterze przyczynowo-skutkowym. Plan ten pozwala przeprowadzić pomiar początkowy, pomiar końcowy oraz porównać grupę kontrolną z grupą eksperymentalną. Umożliwia też manipulowanie zmienną niezależną i - w konsekwencji - określenie następstwa czasowego. Co więcej, dzięki wykorzystywaniu grup, które zostały losowo dobrane, plan ten umożliwia kontrolowanie większości źródeł trafności j wewnętrznej. Trafność zewnętrzna tego planu jest jednak mała i nie pozwala badaczom na uogólnianie zebranych wyników na inne - niż badana - populacje. W tym względzie lepsze są dwie odmiany planu klasycznego: czterogrupowy plan i Solomona i plan z grupą kontrolną i tylko pomiarem końcowym.
Czterogrupowy plan Solomona
Pomiar początkowy przeprowadzany w warunkach eksperymentalnych ma zarówno swoje zalety, jak i wady. Mimo że pomiar początkowy stwarza podstawy i do oceny sekwencji czasowych, i dokonania operacji porównywania, to uwrażliwiający efekt jego działania jest niebagatelny. Uwrażliwiając wylosowaną zbiorowość, pomiar początkowy może bowiem wpłynąć na pomiar końcowy. I tak na przykład dokonanie pomiaru postaw społecznych w stosunku do polityki rządu, zanim zostanie' ona wdrożona, może - w porównaniu z grupą bez pomiaru początkowego - wpłynąć uwrażliwiająco na zachowania osób badanych w pomiarze końcowym. Jest to możliwe dlatego, że pomiar początkowy może spowodować, iż osoby badane zaczną się zastanawiać i analizować możliwe konsekwencje wdrożenia tej polityki. Co więcej, w wielu wypadkach przeprowadzenie pomiaru początkowego może się okazać nierealne. Tak się dzieje na przykład w szkolnictwie, gdzie bardzo często przeprowadza się eksperymenty dotyczące nowych metod nauczania. W takiej sytuacji pomiar początkowy nie jest oczywiście możliwy.
Czterogrupowy plan Solomona ma takie same cechy jak plan klasyczny oraz dodatkowo wprowadza grupę eksperymentalną i grupę kontrolną bez pomiaru początkowego. Dlatego też poprzez porównanie ze sobą dwóch grup eksperymentalnych (02 i 05) oraz dwóch grup kontrolnych (04 i 06) pozwala na bezpośredni pomiar uwrażliwiającego efektu testowania. Dzięki przeprowadzeniu takich porównań możemy ocenić, czy zmienna X oddziałuje inaczej w grupach, w których nie przeprowadzono uwrażliwiającego pomiaru początkowego. Jeżeli się okaże, że zmienna niezależna wywiera wpływ na zmienną zależną również wtedy, kiedy nie dokonano pomiaru początkowego, to otrzymane wyniki można uogólniać na populację, w której przed zadziałaniem zmiennej X nie dokonano wcześniejszego pomiaru. Według Campbella i Stanleya:
nie tylko zwiększa on możliwość uogólniania wyników, ale również pozwala ocenić efekt oddziaływania zmiennej X na cztery różne sposoby: 02>04 , O5 > 06, i 01 > O3. Występujący realnie brak stałości warunków postępowania eksperymentalnego sprawia, że otrzymanie zgodnych wyników tych porównań gwarantuje większą pewność naszego wnioskowania.
Przykład: „Wyprzedawanie Pentagonu". Ciekawego przykładu zastosowania planu czterogrupowego dostarczają badania dotyczące wpływu programów telewizyjnych na politykę. We wczesnych latach sześćdziesiątych większość specjalistów z dziedziny nauk politycznych była mocno przywiązana do teorii, zgodnie z którą telewizja i inne mass media wywierają minimalny wpływ i generalnie są spostrzegane jako środki nie mające większego znaczenia. Stanowisko to zaczęło się zmieniać pod koniec dekady, kiedy w trakcie wojny w Wietnamie i demonstracji studenckich dziennikarstwo telewizyjne znalazło się w centrum zainteresowania opinii publicznej. W swoich badaniach Robinson poszukiwał związku pomiędzy programami informacyjnymi produkowanymi przez duże sieci telewizyjne a polityką. Postawił on, między innymi, takie pytania: Czy wiadomości telewizyjne wpływają na etos prowadzonej przez państwo polityki? Czy podsycają one postawę cynizmu i uczucie bezradności? Czy mają wpływ na wybory?
Robinson wykorzystał czterogrupowy plan Solomona, aby sprawdzić, jaki wpływ wywarł wyprodukowany przez sieć CBS film dokumentalny The Selling of the Pentagon („Wyprzedawanie Pentagonu") na opinie ludzi dotyczące wojska, administracji i mediów. (W rzeczywistości Robinson przeprowadził dwa zestawy eksperymentów - w pierwszym badał efekty oddziaływania programu telewizyjnego, w drugim zaś analizował oddziaływanie komentarza przedstawionego na końcu programu. Tu przedstawimy jedynie badania z pierwszej grupy).
Aby sprawdzić efekt oddziaływania programu telewizyjnego, wykorzystano plan badawczy z dwiema grupami eksperymentalnymi i dwiema grupami kontrolnymi. Pomiar początkowy przeprowadzono w stosunku do niektórych (nie wszystkich) uczestników badania. W grupach eksperymentalnych dokonano pomiaru końcowego natychmiast po zakończeniu emisji filmu. W grupach kontrolnych natomiast, tuż przed emisją przeprowadzono badanie wstępne. Kolejne badanie przeprowadzono we wszystkich grupach dwa miesiące później. Pomiar początkowy i pomiar końcowy polegały na wypełnieniu kwestionariusza dotyczącego opinii i stopnia zaufania w stosunku do: instytucji społecznych i politycznych, urzędników państwowych, osób prywatnych i organizacji skupiających media. Kwestionariusz zastosowany w drugim badaniu dotyczył tych samych tematów, był jednak nieco krótszy.
Analiza wyników tego eksperymentu pozwala lepiej zrozumieć praktyczną stronę badań społecznych. Robinson wybrał początkowo plan Solomona, ponieważ zapewnia on skuteczny sposób kontrolowania wszystkich potencjalnych czynników, które mogłyby być źródłem alternatywnych wyjaśnień otrzymanych wyników. Wprowadzenie grupy eksperymentalnej oraz grupy kontrolnej bez pomiaru początkowego stworzyło jednak wiele problemów. Okazało się, że osoby z grupy B i grupy D, które nie przeszły przez etap pomiaru początkowego, zdecydowanie mniej chętnie zgadzały się na udział w badaniach kwestionariuszowych w porównaniu z osobami, które już wypełniały ten kwestionariusz. Spowodowało to tak dużą utratę osób badanych w tych dwóch grupach, że w analizie wyników badacze mogli wykorzystać jedynie grupy z pomiarem początkowym.
Uzyskane wyniki potwierdziły, że film dokumentalny The Selling of the Pentagon zmienił opinie ludzi o funkcjonowaniu amerykańskiego wojska na mniej pozytywne. Osoby z grup eksperymentalnych spostrzegały wojsko jako chętniej angażujące się w sprawy polityczne i chętniej poszukujące określonych korzyści politycznych, niż były skłonne wcześniej przypuszczać. W grupie kontrolnej natomiast nie odnotowano istotnych zmian w żadnej ze spraw. Wywołana eksperymentalnie zmiana opinii jest tu bardzo ważna, ponieważ zmieniła ona postawy osób badanych na „mniej lojalne", tj. spowodowała, iż uznały one, że polityka rządu jest zła.
Plan badawczy z grupą kontrolną i tylko pomiarem końcowym (posttestem)
Chociaż czterogrupowy plan Solomona jest mocnym planem eksperymentalnym, to jego stosowanie okazuje się często niepraktyczne i zbyt kosztowne. Może się też okazać, że wymagany w nim pomiar początkowy działa uwrażliwiająco. Plan badawczy z grupą kontrolną i tylko z pomiarem końcowym jest odmianą zarówno planu klasycznego, jak i planu Solomona. W planie tym w ogóle rezygnuje się z pomiaru początkowego. Osoby badane zostają losowo przyporządkowane zarówno do grupy eksperymentalnej, jak i do kontrolnej, a pomiaru dokonuje się w trakcie lub po zakończeniu oddziaływania zmiennej niezależnej.
Przypuśćmy, że przeprowadzając badanie dotyczące wpływu pogadanek oświatowych na zmianę postaw ludzi wobec wirusa AIDS, badacz losowo przyporządkowuje osoby badane do dwóch grup. Jedna grupa bierze udział w czterogodzinnej prelekcji na temat AIDS. Następnie w obu grupach przeprowadza się wywiad i porównuje uzyskane odpowiedzi. Przedmiotem porównania są postawy dotyczące bezpiecznego seksu w grupie eksperymentalnej i kontrolnej. Jeżeli różnica między postawami okaże się istotna, to można przyjąć, że pogadanka wpłynęła na zmianę postaw. Dzięki temu, że osoby badane zostały losowo przyporządkowane do grup badawczych, badacz może wyprowadzać wnioski dotyczące porządku czasowego. Procedura ta eliminuje bowiem wszelkie początkowe różnice pomiędzy grupami, co pozwala na wyciągnięcie wniosku, że przyczyną zaobserwowanej różnicy postaw jest wysłuchana prelekcja.
Plan z grupą kontrolną i pomiarem końcowym umożliwia kontrolowanie wszystkich źródeł braku trafności związanych z planem badawczym. Ponieważ pomiar początkowy tu nie występuje, dlatego też testowanie i instrumentacja nie mogą wpływać na obniżenie trafności planu. Pozostałe czynniki związane z planem (wewnętrzne) są w pełni kontrolowane, ponieważ na obie grupy wpływają takie same zdarzenia zewnętrzne i obie podlegają takiemu samemu procesowi dojrzewania. Ponadto czynnik selekcji, który jest zewnętrzny w stosunku do planu badawczego - dzięki losowemu przyporządkowaniu osób badanych do grup badawczych - także podlega tu kontroli, co przeciwdziała powstawaniu początkowych różnic między grupami.
Plany eksperymentalne umożliwiające badanie skutków rozciągniętych w czasie
We wszystkich schematach eksperymentalnych, które opisaliśmy do tej pory, efekt oddziaływania zmiennej niezależnej na zmienną zależną można było zarejestrować natychmiast lub krótko po zakończeniu badania. Czasami jednak efekt ten może się pojawiać znacznie później i może być rozciągnięty w czasie. Szczególnie wyraźnie uwidacznia się to w badaniach dotyczących polityki i w badaniach, w których zmienną zależną są postawy.
Załóżmy, że chcielibyśmy zbadać, jak płeć i rasa wpływają na proces integracji w szkołach i wpływ tego procesu na zjawisko rasizmu i seksizmu wśród uczniów. Jest mało prawdopodobne, aby efekt wprowadzonego w szkole programu integracji ujawnił się natychmiast i dlatego rejestrowanie ewentualnych zmian postaw musi zostać rozciągnięte w czasie. W podobnej sytuacji znajdziemy się również wówczas, kiedy będziemy chcieli zbadać, jaki wpływ może wywrzeć ograniczenie prawa do aborcji na prawybory kandydatów. W tym wypadku badacz będzie zainteresowany sprawdzeniem i określeniem warunków, w jakich ludzie zmieniają swoje zachowania wyborcze w odpowiedzi na bardziej restryktywną politykę dotyczącą aborcji. Zmian tych jednakże nie można oczekiwać natychmiast, zatem oszacowanie zmian w sposobie głosowania będzie możliwe znacznie później.
Jednym z rozwiązań problemu opóźnionego efektu badania może być wprowadzenie dodatkowych sesji pomiaru końcowego, np. po sześciu miesiącach lub po roku. Kiedy badanie jest przeprowadzane na przykład w szkole, wprowadzenie dodatkowych sesji pomiaru końcowego jest wygodnym rozwiązaniem, zwłaszcza że dzieci chodzą do szkoły i zebranie ich nie nastręcza żadnych kłopotów. Jednakże - o czym pisali Campbell i Stanley - trzeba pamiętać, że:
przeprowadzanie kolejnych pomiarów końcowych przez badacza sprawia, że powtarzanie pomiarów u tych samych osób może, analogicznie jak pomiar początkowy, wpływać zakłócająco na trafność planu. Dlatego też lepszym rozwiązaniem jest tworzenie zestawów grup eksperymentalnych i kontrolnych dla każdego kolejnego pomiaru końcowego oddalonego w czasie.
Taką sama metodę podwajania grupy eksperymentalnej można również zastosować i w innych planach badawczych.
Plany czynnikowe
We wszystkich planach badawczych, które omówiliśmy dotychczas, występowała tylko jedna zmienna niezależna (postępowanie eksperymentalne), która oddziaływała w grupie eksperymentalniej i nie oddziaływała w grupie kontrolnej. Zmienną niezależną była na przykład pogadanka oświatowa, film czy polityka społeczna i w każdym z tych przykładów badano efekt oddziaływania tylko jednej zmiennej. Czasami jednak badacze mogą uzyskać więcej informacji, badając efekt jednoczesnego oddziaływania dwóch lub więcej zmiennych niezależnych. Z badań nad funkcjonowaniem instytucji wynika, że wielkość instytucji jest powiązana z morale jej pracowników. Duże instytucje mają tendencję do stawiania swoich pracowników w sytuacjach stresowych i wpływają na obniżanie morale. Chociaż wielkość instytucji jest ważnym czynnikiem wpływającym na morale jej pracowników, to jednak badacz nie może analizować jej niezależnie od innych zmiennych związanych z funkcjonowaniem instytucji. Duże instytucje mogą się różnić strukturą - niektóre minimalizują negatywny efekt wielkości poprzez wprowadzanie decentralizacji.
Badanie efektu więcej niż jednej zmiennej niezależnej wymaga dużej liczby grup eksperymentalnych i wprowadzenia planu czynnikowego. Przypuśćmy, że zmiennymi niezależnymi będą dla nas wielkość instytucji i stopień decentralizacji, a morale pracowników będzie zmienną zależną. Jeżeli każda ze zmiennych niezależnych będzie przyjmować jedynie dwie wartości (zmienne dychotomiczne), to do zbadania wszystkich kombinacji wartości tych zmiennych potrzebne będą cztery grupy eksperymentalne.
Możliwe są następujące kombinacje: (1) instytucja duża i wysoka decentralizacja, (2) instytucja mata i wysoka decentralizacja, (3) instytucja duża i niska decentralizacja oraz (4) instytucja mała i niska decentralizacja. W wypadku tego problemu można zastosować każdy z planów omówionych wcześniej.
Trafność zewnętrzna planów czynnikowych. Podstawową zaletą korzystania z planów czynnikowych jest możliwość rozszerzenia zakresu generalizowania wyników. Zamiast „kontrolowania wszystkiego", jak to było w planach jednozmiennowych, badacz może wprowadzić dodatkowe, istotne z punktu widzenia badania, zmienne. Każda z nich może mieć dwie lub więcej wartości. Dzięki temu badacz, uogólniając wyniki badań, nie jest ograniczony tylko do jednego, stałego poziomu każdej z tych zmiennych. Badacz może wyprowadzać wnioski o tym, że badany efekt (morale) wystąpi na wszystkich poziomach danej zmiennej lub że efekt ten jest różny na różnych poziomach tej czy innej zmiennej. Duże, wysoko zdecentralizowane firmy mogą kształtować morale pracowników w podobny sposób, jak czynią to małe firmy o niskim stopniu decentralizacji. Decentralizacja może się w sposób istotny przyczyniać do poprawy morale pracowników w dużych firmach, jednak bywa, że nie przynosi żadnych efektów w firmach małych. Plany czynnikowe zwiększają trafność zewnętrzną eksperymentów, albowiem - jak stwierdził Ronald A. Fisher:
Każdy wniosek [...] ma mocniejsze podstawy indukcyjne, jeżeli został wyprowadzony na podstawie eksperymentu, w którym użyto zróżnicowanej liczby składników niż w eksperymencie, w którym składniki te są utrzymywane na stałym poziomie. Dokładna standaryzacja warunków badania, która często jest nierozważnie zalecana jako panaceum, zawsze ma wadę polegającą na tym, że wysoko standaryzowany eksperyment pozwala na wyciąganie bezpośrednich wniosków tylko w stosunku do wąskiego zakresu warunków określonych w procesie standaryzacji. Dlatego też standaryzacja osłabia raczej, niż wzmacnia podstawy naszego wnioskowania o występowaniu podobnych rezultatów wtedy, kiedy - zazwyczaj w praktyce - warunki są nieco bardziej zróżnicowane.
Efekty interakcji w planach czynnikowych. Zaletą planów czynnikowych jest możliwość dokonywania systematycznych ocen interakcji dwóch (lub więcej) zmiennych niezależnych. Zmienne pozostają ze sobą w interakcji, jeżeli wpływ jednej zmiennej niezależnej na zmienną zależną zależy od wartości drugiej zmiennej niezależnej.
Jeżeli duże instytucje przyczyniają się do niskiego morale jej pracowników jedynie w przypadku instytucji o niskim stopniu decentralizacji, to możemy przyjąć, że wielkość organizacji i decentralizacja wchodzą ze sobą w interakcję. I na odwrót, jeżeli się okaże, że im większa wielkość organizacji, tym mniejsze jest morale jej członków - bez względu na to, czy organizacja jest mniej lub bardziej zdecentralizowana - to wpływ wielkości organizacji na morale nie zależy od decentralizacji i te dwie zmienne nie wchodzą ze sobą w interakcję. Testowanie stopnia interakcji pozwala znacznie lepiej zrozumieć, jak zmienna niezależna wpływa na zmienną zależną. Dzięki temu możemy wyraźniej formułować wnioski o wpływie jednej zmiennej na drugą, ponieważ badamy jednoczesne działanie dwóch zmiennych niezależnych.
Podsumowanie
1. Plan badawczy to program sterujący badaczem w procesie zbierania, analizowania i interpretowania wyników. Umożliwia on wyciąganie wniosków przyczynowo-skutkowych i określa zakres możliwych generalizacji.
2. Klasyczny plan badawczy zakłada cztery operacje: porównywanie, manipulowanie, kontrolowanie i uogólnianie. Porównywanie to operacja pozwalająca badaczowi zademonstrować, że zmienna niezależna i zmienna zależna są ze sobą powiązane.
Manipulowanie związane jest z określonymi formami kontroli dotyczącymi zainicjowania działania zmiennej niezależnej, co pozwala badaczowi na określenie czasowego uporządkowania zmiennych. Operacja kontrolowania pozwala badaczowi na wyeliminowanie innych czynników, które mogłyby dostarczyć podstaw alternatywnego wyjaśnienia związku stwierdzonego pomiędzy zmienną niezależną i zmienną zależną. Czwarta operacja, uogólnianie, pozwala na uogólnienie zebranych wyników na rzeczywiste warunki lub populacje, które są przez badacza analizowane.
3. Proces kontrolowania jest związany z trafnością wewnętrzną planu eksperymentalnego. Aby zapewnić trafność wewnętrzną, badacz musi wyeliminować konkurencyjne wyjaśnienia przyczyn zmian wartości zmiennej zależnej. Czynniki zakłócające trafność wewnętrzną mogą mieć charakter wewnętrzny lub zewnętrzny w stosunku do operacji eksperymentalnej. Czynniki zewnętrzne nazywane są czynnikami selekcji. Powodują stronniczość wynikającą z niejednakowej rekrutacji osób badanych do grupy eksperymentalnej i grupy kontrolnej. Czynniki związane z planem eksperymentalnym (wewnętrzne) to: historia, dojrzewanie, utrata osób badanych, instrumentacja, testowanie, zjawisko artefaktu regresji i czynniki, które wchodzą w interakcję z czynnikiem selekcji spowodowanym różnym przyporządkowaniem osób badanych do grupy eksperymentalnej i grupy kontrolnej.
4. Aby przeciwdziałać efektom działania czynników zewnętrznych w stosunku do planu, stosuje się dwie metody kontroli. Dobór wiązany pozwala badaczom na kontrolowanie zmiennych, które są im znane przed rozpoczęciem operacji badawczej, a randomizacja umożliwia wyrównanie efektów działania zarówno czynników przewidywalnych, jak i nieprzewidywalnych. Czynniki zewnętrzne w stosunku do planu są kontrolowane przez wprowadzenie grupy kontrolnej.
5. Uogólnianie jest związane z problemem trafności zewnętrznej planu eksperymentalnego. Dotyczy ono zakresu, w jakim wyniki badań można przenosić na większe populacje i inne warunki.
6. Plany badań eksperymentalnych są najsilniejszymi modelami logicznego wnioskowania, ponieważ umożliwiają manipulowanie zmiennymi niezależnymi i stwarzają warunki maksymalnego kontrolowania czynników zewnętrznych i wewnętrznych w stosunku do planu. Dwie odmiany planu klasycznego to: czterogrupowy plan Solomona i plan z grupą kontrolną i tylko z pomiarem końcowym. Inne plany pozwalają na badanie skutków rozciągniętych w czasie, a plany czynnikowe umożliwiają badaczom analizowanie skutków więcej niż jednej zmiennej niezależnej. Korzyści planów czynnikowych wynikają stąd, że zwiększają one trafność zewnętrzną badania i pozwalają badaczowi na ocenę interakcji pomiędzy zmiennymi niezależnymi.