Metodologia z elementami
logiki
dr Krzysztof Krejtz
dr Izabela Krejtz
Kilka kwestii
organizacyjnych
• Wykład kończy się egzaminem, 35
pytań,
• 18 zalicza
– Wiedza jest kumulatywna …
– dobrze więc chodzić na wykłady i
– nie spóźniać się i
– nie wychodzić w trakcie
– :o)
• Materiały będą dostępne w
internecie
Wymagania:
• Na egzaminie obowiązuje:
– materiał przekazany w trakcie wykładów oraz
– materiał zawarty w podręczniku.
• Uwaga: Materiały z wykładu umieszczane w sieci
SWPS nie stanowią pełnego odzwierciedlenia
treści wykładów.
• Literatura obowiązkowa:
– Shaughnessy, J.J., Zechmeister, E.B. i Zechmeister, J.S.
(2002). Metody badawcze w psychologii. Gdańsk:
Gdańskie Wydawnictwo Psychologiczne
Forma pracy
• CEL:
– praktyczne i aplikacyjne przygotowanie metodologiczne
oraz statystyczne do zaplanowania własnych badań
magisterskich.
– wykłady będą wzbogacone o odwołania do wybranych
prac magisterskich wykonanych (głównie) w SWPS.
• Odwołania do zrealizowanych prac magisterskich
służyć będą omówieniu:
– możliwych analiz danych,
– pewnych potknięć
– bardziej zaawansowanych kwestii metodologicznych i
statystycznych.
Treści programowe
• Podstawy postępowania naukowego
• Metody i procedury badawcze
• Psychologia eksperymentalna w
praktyce
• Elementy logiki
Psychologia eksperymentalna
w praktyce
• Psychofizyka poznawcza
– eksperymenty z małą liczbą
uczestników;
• Badania procesów uwagi i czasy
reakcji
• Analiza treści
– Rzetelność w badaniach archiwalnych -
pomiar zgodności sędziów
Pułapki metodologiczne i
jak sobie z nimi radzić.
Przypomnienie wiadomości z
metodologii badań i statystyki
Postawienie
problemu
Hipotezy
Operacjonalizacja
zmiennych, wskaźniki
Planowanie badania
Realizacja
badania
analiza danych
wnioski
D
laczego nawet dobrym badaczom
nie sprawdzają się trafne hipotezy?!
Depresja a opowiadanie
dowcipów
mgr Sylwia Glura
Wydział Psychologii UW
Pułapka #1: banalna hipoteza
• Ogólne pytanie badawcze:
– czy istnieje coś specyficznego w reagowaniu osób
depresyjnych na komizm dowcipów?
• Hipoteza
„Osoby depresyjne niżej oceniają komizm dowcipów
niż osoby niedepresyjne”
– Bardzo prawdopodobne, że wszystko oceniają gorzej:
siebie, świat, przyszłość (triada depresyjna Becka).
• Dlaczego inaczej miałoby być z dowcipami?
• Co jest w tym specyficznego i ciekawego?
Ciekawsza hipoteza
• Nawiązanie do koncepcji asymilacji i kontrastu
(Schwarz i Clore, 1983)
– Słynne badania nad pogodą i oceną zadowolenia z
całego życia
Można spodziewać się interakcji między dostrzeganiem
swojego stanu depresyjnego a oceną komizmu
Przewidywania
Różnica będzie wyraźna kiedy ocena komizmu dowcipów
będzie poprzedzać pomiar depresji.
Gdy pomiar depresji pierwszy, różnica zaniknie
Hipoteza asymilacji i kontrastu:
przewidywane wyniki
W grupie
depresyjnych,
Efekt kontrastu
O
ce
n
a
k
o
m
iz
m
u
0
1
2
3
4
5
depresyjni
niedepr.
dowcipy + BDI
BDI + dowcipy
Pomiar zmiennej zależnej
• W celu testowania hipotezy o
kontraście badacz przeprowadził
pilotaż i wybrał jeden najlepiej
oceniany przez wszystkich dowcip.
– Następnie badani wyselekcjonowani jako
depresyjni lub niedepresyjni (BDI < 6 lub
BDI > 9) odpowiadali, czy dowcip im się
podoba, czy też nie.
• Ponadto sprawdzano (ukryta kamera), czy
badany się uśmiechnął, czy też nie.
Pułapka #2: zmienna zależna
na skali nominalnej
• Zmienna na skali nominalnej
– Ograniczona możliwość analizy statystycznej, chi
kwadrat, testy nieparametryczne
– Niska moc statystyczna badania
– Konieczność realizacji badania na dużych próbach (N
=50 w grupie)
!!! Ale czasami jest to zmienna WAŻNA:
›
kupi – nie kupi,
›
ogląda – nie ogląda,
›
pomaga – nie pomaga,
›
oświadczy się – czy się nie oświadczy ...
Analiza przykładu z
zastosowaniem testu chi
kwadrat
wyniki
Tabela krzyżowa NASTRÓJ * POMIAR
Liczebność
15
5
20
9
11
20
24
16
40
depresyjni
niedepresyjni
NASTRÓJ
Ogółem
BDI pierwszy BDI drugi
POMIAR
Ogółem
Pułapka# 3:
za mała próba
Testy Chi-kwadrat
3,750
b
1
,053
2,604
1
,107
3,822
1
,051
,105
,053
3,656
1
,056
40
Chi-kwadrat Pearsona
Poprawka na ciągłość
a
Iloraz wiarygodności
Dokładny test Fishera
Test związku liniowego
N Ważnych obserwacji
Wartość
df
Istotność
asymptotyczn
a
(dwustronna)
Istotność
dokładna
(dwustronna)
Istotność
dokładna
(jednostr
onna)
Obliczone wyłącznie dla tabeli 2x2.
a.
,0% komórek (0) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 8,00.
b.
Podwoiliśmy liczebność
próby
Tabela krzyżowa NASTRÓJ * POMIAR
Liczebność
30
10
40
18
22
40
48
32
80
depresyjni
niedepresyjni
NASTRÓJ
Ogółem
BDI pierwszy BDI drugi
POMIAR
Ogółem
Testy Chi-kwadrat
7,500
b
1
,006
6,302
1
,012
7,644
1
,006
,012
,006
7,406
1
,006
80
Chi-kwadrat Pearsona
Poprawka na ciągłość
a
Iloraz wiarygodności
Dokładny test Fishera
Test związku liniowego
N Ważnych obserwacji
Wartość
df
Istotność
asymptotyczn
a
(dwustronna)
Istotność
dokładna
(dwustronna)
Istotność
dokładna
(jednostr
onna)
Obliczone wyłącznie dla tabeli 2x2.
a.
,0% komórek (0) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność
oczekiwana wynosi 16,00.
b.
W której grupie różnice są
istotne?
Test chi2 dla jednej zmiennej
POMIAR
30
20,0
10,0
10
20,0
-10,0
40
18
20,0
-2,0
22
20,0
2,0
40
BDI pierwszy
BDI drugi
Ogółem
BDI pierwszy
BDI drugi
Ogółem
NASTRÓJ
depresyjni
niedepresyjni
Obserwo
wane N
Oczekiwane N
Reszty
Statystyki testu
10,000
1
,002
,400
1
,527
Chi-kwadrat
a
df
Istotność asymptotyczna
Chi-kwadrat
a
df
Istotność asymptotyczna
NASTRÓJ
depresyjni
niedepresyjni
POMIAR
0 komórek (,0%) ma liczebność oczekiwaną
mniejszą od 5. Minimalna liczebność
oczekiwana w komórce wynosi 20,0.
a.
chi
2
(1, N = 40) = 10,00; p < 0,01
chi
2
(1, N=40)=0,40; n.i.
Styl APA
Styl APA zapisywania
wyników
• Styl APA (American Psychological Association) – powszechnie
przyjęty standard prezentacji raportów empirycznych zaleca, aby
wyniki testów statystycznych przedstawiane były w postaci:
– nazwa statystyki,
– stopnie swobody (w nawiasie), dla chi kwadrat podaje się często
również N
– wielkość statystyki – z zaokrągleniem do dwóch miejsc po przecinku
– poziom istotności – w przypadku wyników istotnych, zaokrąglenia w
górę do wartości p < 0,05; p < 0,01 lub p < 0,001.
• W przypadku tendencji (p poniżej 0,2) i niektórych nieistotnych wyników
podaje się dokładną wartość lub podajemy n.i. (gdy wyniki są zdecydowanie
nieistotne)
• chi
2
(1, N = 50) = 16,88; p < 0,001;
• r (98) = 0,22; p < 0,05;
• t (18)=1,86; p < 0,08;
• F (2, 36) = 1,07; n.i.
Pułapka #4: konstrukcja skal
przedziałowych typu Likerta
• Załóżmy, że badaczka prosiła badanych o ocenę
wybranego dowcipu na skali interwałowej (typu
Likerta). Dowcip ten:
Pułapka: zdefiniowanie punktu środkowego;
dlaczego nie „trudno mi powiedzieć”
Zdecydowa
nie mi się
nie podobał
Raczej mi się
nie podobał
Trochę mi
się nie
podobał,
trochę
podobał
Raczej mi
się podobał
Zdecydo
wanie mi
się
podobał
Pułapka #4: konstrukcja skal
przedziałowych typu Likerta
• Załóżmy, że badaczka prosiła badanych o ocenę
wybranego dowcipu na skali interwałowej (typu
Likerta). Dowcip ten:
Rada: połączenie obu odpowiedzi
Zdecydowa
nie mi się
nie podobał
Raczej mi
się nie
podobał
Nie
podobał
mi się
Ani tak
ani nie
Podobał
mi się
Raczej mi
się podobał
Zdecydowa
nie mi się
podobał
Pułapka #5: brak możliwości
sprawdzenia rzetelności
pomiaru
- Dlaczego?
- Pytanie pomocnicze: jak sprawdzić
rzetelność naszej wagi łazienkowej?
- Badaczka wybrała do badania sześć
dowcipów wstępnie ocenionych jako
dobre lub bardzo dobre.
Pułapka #6: udzielanie
mechanicznych odpowiedzi
Badani mogą odpowiadać
mechanicznie, w jednakowy sposób
(tzw. efekt halo)
w celu jego uniknięcia badaczka w
trzech przypadkach stosowała
odwróconą skalę
- (badani odpowiadali od „zdecydowanie
mi się podobał” do „zdecydowanie mi
się nie podobał”)
Analiza rzetelności
Pułapka #7: badaczka
zapomniała zrekodować
zmienne
Współczynnik rzetelności
• α Cronbacha (od 0 do 1) powinno
wynosić co najmniej 0.7 a najlepiej
być bliskie 0.9
– alfy 0.6 i niżej też są czasem uważane za
odpowiednie
• miara, która powinna zawsze towarzyszyć
tworzeniu nowego narzędzia.
• Oceniamy rzetelność każdej podskali
(wewnętrzną spójność)
Rekodowanie danych
wyniki
Testy efektów międzyobiektowych
Zmienna zależna: DOWCIPY
69,746
a
3
23,249
75,914
,000
991,701
1
991,701 3238,209
,000
29,201
1
29,201
95,351
,000
24,939
1
24,939
81,433
,000
15,606
1
15,606
50,957
,000
23,275
76
,306
1084,722
80
93,021
79
Źródło zmienności
Model skorygowany
Stała
NASTRÓJ
POMIAR
NASTRÓJ * POMIAR
Błąd
Ogółem
Ogółem skorygowane
Typ III sumy
kwadratów
df
Średni
kwadrat
F
Istotność
R kwadrat = ,750 (Skorygowane R kwadrat = ,740)
a.
dowcipy
NASTRÓJ
niedepresyjni
depresyjni
O
sz
ac
ow
an
e
śr
ed
ni
e
br
ze
go
w
e
4,5
4,0
3,5
3,0
2,5
2,0
1,5
POMIAR
BDI pierwszy
BDI drugi
Jeszcze ciekawsza hipoteza
• Jack Brehm (1999) – emocje jako stany
motywacyjne.
• Badani mogą być motywowani do utrzymywania
swojego stanu emocjonalnego i do
przeciwdziałania próbom zmiany stanu
emocjonalnego – do pewnego krytycznego
momentu
– W jego badaniu studenci wysłuchiwali smutnej historii,
potem dostawali niespodziewaną nagrodę w wysokości (3
grupy) 1$, 2$ lub 3$. Okazało się, że smutek był
największy w grupie z 2$!
Testowanie modelu Brehma:
rola poziomu komizmu
dowcipów
• W odrębnej grupie osób badanych
zrobiono pilotaż z użyciem serii dowcipów i
wybrano 4 zestawy ze względu na poziom
komizmu.
• W oparciu o model Brehma przewidywano
„opór” w przypadku dowcipów średnich i
dobrych, oraz przełamanie go w przypadku
świetnych dowcipów
Przykładowy układ wyników
Pułapka #8: schemat
badania
• Schemat między osobami
– 2 (depresja) x 4 (komizm). Depresyjni i
niedepresyjni podzieleni są na 4 grupy,
każda grupa ocenia dowcipy o różnym
poziomie komizmu.
– Niezwykle trudne badanie w realizacji. W
każdej z 8 celek powinno być co
najmniej 20 osób, co daje minimum 160
osób badanych
Pułapka #9: powtarzany
pomiar
• Schemat mieszany 2 (depresja – między
osobami) x 4 (komizm – wewnątrz osób).
Każda z 2 grup (po 20 osób) ocenia 4
rodzaje dowcipów
– Możliwe efekty oczekiwania lub znużenia, gdy
dowcipy są umieszczone w uporządkowanych
blokach (od najmniej dowcipnych do
najbardziej lub odwrotnie)
• Rekomendacja: Prezentowanie dowcipów
w losowej kolejności, dla każdego
badanego w innej.
wyniki
komizm dowcipów
DOWCIP
4
3
2
1
oc
en
a
do
w
ci
pó
w
4,0
3,5
3,0
2,5
2,0
NASTRÓJ
depresyjni
niedepresyjni
Testy wielu zmiennych
b
,898
222,880
a
3,000
76,000
,000
,102
222,880
a
3,000
76,000
,000
8,798
222,880
a
3,000
76,000
,000
8,798
222,880
a
3,000
76,000
,000
,497
24,988
a
3,000
76,000
,000
,503
24,988
a
3,000
76,000
,000
,986
24,988
a
3,000
76,000
,000
,986
24,988
a
3,000
76,000
,000
Ślad Pillai
Lambda Wilksa
Ślad Hotellinga
Największy
pierwiastek Roy'a
Ślad Pillai
Lambda Wilksa
Ślad Hotellinga
Największy
pierwiastek Roy'a
Efekt
DOWCIP
DOWCIP * NASTRÓJ
Wartość
F
df hipotezy df błędu
Istotność
Statystyka dokładna
a.
Plan: Intercept+NASTRÓJ
Plan wewnątrzobiektowy: DOWCIP
b.
Testy efektów międzyobiektowych
Miara: MIARA_1
Zmienna przekształcona: Średnia
2492,586
1 2492,586 14760,018
,000
1,339
1
1,339
7,929
,006
13,172
78
,169
Źródło zmienności
Intercept
NASTRÓJ
Błąd
Typ III sumy
kwadratów
df
Średni
kwadrat
F
Istotność
Pułapka 10: brak prób integracji teoretycznej obu
modeli. Czy można testować przewidywania obu
modeli jednocześnie?
Niedepresyjni Depresyjni
Schemat mieszany: 2 (kolejność – między os.) x 2
(depresja – między os.) x 4 komizm (wewnątrz os.)
Analiza wyników realnego badania:
I. Rzeczywisty układ średnich
Niedepresyjni Depresyjni
Pułapka# 10 : (nieco)
nadmierna generalizacja
wniosków w tytule
Wpływ depresji na docenianie komizmu:
dlaczego osobom depresyjnym nie
powinniśmy opowiadać przeciętnych
dowcipów?
• Tytuł sugeruje zależność przyczynową (wpływ), natomiast
zmienna niezależna (depresja) nie jest zmienną losowo
manipulowaną, lecz zmienną różnicową.
• Może być tak, że uparte niedostrzeganie zabawnych i
komicznych aspektów otaczającego świata prowadzi do
narastania nastroju depresyjnego...