Wprowadzenie do metod badań społecznych
WYKŁAD 9
Rodzaje błędów
Definicja
Błąd to różnica między wartością
obserwowaną (wynikiem) a wartością „
prawdziwą”.
I Błędy wynikające z właściwości narzędzia
pomiaru:
1. Błędy wynikające z posługiwania się różnymi
technikami zbierania danych (kwestionariusz
F2F, ankieta pocztowa, CATI, CAPI, itp.).
2. Błędy wynikające z operacjonalizacji – błędy
pytań:
a. usytuowanie w kwestionariuszu (na
początku, na końcu, efekt kontekstu);
b. sposób konstrukcji skali (ze środkowym
punktem, bez środkowego punktu, z
uwzględnieniem „ nie wiem”);
c. pytania drażliwe (mogą oddziaływać na
wszystkie pozostałe odpowiedzi).
II Błędy powstające w trakcie badania w wyniku
interakcji między ankieterem a respondentem.
1.
„Błędy” ankietera:
a.
oddziaływanie ankietera na odpowiedzi
respondenta
(i)
poprzez obserwowalne cechy fizyczne (płeć,
wiek, rasa, status społeczny, wygląd);
(ii)
poprzez sposób prowadzenia wywiadu
(ewentualna perswazja);
(iii)
poprzez wrażenie (np. atrakcyjność).
b. motywacja ankietera do pracy;
c. kwalifikacje;
d. przekonanie o ustrukturyzowaniu poglądów
respondenta, co powoduje wybiórczość w
zadawaniu pytań i dopowiadanie sobie informacji.
III „Błędy” po stronie ankietera.
1.Wyobrażenie o instytucji
prowadzącej badania (efekt
sponsora).
2.Wyobrażenie o celu badania
(naukowe, komercyjne).
3. Kwestia anonimowości.
4. Skłonność do potakiwania.
5. Udzielanie odpowiedzi politycznie
poprawnych, społecznie
akceptowalnych.
IV Wszystkie błędy związane z
doborem i realizacją próby.
V Niektóre błędy na etapie analizowania
danych.
1.
Kwestia uwzględniania w analizach
zmiennych reprezentujących różne poziomy:
a.
poziom respondentów, poziom gmin,
poziom krajów;
b.
w badaniu panelowym – poziom obserwacji
dla każdego respondenta w kolejnych
punktach czasowych, poziom
respondentów;
c.
analizy metodologiczne nad efektem
ankietera – poziom respondentów, poziom
(cechy) ankieterów.
Jak sobie radzić z analizami, w
których są zmienne reprezentujące
różne poziomy agregacji?
Należy się w takich analizach
posługiwać
modelami
wielopoziomowymi
(Domański
i
Pokropek 2011).
Korzyści posługiwania się modelami wielopoziomowymi:
(i) Możliwość wprowadzania do rozpatrywanego modelu
cech „kontekstowych”. Gdy np. analizując połączony
zbiór danych ESS z 22 krajów chcemy ustalić, jak
poziom zamożności kraju (mierzony GDP per capita)
oddziałuje na siłę związku między poziomem
wykształcenia a zarobkami.
(ii)Możliwość
ustalenia
jaka
część
zróżnicowania
wyjaśnianego zjawiska wynika z wpływu cech
mierzonych na poziomie jednostek a jaka z wpływu
cech kontekstowych (dekompozycja wariancji).
(iii)Możliwość ustalenia, na ile zależności między
rozpatrywanymi zmiennymi (np. wykształceniem i
zarobkami) różnią się między kategoriami (np. krajami)
drugiego poziomu.
(iv)Możliwość
uniknięcia
błędów
we
wnioskowaniu
dotyczącym istotności statystycznej, o których poniżej.
Posługiwanie się bowiem klasycznymi
modelami (np. regresji liniowej) do analizy
zmiennych reprezentujących różne
poziomy powoduje:
(i) Zawyżenie
wielkości
błędów
standardowych
parametrów
(np.
współczynników
regresji),
a
więc
wysnuwanie
z
takiej
analizy
nieuprawnionego wniosku, że zależność
jest statystycznie istotna (odrzucenie
hipotezy „zerowej”);
(ii)Błędne oszacowania siły zależności
między rozpatrywanymi zmiennymi.