Wprowadzenie do metod badań społecznych
Wprowadzenie do metod badań społecznych
WYKŁAD 5
DOBÓR PRÓBY
Definicja:
Próba jest to część populacji.
Próbę pobiera się w celu:
• minimalizacji kosztów badania
• oszczędności czasowych
• ponieważ zrobienie badania
wyczerpującego (np. spis powszechny)
jest praktycznie niemożliwe
Uściślenia terminologiczne:
• operat losowania – spis elementów
populacji
• próba założona i próba faktyczna
• parametry – wartości w populacji i
statystyki (odpowiadające im
wartości w próbie)
Podstawowe metody doboru próby:
• losowe (probabilistyczne)
• nielosowe (nieprobabilistyczne)
Definicja
Próba losowa – każda jednostka
obserwacji ma określone (znane, na
ogół
równe)
prawdopodobieństwo
znalezienia się w próbie
W ramach doboru losowego
wyróżniane są cztery metody:
• prosty dobór losowy
• dobór systematyczny
• dobór warstwowy
• dobór grupowy (clusterowy)
Próba dobierana metodą random route
również jest doborem losowym,
chociaż pogląd ten nie jest podzielany
przez wszystkich badaczy.
Podstawowym problemem w doborze
próby jest zapewnienie, aby wielkości
statystyk
(to,
co
jest
w
próbie)
odpowiadały
możliwie
dokładnie
wartościom parametrów (temu, co jest w
populacji).
W tym celu odwołujemy się do dwóch
kluczowych pojęć:
• prawa wielkich liczb
• definicji „błędy standardowego”
Prawo wielkich liczb mówi o tym, że dobierając próbę
metodą losową z populacji o jakimkolwiek rozkładzie,
uzyskujemy rozkład zbliżony do rozkładu „normalnego” – im
większa próba tym zbieżność do rozkładu normalnego jest
większa.
W praktyce daje to możliwość oszacowania przedziału, w
jakim wielkości statystyk ( np. średnia dochodów w próbie)
oscyluje wokół tego, co jest „naprawdę” (np. średnia
dochodów populacji).
Czyli uzyskujemy możliwość oszacowania wielkości „błędu”.
Podstawową jednostką „błędu” jest tzw. błąd standardowy.
Jest to średnia zmienność (wariancja) statystki wokół
wielkości parametru. Albo inaczej: jest to średnia różnica
między wielkością statystyki a wielkością parametru.
Prawidłowością empiryczną jest to, że w granicach jednego
błędu standardowego mieści się około 68% przypadków –
statystyk z próby.
Wnioskując na podstawie próby o tym, jak
jest w populacji:
• robimy
założenie,
że
wszystkie
rozpatrywane przez nas statystyki z próby
sytuują się, zgodnie z prawem wielkich
liczb, w hipotetycznym rozkładzie losowym,
który otrzymalibyśmy gdyby wylosować
próbę
(i powtórzyć badanie) n razy (1000, 100
tys., 1 mln)
• sytuują się mianowicie w granicach jednego
błędu standardowego w stosunku do
wartości parametrów, których oczywiście
nigdy nie jesteśmy w stanie ustalić
Problemy z realizacją
Im wyższy non-response tym większe
prawdopodobieństwo
błędu systematycznego, czyli że
dobór
nie jest doborem losowym.
1. Próba rezerwowa (różne warianty).
Mankamentem jest to, że
uzyskujemy w ten sposób próbę,
która może być nielosowa.
2. Wylosowanie z góry większej próby i
realizacja „do wyczerpania”.
Metody doboru nielosowego:
• próba kwotowa
• próba celowa
• próba okolicznościowa
Próba kwotowa
Definicja
Jest to próba warstwowa, w której do
poszczególnych warstw respondenci są
dobierani ( a nie losowani) przez
ankieterów.
Zalety:
• łatwość konstrukcji (trzeba mieć tylko
zagregowane rozkłady populacji)
• nie ma problemów z realizowalnością
• tania
Wady:
• może być równie dobra a nawet bardziej
reprezentatywna od próby losowej, ale
nigdy się tego nie dowiemy, bo nie można
obliczyć błędu standardowego
• trudności w przeprowadzeniu kontroli
• ankieterzy ułatwiają sobie pracę i próba
może być niereprezentacyjna