Badania reprezentacyjne
Dr hab. inż. Jadwiga Stobiecka
Pojęcia związane z doborem
próby
Populacja:
generalna/badana
skończona/nieskończona
Operat losowania
Próba
Jednostka próby/jednostka losowania
Metoda doboru próby (losowa/nielosowa
)
Etapy procesu doboru próby
1. Zdefiniowanie populacji
•
Element badania
•
Jednostki populacji
•
Zakres przestrzenny
•
Zakres czasowy
2. Określenie operatu losowania
•
Jednostka losowania
•
Wykaz jednostek losowania (mapa, plan, wykaz miejscowości, rejestr, książka
telefoniczna, lista płac)
•
Właściwości (kompleksowość, adekwatność, wyłączność, dokładność,
dogodność)
3. Określenie jednostki losowania
•
Dzielnica, osiedle, ulica, blok mieszkalny
•
Rodzina, gospodarstwo domowe
•
Firma, pracownik, osoba
4. Wybór metody doboru próby
(losowa/nielosowa)
5. Określenie liczebności próby
•
Cechy mierzalne/niemierzalne
•
Populacja skończona/nieskończona
Określenie populacji
Wybór operatu losowania
Ocena typu doboru próby
Losowy
Prosty
Warstwowy
Zespołowy
Wielostopniow
y
Nielosowy
Przypadkowy
Sędziów
Kwotowy
Kuli śniegowej
Oszacowanie liczebności próby
Realizacja projektu doboru
Proces doboru próby
Dobór próby
Dobór oparty o rachunek
prawdopodobieństwa
Dobór losowy prosty
Dobór losowy systematyczny
Dobór losowy warstwowy
Dobór losowy grupowy
Dobór losowy wielostopniowy
Pozostałe dobory
Dobór systematyczny
1
26
51
76
2
27
52
77
3
28
53
78
4
29
54
79
5
30
55
80
6
31
56
81
7
32
57
82
8
33
58
83
9
34
59
84
10
35
60
85
11
36
61
86
12
37
62
87
13
38
63
88
14
39
64
89
15
40
65
90
16
41
66
91
17
42
67
92
18
43
68
93
19
44
69
94
20
45
70
95
21
46
71
96
22
47
72
97
23
48
73
98
24
49
74
99
25
50
75
100
N = 100
N = 100
N = 100
N = 100
n = 20
n = 20
n = 20
n = 20
N/n = 5
N/n = 5
N/n = 5
N/n = 5
wybór losowy liczby (1-5): 4
wybór losowy liczby (1-5): 4
wybór losowy liczby (1-5): 4
wybór losowy liczby (1-5): 4
start od #4 i dobór co 5. jednostkę
start od #4 i dobór co 5. jednostkę
start od #4 i dobór co 5. jednostkę
start od #4 i dobór co 5. jednostkę
Dobór warstwowy
Maksymalizacja wariancji
(zmienności) między warstwami i
minimalizacja wariancji wewnątrz
warstw
Wzrost reprezentatywności próby
Identyfikacja podgrup
Bardziej precyzyjna estymacja
parametru populacji (mniejsza
wariancja w warstwach)
Rodzaje doborów warstwowych
Proporcjonalny
Liczba jednostek próby w każdej warstwie jest
proporcjonalny do rozmiaru warstwy w populacji
Prawdopodobieństwo wyboru jest takie same dla
każdej warstwy
Nieproporcjonalny
Liczba jednostek próby w wybranych warstwach jest
nieproporcjonalna w stosunku do rozmiaru warstwy w
populacji
Pewne jednostki w próbie reprezentują mniejszą lub
większą liczbę jednostek w populacji
Optymalny
Występują duże różnice w wariancjach zmiennej w
poszczególnych warstwach
Liczebności warstw są różne
Występują różnice w kosztach dotarcia do
poszczególnych warstw
Dobór grupowy
Podział populacji na grupy, tak ze
zmienność wewnątrzgrupowa jest
maksymalna z międzygrupowa -
minimalna
Losowy wybór grup
Procedura:
Procedura:
Procedura:
Procedura:
Wybór warstwowy a grupowy
•Wybór próby losowej z każdej warstwy
•Całkowita wariancja zmiennej zależy
od wariancji wewnątrzwarstwowej
•Losowy wybór grup
•Całkowita wariancja zmiennej zależy
od wariancji międzygrupowej
Pierwotne jednostki losowania- PSU
Wtórne jednostki losowania- SSU
Grupa 1
Grupa 2
Grupa 3
....
Obszarowy dobór gospodarstw
domowych
Przestrzenna segmentacja gospodarstw
Błądzenie losowe (random walk)
Dobór Kisha
Etap I – opracowanie alfabetycznej listy osób
w gospodarstwie domowym
Etap II – wybór kolumny w tabeli Kisha
odpowiadającej
ostatniej cyfrze numeru
domu/mieszkania i wiersza
oznaczającego liczbę członków
gospodarstwa
Etap III – wybranie osoby na liście o numerze z
tabeli Kisha
Dobór nie oparty o rachunek
prawdopodobieństwa
1.Dobór kwotowy
2.Dobór jednostek typowych
3.Dobór przez eliminację
4.Dobór celowy
5.Dobór przypadkowy
6.”Przechwytywanie po drodze”
7. Dobór metodą „kuli śniegowej”
8. Dobór sieciowy
Dobór kwotowy
Zmienne niepowiązane ze sobą
Płeć
Mężczyźni
19
Kobiety
21
Ogółem
40
Wiek
Poniżej
35
20
Powyże
j
35
20
Ogółem
40
Miejsce
zamieszkania
Wieś
15
Miasto
25
Ogółem
40
Dobór kwotowy
Zmienne wiązane
Miejsce
zamieszka
nia
Płeć
Wiek
Raze
m
Ogółem
Poniżej 35
Powyżej
35
Wieś
Mężczyźni
2
5
7
15
Kobiety
3
5
8
Miasto
Mężczyźni
6
6
12
25
Kobiety
9
4
13
Ogółem
20
20
40
Dobór kwotowy
Podejście mieszane
Płeć
Wiek
Ogółe
m
Poniżej
35
Powyże
j 35
Mężczyźn
i
8
11
19
Kobiety
12
9
21
Ogółem
20
20
40
Miejsce
zamieszkania
Wieś
15
Miasto
25
Ogółem
40
Liczebność próby
charakterystyka podejść
Arbitralne
Zdeterminowane analizami (wymogi tabel
kontyngencji)
Zależne od budżetu
Zależne od określonego z góry poziomu
precyzji:
o
Podejście oparte na przedziałach
ufności
o
Podejście oparte na testowanie hipotez
statystycznych
Określenie liczebności próby
Statystyczne determinanty wielkości
próby
Poziom ufności
95% ufność lub 0.05 poziom istotności
Stopień precyzji (tolerancja błędu)
Dokładność w estymacji parametru w populacji
generalnej na podstawie próby
+/- $5.00
czy +/- $1.00
+/- 10% czy +/- 5%
Zmienność cechy (wariancja) w populacji
W jakim stopniu jednostki losowania różnią się
między sobą w populacji
Relacja między wielkością
próby a precyzją
S
N
S
X
=
Precyzja oszacowania parametru
Rozmiar próby
Odchylenie standardowe cechy w populacji
Na podstawie średniej z próby
Gdzie:
σ- odchylenie stand.
populacji
E- dopuszczalny błąd
Z- liczba odchyleń
standardowych związanych
z poziomem ufności
N- rozmiar populacji (pop.
duża)
Gdzie:
σ- odchylenie stand.
populacji
E- dopuszczalny błąd
Z- liczba odchyleń
standardowych związanych
z poziomem ufności
N- rozmiar populacji (pop.
duża)
Na podstawie proporcji z próby
Gdzie: π- proporcja populacji
Gdzie: π- proporcja populacji
Dane interwałowe lub stosunkowe (na dostawie
średniej z próby)
n = Z
2
2
E
2
Dla 1- = 0.95, Z
= 1,96 2
Problem: jaka powinna być liczebność próby, żeby z dokładnością
do 0,1 punktu oszacować średnią ocen na 7 punktowej skali Likerta?
-wariancja odpowiedzi przy założeniu rozkładu normalnego wynosi
41
,
0
6
1
min
max
1
2
146
01
,
0
41
,
0
2
2
n
W 95 takich próbach na 100 średnia ocena na
skali będzie wynosić X punktów 0,41, czyli
Jestem na 95% „ufny”, że średnia ocena na
skali będzie wynosić X punktów 0,41
Liczebność próby prostej
Liczebność próby prostej
Dane nominalne lub porządkowe
n = Z
2
(1 -
E
2
Dla 1- = 0.95, Z = 1,96 2
Problem: jaka powinna być liczebność próby, żeby z dokładnością do
3% oszacować frakcje respondentów dokonujących zakupu produktu?
-maksymalna wariancja zmiennej występuje w sytuacji gdy
1
05
1111
0009
,
0
1
0009
,
0
25
,
0
2
2
n
W 95 takich próbach na 100 odsetek kupujących
produkt będzie X% 3%, czyli
Jestem na 95% „ufny”, że odsetek kupujących
będzie wynosić X% 3%
Zasady
100 jednostek losowania w każdej podgrupie głównej i
20-50 jednostek podgrupie o mniejszej wadze
Przykład
Tabela kontyngencji
Wiek: 5 kategorii
Intencja zakupu: - 5-punktowa skala Likerta
Wielkość próby: 5 x 5 = 25 x 100 = 2500
respondentów
Segmentacja: wielkość próby ogólnokrajowej z
licznymi podgrupami wynosi 2500 +
Wielkość próby a analiza podgrup