Proces doboru próby
Pojęcia podstawowe:
Badana populacja - (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje. Przykłady: populacja gosp. Domowych w woj. Pomorskim, populacja kobiet w wieku 35-50 lat w Gdańsk, populacja studentów PG, populacja przedsiębiorstw o pewnych rodzaju działalności na terenie Polski.
Badania pełne (wyczerpujące) - wszystkie jednostki badanej populacji poddaje się pomiarowi
Badania częściowe (niewyczerpujące, próbkowe) - część jednostek badanej populacji poddaje się pomiarowi. Część jednostek nosi nazwę próby np. 300 studentów PG.
Dominują badania próbkowe.
Etapy procesu doboru próby
Zdefiniowanie badanej populacji.
Sporządzenie wykazu badanej populacji (zbiorowości generalnej)
Określenie liczebności próby.
Wybór metody doboru próby.
Pobranie próby.
Zdefiniowanie badanej populacji - trzeba określić badaną populację za pomocą:
Jednostkę badania (kto lub co jest przedmiotem badania np. jednostka badania mężczyźni w wieku 18-35 lat)
Zakres czasowy populacji tzn. podajemy moment lub przedział czasu, którego dotyczy populacja np. stan populacji na 31 grudnia 2009 r.
Zakres przestrzenny populacji - zazwyczaj obszar geograficzny, którego dotyczy populacja np. województwo Pomorskie
Wynika z problemu badawczego i decyzji, której ma służyć informacja wynikająca z badania.
Sporządzenie wykazu badanej populacji (zbiorowości generalnej) - zbiór wszystkich jednostek populacji, który zostanie użyty w badaniu. Zazwyczaj korzysta się z pewnych rejestrów lub spisów, które już gdzieś występują np. PESEL, GUS, wykazy przedsiębiorstw
Operat losowania (doboru próby) - kompletny wykaz jednostek populacji, którym to jednostkom przypisano określone symbole identyfikacyjne najczęściej liczby w celu doboru próby
Określenie liczebności próby - wyznacza się na podstawie kilku sposobów:
Wg eksperta - w zależności od rodzaju badania wyznaczamy liczebność próby na podstawie opinii eksperta. Ekspert na podstawie wiedzy historycznej nam dobiera tę próbę.
Wg minimalnej liczebności komórki - metoda analizy danych nam to narzuca
Np. komórki
Tabela 1
X Y |
Y1 |
Y2 |
Y3 |
X1 |
a |
b |
c |
X2 |
d |
e |
f |
A,b,c,d,e,f - liczba jednostek przyjmujących odpowiednio kategorie xi oraz yj (i=1,2; j=1,2,3)
Przeciętnie 30 jednostek/komórkę
Wg budżetu
tyle ile mamy pieniędzy. Tej metody nie można stosować jako jedynej.
Wg założonego dopuszczalnego błędu - założony dopuszczalny błąd determinuje liczebność próby. Dotyczy doboru losowego. Wzór można stosować w specyficznych sytuacjach.
Przy wyznaczaniu wartości średniej populacji
gdzie:
n - minimalna liczebność próby
σ- odchylenie standardowe cechy w populacji (np. z pilotażu)
uα - wartość zmiennej losowej o rozkladzie normalnym standaryzowanym odczytana tak, aby P {- uα <u< uα} (np. 1-α =0,95 to uα = 1,96)
E - założony maksymalny błąd, tzn, maksymalna dopuszczalna różnica między wartością średnią populacji μ a wartością średnią próby
Przedział ufności
P= {
- uα
< μ <
+ uα
< }= 1- α
- E < μ <
+ E
E = uα *
=>
Im błąd będzie mniejszy tym liczebność próby będzie rosła.
Liczebność próby zależy od
Przy wyznaczaniu proporcji populacji π
n - minimalna liczebność próby
uα - wartość zmiennej losowej o rozkładzie normalnym standaryzowanym odczytana tak, aby P { - uα <u< uα } (np. 1-α=0,95 to uα = 1,96)
π - proporcja populacji (np. z pilotażu)
E - założony dopuszczalny błąd, tzn. maksymalna dopuszczalna różnica między proporcją populacji pi a proporcją próby p.
Wybór metody doboru próby.
Metody nielosowe:
Dobór przypadkowy - do próby dobieramy jednostki przypadkowo tzn. nielosowo, gdyż w odpowiednim czasie znalazły się one w miejscu. Którym gromadzono dane np. ktoś stoi w centrum handlowym i wyłapuje ludzi, tak samo w barze, na ulicy…
Dobór celowy - badacz na podstawie wiedzy o jednostkach badanej populacji wskazuje te jednostki, które wejdą do próby np. dobór miasta do prawyborów (jak wyglądała historia głosowania tzn. wyniki były zbliżone do wyników w całym kraju)
Dobór kwotowy - najczęściej wykorzystywany przez firmy badawcze. Istota: struktura próby ma być zgodna ze strukturą populacji ze względu na ważne dla nas cechy.
Przebieg doboru kwotowego:
Określenie cech ze względu, na które kontrolujemy strukturę próby tzw. Cechy kontrolne, może być jedna
Określamy/wyznaczamy strukturę populacji ze względu na cechy kontrolne. (Często wykorzystuje się tu dane wtórne.)
Na podstawie liczebności próby i jej struktury, ze względu na cechy kontrolne, wyznaczamy tzw. kwoty jednostek tworzące próbę
Kwota - liczba jednostek zapewniająca zgodność struktury próby ze strukturą populacji ze względu na cechy kontrolne
Dobór jednostek w zakresie kwot wg uznania, bądź pewnego klucza. Np. Dobór próby 400-elementowej z pośród studentów PG. Płeć: 30% kobiet, 70% czyli kwota kobiet = 0,3 * 400 =120 kobiet i kwota mężczyzn = 0,7 * 400 = 280 mężczyzn bierzemy
Dobór: 120 studentek PG i 280 studentów PG
Ze względu na cechy kontrolne próba jest reprezentatywna
Dobór metoda kuli śnieżnej - stosujemy, gdy trudno jest nam znaleźć jednostki
Szuka się pewnej grupy jednostek znajdujemy 10 jednostek, a mieliśmy 300, prosimy, żeby wskazały nam 3 kolejne, to mamy 30 osób, kolejne proszę o wskazanie 4 osób, to mamy 120 osób itd.
Metody losowe:
Warunki:
każda jednostka badanej populacji ma dodatnia znane prawdopodobieństwo dostania się do próby (każdy ma szanse)
dla każdego zespołu tworzonego z jednostek populacji można określić prawdopodobieństwo tego, że w całości znajdzie się on w próbie
Żeby spełnić powyższe warunki stosuje się operat losowania.
Na podstawie doborów losowych znane są naukowe metody przenoszenia wyników próby na badaną populacje (tzw. wnioskowanie statystyczne) przy nielosowych takiego nie ma.
Losowanie indywidualne proste - dobieramy do próby pojedyncze jednostki bezpośrednio z operatu losowania przy czym każda jednostka ma jednakowe prawdopodobieństwo znalezienia się w próbie.
Losowanie systematyczne -
Wyznaczamy interwał losowania τ
τ =
, gdzie N - liczebność populacji; n - liczebność próby
Z pierwszego interwału losujemy jedną jednostkę (tzn. z interwału <1, τ >) np. o numerze k
Numery jednostek wg operatu losowania wchodzące do próby:
k; k+ τ, k+2 τ;…; k + τ (n - 1)
Losowanie warstwowe - stosujemy, gdy populacja jest zróżnicowana ze względu na ważne dla nas cechy i można w niej wyróżnić jednorodne grupy jednostek ze względu na te cechy tzw. Warstwy. Następnie z każdej warstwy losujemy odpowiednią liczbę jednostek
Losowanie zespołowe - stosujemy, gdy wykazy danych populacji są duże i w tej badanej populacji można wyróżnić zespoły jednostek, które są wewnętrznie zróżnicowane a zewnętrznie nie różnią się ze względu na ważne dla nas cechy. Następnie do próby losujemy całe zespoły z operatu tych zespołów.
2 po losowaniu równa się 2 przed losowaniem
próba
Losowanie proste
Populacja
W
, s
n
μ
μ, σ
losowanie
n1
Osoby w młodym wieku
próba
Osoby w średnim wieku
n2
losowanie
losowanie
n3
Osoby w starym wieku
n
5
2
próba
losowanie
losowanie
losowanie
populacja
1
2
3
n
5
4