DOBÓR PRÓBY I SCHEMATY DOBORU PRÓBY

background image

DOBÓR PRÓBY I

SCHEMATY DOBORU

PRÓBY

background image

Organizowanie sondaży przedwyborczych na podstawie których
można przewidywać wyniki wyborów, stało się ostatnio bardzo
popularne. W trakcie kampanii roku 1992 wyniki sondaży
prowadziły do przeszacowywania prognozowanego zwycięstwa
Clintona i niedoszacowywania siły Perota. Badając sposób
organizowania sondaży, Richard Lau sformułował istotne
wnioski metodologiczne dotyczące głosowania w ogóle. Według
Laua zróżnicowanie wyników, podobnie jak błąd, jest wynikiem
zbyt małej liczebności próby, specyfiki populacji, z której się
wybiera osoby badane, niewłaściwie określonego odsetka braku
odpowiedzi, proporcji osób „niezdecydowanych” oraz tego, na
ile dni przed właściwymi wyborami przeprowadza się badania.
Jeżeli te czynniki wpływają na wyniki sondaży, to czy wpływają
również na wyniki innych badań, w których korzysta się z
określonej próby osób badanych?

background image

Badacze zbierają dane po to, aby przetestować postawione
hipotezy oraz uzyskać empiryczne podstawy wyjaśniania i
przewidywania. Mając skonstruowane narzędzie pomiarowe
pozwalające uzyskiwać odpowiednie dane z punktu widzenia
problemu badawczego, musimy zadbać o to, aby
wyprowadzane wnioski i prognozy można było uogólnić. Tylko
wówczas bowiem będą one miały wartość naukową.
Uogólnianie jest jednym z podstawowych etapów procesu
badawczego. Uogólnianie jest ważne nie tylko z punktu
widzenia testowanych hipotez, lecz również z powodu
możliwości dokonywania szerszego opisu.

background image

Zazwyczaj uogólnienia nie są oparte na danych
pochodzących ze wszystkich możliwych pomiarów, od
wszystkich respondentów czy wynikających ze wszystkich
zdarzeń zdefiniowanych w problemie badawczym. Badacze
posługują się raczej stosunkowo małą liczbą przypadków
(próbą) jako podstawą wyciągania wniosków o całej
zbiorowości (populacji). Sondaże przedwyborcze są tego
dobrym przykładem. Oparte na odpowiedziach stosunkowo
małej grupy respondentów pozwalają przewidywać, jak
głosowaliby wszyscy głosujący, gdyby wybory odbyły się
wtedy, kiedy został przeprowadzony sondaż. Na ich
podstawie można również przewidywać, jaki będzie rozkład
głosów w czasie rzeczywistych wyborów. Zarówno naukowcy
prowadzący badania w ramach nauk społecznych, jak i
osoby organizujące sondaże przedwyborcze stosują różne
kryteria przy doborze próby. To zaś wpływa na rodzaj
wniosków, jakie – na podstawie danych z próby – można
wyprowadzić o populacji.

background image

PO CO JEST POTRZEBNA PRÓBA?

U podstaw uogólnień opartych na danych empirycznych leżą
zazwyczaj wyniki cząstkowe, ponieważ zebranie danych od
wszystkich osób objętych problemem badawczym nie jest
zazwyczaj możliwe, jest niepraktyczne lub jest zdecydowanie
za drogie. Badacze mogą wyprowadzać precyzyjne wnioski
dotyczące wszystkich analizowanych obiektów (całego zbioru)
na podstawie niewielkiej liczby obiektów (podzbioru), pod
warunkiem, ze ów podzbiór jest reprezentatywny dla całego
zbioru.
Całkowity zbiór obiektów poddawanych analizie czy całkowity
zbiór danych nazywamy populacją. Natomiast podzbiór
pochodzących z populacji i będący podstawą uogólnień na
całą populację nazywamy próbą. Wartość określonej zmiennej
charakteryzującej populację – np. medianę dochodów czy
poziom formalnego wykształcenia – nazywamy parametrem;
jego odpowiednik w próbie nosi nazwę statystyki.
Podstawowym celem teorii doboru próby jest dostarczanie
metod szacowania nieznanych wartości parametrów na
podstawie – dających się łatwo obliczyć – wartości
odpowiednich statystyk.

background image

POPULAC
JA

Populacja – ujmując rzecz metodologicznie – to „zbiór
wszystkich przypadków wykazujących określone cechy”. Na
przykład, określając cechy jako „ludzie” i „mieszkańcy
Wielkiej

Brytanii”,

możemy

określić populację

jako

zbiorowość składającą się z wszystkich ludzi mieszkających w
Wielkiej Brytanii. Populację mogą stanowić wszyscy
mieszkańcy danej dzielnicy, instytucje ustawodawcze, domy
czy rejestry. To, jaka jest populacja, zależy od problemu
badawczego.

Badając

zachowania

konsumentów

w

określonym mieście, możemy zdefiniować populację jako
wszystkie gospodarstwa domowe w tym mieście. Możemy
też, jeżeli interesuje nas konkretny produkt - powiedzmy
karma dla psów - do populacji zaliczyć wszystkich tych
mieszkańców, którzy posiadają psy.

background image

Podstawowym problemem przy określaniu wartości parametru
(dla populacji) na podstawie wartości zarejestrowanej w próbie
jest zatem zdefiniowanie populacji. Jeśli politolog interesuje się
zachowaniami

wyborców

Wielkiej

Brytanii

i

chciałby

skonstruować próbę, na podstawie której będzie mógł
przewidywać wyniki głosowania, to powinien z niej wykluczyć
wszystkie osoby poniżej 18 roku życia, ponieważ nie mają one
praw wyborczych. Zdefiniowanie populacji jaki „wszystkie osoby
powyżej 18 roku życia, mieszkające w Wielkiej Brytanii” jest
jednak określeniem zbyt szerokim, ponieważ aby móc głosować,
trzeba spełniać określone wymogi prawne. Osoby, które nie
spełniają tych wymogów nie mają praw wyborczych i powinny
zostać wyłączone z populacji, z której będzie pobierana próba.
Populacja powinna zatem zostać określona w terminach:

• Obiektów, które się na nią składają

• Zakresu

• Czasu – np.

wszyscy mieszkańcy powyżej 18 roku życia, mieszkający

na stałe w danym okręgu

mieszkańcy Wielkiej Brytanii

począwszy od 1 maja 1995r

POPULACJA
cd.

background image

JEDNOSTKA DOBORU PRÓBY

Pojedynczy obiekt z populacji, z której będzie pobierana próba
(np. głosujący, gospodarstwo domowe), jest określany jako
jednostka doboru próby. Jednostki doboru próby są
zazwyczaj charakteryzowane przez cechy ilościowe, które
mają istotne znaczenie z punktu widzenia problemu
badawczego. Na przykład, jeżeli populacja definiowana jest
jako wszyscy trzecioklasiści, którzy konkretnego dnia poszli do
szkół publicznych w danym mieście, to jednostką doboru
próby będą trzecioklasiści. Trzecioklasiści mają jednak wiele
różnych cech (zmiennych), takich jak otrzymane stopnie,
nawyki, posiadane opinie czy oczekiwania. Projekt badawczy
może dotyczyć tylko jednej z tych zmiennych, np. stopni z
matematyki czy związków między kilkoma zmiennymi, np.
ilorazów inteligencji i formalnego wykształcenia rodziców.

POPULACJA
cd.

background image

Jednostką doboru próby nie zawsze musi być osoba. Może nią
być zdarzenie, uniwersytet, miasto czy naród. Rudolph J Rummel,
badając zachowanie się ludzi w trakcie konfliktów wewnętrznych
i międzynarodowych, zebrał przez 3 lata dane dotyczące
zachowania się ludzi w 22 konfliktach wewnętrznych i
międzynarodowych dla 77 różnych narodów. W badaniu tym
jednostką doboru próby były narody, ale nie wszystkie narody
zostały wybrane. Jednostki doboru próby musiały spełnić dwa
kryteria, aby mogły zostać włączone do badań:

• posiadać polityczną suwerenność przynajmniej przez 2 lata i

wyrażającą się w nawiązaniu dyplomatycznych stosunków z
innymi państwami, jak też posiadaniem Ministerstwa Spraw
zagranicznych

• liczbę ludności nie mniejszą niż 800000.

JEDNOSTKA DOBORU PRÓBY cd.

POPULACJA
cd.

background image

POPULACJE SKOŃCZONE I NIESKOŃCZONE

Populacja może być skończona lub nieskończona w zależności
od tego, czy jednostka doboru próby jest skończona lub
nieskończona.

Populacja

skończona

składa

się

z

przeliczalnej liczby jednostek, np. wszyscy zarejestrowani
wyborcy w danym mieście i w danym roku. Populacja
nieskończona
natomiast składa się z nieskończenie wielu
jednostek, jak np. nieograniczona liczba rzutów monetą.
Pobieranie próby po to, aby otrzymać informacje o określonej
właściwości konkretnej skończonej populacji nazywane jest
zazwyczaj dobrem reprezentacyjnym.

POPULACJA
cd.

background image

PODSTAWA DOBORU PRÓBY (OPERAT)

Mając zdefiniowaną populację, badacze pobierają próbę, która
ma adekwatnie reprezentować te populacje. Odpowiednie
procedury polegają na pobieraniu próby z podstawy dobory
próby
, którą tworzy pełna liczba jednostek doboru próby. W
sytuacji idealnej podstawa doboru próby, czyli operat zawiera
wszystkie jednostki składające się na daną populację. W
praktyce jednak takie listy rzadko istnieją – badacze zazwyczaj
tworzą listę zastępczą. Na przykład w dużych badaniach
obejmujących cały kraj trudno opracować listę, która
zawierałaby

spis

wszystkich

mieszkańców

Stanów

zjednoczonych. Z problemem tym regularnie stykają się nawet
duże instytucje badawcze, takie jak Urząd Statystyczny, który
co 10 lat podaje dane na temat wielkości populacji.
W badaniach prowadzonych na mniejszą skalę operat doboru
próby może zostać opracowany na podstawie książki
telefonicznej, spisu mieszkańców danego miasta czy list
członków organizacji państwowych lub prywatnych.

POPULACJA
cd.

background image

Pomiędzy podstawą pomiaru próby a rzeczywistą populacją
powinien istnieć bardzo wysoki stopień odpowiedniości. To, czy
próba okaże się właściwa, zależy głównie i przede wszystkim od
podstawy doboru próby. I rzeczywiście, każdy aspekt schematu
doboru próby – populacja, etapy doboru i zastosowana
procedura selekcji – jest powiązany z podstawą losowania.
Zanim badacz pobierze próbę, najpierw musi ocenić jakość
podstawy doboru próby. Leslie Kish przedstawił liste typowych
problemów związanych z tworzeniem podstawy doboru próby.
Lista ta obejmuje problemy takie, jak: niepełna podstawa
doboru próby, grupowanie elementów oraz problem tzw.
elementów pustych znajdujących się poza badaną populacją.

PODSTAWA DOBORU PRÓBY (OPERAT) cd.

POPULACJA
cd.

background image

NIEPEŁNA PODSTAWA DOBORU PRÓBY

Problem niepełnej podstawy doboru próby pojawia się wtedy,
kiedy nie wszystkie jednostki doboru próby, z których składa
się populacja, znalazły się na liście. Na przykład, jeżeli
populacja składa się z wszystkich nowych mieszkańców
danego miasta, to podstawa doboru próby oparta na liście
właścicieli posiadłości w tym mieście stworzy niepełną
podstawę doboru próby. Znajdą się bowiem na niej wszyscy
nowi mieszkańcy, którzy kupili domy ale nie znajdą się na niej
ci nowi mieszkańcy, którzy wynajmują domy lub mieszkania.
Kiedy podstawa doboru próby jest niepełna to jednym z
rozwiązań może być stosowanie listy dodatkowej. Można, np.,
stworzyć listę wszystkich osób które od niedawna wynajmują
mieszkania, posługując się spisem mieszkańców, jeśli ten spis
zawiera informacje identyfikujące nowych mieszkańców.

POPULACJA
cd.

background image

GRUPOWANIE ELEMENTÓW

Drugim potencjalnym problemem związanym z podstawy
doboru próby jest grupowanie elementów. Problem ten
pojawia się wtedy, kiedy jednostki doboru próby tworzą
raczej grupy niż mają charakter indywidualny. Podstawa
doboru próby może się np. składać z bloków mieszkalnych,
podczas badanie dotyczy osób. Jednym z możliwych
rozwiązań tego problemu może być stworzenie najpierw
próby z bloków, a potem stworzenie listy wszystkich
mieszkańców w każdym z wybranych bloków. Następnie z
każdego mieszkania wybiera się jedną osobę (w wielu
mieszkaniach mieszka bowiem więcej osób) zgodnie z
przyjętymi wcześniej kryteriami, takimi jak osoby powyżej 18
roku życia czy wyłącznie głowy rodziny.

POPULACJA
cd.

background image

PUSTE ELEMENTY SPOZA POPULACJI

Problem pustych elementów spoza populacji jest dość
powszechny. Pojawia się on wtedy, kiedy niektóre z jednostek
doboru próby, które znalazły się na liście tworzącej podstawę
doboru próby, nie należą do populacji będącej przedmiotem
badania. Z takim przypadkiem mamy do czynienia np. wtedy,
gdy populacja zostaje zdefiniowana jako osoby posiadające
prawa wyborcze, natomiast w podstawie doboru próby
znajdują się osoby, które są zbyt młode aby głosować.
Problem ten powstaje również wtedy, gdy korzysta się z
nieaktualnych list. Może się tak zdarzyć, gdy korzystamy ze
spisów mieszkańców danego miasta, a spis ten zawiera
jedynie adresy, a nie nazwiska mieszkańców. Brak nazwisk
nie oznacza jednak, że pod danym adresem nikt nie mieszka.
Mieszkańcy mogli się niedawno wprowadzić i jeszcze nie
zostali wprowadzeni na taką listę. Takie przypadki należy
traktować jako puste i po prostu nie uwzględniać ich w
próbie. Dobrze jest pobrać nieco większą próbę, aby później
móc zastąpić takie przypadki.

POPULACJA
cd.

background image

SCHEMATY DOBORU
PRÓBY

Problem związany z pobieraniem próby pojawia się wtedy,
kiedy

badacze

chcą

skonstruować

próbę

reprezentatywną. Podstawowym wymogiem stawianym
wobec każdej próby jest to, aby była ona w maksymalnym
stopniu reprezentatywna w stosunku do populacji, z której
została pobrana. Dana próba jest uważana za próbę
reprezentatywna wtedy, gdy wyprowadzane przez badacza
wnioski na podstawie badania próby są podobne do
wniosków, które badacz otrzymałby, gdyby przebadał całą
populację.

background image

DOBÓR LOSOWY I NIELOSOWY

We współczesnej teorii doboru próby wprowadza się
rozróżnienie na dobór losowy i dobór nielosowy. Istotą doboru
losowego
jest to, że dla każdej jednostki doboru próby
wchodzącej

w

skład

populacji

możemy

określić

prawdopodobieństwo, z jakim jednostka ta może znaleźć się w
próbie. W najprostszym przypadku wszystkie jednostki mają
jednakowe prawdopodobieństwo znalezienia się w próbie. W
przypadku doboru nielosowego nie ma możliwości
określenia

prawdopodobieństwa

włączenia

określonego

elementu do próby i nie ma gwarancji, że każdy element może
zostać włączony do próby z równym prawdopodobieństwem.
Jeżeli jakiś zbiór elementów nie ma żadnej szansy na to aby
znaleźć się w próbie, to należałoby zawęzić definicję populacji.
Oznacza to, że cechy tego zbioru elementów pozostaną
nieznane i nie będzie można poznać dokładnej charakterystyki
populacji.

SCHEMATY DOBORU
PRÓBY cd.

background image

Dobry projekt doboru próby pozwala przyjąć, że badania
przeprowadzone na różnych problemach pobranych z tej samej
populacji będą dawały rezultaty nieróżniące się od parametrów
populacyjnych o więcej niż określoną wartość. Losowe
schematy doboru próby pozwalają badaczom określić zakres, w
jakim wyniki otrzymane na podstawie badania próby będą się
różniły od wyników otrzymanych w sytuacji, w której badano
by całą populację. Posługując się losowym schematem doboru
próby, można oszacować parametry populacyjne na podstawie
statystyk obliczanych z próby.
Chociaż parametry populacyjne można oszacować jedynie na
podstawie prób losowych, w naukach społecznych często
korzysta się z prób nielosowych. Wpływa na to, z jednej strony,
wygoda, z drugiej – czynniki ekonomiczne. W niektórych
przypadkach (np. badania eksploracyjne) mogą one przeważyć
nad korzyściami wynikającymi ze stosowania prób losowych. W
naukach społecznych korzysta się z prób nielosowych również
wtedy, kiedy trudno jest precyzyjnie zdefiniować populację lub
kiedy nie da się stworzyć listy elementów składających się na
populację. Nie da się np. stworzyć listy osób nałogowo
zażywających

narkotyki

czy

listy

osób

nielegalnie

mieszkających w Stanach Zjednoczonych.

DOBÓR LOSOWY I NIELOSOWY cd.

SCHEMATY DOBORU
PRÓBY cd.

background image

NIELOSOWE SCHEMATY DOBORU PRÓBY
W naukach społecznych zazwyczaj wykorzystuje się 3 rodzaje
prób, które zostały pobrane w sposób nielosowy. Są to: próba
okolicznościowa, próba celowa i próba kwotowa.

PRÓBA OKOLICZNOŚCIOWA
To próba, którą tworzą osoby łatwo dostępne. Profesorowie
college’u mogą wybrać studentów ze swojej grupy; badacz
może wybrać pierwsze 200 osób, które spotka na ulicy i które
wyrażą zgodę na przeprowadzenie wywiadu. Nie ma żadnej
możliwości określenia stopnia reprezentatywności próby
okolicznościowej i dlatego na jej podstawie nie można
oszacować parametrów populacyjnych.

PRÓBA CELOWA
Do próby celowej (określanej też jako próba ekspercka)
badacze dobierają osoby w sposób subiektywny, starając się
otrzymać próbę, która wydaje się reprezentować populację.
Szansa zakwalifikowania określonej osoby do próby zależy od
subiektywnej oceny badacza. Ponieważ najczęściej trudno jest
określić, dlaczego badacze kwalifikują niektóre osoby jako
należące do próby, dlatego trudno jest w przypadku każdej
osoby określić jej prawdopodobieństwo zakwalifikowania się do
próby.

SCHEMATY DOBORU
PRÓBY cd.

background image

PRÓBA KWOTOWA

Podstawowym celem tworzenia próby kwotowej jest uzyskanie
maksymalnego podobieństwa do populacji wyjściowej. Jeżeli
wiadomo, że populacja składa się w równej części z mężczyzn i
kobiet, to należy wybrać do próby taką samą liczbę kobiet i
mężczyzn. W doborze kwotowym dobiera się osoby badane ze
względu na takie parametry, jak: płeć, wiek, miejsce zamieszkania
czy pochodzenie etniczne, kierując się rozkładem tych zmiennych
w populacji. Dysproporcje między próbą i populacją mogą się
pojawić w stosunku do tych wszystkich zmiennych, które nie
zostały w kwotach zdefiniowanych przez badacza. W przypadku
próby kwotowej, podobnie jak w przypadku innych prób opartych
na doborze nielosowym, nie możemy dokładnie oszacować
parametrów populacyjnych na podstawie danych otrzymanych z
badania próby.

SCHEMATY DOBORU
PRÓBY cd.

background image

LOSOWE SCHEMATY DOBORU PRÓBY

Dobór losowy – w przeciwieństwie do doboru nielosowego –
pozwala na określenie prawdopodobieństwa, z jakim każdy
element populacji może zostać włączony do próby. Metody
doboru losowego dzielą się na 4 rodzaje: losowanie
indywidualne

nieograniczone,

losowanie

indywidualne

systematyczne, losowanie warstwowe i losowanie grupowe.

background image

LOSOWANIE INDYWIDUALNE NIEOGRANICZONE

Jest podstawowym sposobem doboru probabilistycznego i
elementem

wszystkich

bardziej

złożonych

losowych

schematów doboru próby. W losowaniu indywidualnym
nieograniczonym każdy z elementów składających się na całą
populację ma takie same, niezerowe prawdopodobieństwo
dostania się do próby. Na przykład prawdopodobieństwo
wyrzucenie orła lub reszki w trakcie rzutu idealną moneta jest
jednakowe i znane, a każdy kolejny wynik jest niezależny od
wyników poprzednich. Aby skonstruować próbę losową,
naukowcy najczęściej posługują się specjalnymi programami
komputerowymi lub tablicami liczb losowych. Przy tej metodzie
doboru próby decyzja o wybraniu określonego elementu ma
charakter losowy, tj. niezależny od tego, jakie elementy zostały
wcześniej wybrane. Stosując te procedurę konstrukcji próby,
eliminujemy wszelką systematyczność w jej doborze i możemy
oszacować wartość parametrów, które będą reprezentować
rzeczywiste wartości w ogólnej populacji.
Procedura

doboru

losowego

gwarantuje,

że

prawdopodobieństwo włączenia każdego elementu populacji
do próby będzie jednakowe.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE SYSTEMATYCZNE

Polega na wybieraniu każdego K elementu z populacji,
począwszy od pierwszego elementu, który zostaje wybrany w
sposób losowy. Jeżeli chcemy pobrać próbę składającą się ze 100
osób pochodzącą z populacji składającej się z 10000 osób, to
będziemy wybierać co setną osobę. Pierwszy element
wybieramy w sposób losowy, np. korzystając z tablic liczb
losowych.
Losowanie systematyczne jest wygodniejsze niż losowanie
indywidualne nieograniczone. W sytuacji, gdy badacz bez
doświadczenia w stosowaniu różnych technik pobierania próby
ma skonstruować próbę, łatwiej mu będzie wybierać co K
element, niż korzystać z tablic liczb losowych. Próby
systematyczne jest także łatwiej pobierać wtedy, gdy populacja
jest bardzo duża, lub wtedy, gdy pobrana próba ma być bardzo
liczna.
W losowaniu systematycznym każdy element populacji może
zostać wylosowany do próby z prawdopodobieństwem 1/K. w
losowaniu tym może się jednak pojawić cykliczne wahanie
(określony wzorzec) danych, przypadające co każde K
elementów. Zjawisko to może być przyczyną pobrania próby
stronniczej.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE WARSTWOWE

Badacze posługują się próbą warstwową przede wszystkim po
to, aby mieć pewność, że różne grupy składające się na
populacje są właściwie reprezentowane w próbie. Zwiększa to
poziom dokładności przy oszacowywaniu wartości parametrów.
Co więcej, posiadając wszystkie cechy poprzednich technik,
losowanie warstwowe jest zdecydowanie korzystniejsze ze
względów ekonomicznych. Istotą losowania warstwowego jest
tworzenie zbiorów homogenicznych grup wyodrębnionych ze
względu na badane zmienne. Dokonując losowania z każdej
grupy oddzielnie, otrzymujemy zbiór homogenicznych prób,
które połączone razem tworzą próbę, bardziej heterogenicznej
populacji. Zabieg ten zwiększa poziom dokładności oszacowań
parametrów.
Warunkiem

koniecznym

przy

dzieleniu

populacji

na

homogeniczne warstwy jest to, że kryterium podziału musi
pozostawać w związku z badanymi zmiennymi. Ponadto
zastosowane kryteria podziału nie powinny prowadzić do
pobrania zbyt wielu prób. Całkowita wielkość próby otrzymanej
poprzez losowanie warstwowe nie powinna bowiem przewyższać
wielkości próby, którą uzyskalibyśmy przy zastosowaniu
losowania indywidualnego nieograniczonego.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

Losowanie wewnątrz każdej warstwy może być dokonywane w
sposób proporcjonalny lub nieproporcjonalny. Jeżeli z każdej
warstwy wylosujemy jednakową liczbę elementów lub stałą ich
frakcję (n/N), to taka próba nazywa się proporcjonalną próbą
warstwową. Wielkość próby pobranej z każdej warstwy (n) jest
bowiem proporcjonalna do wielkości warstwy w populacji (N).
jeżeli jednak całkowite liczebności poszczególnych warstw nie
są sobie równe, to otrzymamy nieproporcjonalną próbę
warstwową. Zazwyczaj nieproporcjonalna próba warstwowa
jest wykorzystywania do porównywania dwóch lub więcej
konkretnych warstw lub do poszerzonej analizy jednej warstwy.
Posługiwanie się nieproporcjonalną próbą warstwową wymaga
ważenia oszacowanych parametrów populacji ze względu na
liczbę osób wpadających do każdej warstwy.

LOSOWANIE WARSTWOWE cd.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE GRUPOWE

Czwartym rodzajem pobierania grupy losowej w naukach
społecznych jest losowanie grupowe. Najczęściej stosuje się je
w badaniach prowadzonych na dużą skalę, ponieważ jest to
najmniej kosztowny schemat pobierania próby. Losowanie
grupowe polega na wcześniejszym określeniu dużych
zbiorowości zwanych grupami i następnie losowaniu określonej
liczby

grup

za

pomocą

losowania

indywidualnego

nieograniczonego lub losowania warstwowego. W zależności od
problemu badawczego do próby można włączyć wszystkie
elementy z danej grupy lub wybrać określoną ich liczbę,
stosując losowanie indywidualne nieograniczone lub losowanie
warstwowe.
Wybór grup zależy od celu badania i dostępnych informacji.
Grupami mogą być gospodarstwa domowe, kwartały, szkoły,
okręgi czy miasta.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWY DOBÓR PRÓB:

PODSUMOWANIE

Opisane cztery metody losowego doboru próby to
podstawowe schematy losowania stosowane w naukach
społecznych. Nie wyczerpują one oczywiście wszystkich
możliwych procedur losowania.

background image

WIELKOŚĆ PRÓBY

Próbą jest każdy podzbiór pochodzący z populacji. Podzbiorem
jest każdy układ elementów należących do populacji, które nie
obejmuje wszystkich elementów definiowanych jako populacja.
Proba może zawierać tylko jeden element, wszystkie elementy
z wyjątkiem jednego, czy jakąkolwiek inną ich liczbę.
Istnieje wiele nieporozumień co do tego, jak duża powinna być
próba. Jednym z nich jest np. pogląd, że próba musi stanowić
określoną proporcję populacji; innym, że powinna liczyć 2000
elementów; jeszcze innym, że wraz ze zwiększaniem wielkości
próby rośnie precyzja wnioskowania na podstawie danych z
próby. Przekonania te są fałszywe, ponieważ nie wynikają z
teorii pobierania próby. Aby właściwie oszacować wielkość
próby, należy ustalić oczekiwany poziom dokładności
oszacowań, tzn. określić wielkość akceptowanego błędu
standardowego.

background image

BŁĄD STANDARDOWY

Pojęcie błędu standardowego jest głównym pojęciem teorii
pobierania próby i odgrywa zasadniczą rolę w określaniu
wielkości próby. Jest to jedna z miar statystycznych wskazująca,
na ile dokładnie wyniki otrzymane na podstawie badania próby
odzwierciedlają rzeczywiste wartości parametrów w populacji.
Jeż4eli nieskończenie wiele razy pobierać będziemy próbę, to
każda wybrana zostanie więcej niż jeden raz. Możemy zatem
sporządzić wykres rozkładu wszystkich średnich obliczonych z
próby. Rozkład wartości średnich z próby obliczonych dla
nieskończonej liczby prób nazywa się rozkładem z próby
średnich
.
Można zatem założyć, że wartość średnia obliczona z
nieskończenie wielu prób rowna się średniej w populacji. Im
bardziej wartości średniej z próby odchylają się od średniej
populacyjnej, tym większe staje się zróżnicowanie wyników
uzyskanych z każdej próby. Tym większe również staje się
ryzyko popełnienia dużego błędu przy oszacowaniu wartości
parametru w populacji na podstawie wyników jednej próby lub
ograniczonej liczby prób.

WIELKOŚĆ PRÓBY
cd.

background image

BŁĄD STANDARDOWY cd.

W rzeczywistości wartość średnia w populacji nie jest znana, a
badacz pobiera tylko jedną próbę po to, aby oszacować wartość
parametrów populacji. Rozkład wartości otrzymanych w jednej
próbie jest traktowany jako wskaźnik całego rozkładu z próby.
Miarą rozproszenia wartości w jednej próbie jest odchylenie
standardowe s. Rozkład wszystkich wartości średnich wokół
średniej tych wartości nazywamy błędem standardowym (SE).
Możemy obliczyć odchylenie standardowe i następnie
oszacować wartość SE. Nie można obliczyć wartości SE
bezpośrednio, ponieważ nie można pobrać nieskończenie wielu
prób potrzebnych dla tych obliczeń. Możemy natomiast przyjąć,
że rozproszenie wartości zmiennej w ramach pojedynczej,
losowo pobranej próby reprezentatywnej odzwierciedla
rozproszenie tych wartości w ramach populacji.

WIELKOŚĆ PRÓBY
cd.

background image

PRZEDZIAŁY UFNOŚCI
Jeżeli rozkład z próby średnich jest normalny lub bliski rozkładowi
normalnemu, to aby oszacować położenie średniej w populacji,
możemy się odwołać do własności rozkładu normalnego.
Gdybyśmy znali średnią wszystkich średnich z próby (średnią w
populacji) i odchylenie standardowe średnich z próby
(standardowy błąd średniej), to moglibyśmy obliczyć wartość
wyniku Z i określić, jaki procent wartości średnich z próby może
się pojawić w określonym przedziale wyników. W przedziale
pomiędzy -1Z i +1Z możemy oczekiwać 68% wartości średnich z
próby; pomiędzy -1,96Z a +1,96Z około 95%, a pomiędzy -2,58 a
+2,58 około 99% wartości średnich z próby. Ponieważ jednak nie
znamy średniej w populacji, musimy ją oszacować na podstawie
pojedynczej próby.
W

tym

celu

można

się

posłużyć

krzywa

normalną.

Prawdopodobieństwo, że wszystkie średnie z próby będą się
różniły od średniej populacyjnej o mniej niż ±1,96Z wynosi 95,5%.
Nie wiemy jednak, czy średnia z próby jest mniejsza czy większa
od prawdziwej średniej w populacji. Jeżeli jednak skonstruujemy
przedział od -1,96Z do +1,96Z wokół średniej z próby, to możemy
być pewni, że 95,5% populacji wpada do tego przedziału.
Oznacza to, ze prawdopodobieństwo popełnienia błędu
polegającego na przyjęciu, że średnia populacyjna nie wpada do
tego przedziału, wynosi około 5%.

WIELKOŚĆ PRÓBY
cd.

background image

OKREŚLANIE WIELKOŚCI PRÓBY

Jeżeli przy podejmowaniu decyzji o wielkości próby koszty i inne
czynniki natury praktycznej nie mają znaczenia, to określenie
wymaganej wielkości próby nie jest trudne.
Aby obliczyć wielkość próby, musimy mieć jakieś wyobrażenie o
wielkości odchylenia standardowego w populacji i należy
zdecydować, jak duży standardowy błąd pomiaru możemy
tolerować.
Jeżeli wielkość próby okaże się zbyt duża w stosunku do
populacji, to należy wprowadzić poprawkę dla populacji
nieskończenie dużych.
W praktyce decyzje dotyczące wielkości próby są bardziej
złożone. Badacze muszą przede wszystkim zdecydować, jak
precyzyjne wyniki chcieliby otrzymać, tj. muszą podjąć decyzję o
akceptowalnej wielkości standardowego błędu pomiaru. Po
drugie, muszą określić sposób analizy otrzymanych danych. Po
trzecie, jeżeli badacze analizują jednocześnie więcej niż jedną
zmienną, to powinni się upewnić, czy próba, która jest
wystarczająca dla jednej zmiennej, będzie również wystarczająca
dla innej zmiennej.

WIELKOŚĆ PRÓBY
cd.

background image

BŁĘDY NIELOSOWE

W teorii losowego doboru próby rozważa się błędy wynikające z
procedury losowania. Stosując idealny plan losowania,
minimalizujemy ten rodzaj błędu. Jest to błąd wyznaczający
różnicę między tym, czego się spodziewamy, a tym, co
otrzymujemy, stosując określony zbiór procedur. Jeżeli nawet
błąd losowy zostaje zminimalizowany, to nadal istnieje wiele
innych źródeł błędu. W badaniach sondażowych najbardziej
dominującym błędem jest błąd wynikający z braku
odpowiedzi
. Nieudzielenie odpowiedzi prowadzi do braku
danych i jest zazwyczaj spowodowane odmową odpowiedzi,
nieobecnością czy przeoczeniem określonych kategorii. Brak
odpowiedzi może w istotny sposób obciążać otrzymane wyniki.
Ogólnie rzecz biorąc, przyczyny zniekształcenia wyników mogą
być następujące:
1. im większa proporcja osób nie udzielających odpowiedzi, tym

większy będzie popełniany błąd.

2. Istotność błędu wynikającego z braku odpowiedzi zależy od

zakresu, w jakim średnia populacyjna obliczona w próbie dla
warstwy osób nie udzielających odpowiedzi różni się od
średniej obliczanej dla warstwy osób odpowiadających

background image

3. Każdy z wymienionych niżej powodów nieudzielenia

odpowiedzi w inny sposób spływa na otrzymane wyniki

•Brak możliwości przeprowadzenia wywiadu: ludzie chorzy,

niepiśmienni czy posiadający bariery językowe

•Nieodnalezieni respondenci – osoby, które się przeprowadziły

i nie są dostępne

•Nieobecni w domu – osoby nieobecne w domu w momencie

przeprowadzania wywiadu, lecz dostępne kiedy indziej. Ich
wyniki są dodawane w późniejszym terminie

•Odmowa odpowiedzi – osoby, które odmawiają współpracy

lub

udzielenia

odpowiedzi

na

wszystkie

pytania

kwestionariusza

Proporcja osób nie udzielających odpowiedzi zależy od takich
czynników, jak: rodzaj populacji, metoda zbierania danych,
rodzaj zadawanych pytań, umiejętności ankietera i liczba
ponawianych kontaktów z respondentem. Źle zaprojektowany
i/lub źle przeprowadzony wywiad może dawać wysoką
proporcję nie udzielonych odpowiedzi.

BŁĘDY
NIELOSOWE
cd.

background image

PODSUMOWANIE

1. aby otrzymać dokładne oszacowania parametrów,

badacz musi skutecznie rozwiązać trzy problemy:

• zdefiniować populację

• pobrać próbę reprezentatywną

• określić wielkość próby

2. Populacja powinna zostać zdefiniowana w terminach

treści, zakresu i czasu. Próbą jest każdy podzbiór
jednostek, z których składa się populacja. Próba może
zawierać od jednego elementu do wszystkich
elementów z wyjątkiem jednego lub składać się z
dowolnej liczby elementów z tego zakresu.

3. Po zdefiniowaniu populacji i określeniu wielkości próby

należy wybrać taki schemat doboru próby, który
gwarantuje

jej

reprezentatywność.

Próba

jest

reprezentatywna wtedy, kiedy analizy przeprowadzone
na danych z próby dają wyniki równoważne tym, jakie
otrzymano by, analizując całą populację. Badacze
korzystają z losowych schematów doboru próby
najczęściej

wtedy,

gdy

potrafią

określić

prawdopodobieństwo włączenia każdego elementu
populacji do próby.

background image

4. Określenie wielkości próby zależy bezpośrednio od wartości

standardowego błędu pomiaru i szerokości przedziału
ufności określonego przez badacza. Przedział ufności może
być skrajnie wąski, gdy badacz decyduje się na ponoszenie
wysokiego ryzyka popełnienia błędu, lub bardzo szeroki,
jeżeli chce, aby ryzyko popełnienia błędu było minimalne.

5. W badaniach sondażowych, obok błędu losowania, mamy

do czynienia z błędem spowodowanym nieudzieleniem
odpowiedzi przez respondentów. Brak odpowiedzi może
być spowodowany odmową, nieobecnością, przeoczeniem
kategorii odpowiedzi itp. Brak odpowiedzi może się
przyczyniać do popełniania istotnego błędu w trakcie
analizowania

wyników.

Jeśli

procent

udzielonych

odpowiedzi jest niski, to badacze powinni stosować którąś
ze wspomnianych technik rekompensowania.

PODSUMOWANIE cd.


Document Outline


Wyszukiwarka

Podobne podstrony:
B4 a Folia 2 schematy doboru proby
Dobór próby badawczej, pedagogika
Dobór próby
NIEPROBABILISTYCZNY DOBÓR PRÓBY
21. Dobór próby w badaniach epidemiologicznych-reprezentatywność próby
Wykład 5 DOBÓR PRÓBY
Dobor proby
BM Stobiecka dobór próby
Ćwiczenia 6 dobór próby
PROJEKTOWANIE BADAN zadania DOBOR PROBY 03 2012
dobór próby
Dobór próby badawczej, pedagogika
dobor proby
Wykład 5 DOBÓR PRÓBY
10 Dobor proby
Dobór próby badania marketingowe
6 Dobór wentylatora +schemat po tencjalny

więcej podobnych podstron