background image

DOBÓR PRÓBY I 

SCHEMATY DOBORU 

PRÓBY

background image

Organizowanie sondaży przedwyborczych na podstawie których 
można  przewidywać  wyniki  wyborów,  stało  się  ostatnio  bardzo 
popularne.  W  trakcie  kampanii  roku  1992  wyniki  sondaży 
prowadziły  do  przeszacowywania  prognozowanego  zwycięstwa 
Clintona  i  niedoszacowywania  siły  Perota.  Badając  sposób 
organizowania  sondaży,  Richard  Lau  sformułował  istotne 
wnioski metodologiczne dotyczące głosowania w ogóle. Według 
Laua  zróżnicowanie  wyników,  podobnie  jak  błąd,  jest  wynikiem 
zbyt  małej  liczebności  próby,  specyfiki  populacji,  z  której  się 
wybiera osoby badane, niewłaściwie określonego odsetka braku 
odpowiedzi,  proporcji  osób  „niezdecydowanych”  oraz  tego,  na 
ile  dni  przed  właściwymi  wyborami  przeprowadza  się  badania. 
Jeżeli  te czynniki wpływają  na  wyniki  sondaży,  to  czy wpływają 
również  na  wyniki  innych  badań,  w  których  korzysta  się  z 
określonej próby osób badanych?

background image

Badacze  zbierają  dane  po  to,  aby  przetestować  postawione 
hipotezy  oraz  uzyskać  empiryczne  podstawy  wyjaśniania  i 
przewidywania.  Mając  skonstruowane  narzędzie  pomiarowe 
pozwalające  uzyskiwać  odpowiednie  dane  z  punktu  widzenia 
problemu  badawczego,  musimy  zadbać  o  to,  aby 
wyprowadzane wnioski i prognozy można było uogólnić. Tylko 
wówczas bowiem będą one miały wartość naukową.
Uogólnianie  jest  jednym  z  podstawowych  etapów  procesu 
badawczego.  Uogólnianie  jest  ważne  nie  tylko  z  punktu 
widzenia  testowanych  hipotez,  lecz  również  z  powodu 
możliwości dokonywania szerszego opisu.

background image

Zazwyczaj  uogólnienia  nie  są  oparte  na  danych 
pochodzących  ze  wszystkich  możliwych  pomiarów,  od 
wszystkich  respondentów  czy  wynikających  ze  wszystkich 
zdarzeń  zdefiniowanych  w  problemie  badawczym.  Badacze 
posługują  się  raczej  stosunkowo  małą  liczbą  przypadków 
(próbą)  jako  podstawą  wyciągania  wniosków  o  całej 
zbiorowości  (populacji).  Sondaże  przedwyborcze  są  tego 
dobrym  przykładem.  Oparte  na  odpowiedziach  stosunkowo 
małej  grupy  respondentów  pozwalają  przewidywać,  jak 
głosowaliby  wszyscy  głosujący,  gdyby  wybory  odbyły  się 
wtedy,  kiedy  został  przeprowadzony  sondaż.  Na  ich 
podstawie  można  również  przewidywać,  jaki  będzie  rozkład 
głosów w czasie rzeczywistych wyborów. Zarówno naukowcy 
prowadzący  badania  w  ramach  nauk  społecznych,  jak  i 
osoby  organizujące  sondaże  przedwyborcze  stosują  różne 
kryteria  przy  doborze  próby.  To  zaś  wpływa  na  rodzaj 
wniosków,  jakie  –  na  podstawie  danych  z  próby  –  można 
wyprowadzić o populacji.

background image

PO CO JEST POTRZEBNA PRÓBA?

U  podstaw  uogólnień  opartych  na  danych  empirycznych  leżą 
zazwyczaj  wyniki  cząstkowe,  ponieważ  zebranie  danych  od 
wszystkich  osób  objętych  problemem  badawczym  nie  jest 
zazwyczaj  możliwe,  jest  niepraktyczne  lub  jest  zdecydowanie 
za  drogie.  Badacze  mogą  wyprowadzać  precyzyjne  wnioski 
dotyczące wszystkich analizowanych obiektów (całego zbioru) 
na  podstawie  niewielkiej  liczby  obiektów  (podzbioru),  pod 
warunkiem,  ze  ów  podzbiór  jest  reprezentatywny  dla  całego 
zbioru.
Całkowity  zbiór  obiektów  poddawanych  analizie  czy  całkowity 
zbiór  danych  nazywamy  populacją.  Natomiast  podzbiór 
pochodzących  z  populacji  i  będący  podstawą  uogólnień  na 
całą populację nazywamy próbą. Wartość określonej zmiennej 
charakteryzującej  populację  –  np.  medianę  dochodów  czy 
poziom formalnego wykształcenia – nazywamy  parametrem
jego  odpowiednik  w  próbie  nosi  nazwę  statystyki
Podstawowym  celem  teorii  doboru  próby  jest  dostarczanie 
metod  szacowania  nieznanych  wartości  parametrów  na 
podstawie  –  dających  się  łatwo  obliczyć  –  wartości 
odpowiednich statystyk.

background image

POPULAC
JA

Populacja  –  ujmując  rzecz  metodologicznie  –  to  „zbiór 
wszystkich  przypadków  wykazujących  określone  cechy”.  Na 
przykład,  określając  cechy  jako  „ludzie”  i  „mieszkańcy 
Wielkiej 

Brytanii”, 

możemy 

określić  populację 

jako 

zbiorowość składającą się z wszystkich ludzi mieszkających w 
Wielkiej  Brytanii.  Populację  mogą  stanowić  wszyscy 
mieszkańcy  danej  dzielnicy,  instytucje  ustawodawcze,  domy 
czy  rejestry.  To,  jaka  jest  populacja,  zależy  od  problemu 
badawczego. 

Badając 

zachowania 

konsumentów 

określonym  mieście,  możemy  zdefiniować  populację  jako 
wszystkie  gospodarstwa  domowe  w  tym  mieście.  Możemy 
też,  jeżeli  interesuje  nas  konkretny  produkt  -  powiedzmy 
karma  dla  psów  -  do  populacji  zaliczyć  wszystkich  tych 
mieszkańców, którzy posiadają psy.

background image

Podstawowym  problemem  przy  określaniu  wartości  parametru 
(dla  populacji)  na  podstawie  wartości  zarejestrowanej  w  próbie 
jest  zatem  zdefiniowanie  populacji.  Jeśli  politolog  interesuje  się 
zachowaniami 

wyborców 

Wielkiej 

Brytanii 

chciałby 

skonstruować  próbę,  na  podstawie  której  będzie  mógł 
przewidywać  wyniki  głosowania,  to  powinien  z  niej  wykluczyć 
wszystkie  osoby  poniżej  18  roku  życia,  ponieważ  nie  mają  one 
praw wyborczych. Zdefiniowanie populacji jaki „wszystkie osoby 
powyżej  18  roku  życia,  mieszkające  w  Wielkiej  Brytanii”  jest 
jednak określeniem zbyt szerokim, ponieważ aby móc głosować, 
trzeba  spełniać  określone  wymogi  prawne.  Osoby,  które  nie 
spełniają  tych  wymogów  nie  mają  praw  wyborczych  i  powinny 
zostać  wyłączone  z  populacji,  z  której  będzie  pobierana  próba. 
Populacja powinna zatem zostać określona w terminach:

• Obiektów, które się na nią składają

• Zakresu

• Czasu – np. 

wszyscy mieszkańcy powyżej 18 roku życia, mieszkający 

na stałe w danym okręgu

mieszkańcy Wielkiej Brytanii

począwszy od 1 maja 1995r

POPULACJA 
cd.

background image

JEDNOSTKA DOBORU PRÓBY

Pojedynczy obiekt z populacji, z której będzie pobierana próba 
(np.  głosujący,  gospodarstwo  domowe),  jest  określany  jako 
jednostka  doboru  próby.  Jednostki  doboru  próby  są 
zazwyczaj  charakteryzowane  przez  cechy  ilościowe,  które 
mają  istotne  znaczenie  z  punktu  widzenia  problemu 
badawczego.  Na  przykład,  jeżeli  populacja  definiowana  jest 
jako wszyscy trzecioklasiści, którzy konkretnego dnia poszli do 
szkół  publicznych  w  danym  mieście,  to  jednostką  doboru 
próby  będą  trzecioklasiści.  Trzecioklasiści  mają  jednak  wiele 
różnych  cech  (zmiennych),  takich  jak  otrzymane  stopnie, 
nawyki,  posiadane  opinie  czy  oczekiwania.  Projekt  badawczy 
może  dotyczyć  tylko  jednej  z  tych  zmiennych,  np.  stopni  z 
matematyki  czy  związków  między  kilkoma  zmiennymi,  np. 
ilorazów inteligencji i formalnego wykształcenia rodziców.

POPULACJA 
cd.

background image

Jednostką  doboru  próby  nie  zawsze  musi  być  osoba.  Może  nią 
być zdarzenie, uniwersytet, miasto czy naród. Rudolph J Rummel, 
badając zachowanie się ludzi w trakcie konfliktów wewnętrznych 
i  międzynarodowych,  zebrał  przez  3  lata  dane  dotyczące 
zachowania  się  ludzi  w  22  konfliktach  wewnętrznych  i 
międzynarodowych  dla  77  różnych  narodów.  W  badaniu  tym 
jednostką  doboru  próby  były  narody,  ale  nie  wszystkie  narody 
zostały  wybrane.  Jednostki  doboru  próby  musiały  spełnić  dwa 
kryteria, aby mogły zostać włączone do badań:

• posiadać  polityczną  suwerenność  przynajmniej  przez  2  lata  i 

wyrażającą  się  w  nawiązaniu  dyplomatycznych  stosunków  z 
innymi  państwami,  jak  też  posiadaniem  Ministerstwa  Spraw 
zagranicznych

• liczbę ludności nie mniejszą niż 800000.

JEDNOSTKA DOBORU PRÓBY cd.

POPULACJA 
cd.

background image

POPULACJE SKOŃCZONE I NIESKOŃCZONE

Populacja może być skończona lub nieskończona w zależności 
od  tego,  czy  jednostka  doboru  próby  jest  skończona  lub 
nieskończona. 

Populacja 

skończona 

składa 

się 

przeliczalnej  liczby  jednostek,  np.  wszyscy  zarejestrowani 
wyborcy  w  danym  mieście  i  w  danym  roku.  Populacja 
nieskończona
  natomiast  składa  się  z  nieskończenie  wielu 
jednostek,  jak  np.  nieograniczona  liczba  rzutów  monetą. 
Pobieranie próby po to, aby otrzymać informacje o określonej 
właściwości  konkretnej  skończonej  populacji  nazywane  jest 
zazwyczaj dobrem reprezentacyjnym.

POPULACJA 
cd.

background image

PODSTAWA DOBORU PRÓBY (OPERAT)

Mając zdefiniowaną populację, badacze pobierają próbę, która 
ma  adekwatnie  reprezentować  te  populacje.  Odpowiednie 
procedury  polegają  na  pobieraniu  próby  z  podstawy  dobory 
próby
,  którą  tworzy  pełna  liczba  jednostek  doboru  próby.  W 
sytuacji  idealnej  podstawa  doboru  próby,  czyli  operat  zawiera 
wszystkie  jednostki  składające  się  na  daną  populację.  W 
praktyce jednak takie listy rzadko istnieją – badacze zazwyczaj 
tworzą  listę  zastępczą.  Na  przykład  w  dużych  badaniach 
obejmujących  cały  kraj  trudno  opracować  listę,  która 
zawierałaby 

spis 

wszystkich 

mieszkańców 

Stanów 

zjednoczonych. Z problemem tym regularnie stykają się nawet 
duże  instytucje  badawcze,  takie  jak  Urząd  Statystyczny,  który 
co 10 lat podaje dane na temat wielkości populacji.
W  badaniach  prowadzonych  na  mniejszą  skalę  operat  doboru 
próby  może  zostać  opracowany  na  podstawie  książki 
telefonicznej,  spisu  mieszkańców  danego  miasta  czy  list 
członków organizacji państwowych lub prywatnych.

POPULACJA 
cd.

background image

Pomiędzy  podstawą  pomiaru  próby  a  rzeczywistą  populacją 
powinien istnieć bardzo wysoki stopień odpowiedniości. To, czy 
próba okaże się właściwa, zależy głównie i przede wszystkim od 
podstawy doboru próby. I rzeczywiście, każdy aspekt schematu 
doboru  próby  –  populacja,  etapy  doboru  i  zastosowana 
procedura  selekcji  –  jest  powiązany  z  podstawą  losowania. 
Zanim  badacz  pobierze  próbę,  najpierw  musi  ocenić  jakość 
podstawy  doboru  próby.  Leslie  Kish  przedstawił  liste  typowych 
problemów  związanych  z  tworzeniem  podstawy  doboru  próby. 
Lista  ta  obejmuje  problemy  takie,  jak:  niepełna  podstawa 
doboru  próby,  grupowanie  elementów  oraz  problem  tzw. 
elementów pustych znajdujących się poza badaną populacją.

PODSTAWA DOBORU PRÓBY (OPERAT) cd.

POPULACJA 
cd.

background image

NIEPEŁNA PODSTAWA DOBORU PRÓBY

Problem  niepełnej  podstawy  doboru  próby  pojawia  się  wtedy, 
kiedy  nie  wszystkie  jednostki  doboru  próby,  z  których  składa 
się  populacja,  znalazły  się  na  liście.  Na  przykład,  jeżeli 
populacja  składa  się  z  wszystkich  nowych  mieszkańców 
danego  miasta,  to  podstawa  doboru  próby  oparta  na  liście 
właścicieli  posiadłości  w  tym  mieście  stworzy  niepełną 
podstawę  doboru  próby.  Znajdą  się  bowiem  na  niej  wszyscy 
nowi mieszkańcy, którzy kupili domy ale nie znajdą się na niej 
ci nowi mieszkańcy, którzy wynajmują domy lub mieszkania.
Kiedy  podstawa  doboru  próby  jest  niepełna  to  jednym  z 
rozwiązań  może  być  stosowanie  listy  dodatkowej.  Można,  np., 
stworzyć  listę  wszystkich  osób  które  od  niedawna  wynajmują 
mieszkania, posługując  się spisem mieszkańców, jeśli ten spis 
zawiera informacje identyfikujące nowych mieszkańców.

POPULACJA 
cd.

background image

GRUPOWANIE ELEMENTÓW

Drugim  potencjalnym  problemem  związanym  z  podstawy 
doboru  próby  jest  grupowanie  elementów.  Problem  ten 
pojawia  się  wtedy,  kiedy  jednostki  doboru  próby  tworzą 
raczej  grupy  niż  mają  charakter  indywidualny.  Podstawa 
doboru  próby  może  się  np.  składać  z  bloków  mieszkalnych, 
podczas  badanie  dotyczy  osób.  Jednym  z  możliwych 
rozwiązań  tego  problemu  może  być  stworzenie  najpierw 
próby  z  bloków,  a  potem  stworzenie  listy  wszystkich 
mieszkańców  w  każdym  z  wybranych  bloków.  Następnie  z 
każdego  mieszkania  wybiera  się  jedną  osobę  (w  wielu 
mieszkaniach  mieszka  bowiem  więcej  osób)  zgodnie  z 
przyjętymi wcześniej kryteriami, takimi jak osoby powyżej 18 
roku życia czy wyłącznie głowy rodziny.

POPULACJA 
cd.

background image

PUSTE ELEMENTY SPOZA POPULACJI

Problem  pustych  elementów  spoza  populacji  jest  dość 
powszechny. Pojawia się on wtedy, kiedy niektóre z jednostek 
doboru próby, które znalazły się na liście tworzącej podstawę 
doboru  próby,  nie  należą  do  populacji  będącej  przedmiotem 
badania. Z takim przypadkiem mamy do czynienia np. wtedy, 
gdy  populacja  zostaje  zdefiniowana  jako  osoby  posiadające 
prawa  wyborcze,  natomiast  w  podstawie  doboru  próby 
znajdują  się  osoby,  które  są  zbyt  młode  aby  głosować. 
Problem  ten  powstaje  również  wtedy,  gdy  korzysta  się  z 
nieaktualnych  list.  Może  się  tak  zdarzyć,  gdy  korzystamy  ze 
spisów  mieszkańców  danego  miasta,  a  spis  ten  zawiera 
jedynie  adresy,  a  nie  nazwiska  mieszkańców.  Brak  nazwisk 
nie oznacza jednak, że pod danym adresem nikt nie mieszka. 
Mieszkańcy  mogli  się  niedawno  wprowadzić  i  jeszcze  nie 
zostali  wprowadzeni  na  taką  listę.  Takie  przypadki  należy 
traktować  jako  puste  i  po  prostu  nie  uwzględniać  ich  w 
próbie. Dobrze  jest pobrać  nieco  większą próbę, aby później 
móc zastąpić takie przypadki.

POPULACJA 
cd.

background image

SCHEMATY DOBORU 
PRÓBY

Problem  związany  z  pobieraniem  próby  pojawia  się  wtedy, 
kiedy 

badacze 

chcą 

skonstruować 

próbę 

reprezentatywną.  Podstawowym  wymogiem  stawianym 
wobec  każdej  próby  jest  to,  aby  była  ona  w  maksymalnym 
stopniu  reprezentatywna  w  stosunku  do  populacji,  z  której 
została  pobrana.  Dana  próba  jest  uważana  za  próbę 
reprezentatywna  wtedy,  gdy  wyprowadzane  przez  badacza 
wnioski  na  podstawie  badania  próby  są  podobne  do 
wniosków,  które  badacz  otrzymałby,  gdyby  przebadał  całą 
populację.

background image

DOBÓR LOSOWY I NIELOSOWY

We  współczesnej  teorii  doboru  próby  wprowadza  się 
rozróżnienie na dobór losowy i dobór nielosowy. Istotą doboru 
losowego
  jest  to,  że  dla  każdej  jednostki  doboru  próby 
wchodzącej 

skład 

populacji 

możemy 

określić 

prawdopodobieństwo, z jakim jednostka ta może znaleźć się w 
próbie.  W  najprostszym  przypadku  wszystkie  jednostki  mają 
jednakowe  prawdopodobieństwo  znalezienia  się  w  próbie.  W 
przypadku  doboru  nielosowego  nie  ma  możliwości 
określenia 

prawdopodobieństwa 

włączenia 

określonego 

elementu do próby i nie ma gwarancji, że każdy element może 
zostać  włączony  do  próby  z  równym  prawdopodobieństwem. 
Jeżeli  jakiś  zbiór  elementów  nie  ma  żadnej  szansy  na  to  aby 
znaleźć się w próbie, to należałoby zawęzić definicję populacji. 
Oznacza  to,  że  cechy  tego  zbioru  elementów  pozostaną 
nieznane i nie będzie można poznać dokładnej charakterystyki 
populacji.

SCHEMATY DOBORU 
PRÓBY cd.

background image

Dobry  projekt  doboru  próby  pozwala  przyjąć,  że  badania 
przeprowadzone na różnych problemach pobranych z tej samej 
populacji będą dawały rezultaty nieróżniące się od parametrów 
populacyjnych  o  więcej  niż  określoną  wartość.  Losowe 
schematy doboru próby pozwalają badaczom określić zakres, w 
jakim wyniki  otrzymane na podstawie badania próby będą się 
różniły  od  wyników  otrzymanych  w  sytuacji,  w  której  badano 
by całą populację. Posługując się losowym schematem doboru 
próby, można oszacować parametry populacyjne na podstawie 
statystyk obliczanych z próby.
Chociaż  parametry  populacyjne  można  oszacować  jedynie  na 
podstawie  prób  losowych,  w  naukach  społecznych  często 
korzysta się z prób nielosowych. Wpływa na to, z jednej strony, 
wygoda,  z  drugiej  –  czynniki  ekonomiczne.  W  niektórych 
przypadkach (np. badania eksploracyjne) mogą one przeważyć 
nad korzyściami wynikającymi ze stosowania prób losowych. W 
naukach społecznych korzysta się z  prób  nielosowych również 
wtedy, kiedy trudno jest precyzyjnie zdefiniować populację lub 
kiedy nie da się stworzyć listy elementów składających się na 
populację.  Nie  da  się  np.  stworzyć  listy  osób  nałogowo 
zażywających 

narkotyki 

czy 

listy 

osób 

nielegalnie 

mieszkających w Stanach Zjednoczonych.

DOBÓR LOSOWY I NIELOSOWY cd.

SCHEMATY DOBORU 
PRÓBY cd.

background image

NIELOSOWE SCHEMATY DOBORU PRÓBY
W  naukach  społecznych  zazwyczaj  wykorzystuje  się  3  rodzaje 
prób,  które  zostały  pobrane  w  sposób  nielosowy.  Są  to:  próba 
okolicznościowa, próba celowa i próba kwotowa. 

PRÓBA OKOLICZNOŚCIOWA
To  próba,  którą  tworzą  osoby  łatwo  dostępne.  Profesorowie 
college’u  mogą  wybrać  studentów  ze  swojej  grupy;  badacz 
może  wybrać  pierwsze  200  osób,  które  spotka  na  ulicy  i  które 
wyrażą  zgodę  na  przeprowadzenie  wywiadu.  Nie  ma  żadnej 
możliwości  określenia  stopnia  reprezentatywności  próby 
okolicznościowej  i  dlatego  na  jej  podstawie  nie  można 
oszacować parametrów populacyjnych.

PRÓBA CELOWA
Do  próby  celowej  (określanej  też  jako  próba  ekspercka) 
badacze  dobierają  osoby  w  sposób  subiektywny,  starając  się 
otrzymać  próbę,  która  wydaje  się  reprezentować  populację. 
Szansa  zakwalifikowania  określonej  osoby  do  próby  zależy  od 
subiektywnej  oceny  badacza.  Ponieważ  najczęściej  trudno  jest 
określić,  dlaczego  badacze  kwalifikują  niektóre  osoby  jako 
należące  do  próby,  dlatego  trudno  jest  w  przypadku  każdej 
osoby określić jej prawdopodobieństwo zakwalifikowania się do 
próby.

SCHEMATY DOBORU 
PRÓBY cd.

background image

PRÓBA KWOTOWA

Podstawowym  celem  tworzenia  próby  kwotowej  jest  uzyskanie 
maksymalnego  podobieństwa  do  populacji  wyjściowej.  Jeżeli 
wiadomo,  że  populacja  składa  się  w  równej  części  z  mężczyzn  i 
kobiet,  to  należy  wybrać  do  próby  taką  samą  liczbę  kobiet  i 
mężczyzn.  W  doborze  kwotowym  dobiera  się  osoby  badane  ze 
względu na takie parametry, jak: płeć, wiek, miejsce zamieszkania 
czy pochodzenie etniczne, kierując się rozkładem tych zmiennych 
w  populacji.  Dysproporcje  między  próbą  i  populacją  mogą  się 
pojawić  w  stosunku  do  tych  wszystkich  zmiennych,  które  nie 
zostały  w  kwotach  zdefiniowanych  przez  badacza.  W  przypadku 
próby kwotowej,  podobnie jak w przypadku innych prób opartych 
na  doborze  nielosowym,  nie  możemy  dokładnie  oszacować 
parametrów  populacyjnych  na  podstawie  danych  otrzymanych  z 
badania próby.

SCHEMATY DOBORU 
PRÓBY cd.

background image

LOSOWE SCHEMATY DOBORU PRÓBY

Dobór  losowy  –  w  przeciwieństwie  do  doboru  nielosowego  – 
pozwala  na  określenie  prawdopodobieństwa,  z  jakim  każdy 
element  populacji  może  zostać  włączony  do  próby.  Metody 
doboru  losowego  dzielą  się  na  4  rodzaje:  losowanie 
indywidualne 

nieograniczone, 

losowanie 

indywidualne 

systematyczne, losowanie warstwowe i losowanie grupowe.

background image

LOSOWANIE INDYWIDUALNE NIEOGRANICZONE

Jest  podstawowym  sposobem  doboru  probabilistycznego  i 
elementem 

wszystkich 

bardziej 

złożonych 

losowych 

schematów  doboru  próby.  W  losowaniu  indywidualnym 
nieograniczonym  każdy  z  elementów  składających  się  na  całą 
populację  ma  takie  same,  niezerowe  prawdopodobieństwo 
dostania  się  do  próby.  Na  przykład  prawdopodobieństwo 
wyrzucenie orła lub  reszki w trakcie rzutu idealną moneta jest 
jednakowe  i  znane,  a  każdy  kolejny  wynik  jest  niezależny  od 
wyników  poprzednich.  Aby  skonstruować  próbę  losową, 
naukowcy  najczęściej  posługują  się  specjalnymi  programami 
komputerowymi lub tablicami liczb losowych. Przy tej metodzie 
doboru  próby  decyzja  o  wybraniu  określonego  elementu  ma 
charakter losowy, tj. niezależny od tego, jakie elementy zostały 
wcześniej  wybrane.  Stosując  te  procedurę  konstrukcji  próby, 
eliminujemy wszelką systematyczność w jej doborze i możemy 
oszacować  wartość  parametrów,  które  będą  reprezentować 
rzeczywiste wartości w ogólnej populacji.
Procedura 

doboru 

losowego 

gwarantuje, 

że 

prawdopodobieństwo  włączenia  każdego  elementu  populacji 
do próby będzie jednakowe.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE SYSTEMATYCZNE

Polega  na  wybieraniu  każdego  K  elementu  z  populacji, 
począwszy  od  pierwszego  elementu,  który  zostaje  wybrany  w 
sposób losowy. Jeżeli chcemy pobrać próbę składającą się ze 100 
osób  pochodzącą  z  populacji  składającej  się  z  10000  osób,  to 
będziemy  wybierać  co  setną  osobę.  Pierwszy  element 
wybieramy  w  sposób  losowy,  np.  korzystając  z  tablic  liczb 
losowych.
Losowanie  systematyczne  jest  wygodniejsze  niż  losowanie 
indywidualne  nieograniczone.  W  sytuacji,  gdy  badacz  bez 
doświadczenia  w  stosowaniu  różnych  technik  pobierania  próby 
ma  skonstruować  próbę,  łatwiej  mu  będzie  wybierać  co  K 
element,  niż  korzystać  z  tablic  liczb  losowych.  Próby 
systematyczne jest także łatwiej pobierać wtedy, gdy populacja 
jest bardzo duża, lub wtedy, gdy pobrana próba ma być bardzo 
liczna.
W  losowaniu  systematycznym  każdy  element  populacji  może 
zostać  wylosowany  do  próby  z  prawdopodobieństwem  1/K.  w 
losowaniu  tym  może  się  jednak  pojawić  cykliczne  wahanie 
(określony  wzorzec)  danych,  przypadające  co  każde  K 
elementów.  Zjawisko  to  może  być  przyczyną  pobrania  próby 
stronniczej.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE WARSTWOWE

Badacze  posługują  się  próbą  warstwową  przede  wszystkim  po 
to,  aby  mieć  pewność,  że  różne  grupy  składające  się  na 
populacje  są  właściwie  reprezentowane  w  próbie.  Zwiększa  to 
poziom  dokładności  przy  oszacowywaniu  wartości  parametrów. 
Co  więcej,  posiadając  wszystkie  cechy  poprzednich  technik, 
losowanie  warstwowe  jest  zdecydowanie  korzystniejsze  ze 
względów  ekonomicznych.  Istotą  losowania  warstwowego  jest 
tworzenie  zbiorów  homogenicznych  grup  wyodrębnionych  ze 
względu  na  badane  zmienne.  Dokonując  losowania  z  każdej 
grupy  oddzielnie,  otrzymujemy  zbiór  homogenicznych  prób, 
które  połączone  razem  tworzą  próbę,  bardziej  heterogenicznej 
populacji.  Zabieg  ten  zwiększa  poziom  dokładności  oszacowań 
parametrów.
Warunkiem 

koniecznym 

przy 

dzieleniu 

populacji 

na 

homogeniczne  warstwy  jest  to,  że  kryterium  podziału  musi 
pozostawać  w  związku  z  badanymi  zmiennymi.  Ponadto 
zastosowane  kryteria  podziału  nie  powinny  prowadzić  do 
pobrania  zbyt  wielu  prób.  Całkowita  wielkość  próby  otrzymanej 
poprzez losowanie warstwowe nie powinna bowiem przewyższać 
wielkości  próby,  którą  uzyskalibyśmy  przy  zastosowaniu 
losowania indywidualnego nieograniczonego.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

Losowanie wewnątrz każdej warstwy może być dokonywane w 
sposób  proporcjonalny  lub  nieproporcjonalny.  Jeżeli  z  każdej 
warstwy wylosujemy jednakową liczbę elementów lub stałą ich 
frakcję  (n/N),  to  taka  próba  nazywa  się  proporcjonalną  próbą 
warstwową. Wielkość próby pobranej z każdej warstwy (n) jest 
bowiem  proporcjonalna  do  wielkości  warstwy  w  populacji  (N). 
jeżeli  jednak  całkowite  liczebności  poszczególnych  warstw  nie 
są  sobie  równe,  to  otrzymamy  nieproporcjonalną  próbę 
warstwową.  Zazwyczaj  nieproporcjonalna  próba  warstwowa 
jest  wykorzystywania  do  porównywania  dwóch  lub  więcej 
konkretnych warstw lub do poszerzonej analizy jednej warstwy. 
Posługiwanie  się  nieproporcjonalną  próbą  warstwową  wymaga 
ważenia  oszacowanych  parametrów  populacji  ze  względu  na 
liczbę osób wpadających do każdej warstwy.

LOSOWANIE WARSTWOWE cd.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWANIE GRUPOWE

Czwartym  rodzajem  pobierania  grupy  losowej  w  naukach 
społecznych  jest  losowanie  grupowe.  Najczęściej  stosuje  się  je 
w  badaniach  prowadzonych  na  dużą  skalę,  ponieważ  jest  to 
najmniej  kosztowny  schemat  pobierania  próby.  Losowanie 
grupowe  polega  na  wcześniejszym  określeniu  dużych 
zbiorowości zwanych grupami i następnie losowaniu określonej 
liczby 

grup 

za 

pomocą 

losowania 

indywidualnego 

nieograniczonego lub losowania warstwowego. W zależności od 
problemu  badawczego  do  próby  można  włączyć  wszystkie 
elementy  z  danej  grupy  lub  wybrać  określoną  ich  liczbę, 
stosując  losowanie  indywidualne  nieograniczone  lub  losowanie 
warstwowe.
Wybór  grup  zależy  od  celu  badania  i  dostępnych  informacji. 
Grupami  mogą  być  gospodarstwa  domowe,  kwartały,  szkoły, 
okręgi czy miasta.

LOSOWE SCHEMATY DOBORU PRÓBY cd.

background image

LOSOWY DOBÓR PRÓB: 

PODSUMOWANIE

Opisane  cztery  metody  losowego  doboru  próby  to 
podstawowe  schematy  losowania  stosowane  w  naukach 
społecznych.  Nie  wyczerpują  one  oczywiście  wszystkich 
możliwych procedur losowania.

background image

WIELKOŚĆ PRÓBY

Próbą jest każdy podzbiór pochodzący z populacji. Podzbiorem 
jest każdy układ elementów należących do populacji, które nie 
obejmuje wszystkich elementów definiowanych jako populacja. 
Proba może zawierać tylko jeden element, wszystkie elementy 
z wyjątkiem jednego, czy jakąkolwiek inną ich liczbę.
Istnieje wiele nieporozumień co do tego, jak duża powinna być 
próba.  Jednym  z  nich  jest  np.  pogląd,  że  próba  musi  stanowić 
określoną  proporcję  populacji;  innym,  że  powinna  liczyć  2000 
elementów;  jeszcze  innym,  że  wraz  ze  zwiększaniem  wielkości 
próby  rośnie  precyzja  wnioskowania  na  podstawie  danych  z 
próby.  Przekonania  te  są  fałszywe,  ponieważ  nie  wynikają  z 
teorii  pobierania  próby.  Aby  właściwie  oszacować  wielkość 
próby,  należy  ustalić  oczekiwany  poziom  dokładności 
oszacowań,  tzn.  określić  wielkość  akceptowanego  błędu 
standardowego.

background image

BŁĄD STANDARDOWY

Pojęcie  błędu  standardowego  jest  głównym  pojęciem  teorii 
pobierania  próby  i  odgrywa  zasadniczą  rolę  w  określaniu 
wielkości próby. Jest to jedna z miar statystycznych wskazująca, 
na ile dokładnie wyniki otrzymane na podstawie badania próby 
odzwierciedlają rzeczywiste wartości parametrów w populacji.
Jeż4eli  nieskończenie  wiele  razy  pobierać  będziemy  próbę,  to 
każda  wybrana  zostanie  więcej  niż  jeden  raz.  Możemy  zatem 
sporządzić  wykres  rozkładu  wszystkich  średnich  obliczonych  z 
próby.  Rozkład  wartości  średnich  z  próby  obliczonych  dla 
nieskończonej  liczby  prób  nazywa  się  rozkładem  z  próby 
średnich
.
Można  zatem  założyć,  że  wartość  średnia  obliczona  z 
nieskończenie  wielu  prób  rowna  się  średniej  w  populacji.  Im 
bardziej  wartości  średniej  z  próby  odchylają  się  od  średniej 
populacyjnej,  tym  większe  staje  się  zróżnicowanie  wyników 
uzyskanych  z  każdej  próby.  Tym  większe  również  staje  się 
ryzyko  popełnienia  dużego  błędu  przy  oszacowaniu  wartości 
parametru w populacji na podstawie wyników jednej próby lub 
ograniczonej liczby prób.

WIELKOŚĆ PRÓBY 
cd.

background image

BŁĄD STANDARDOWY cd.

W rzeczywistości wartość średnia w populacji nie jest znana, a 
badacz pobiera tylko jedną próbę po to, aby oszacować wartość 
parametrów  populacji.  Rozkład  wartości  otrzymanych  w  jednej 
próbie  jest  traktowany  jako  wskaźnik  całego  rozkładu  z  próby. 
Miarą  rozproszenia  wartości  w  jednej  próbie  jest  odchylenie 
standardowe  s.  Rozkład  wszystkich  wartości  średnich  wokół 
średniej tych wartości nazywamy błędem standardowym (SE).
Możemy  obliczyć  odchylenie  standardowe  i  następnie 
oszacować  wartość  SE.  Nie  można  obliczyć  wartości  SE 
bezpośrednio, ponieważ nie można pobrać nieskończenie wielu 
prób potrzebnych dla tych obliczeń. Możemy natomiast przyjąć, 
że  rozproszenie  wartości  zmiennej  w  ramach  pojedynczej, 
losowo  pobranej  próby  reprezentatywnej  odzwierciedla 
rozproszenie tych wartości w ramach populacji.

WIELKOŚĆ PRÓBY 
cd.

background image

PRZEDZIAŁY UFNOŚCI
Jeżeli rozkład z próby średnich jest normalny lub bliski rozkładowi 
normalnemu,  to  aby  oszacować  położenie  średniej  w  populacji, 
możemy  się  odwołać  do  własności  rozkładu  normalnego. 
Gdybyśmy  znali  średnią  wszystkich  średnich  z  próby  (średnią  w 
populacji)  i  odchylenie  standardowe  średnich  z  próby 
(standardowy  błąd  średniej),  to  moglibyśmy  obliczyć  wartość 
wyniku  Z  i  określić,  jaki  procent  wartości  średnich  z  próby  może 
się  pojawić  w  określonym  przedziale  wyników.  W  przedziale 
pomiędzy -1Z i +1Z możemy oczekiwać 68% wartości średnich z 
próby; pomiędzy -1,96Z a +1,96Z około 95%, a pomiędzy -2,58 a 
+2,58 około 99% wartości średnich z próby. Ponieważ jednak nie 
znamy  średniej  w  populacji,  musimy  ją  oszacować  na  podstawie 
pojedynczej próby.

tym 

celu 

można 

się 

posłużyć 

krzywa 

normalną. 

Prawdopodobieństwo,  że  wszystkie  średnie  z  próby  będą  się 
różniły od średniej populacyjnej o mniej niż ±1,96Z wynosi 95,5%. 
Nie wiemy jednak, czy średnia z próby jest mniejsza czy większa 
od  prawdziwej  średniej  w  populacji.  Jeżeli  jednak  skonstruujemy 
przedział od -1,96Z do +1,96Z wokół średniej z próby, to możemy 
być  pewni,  że  95,5%  populacji  wpada  do  tego  przedziału. 
Oznacza  to,  ze  prawdopodobieństwo  popełnienia  błędu 
polegającego  na  przyjęciu,  że  średnia  populacyjna  nie  wpada  do 
tego przedziału, wynosi około 5%.

WIELKOŚĆ PRÓBY 
cd.

background image

OKREŚLANIE WIELKOŚCI PRÓBY

Jeżeli przy podejmowaniu decyzji o wielkości próby koszty i inne 
czynniki  natury  praktycznej  nie  mają  znaczenia,  to  określenie 
wymaganej wielkości próby nie jest trudne.
Aby obliczyć wielkość próby, musimy mieć jakieś wyobrażenie o 
wielkości  odchylenia  standardowego  w  populacji  i  należy 
zdecydować,  jak  duży  standardowy  błąd  pomiaru  możemy 
tolerować.
Jeżeli  wielkość  próby  okaże  się  zbyt  duża  w  stosunku  do 
populacji,  to  należy  wprowadzić  poprawkę  dla  populacji 
nieskończenie dużych.
W  praktyce  decyzje  dotyczące  wielkości  próby  są  bardziej 
złożone.  Badacze  muszą  przede  wszystkim  zdecydować,  jak 
precyzyjne wyniki chcieliby otrzymać, tj. muszą podjąć decyzję o 
akceptowalnej  wielkości  standardowego  błędu  pomiaru.  Po 
drugie,  muszą  określić  sposób  analizy  otrzymanych  danych.  Po 
trzecie,  jeżeli  badacze  analizują  jednocześnie  więcej  niż  jedną 
zmienną,  to  powinni  się  upewnić,  czy  próba,  która  jest 
wystarczająca dla jednej zmiennej, będzie również wystarczająca 
dla innej zmiennej.

WIELKOŚĆ PRÓBY 
cd.

background image

BŁĘDY NIELOSOWE

W teorii losowego doboru próby rozważa się błędy wynikające z 
procedury  losowania.  Stosując  idealny  plan  losowania, 
minimalizujemy  ten  rodzaj  błędu.  Jest  to  błąd  wyznaczający 
różnicę  między  tym,  czego  się  spodziewamy,  a  tym,  co 
otrzymujemy,  stosując  określony  zbiór  procedur.  Jeżeli  nawet 
błąd  losowy  zostaje  zminimalizowany,  to  nadal  istnieje  wiele 
innych  źródeł  błędu.  W  badaniach  sondażowych  najbardziej 
dominującym  błędem  jest  błąd  wynikający  z  braku 
odpowiedzi
.  Nieudzielenie  odpowiedzi  prowadzi  do  braku 
danych  i  jest  zazwyczaj  spowodowane  odmową  odpowiedzi, 
nieobecnością  czy  przeoczeniem  określonych  kategorii.  Brak 
odpowiedzi może w istotny sposób obciążać otrzymane wyniki.
Ogólnie  rzecz  biorąc,  przyczyny  zniekształcenia  wyników  mogą 
być następujące:
1. im większa proporcja osób nie udzielających odpowiedzi, tym 

większy będzie popełniany błąd.

2. Istotność  błędu  wynikającego  z  braku  odpowiedzi  zależy  od 

zakresu,  w  jakim  średnia  populacyjna  obliczona  w  próbie  dla 
warstwy  osób  nie  udzielających  odpowiedzi  różni  się  od 
średniej obliczanej dla warstwy osób odpowiadających

background image

3.  Każdy  z  wymienionych  niżej  powodów  nieudzielenia 

odpowiedzi w inny sposób spływa na otrzymane wyniki

•Brak  możliwości  przeprowadzenia  wywiadu:  ludzie  chorzy, 

niepiśmienni czy posiadający bariery językowe

•Nieodnalezieni respondenci – osoby, które się przeprowadziły 

i nie są dostępne

•Nieobecni  w  domu  –  osoby  nieobecne  w  domu  w  momencie 

przeprowadzania wywiadu, lecz dostępne kiedy indziej. Ich 
wyniki są dodawane w późniejszym terminie

•Odmowa  odpowiedzi  –  osoby,  które  odmawiają  współpracy 

lub 

udzielenia 

odpowiedzi 

na 

wszystkie 

pytania 

kwestionariusza

Proporcja  osób  nie  udzielających  odpowiedzi  zależy  od  takich 
czynników,  jak:  rodzaj  populacji,  metoda  zbierania  danych, 
rodzaj  zadawanych  pytań,  umiejętności  ankietera  i  liczba 
ponawianych  kontaktów  z  respondentem.  Źle  zaprojektowany 
i/lub  źle  przeprowadzony  wywiad  może  dawać  wysoką 
proporcję nie udzielonych odpowiedzi.

BŁĘDY 
NIELOSOWE
 cd.

background image

PODSUMOWANIE

1. aby  otrzymać  dokładne  oszacowania  parametrów, 

badacz musi skutecznie rozwiązać trzy problemy:

• zdefiniować populację

• pobrać próbę reprezentatywną

• określić wielkość próby

2. Populacja  powinna  zostać  zdefiniowana  w  terminach 

treści,  zakresu  i  czasu.  Próbą  jest  każdy  podzbiór 
jednostek,  z  których  składa  się  populacja.  Próba  może 
zawierać  od  jednego  elementu  do  wszystkich 
elementów  z  wyjątkiem  jednego  lub  składać  się  z 
dowolnej liczby elementów z tego zakresu.

3. Po  zdefiniowaniu  populacji  i  określeniu  wielkości  próby 

należy  wybrać  taki  schemat  doboru  próby,  który 
gwarantuje 

jej 

reprezentatywność. 

Próba 

jest 

reprezentatywna  wtedy,  kiedy  analizy  przeprowadzone 
na  danych  z  próby  dają  wyniki  równoważne  tym,  jakie 
otrzymano  by,  analizując  całą  populację.  Badacze 
korzystają  z  losowych  schematów  doboru  próby 
najczęściej 

wtedy, 

gdy 

potrafią 

określić 

prawdopodobieństwo  włączenia  każdego  elementu 
populacji do próby.

background image

4. Określenie wielkości próby zależy bezpośrednio od wartości 

standardowego  błędu  pomiaru  i  szerokości  przedziału 
ufności określonego przez badacza. Przedział ufności może 
być skrajnie wąski, gdy badacz decyduje się na ponoszenie 
wysokiego  ryzyka  popełnienia  błędu,  lub  bardzo  szeroki, 
jeżeli chce, aby ryzyko popełnienia błędu było minimalne.

5. W  badaniach  sondażowych,  obok  błędu  losowania,  mamy 

do  czynienia  z  błędem  spowodowanym  nieudzieleniem 
odpowiedzi  przez  respondentów.  Brak  odpowiedzi  może 
być  spowodowany  odmową,  nieobecnością,  przeoczeniem 
kategorii  odpowiedzi  itp.  Brak  odpowiedzi  może  się 
przyczyniać  do  popełniania  istotnego  błędu  w  trakcie 
analizowania 

wyników. 

Jeśli 

procent 

udzielonych 

odpowiedzi  jest  niski,  to  badacze  powinni  stosować  którąś 
ze wspomnianych technik rekompensowania. 

PODSUMOWANIE cd.


Document Outline