Wykład 2

Wprowadzenie do badań

2.1.

Podstawowe pojęcia

Populacja generalna – zbiorowość statystyczna; zbiór elementów nieidentycznych z punktu

widzenia badanej cechy.

Próba – podzbiór populacji generalnej, podlegający badaniu ze względu na ustaloną cechę, w celu

wyciągnięcia wniosków o kształtowaniu się badanej cechy w populacji generalnej.

Liczebność próby – liczba elementów populacji generalnej wybranych do próby (oznaczana

zwykle jako „n”) . Gdy n<30 mówi się często o małej próbie.

Próba reprezentacyjna – próba, której struktura pod względem badanej cechy nie róŜni się

istotnie od struktury populacji generalnej. Reprezentatywność - stopień w jakim próba reprezentuje

populację generalną w celu uogólnienia na nią prawidłowości zaobserwowanych w próbie

Schemat losowania próby – praktyczny sposób losowania elementów populacji generalnej do

próby, uwzględniający moŜliwości techniczne, koszt i efektywność uzyskanych wyników.

Losowanie niezaleŜne – schemat losowania próby ze zwracaniem kaŜdego wylosowanego

elementu w trakcie losowania, tak Ŝe jeden element moŜe zostać wylosowany do próby więcej niŜ

jeden raz.

Losowanie zaleŜne – schemat losowania elementów do próby bez zwracania kaŜdego

wylosowanego elementu populacji generalnej, tak Ŝe jeden element moŜe zostać wylosowany do

próby tylko jeden raz.

Losowanie nieograniczone – schemat losowania, w którym wylosowanie pewnej jednostki nie

ogranicza moŜliwości wylosowania do próby jakiejkolwiek innej jednostki.

Losowanie ograniczone – schemat losowania, który pewnym jednostkom nie pozwala znaleźć się

w próbie jednocześnie. Do najbardziej rozpowszechnionych schematów losowania ograniczonego

moŜna zaliczyć: dobór wielostopniowy i dobór wielofazowy.

Losowanie indywidualne – schemat losowania, w którym jednostka losowania jest jednocześnie

jednostką badania.

Losowanie zespołowe – schemat losowania, w którym jednostka losowania składa się z pewnej

liczby jednostek badania (co najmniej dwóch). Przykładem losowania zespołowego, ze względu na

poszczególne osoby, moŜe być wylosowanie do badania pewnej liczby gospodarstw domowych.

2.2.

Indeksy, skale, typologie

Badacze muszą często stosować róŜne wskaźniki, aby trafnie i adekwatnie zmierzyć daną

zmienną. Indeksy i skale1 tworzy się w celu uzyskania porządkowego miernika danej zmiennej. Dla

niektórych zmiennych, takich jak np. wiek, wystarcza jedno pytanie. Często jednak przedmiotem

1 Szerzej na ten temat: E. Babbie, Badania społeczne w prakty ce, Wydawnictwo Naukowe PWN, Warszawa

2003, s. 173-199.

dr Mirosława Szewczyk

1

Statystyka

badania są zmienne, dla których nie ma jasnych i jednoznacznych wskaźników. Dotyczy to zwłaszcza

postaw i poglądów. Badacz uŜywa wówczas zestawu pytań, z których kaŜde stanowi jakiś wskaźnik

zmiennej. Natomiast uwzględnienie tylko pojedynczych odpowiedzi mogłoby prowadzić do

nierzetelnych wniosków.

Terminy indeks i skala są na ogół w literaturze stosowane zamiennie. RóŜnią się one sposobem

ustalania wyniku. Główne etapy tworzenia indeksu to wybór moŜliwych pytań, zbadanie zaleŜności

pomiędzy nimi, ustalenie punktacji indeksu i sprawdzenie jego trafności. Indeks tworzony jest przez

proste zsumowanie wyników przypisanych poszczególnym wartościom, np. w badaniach dotyczących

aktywności politycznej - dodajemy liczbę twierdzeń świadczących o aktywności (głosowanie – 1pkt,

praca przy organizacji kampanii – 1 pkt, kandydowanie w wyborach 1pkt). Skala natomiast

wykorzystuje róŜnice w intensywności zmiennej (osoby kandydujące zapewne pracowały przy

organizacji kampanii, a takŜe wzięły udział w głosowaniu – a zatem wykazały znacznie większą

aktywność polityczną od osób które np. tylko głosowały).

Typologia to miernik złoŜony. Często badacz postanawia podsumować skrzyŜowanie co najmniej

dwóch zmiennych, tworząc w ten sposób zbiór kategorii lub typów zwany typologią. Przykład

przedstawia poniŜsza tabela.

Tabela 4. Typologia polityczna gazet.

Polityka zagraniczna

konserwatywna

liberalna

Sprawy

konserwatywna

A

B

wewnętrzne

liberalna

C

D

Źródło: E. Babbie, Badania społeczne w prakty ce, Wydawnictwo Naukowe PWN, Warszawa 2003, s.197.

Czynnikiem określającym ilość informacji, jakiej moŜe dostarczyć określona zmienna, jest typ skali

pomiarowej. WyróŜnić moŜna następujące skale: nominalna, porządkowa, przedziałowa, ilorazowa.

Skala nominalna umoŜliwia pomiar na najniŜszym poziomie klasyfikacji obiektów według rozłącznych

cech, nie ma własności wartościujących – dla potrzeb identyfikacji jednostki stosuje się jedynie opis

słowny (np. forma prawna: osoba fizyczna, spółka cywilna, spółka z o.o., spółka akcyjna, spółdzielnia,

podmiot państwowy).

Skala porządkowa cechuje się tym, Ŝe ponumerowane pozycje obserwowanych w próbie wartości

pokazują relacje między sobą. W skalowaniu porządkującym korzysta się z rangowania -

porządkowania od wartości najmniejszej do największej i przypisywania uszeregowanym obiektom

kolejnych liczb w porządku rosnącym lub malejącym. Przykładem uŜycia skali porządkowej moŜe być

pytanie dotyczące częstotliwości współpracy badanego podmiotu z innymi przedsiębiorstwami

w zakresie wdraŜania innowacji. MoŜliwe odpowiedzi według pięciostopniowej skali: (1) bardzo często,

(2) często, (3) rzadko, (4) bardzo rzadko, (5) okazjonalnie.

dr Mirosława Szewczyk

2

Statystyka

W skali interwałowej (przedziałowej) oprócz rangowania wyników obserwacji określamy równieŜ

róŜnice między nimi (umoŜliwia pomiar ilościowy na poziomie wartościowania addytywnego).

Przykładem moŜe być odpowiedź na pytanie o rok załoŜenia firmy.

Skala

ilorazowa

umoŜliwia

pomiar

na

najwyŜszym

poziomie

z zachowaniem

cech

proporcjonalności, waŜne są nie tylko róŜnice między wynikami, ale równieŜ ilorazy tych róŜnic.

Przykładem moŜe być odpowiedź na pytanie dotyczące średniorocznego zatrudnienia w danym

przedsiębiorstwie (w osobach) czy teŜ wieku respondenta (w latach).

2.3.

Dobór próby

Aby poznać rozkład populacji generalnej naleŜy przeprowadzić badanie. Przeprowadzenie badania

pełnego jest moŜliwe, jeŜeli badana zbiorowość ma skończoną liczbę elementów, a badanie nie ma

charakteru niszczącego. W przeciwnym przypadku obserwacji poddaje się tylko wyodrębniony zespół

elementów populacji generalnej (próbę). Podobnie postępuje się, gdy badanie całej populacji

generalnej jest zbyt kosztowne.

Wykorzystywana w badaniach próba powinna być reprezentatywna, tzn. powinna opisywać

strukturę populacji generalnej z przyjętą dokładnością. Reprezentatywność próby ma zatem

decydujące znaczenie dla jakości wyciągniętych wniosków.

Reprezentatywność typologiczna - próba jest reprezentatywna, jeśli zawiera wszystkie typy

(wartości) interesujących nas cech (zmiennych).

Reprezentatywność rozkładów - próba jest reprezentatywna, jeŜeli rozkłady interesujących

nas cech (zmiennych) w tej próbie odpowiadają (z określonym przybliŜeniem) rozkładom tych

cech (zmiennych) w populacji generalnej.

Reprezentatywność związków między cechami - próba jest reprezentatywna, jeŜeli

zaleŜności występujące między cechami w próbie odpowiadają analogicznym zaleŜnościom

w populacji generalnej

Reprezentatywność próby zaleŜy od sposobu doboru próby oraz od liczebności próby. Metody

doboru próby dzieli się na metody doboru losowego i metody doboru nielosowego. Dobór nielosowy

(subiektywny) uzaleŜniony jest od osoby prowadzącej badanie. Polega on na wyborze konkretnych

jednostek o ustalonych z góry charakterystykach. Przykładem doboru nielosowego są:

dobór celowy, w którym osoba prowadząca badanie wybiera do próby jednostki populacji

świadomie (kierując się swoją wiedzą i przekonaniami w wyborze jednostek „typowych”), np.

wybór artykułów najczęściej kupowanych przez konsumentów, wybór osób o przeciętnych

zarobkach itp.

dobór proporcjonalny (kwotowy), w którym wybiera się określone segmenty próby,

w proporcji odpowiadającej strukturze zbiorowości generalnej. Im więcej wyróŜnia się cech

zbiorowości, tym uzyskuje się więcej segmentów i tym trudniej skompletować odpowiedni

skład zbiorowości próbnej. Dlatego teŜ dla skompletowania składu liczebnego najczęściej

poprzestaje się na 2-3 cechach dających nie więcej niŜ 10 segmentów. Dobór jednostek do

dr Mirosława Szewczyk

3

Statystyka

próby nie ma charakteru losowego, zwłaszcza w końcowej fazie kompletowania struktury

zbioru.

dobór na zasadzie eliminacji jest przeciwieństwem doboru jednostek typowych. W tym

przypadku eliminuje się jednostki odbiegające znacznie od przeciętnych. Powoduje to

zawęŜenie obrazu struktury zjawiska do wielkości przeciętnych.

W doborze losowym wybór jednostek do próby jest przypadkowy, moŜna jednak określić

prawdopodobieństwo, Ŝe dana jednostka lub zespół jednostek znajdzie się w próbie. Przykładem

losowego doboru jednostek do próby jest losowanie niezaleŜne, w którym raz wylosowana do próby

jednostka wraca do populacji. Nieograniczony dobór losowy jest podstawową metodą uzyskania

reprezentatywnej zbiorowości próbnej. JeŜeli próba jest losowa, to wraz ze wzrostem liczebności

próby wzrasta stopień reprezentatywności. Losowanie indywidualne, nieograniczone i niezaleŜne (tj.

ze zwracaniem) nosi nazwę losowania prostego.

Do najbardziej rozpowszechnionych schematów losowania ograniczonego moŜna zaliczyć: dobór

warstwowy, dobór wielostopniowy i dobór wielofazowy.

Dobór warstwowy zaleca się w sytuacji, gdy badana zbiorowość wykazuje silne

zróŜnicowanie pewnej interesującej nas cechy. Metoda ta wymaga podziału całej zbiorowości

na warstwy (grupy), w obrębie których następuje oddzielny dobór losowy. Losowania

dokonuje się zazwyczaj w stosunku wprost proporcjonalnym do liczebności danej warstwy.

Najlepsze efekty osiąga się wówczas, gdy za kryterium podziału przyjmuje się cechy moŜliwie

silnie skorelowane z cechami badanymi (np. dochód, powierzchnia gospodarstwa rolnego,

wiek, miejsce zamieszkania itp.).

Dobór wielostopniowy stosuje się, kiedy moŜliwe jest podzielenie, przy wykorzystaniu

określonego kryterium, badanej zbiorowości na kolejne, coraz mniejsze grupy, np. podział

kraju na województwa, podział województw na powiaty, podział powiatów na gminy itd. Na

początku wybiera się jednostki losowania pierwszego stopnia, następnie jednostki te dzieli się

na mniejsze zespoły (jednostki losowania drugiego stopnia) itd., aŜ ostatecznie dochodzi się

do jednostek badania.

Dobór wielofazowy róŜni się od doboru wielostopniowego jedynie wyborem próby znacznie

liczniejszej od poŜądanej. Z tej próby moŜna wybrać dwie lub więcej mniejszych prób, które

mogą być wykorzystywane w badaniach.

Losowanie do próby polega na ponumerowaniu wszystkich jednostek danej zbiorowości

i dokonaniu wyboru losowego pewnej ich liczby. Najczęściej wykorzystuje się losowanie za pomocą

tablic liczb losowych oraz metodę doboru systematycznego.

Losowanie za pomocą tablic liczb losowych2 polega na odczytaniu w ustalonej kolejności liczb

w nich umieszczonych. Zaczynając zatem od dowolnego miejsca tablicy, wybieramy według ustalonej

zasady tyle liczb, ile jednostek ma liczyć dana próba losowa. Pomija się przy tym wszystkie liczby

większe od liczebności badanej zbiorowości. Zanotowane liczby z tablic liczb losowych wskazują

numery jednostek, które zostały wylosowane do próby.

2 Tablice te zbudowane są tak, Ŝe liczby czytane w dowolnym porządku (pionowo, poziomo, wprzód, wstecz,

całościowo, segmentowo), zachowują zawsze cechy przypadkowości, niezaleŜnie od miejsca ich występowania.

dr Mirosława Szewczyk

4

Statystyka

Dobór systematyczny polega na wyborze z uporządkowanego zbioru odpowiedniej liczby

jednostek w równych odstępach (interwałach). Na początku ustala się liczebność całej zbiorowości

(N), a następnie liczebność próby (n). Na tej podstawie ustala się interwał losowania k=N/n.

Poczynając od losowo obranej jednostki pierwszego interwału dobiera się kolejno co „k” jednostek

z kaŜdego interwału po jednej jednostce, aŜ do osiągnięcia poŜądanej wielkości próby.

Zalety doboru losowego:

Brak wstępnej wiedzy o populacji generalnej nie wpływa negatywnie na reprezentatywność

próby.

UmoŜliwia oszacowanie metodami probabilistycznymi stopnia reprezentatywności uzyskanej

próby i to w zakresie wszystkich moŜliwych cech, ich rozkładów oraz zaleŜności między nimi.

Pozwala skorygować wiedzę o populacji.

Wady doboru losowego:

Próba losowa musi być dostatecznie liczna, co ze względów technicznych lub finansowych

moŜe stanowić pewną trudność.

Mogą wystąpić trudności związane z efektywnym zdefiniowaniem populacji zgodnej z celem

badania, a co z tym związane – listy obiektów tworzących populację generalną.

2.4.

Typy badań

Najczęściej stosowanymi formami badania częściowego są metoda reprezentacyjna, metoda

monograficzna, metoda ankietowa. Badanie reprezentacyjne to takie badanie częściowe, w którym

losowo pobrane do próby jednostki reprezentują całą populację, mimo, Ŝe stanowią tylko jej część.

Badanie monograficzne polega na wszechstronnym, wyczerpującym opisie wybranej jednostki

(np. województwa, przedsiębiorstwa). Jednostka zostaje wybrana do badania świadomie (celowo).

Z reguły jednostka zasługuje na badanie, gdyŜ jest to jednostka „typowa” albo teŜ „nietypowa”.

Badania ankietowe mają miejsce wówczas, gdy nie chodzi tylko o opis faktów i ich właściwości,

ale gdy celem jest równieŜ poznanie opinii. Dane są gromadzone za pomocą odpowiednio

skonstruowanej ankiety, rozsyłanej do wytypowanego lub losowo wybranego grona respondentów.

Stosując tę metodę nie prowadzi się bezpośrednich obserwacji, lecz zwraca się z prośbą do

ankietowanych opodanie informacji.

Ankieta powinna zawierać :

wprowadzenie zapewniające o anonimowości ankiety oraz motywujące respondenta do podania

kompletnych i szczerych odpowiedzi na zawarte w ankiecie pytania

instrukcję prawidłowego wypełnienia ankiety (zwłaszcza w pytaniach z wieloma wariantami

odpowiedzi naleŜy wyraźnie poinformować respondenta czy ma wybrać dokładnie jedną z nich,

czy teŜ moŜe zakreślić kilka)

metryczkę – pytania pozwalające na identyfikację interesujących nas cech kategoryzujących

respondenta (płeć, wiek, miejsce zamieszkania, ...)

dr Mirosława Szewczyk

5

Statystyka

Pytania mogą być:

zamknięte – respondent ma wybrać jedną lub kilka odpowiedzi z zestawu ułoŜonego przez

ankietera; zestaw odpowiedzi na pytanie zamknięte powinien być zupełny (zawierający

wszystkie moŜliwe do przewidzenia warianty odpowiedzi na postawione pytanie, w celu

uzupełnienia zestawu moŜna dołączyć odpowiedź „inne – jakie?”) i rozłączny (w przypadku

pytania z jedną prawidłową odpowiedzią - wybór jednej odpowiedzi powinien wykluczać wybór

innych dostępnych)

otwarte – forma i sposób odpowiedzi są dowolne.

Przykład

Proszę o wzięcie udziału w badaniu i wypełnienie ankiety pt. „Dlaczego czytam wykłady ze

statystyki”. Jej wyniki zostaną wykorzystane wyłącznie do celów naukowych. Celem badania jest

poznanie opinii studentów o wykładach ze statystyki, występujących trudnościach i moŜliwościach ich

przezwycięŜenia. Ankieta jest anonimowa (wypełnionej ankiety nie naleŜy więc podpisywać

nazwiskiem). Proszę o szczegółowe i uwaŜne zapoznanie się z treścią pytań oraz moŜliwymi

odpowiedziami. Odpowiadając na kolejne pytania, naleŜy spośród podanych odpowiedzi wybrać

odpowiedź(i) zgodną(e) z poglądami lub wpisać treść odpowiedzi we właściwym miejscu. Proszę

o odpowiedź na kaŜde pytanie. Dziękuję za zainteresowanie oraz poświęcony czas.

Mirosława Szewczyk

1. Dlaczego przeczytał(a) Pan(Pani) dzisiejszy wykład? (moŜ na zakreś lić krzyŜ ykiem kilka odpowiedzi)

a) Jest to mój ulubiony wykład

b) Pomyliłem(am) się i przeczytałem(am) statystykę zamiast makroekonomii

c) Myślałem(am), Ŝe znajdę odpowiedź na nurtujące mnie pytania

d) Inne (jakie?) ...........................................................

2. Który z wykładów uwaŜa Pan(Pani) za najciekawszy? Proszę uporządkować wykłady

z wymienionych przedmiotów w wybranej przez siebie kolejności (1 – najciekawszy, 2 – średnio

ciekawy, 3 – najmniej ciekawy).

a) Statystyka

b) Makroekonomia

c) Finanse publiczne

3. Czy jest Pan (Pani) zadowolony(a) z jakości materiałów prezentowanych na wykładach ze

statystyki ? (zakreś lić krzyŜ ykiem jedną odpowiedź )

a) Zdecydowanie tak

b) Raczej tak

c) Raczej nie

d) Zdecydowanie nie

e) Nie potrafię ocenić

dr Mirosława Szewczyk

6

Statystyka

Metryka respondenta

4. Płeć

a) Kobieta

b) MęŜczyzna

5. Wiek .............. lat

6. Miejsce zamieszkania (miejscowość/województwo):

................................/woj..............................

Proszę o sprawdzenie, czy udzielił(a) Pan (Pani) odpowiedzi na wszystkie pytania.

Dziękuję za udział w badaniu

Mirosława Szewczyk

Jeśli ma Pan (Pani) dodatkowe uwagi na tematy poruszane w ankiecie, proszę

o zamieszczenie ich poniŜej ................................................................................. ......................

.............................................................................................................................. .......................

.....................................................................................................................................................

2.5.

Zagadnienia i pytania kontrolne

Pytania kontrolne:

1. RozwaŜ grę liczbową „DuŜy Lotek”, w której za pomocą maszyny losującej dokonuje się

doboru sześciu liczb spośród czterdziestu dziewięciu. Jaka jest liczność populacji generalnej,

a jaka liczność próby? Czy jest to losowanie indywidualne czy zespołowe? Czy jest to

losowanie zaleŜne czy niezaleŜne?

2. W przedsiębiorstwie „Oszuścik” przeprowadzono badanie płac zatrudnionych osób. Kiedy

będziemy mogli powiedzieć, Ŝe było to badanie całkowite? Gdy badamy wszystkie cechy,

od których zaleŜą płace? Gdy badamy wszystkich pracowników przedsiębiorstwa? Czy

moŜe w jeszcze innym przypadku?

Problemy do dyskusji:

1. Znajdź w opracowaniach Urzędu Statystycznego (GUS lub Wojewódzkiego Urzędu

Statystycznego) raport z badań z zastosowaniem jednej z metod doboru próby. Jaki rodzaj

doboru próby został zastosowany? Jak liczna była próba?

2. Znajdź w Internecie lub w opracowaniach Urzędu Statystycznego (GUS lub Wojewódzkiego

Urzędu Statystycznego) formularz zawierający zestaw pytań z Narodowego Spisu

dr Mirosława Szewczyk

7

Statystyka

Powszechnego Ludnoś ci i Mieszkań 2002 lub Powszechnego Spisu Rolnego 2002.

Zapoznaj się z poszczególnymi pytaniami.

dr Mirosława Szewczyk

8

Statystyka