Wykład: PRÓBY BADAWCZE
Oprócz tekstów z polecanego Babbiego oraz tekstu z „Badań Empirycznych w Socjologii” (PATRZ: program kursu) warto zwrócić uwagę na teksty dostępne w Internecie. Jest tu na szczęście sporo porad praktycznych.
Z jednej strony widać, że badacze korzystają w takich wypadkach jak losowanie próby z usług wyspecjalizowanych firm (będących w posiadaniu dosyć kosztownych baz danych osobowych).
Z drugiej strony widać wyraźnie, że aby pojąć „o co chodzi” nie unikniemy sięgnięcia do wiedzy ze statystyki. Nowoczesny badacz społeczny jest obecnie wielewiedzącym - musi umieć korzystać z oprogramowania statystycznego zarówno przy badaniach ilościowych (np. SPSS), jak i jakościowych (np. McQDA, Atlas).
Próba |
Opis |
Plusy |
Minusy |
Próba prosta |
Każda jednostka populacja ma takie samo prawdopodobieństwo znalezienie się w próbie. |
Niskie koszty losowania, odpowiednia dla większości testów statystycznych. |
Inne schematy losowania próby mogą dawać lepsze rezultaty. |
Próba systematyczna |
Dobór z listy obejmującej wszystkie elementy danej zbiorowości co n-tej (np. co piędziesiątej) jednostki losowania. |
Tego typu próba jest lepsza od prostej próby losowej. |
Możliwość pokrycia się interwałów losowania z ukrytym uporządkowaniem danego operatu. |
Próba warstwowa |
Losowanie warstwowe polega na tym, że najpierw dzielimy zbiorowość statystyczną na jakościowo różniące się części, a następnie losujemy z każdej warstwy jednostki zbiorowości do próby. |
Próba jest bardziej reprezentatywna od prostej próby losowej pod względem większej liczby zmiennych. |
Wymaga więcej informacji o populacji. |
Próba zespołowa (grupowa) |
Cechą charakterystyczną tego schematu jest to, że elementami losowania nie są poszczególne jednostki populacji, ale grupy. Podział danej zbiorowości na szereg grup i następnie wylosowanie pewnej ich liczby do badania, obejmuje na ogół wszystkie elementy danej grupy. |
Łatwość w losowaniu. |
Istnieje możliwość popełnienia sporych błędów przy szacowaniu parametrów populacji w przypadku niewłaściwego podziału na grupy. |
Próba random-route |
Na podstawie podanego adresu ankieter znajduje inny, pod którym dobiera respondenta. Przy doborze adresów wykorzystuje się schemat losowania dwustopniowego. |
Próba jest tania. |
Możliwy negatywny wpływ ankietera na dobór kolejnego adresu według ustalonej ścieżki. |
Dwustopniowe losowanie próby |
Procedura postępowania jest następująca: Przy podejściu rygorystycznym stosowanie pewnych testów statystycznych wymaga wprowadzenia do nich korekt. 1.losujemy do próby pewną liczbę zespołowych jednostek losowania: nazwiemy to postępowanie losowaniem pierwszego stopnia, a losowanie JL jednostkami losowania pierwszego stopnia (JLPS). "2.wylosowane do próby JLPS dzielimy na mniejsze jednostki losowania zwane jednostkami losowania drugiego stopnia (JLDS); JLDS mogą być jednostkami zespołowymi bądź jednostkami badania". 3.przeprowadzamy losowanie drugiego stopnia. Wylosowane do próby JLDS tworzą ostateczną próbę: wchodzą do niej te jednostki badania, które należą do wylosowanych na drugim stopniu JLDS. |
Najbardziej precyzyjny schemat losowania. |
|
Próba kwotowa |
Opiera się ona na znajomości struktury populacji generalnej wg przyjętych cech (tzw. zmiennych kontrolnych) i narzuceniu tej struktury na skład próby. Stosowane cechy - kryteria to: wiek, płeć, wielkość rodziny, dochód, rodzaj grupy społecznej lub działalności. Liczebność grup (segmentów) w próbie ustala się na podstawie przemnożenia rozkładu procentowego wybranych cech w populacji generalnej, przez ogólną liczebność próby. |
Daje możliwości kontrolowania większej liczby cech. Nie wymaga istnienia operatu. |
Wpływ ankietera na dobór respondenta. |
Próba losowo-kwotowa |
Na pierwszym stopniu doboru losuje się miejscowości miejskie i wiejskie (losowanie dwustopniowe). Drugi stopień doboru - jak w klasycznej próbie kwotowej. |
Daje możliwości kontrolowania większej liczby cech. |
Wpływ ankietera na dobór respondenta. |
Ćwiczenia ze statystyki: Przedziały ufności
Wstęp
Bootstrap jest związany z pobieraniem próby. Najkorzystniejszą sytuacją jest ta, w której dla oszacowania różnych parametrów statystycznych populacji mamy możliwość pobierania z tej populacji wielu prób. Jeśli jest to niemożliwe możemy posłużyć się pobieranim wielokrotnie prób z tej próby którą posiadamy. Postępowanie takie jest sensowne pod warunkiem, że próba, która służy nam do generowania innych możliwych pobrań próby jest reprezentatywna. W bootstrapie losujemy ze zwracaniem (dlaczego?).
Przedział ufności (CI) odzwierciedla zarówno wielkość badanej grupy jak i zmienność analizowanej cechy wewnątrz tej grupy. Średnia będąca wynikiem przeprowadzonych badań nie jest równa rzeczywistej średniej populacyjnej. Rozbieżność między uzyskanym wynikiem a rzeczywistą średnią populacji zależy od wielkości badanej grupy oraz zmienności badanej cechy w jej obrębie. Jeśli badana grupa jest niewielka i ma dużą zmienność analizowanej cechy wówczas rozbieżność między średnią uzyskaną a rzeczywistą może być znaczna. Natomiast, jeśli badana grupa jest dużą z niewielką zmiennością danych wówczas uzyskana średnia będzie prawdopodobnie bardzo bliska średniej populacyjnej. CI jest określany z różnym procentem "zaufania", np. 90 czy też 95%. Najczęściej używa się 95% przedziału ufności, który przy założeniu, że grupa badana była zgromadzona w sposób losowy wskazuje z 95% pewnością, że w zakresie przedziału ufności znajduje się rzeczywista średnia populacyjna. Przedział ufności jest wskaźnikiem precyzji wykonanych pomiarów.
Pewnych problemów koncepcyjnych nastręcza konstrukcja przedziałów ufności. Dla danej znanej populacji możemy obliczyć średnią populacji oraz prawdopodobieństwo uzyskania konkretnej wartości średniej przy losowanie próby o zadanej liczebności z tejże populacji, możemy więc określić prawdopodobieństwo
, że odległość średniej z próby i średniej z populacji jest
. Mając do dyspozycji tylko próbę i zakładając, że jest ona reprezentatywna możemy metodą bootstrapu "wytworzyć" wiele innych prób z badanej populacji i oszacować jakie są granice, w które wpada rządana frakcja średnich (np.:90%, 95%).
Przykład
Rozważmy sądę przedwyborczą, mamy dwóch kandydatów na prezydenta. Ankietowano 1500 osób. 840 osób deklarowało poparcie dla kandydata A zaś 660 dla kandydata B. Na ile pewny może być kandydat A swojego zwycięstwa?
Jak dokładnie brzmi pytanie? Jaki jest 95% przedział ufności dla poparcia kandydata A w całej populacji? Czy też innymi słowami: W jakim przedziale na 95% znajduje się proporcja glosujących popierających kandydata A.
Nasze najlepsze mniemanie o własnościach "świata" z którego pochodzą dane otrzymujemy ze zwykłej proporcji. Wynika z niej, że kandydat A ma poparcie 56% zaś kandydat B poparcie 44% wyborców.
Przypiszmy do kandydata A 0 zaś do B 1
Pobranie ankiety modelujemy przez pobranie losowo 1500 próbek z modelu naszego "świata" czyli wektora złożonego z 56 zer i 44 jedynek. Wynikiem jednej ankiety jest proporcja popierających kandydata A (lub B)
Zbieramy rozkład proporcji - musimy w tym celu "przeprowadzić" wielokrotnie ankietę. Narysujmy histogram.
Chcemy znaleźć 95% przedział ufności musimy znaleźć percentyl 2.5 oraz 97.5. Liczby te stanowią poszukiwany przedział ufności.
Zadania
Przyrost masy w nowej diecie
Producent karmy dla zwierząt chciał przetestować nowy rodzaj karmy. Próbki podawał 12 zwierzakom przez 4 tygodnie. Po tym czasie zanotował następujące przyrosty masy:
15.43 16.92 14.43 12.94 15.92 17.42 18.91 16.92 14.93 14.49 15.92 15.43 kg
średni przyrost wynosi 15.80 kg. producent widzi jednak, że w próbie jest dość znaczny rozrzut pomiędzy poszczególnymi zwierzętami
i nie jest pewien czy można reklamować nowy pordukt podając średni przyrost 15.8 kg. Podejrzewa, że inna grupa zwierząt może mieć zupełnie inną średnią.
Używając powyższych danych znajdźmy szansę, że w innej losowej próbie 12 zwierząt uzyskamy średni przyrost masy poniżej 15 kg.
Wynik zilustrować przy pomocy histogramu.
Średnica drzew
Ogrodnik eksperymentuje z nowym gatunkiem drzew. Posadził 20 sztuk i po dwóch latach zmierzył następujące średnice pni (w cm):
8.5 7.6 9.3 5.5 11.4 6.9 6.5 12.9 8.7 4.8 4.2 8.1 6.5 5.8 6.7 2.4 11.1 7.1 8.8 7.2
Proszę obejrzeć boxplot.
Proszę znaleźć średnią średnicę i 90% przedział ufności dla średniej.
Proszę znaleźć medianę i 90% przedział ufności dla mediany.
Wynik zilustrować przy pomocy histogramu.
Zawartość aluminium w Tebańskich naczyniach.
Zawartość procentowa aluminium w 18 antycznych naczyniach z Teb była następująca:
11.4 13.4 13.5 13.8 13.9 14.4 14.5 15 15.1 15.8 16 16.3 16.5 16.9 17 17.2 17.5 19.0
Jaka jest mediana procentowej zawartości aluminium i jaki jest 95% przedział ufności.
Przedział ufności dla różnicy dwóch średnich
Mamy 7 myszy, którym podano środek, który miał poprawić ich przeżywalność po operacji oraz 9 myszy kontrolnych, którym owego środka nie podano. Myszy traktowane specjalnie przeżyły
94 38 23 197 99 16 141 dni
a myszy traktowane standardowo:
52 10 40 104 51 27 146 30 46 dni
Srednia różnica wynosi 30.63 dni dłużej dla myszy traktowanych po nowemu. Pytanie, na które chcielibyśmy znać odpowiedź to: Czy nowy środek faktycznie poprawia przeżywalność.
Skonstruujmy przedział ufności 95% dla średniej różnicy w przeżywalności.
Uwaga: przy tym problemie każdą z grup traktujemy jako reprezentantów bardzo dużych populacji.
Przedział ufności dla proporcji
W badaniach nad cholesterolem u ludzi stwierdzono, że w grupie 135 badanych z wysokim poziomem cholesterolu 10 osób przeszło zawał serca. Pytanie: Na ile pewni możemy być, że jeśli weźmiemy dużo większą grupę pod uwagę to proporcja zawałowców będzie podobna? Obejrzeć histogram. Jakie wnioski?
Bezrobotni
W próbce 200 osób 7 procent jest bezrobotnych. Określić 95% przedział ufności dla prawdziwej średniej w populacji.
Żywotność baterii
W próbce 20 testowanych baterii stwierdzono średni czas życia 28.85 miesiąca. Określić 95% przedział ufności dla średniej. Wartości dla badanej próbki były następujące:
30 32 31 28 31 29 29 24 30 31 28 28 32 31 24 23 31 27 27 31 miesięcy
Dobór próby w badaniach marketingowych
W badaniach marketingowych kierujemy się metodami doboru próby stosowanymi w socjologii. Przyjęło się, że w przypadku każdego badania mamy do wyboru dwie metody doboru próby:
dobór losowy,
dobór celowy (zwany nielosowym).
Dobór losowy
Wyborem losowym nazywamy taki sposób wyboru próby, w którym:
dla każdego elementu populacji istnieje taka próba, która ten element zawiera,
każdej n - elementowej próbie możliwej do wylosowania z populacji jest przypisane określone, dodatnie prawdopodobieństwo tego, że zostanie ona wylosowana,
losowanie próby przeprowadza się za pomocą pewnego mechanizmu losowego, który zapewnia wylosowanie każdej możliwej próby z przypisanym jej prawdopodobieństwem wyboru 1.
Dobór losowy polega więc na zastosowaniu w doborze próby metod rachunku prawdopodobieństwa. Rozróżniamy:
próbkę losową prostą (każdy członek populacji ma takie samo i większe od zera prawdopodobieństwo znalezienia się w próbce),
próbkę losową wybieraną systematycznie (dobór losowy systematyczny, np. co n-ty element danej populacji),
próbkę losową warstwową (populacja jest dzielona na warstwy, z każdej jest wybierana próbka prosta; w obrębie tego doboru wyróżniamy dodatkowo dobór warstwowy optymalny i proporcjonalny),
próbkę losową zgrupowaną (populacja jest dzielona na wykluczające się grupy, do badania jest wylosowana jedna z grup)
Natomiast, metody nielosowego doboru próby można określić najbardziej ogólnie jako metody, w których wybór jednostki do próby nie ma charakteru losowego, a decyzja o tym, czy dana jednostka populacji znajdzie się w próbie czy nie, zależy od posiadanych o niej informacji2.
Dobór celowy
Metody celowego doboru próby obejmują kilka różnych procedur doboru próby. W badaniach socjologicznych najczęściej stosuje się dobór celowy proporcjonalny.
W doborze nielosowym nie stosuje się metod rachunku prawdopodobieństwa.
Rozróżniamy następujące próby:
celowe (z góry określa się grupę osób, do których chce się dotrzeć wraz z charakteryzującymi tę grupę cechami; jak na przykład płeć, wiek, zawód, wykonywane czynności, wybiera się konkretne osoby, nie są one przypadkowe; przykładem może być grypa 100 osób kupujących w supermarkecie w godz. 8-15),
ilościowe (wg określonych ilości, np. 10 mężczyzn i 20 kobiet),
proporcjonalne (wyniki tak skonstruowanych badań mają dać porównanie dwóch grup, z których jedna zdecydowanie odznacza się daną cechą, której brakuje drugiej dokładnie tej samej cechy; jest to nieco podobne do doboru grup do eksperymentu, z tą różnicą, że na żadną z grup nie działa żaden wprowadzony przez badacza bodziec; przykładem może być badanie z udziałem 50 % palących oraz 50 % niepalących),
kwotowe (dobór ze względu na płeć, wykształcenie - badanie jest prowadzone z wcześniej określoną liczbą osób w zdefiniowanych kategoriach; tym różni się od celowego, że w przypadku próby kwotowej nie ważne kogo się zbada, ważne, aby posiadał cech, które są wymagane; nie jest to badanie imienne),
na podstawie osądu badacza (badacz ma decydujący głos w wyborze - tzw. próba uznaniowa),
wygodne (osoby, do których badacz ma łatwy dostęp, często osoby specjalnie zapraszane)
KSIĄŻKA
Tytuł: DOBÓR PRÓBY W AUDYCIE
Autor: Wiesław Karliński
Warszawa 2005 wydanie I
Notka biograficzna:
Wiesław Karliński , dr inż. (informatyk, absolwent Politechniki Lwowskiej, dr n.med)
W dotychczasowej praktyce zajmował się projektowaniem, budową i wdrażaniem systemów monitorowania, początkowo w zastosowaniach przemysłowych i w medycynie, a następnie w zakresie organizacji i ekonomiki ochrony zdrowia, administracji publicznej oraz finansów publicznych.
W latach 1999-2002 odpowiedzialny za uruchomienie i prowadzenie informatycznego Systemu Monitorowania Reformy Administracji Publicznej. Od roku 2002 jest doradcą ekonomicznym w Najwyższej Izbie Kontroli, gdzie zajmuje się zastosowaniem narzędzi informatycznych oraz metod statystycznych, w tym doboru próby, w badaniach kontrolnych.
Jest autorem szeregu opracowań oraz programów komputerowych z zakresu zastosowań metod statystycznych w różnych dziedzinach: w medycynie (Stat-med), genetyce (Stat-gen), psychometrii (Psycho-scan) oraz w audycie (Pomocnik Kontrolera).
WPROWADZENIE
Książka adresowana jest głównie do osób, które chcą się zapoznać z różnymi metodami doboru próby, a stając przed problemem ich praktycznego zastosowania w audycie, chcą dokonać tego z pełną świadomością.
Opracowanie jest próbą przeglądu i usystematyzowania metod oraz technik doboru próby w aspekcie ich wykorzystania w badaniach audytorskich. Jest to autorska próba pogodzenia prezentowanych przez statystyków teoretycznych opisów stosowanych modeli, które są trudne do praktycznego zastosowania, z metodami czysto praktycznymi stosowanymi przez specjalistów od audytu, które często nie są w sposób dostateczny opisane matematycznie. Autor pokazuje jak różne może być podejście do tej tematyki przez statystyków oraz przez specjalistów od audytu.
Na podstawie wielu testów autor wypracował metody, które przedstawia w przystępny sposób. Pokazuje praktyczne aspekty metod i technik wraz z precyzyjnym ich opisem matematycznym. Na podstawie przedstawionych opisów można opracować algorytmy obliczeniowe, które realizują w praktyce opisywane metody.
Opracowanie zawiera wiele przykładów praktycznych zawierających opis kompletnych rozwiązań.
Praca omawia:
METODY - zagadnienia metodologiczne,
TECHNIKI - praktyczną realizację, krok po kroku, metod mających zastosowanie w procesie audytu,
NARZĘDZIA - narzędzia informatyczne stosowane przy doborze próby.
SPIS TREŚCI
WPROWADZENIE
I. METODY
1. Informacje ogólne
1.1. Zarys metodyki prowadzenia audytu opartego o dobór próby
1.2. Klasyfikacje metod doboru próby
2. Wprowadzenie do statystycznych metod doboru próby
2.1. Koncepcja badania opartego o metody statystyczne
2.2. Zasady wyznaczania estymatorów prostych
2.3. Zastosowanie estymatorów złożonych
2.4. Rozkłady zmiennych losowych w doborze próby
2.5. Reprezentatywność próby
3. Wybrane modele losowania próby w badaniach reprezentacyjnych
3.1. Losowanie proste zależne
3.2. Losowanie systematyczne (z interwałem)
3.3. Losowanie warstwowe
3.4. Losowanie zespołowe
3.5. Losowanie dwustopniowe
3.6. Losowanie dwufazowe
3.7. Losowanie z prawdopodobieństwem proporcjonalnym do wielkości (PPS)
4. Dobór próby z zastosowaniem metody monetarnej (MUS)
4.1. Wyznaczenie liczebności i losowanie próby
4.2. Ekstrapolacja wyników w badaniu wiarygodności
4.2. Ekstrapolacja wyników w badaniu zgodności
5. Weryfikacja hipotez jako cel badania
5.1. Weryfikacja hipotez - zasady ogólne
5.2. Weryfikacja hipotez w procesie audytu
5.3. Wydawanie opinii w związku z weryfikacją hipotez
6. Metody sekwencyjne w doborze próby
6.1. Omówienie ogólne metody sekwencyjnej
6.2. Zastosowanie praktyczne metody sekwencyjnej w audycie
II. TECHNIKI
7. Przygotowanie audytu opartego o dobór próby
7.1. Ocena ryzyka badania audytowego
7.2. Wybór podejścia do audytu
7.3. Określenie wartości dopuszczalnego błędu (progu istotności)
7.4. Identyfikacja operatu losowania
7.5. Wybór techniki losowania elementów próby
8. Zastosowanie statystycznych metod doboru próby
8.1. Dobór próby w estymacji
8.1.1. Estymacja proporcji
8.1.2. Estymacja wartości łącznej cechy
8.2. Dobór próby w badaniu zgodności
8.2.1. Badanie zgodności metodą stałej próby
8.2.2. Badanie zgodności metodą sekwencyjną
8.2.3. Badanie wykrywające
8.2.4. Badanie zgodności metodą monetarną (MUS)
8.3. Dobór próby w badaniu wiarygodności
8.3.1. Badanie wiarygodności metodą „średnio na jednostkę”
8.3.2. Badanie wiarygodności na podstawie różnicy lub proporcji wartości
8.3.3. Badanie wiarygodności metodą monetarną (MUS)
9. Zastosowanie niestatystycznych metod doboru próby
III. NARZĘDZIA
10. Narzędzia uniwersalne
10.1. Oprogramowanie biurowe
10.2. Pakiety statystyczne
11. Narzędzia specjalistyczne
11.1. Program ACL - charakterystyka ogólna, funkcje doboru próby
11.2. Program WinIDEA - funkcje dotyczące doboru próby
11.3. Inne programy specjalistyczne
11.4. Wykorzystanie narzędzi CAATs przez instytucje audytorskie
PODSUMOWANIE
BIBLIOGRAFIA
TABLICE STATYSTYCZNE
Dobór próby i schematy doboru próby
Badacze posługują się stosunkowo niewielką liczbą przypadków (próbą) jako podstawą wyciągania wniosków o całej zbiorowości.
Populacja - całkowity zbiór obiektów poddanych analizie.
Próba - podzbiór danych pochodzących z populacji i będących podstawą uogólnień na całą populację.
Populacja - zbiór wszystkich przypadków wykazujących określone cechy. To, jaka jest populacja zależy od problemu badawczego (gospodarstwa domowe w Wielkiej Brytanii, studenci wyższych szkół niepublicznych Polsce, książki w bibliotece publicznej, wyborcy).
Jednostka doboru próby - pojedynczy obiekt z populacji, z której będzie pobierana próba. Może nią być osoba, zdarzenie, miasto, naród.
Populacja skończona - składa się z przeliczalnej liczby jednostek (np. wszyscy zarejestrowani wyborcy w danym mieście i danym roku).
Populacja nieskończona - składa się z nieskończenie wielu jednostek, np. nieograniczona liczba rzutów monetą.
Dobór reprezentacyjny - pobór próby dla otrzymania informacji o określonej właściwości konkretnej skończonej populacji.
Podstawa doboru próby (operat) - pełna lista jednostek doboru próby (sytuacja idealna: wszystkie jednostki składające się na daną populację).
Próba uważana za reprezentatywną, gdy wyprowadzone na podstawie badania próby wnioski są podobne do wniosków, które badacz otrzymałby, gdyby przebadał całą populację.
Dobór losowy - dla każdej jednostki doboru próby wchodzącej w skład populacji można określić prawdopodobieństwo, z jakim jednostka ta może znaleźć się w próbie.
Losowe schematy doboru próby:
losowanie indywidualne nieograniczone. Każdy z elementów populacji ma takie samo, niezerowe prawdopodobieństwo dostania się do próby. Prawdopodobieństwo to wynosi n/N (gdzie n- liczebność próby, a N liczebność populacji).
losowanie systematyczne. Wybieranie każdego k-tego elementu z populacji, począwszy od pierwszego elementu, który zostanie wybrany w sposób losowy. Prawdopodobieństwo wynosi 1/K (K=N/n). Np. z populacji liczącej 10 000 (N) osób wybieramy próbę 100 (n) osób, czyli wybierać będziemy co setną osobę (10 000:100=100).
losowanie warstwowe. Stosowana by uwzględnić w sposób reprezentatywny grupy składające się na populację. Tworzymy zbiór homogenicznych grup wyodrębnionych ze względu na badane zmienne. Efekt: zwiększenie poziomu dokładności szacowania. Wewnątrz każdej warstwy próba dobierana w sposób losowy. Kryterium podziału musi pozostawać w związku z badanymi zmiennymi.
losowanie grupowe. Polega na wcześniejszym określeniu dużych zbiorowości zwanych grupami i następnie losowaniu określonej liczby grup za pomocą losowania indywidualnego lub warstwowego. Np. badania postaw politycznych osób dorosłych w różnych okręgach wyborczych. Brak listy mieszkańców, dostępna jedynie mapa okręgów wyborczych. Losujemy okręgi wyborcze (losowanie grup), następnie w każdym okręgu losujemy kwartały mieszkalne (losowanie grup) i przeprowadzamy wywiady ze wszystkimi mieszkańcami tych kwartałów. Można dokonać losowania indywidualnego nieograniczonego każdym kwartale, wtedy losowanie próby byłoby procesem trójetapowym.
Dobór nielosowy - nie ma możliwości określenia takiego prawdopodobieństwa.
próba okolicznościowa - tworzą ją osoby łatwo dostępne. Brak możliwości określenia reprezentatywności, dlatego na tej podstawie nie można oszacować parametrów populacyjnych.
próba celowa (ekspercka) - dobór subiektywny, starania o dobór osób reprezentujących populację. Np. badania przedwyborcze prowadzone na populacji miasteczka, które w poprzednich wyborach uzyskało wyniki odzwierciedlające wybory ogólnokrajowe.
próba kwotowa - celem doboru tej próby jest uzyskanie maksymalnego podobieństwa do populacji wyjściowej. Np. wiadomo, że populacja składa się w równej części z kobiet i mężczyzn, - do próby należy wybrać proporcjonalnie po połowie kobiet i mężczyzn. W populacji 15% osób czarnoskórych - w próbie również 15%.
Generalnie osoby badane w próbie kwotowej dobiera się ze względu na parametry: płeć, wiek, miejsce zamieszkania, pochodzenie społeczne/etniczne, kierując się rozkładem tych zmiennych w populacji.
Tu też nie da się dokładnie oszacować parametrów populacyjnych na podstawie danych otrzymanych z badania próby.
Nielosowe błędy pomiaru:
błąd wynikający z braku odpowiedzi
* brak możliwości przeprowadzenia wywiadu: ludzie chorzy, niepiśmienni, posiadający bariery językowe.
* nieodnalezieni respondenci
* nieobecni w domu - ich wyniki dodawane w późniejszym terminie.
* odmowa odpowiedzi - osoby, które odmawiają współpracy lub udzielenia odpowiedzi na wszystkie pytania kwestionariusza
Proporcja osób nie udzielających odpowiedzi zależy od:
- rodzaju populacji,
- metody zbierania danych,
- rodzaju zadawanych pytań,
- umiejętności ankietera,
- liczby ponawianych kontaktów z respondentem.
Źródło: F. Ch. Nachmias, (Zysk i S-ka 2001), Metody badawcze w naukach społecznych
Proszę poszukać także w Internecie tekstu:
O NIEWŁAŚCIWYM STOSOWANIU METOD STATYSTYCZNYCH
Andrzej Sokołowski
Akademia Ekonomiczna w Krakowie, Katedra Statystyki; StatSoft Polska Sp. z o.o.