7 Techniki losowania prób

7. Techniki losowania prób

Pojęcia wstępne:

Populacja (zbiorowość generalna)- zbiór zdarzeń, gospodarstw domowych, osób lub przedmiotów charakteryzujących się wspólna cechą jakościową lub ilościową, musi być jednorodna tzn. aby jednostki statystyczne w niej występujące podlegały, ze względna badaną cechę, działaniu tych samych przyczyn systematycznych, a ich zróżnicowanie w obrębie wyróżnionej populacji wynikało tylko z przyczyn losowych.

Próba losowa (zbiorowość próbna)- część, podzbiór populacji generalnej, podlegająca badaniu statystycznemu,; ważne jest aby była to próba reprezentatywna.

Celem badań statystycznych jest na ogół poznanie rozkładu interesującej nas cechy w populacji generalnej oraz uzyskanie informacji o wartości syntetycznych charakterystyk (parametrów) tego rozkładu.

Celem badań statycznych jest rozpoznanie rozkładu interesującej nas cechy w populacji generalnej.

Głównym kryterium podziału badań statystycznych, związanym z udziałem zbiorowości statystycznej w badaniu jest liczba jednostek zbiorowości statystycznej objętych badaniem, według którego wyróżniamy:

W wielu sytuacjach przeprowadzenie badania pełnego jest praktycznie niemożliwe, ponieważ:

Dlatego też w wielu sytuacjach badanie częściowe jest wymuszoną formą badania.

TECHNIKI DOBORU PRÓBY

Statystyka matematyczna zajmuje się tylko badaniami częściowymi i opiera się na wnioskowaniu statycznym, polegającym na uogólnieniu uzyskanych wyników w próbie na całą populację oraz oszacowaniu wielkości popełnionych przy tym błędów.

Wybór techniki doboru próby zależy przede wszystkim od celu badania, posiadanej przez badacza wiedzy o populacji, rygorów dotyczących wnioskowania o populacji, kosztów opracowania operatu oraz funduszy przeznaczonych na wykonanie badania.

Przed pobraniem próby ważne jest określenie jednostki losowania, wyróżniamy dwa typy:

Według kryterium wyboru jednostki losowania wyróżniamy techniki losowania próby: indywidualne i zbiorowe. (chyba nie trzeba wyjaśniać które są które :))

Techniki doboru próby możemy podzielić na dwie podstawowe grupy:

  1. NIEPROBABILISTYCZNE TECHNIKI WYBORU PRÓBY

    1. wybór przypadkowy (według wygody)

polega na tym, ze to próby dostają się jednostki przypadkowo (nie losowo!), gdyż w odpowiednim czasie znalazły się w miejscu, w którym prowadzono badanie. Możliwość dostania się do próby badawczej ma tylko bliżej nieokreślona część populacji, co ogranicza możliwość późniejszych uogólnień wyników na całą populację.

Wybór przypadkowy elementów do próby nie gwarantuje reprezentatywności próby, ale w pewnym, ograniczonym zakresie umożliwia jednak poznanie populacji.

Taką technikę stosuję się powszechnie w badaniach opinii konsumentów w ankietach ulicznych, ankietach telefonicznych, radiowych, prasowych, internetowych itp.

Cechy:

- szybki i taki w realizacji, nie wymaga posiadania operatu losowania)

- odwołuje się do jednostek łatwo dostępnych chętnych do współpracy

- nie zapewnia reprezentatywnej próby dla żadnej określonej populacji,

- nie może być stosowany w tych badaniach opinii, które zawierają elementy wnioskowania statystycznego

- może być stosowany w badaniach pilotażowych, a także do sformułowania hipotez badawczych lub zebrania ogólnych na dany temat opinii, które będą weryfikowane w późniejszym zasadniczym badaniu.

  1. Wybór celowy

Polega na tym, że badacz na podstawie swojej wiedzy wskazuje jednostki populacji, które zostaną włączone do próby, Jednostki te w opinii badacza są albo reprezentatywne dla danej populacji, albo z innych względów odpowiednie, np. dlatego, ze spełniają określone wcześniej charakterystyki.

Przykład: dobór miasta lub okręgu wyborczego do przeprowadzenia prawyborów, gdzie charakterystyką decydują o wyborze takiego miasta będą niewielkie odchylenia rozkładu głosów w ostatnich wyborach względem całego kraju. Inny przykład dobór ekspertów wdanej dziedzinie w celu wyrażenia opinii np. producenci odzieży zaciągają opinie kilku projektantów.

Istota tej techniki opiera się na posiadaniu przez badacza pewnej wiedzya priori o populacji. Źródła tej wiedzy mogą być różne: analiza danych z przeszłości, doświadczenie, intuicja.

O ile więc decyzja o wykorzystaniu wyboru przypadkowego próby jest zwykle wyrazem zupełnej nieznajomości badanej populacji, o tyle dobór celowy wyraża posiadanie przez badacza informacji, które pozwolą mu wskazać te a nie inne jednostki włączone do próby.

  1. Wybór kwotowy- najbardziej efektywny z metod nieprobabilistycznych

Jej celem jest uzyskanie założonej z góry struktury próby ze względu na wyróżnione charakterystyki

Opiera się na założeniu, że próba jest reprezentatywna dla wszystkich elementów badanej populacji, struktura próby pod względem istotnych cech jest taka sama, jak struktura badanej populacji, dobór więc wymaga dokładnej znajomości struktury badanej zbiorowości. Populację opisuje się według określonych kryteriów (cech) tj.: wiek, płeć, wielkość rodziny, dochód, grupa społeczna, działalność, dzieląc ją na warstwy. Następnie określa się skład próby proporcjonalnie do udziałów procentowych poszczególnych warstw w badanej populacji. Np. w badanej populacji liczącej 1000 osób kobiety stanowią 52%, czyli jest ich 520, to w próbie liczącej 100 osób też będą stanowiły 52%, ale będzie ich 52.

Wykorzystanie techniki kwotowego wyboru jednostek do próby, z jednej strony, zapewnia uzyskanie żądanej struktury próby, lecz z drugiej nie rozstrzyga o tym, w jaki sposób poszczególne jednostki w obrębie danych kwot będą wybierane do próby, co w ostateczności stawia pod znakiem zapytania kwestię reprezentatywności takiej próby. Wyboru z populacji jednostek o zadanych charakterystykach (52 kobiety i 48 mężczyzn) można już później dokonać w sposób celowy, przypadkowy bądź inny wygodny dla ankietera.

Wada tej metody jest brak możliwości szacowania reprezentatywności doboru kwotowego – nie można zastosować do tego celu ani poziomu istotności, ani przedziału ufności. W celu uogólnienia wyników pomiaru próby kwotowej na populację generalną nie można zastosować rachunku wnioskowania statystycznego.

Zalety:

- niewielkim kosztem pozwala na uzyskanie reprezentatywnej próby (reprezentatywnej ze względu na wyróżnione cechy kontrolne),

Wady:

- nie sposób uwzględnić wszystkich istotnych dla celu badania charakterystyk populacji

- mogą wystąpić błędy wyboru jednostek próby, jeżeli o wyborze decyduje subiektywna decyzja ankietera

- metoda nie pozwala na szacowanie błędu próbkowania.

  1. Metoda kuli śniegowej

stosowana jest w przypadku, gdy populacja badana składa się z jednostek nietypowych, do których bardzo trudno jest dotrzeć i ustalić. Metoda ta polega na znalezieniu pierwszej grupy nietypowych jednostek, a następnie poproszeniu ich o wskazanie kolejnych znanych im jednostek o podobnych cechach. W ten sposób powiększamy liczbę jednostek aż do uzyskania zakładanej liczebności próby.

Próba uzyskana tą techniką rzadko bywa próbą reprezentatywną.

  1. PROBABILISTYCZNE TECHNIKI WYBORU PRÓBY

Losowanie rzeczywistych obiektów populacji odbywa się w sposób pośredni przez operat losowania.

Operat losowania jest listą lub quasi-listą członków populacji. Reprezentatywność próby zależy bezpośrednio od tego, w jakim stopniu operat losowania uwzględnia wszystkich członków populacji generalnej, którą próba ma reprezentować.  Operat losowania musi być:

- kompletny, tzn. powinien obejmować wszystkie jednostki badanej populacji, przy czym każda jednostka badania powinna w nim figurować tylko raz

- aktualny - ponieważ operaty losowania są oparte na wynikach spisów (lub rejestracji) z natury rzeczy odzwierciedlają pewien przeszły stan faktyczny, który nie zawsze musi się pokrywać ze stanem obecnym.

  1. Losowanie proste (losowanie ze zwracaniem, losowanie niezależne, zwrotne)

Polega na tym ze każdy wylosowany z populacji element jest do niej zwracany, więc prawdopodobieństwo wylosowania pierwszego i ostatniego elementu jest takie same. Ten wariantem używany jest najczęściej w przypadku populacji nie skończonych. Jego wadą jest to że nie gwarantuje reprezentatywności każdej próby, tak jak 10 rzutów kostką nie gwarantuje uzyskania przynajmniej raz 6; oraz że próbnie mogą się znaleźć parę razy te same jednostki.

  1. Losowanie zależne (losowanie bez zwracania, losowanie bezzwrotne)

Polega na tym że raz wylosowany element populacji nie jest do niej zwracany, ni może się więc pojawić więcej niż jeden raz w próbie. Oznacza to, ze po każdym kolejnym losowaniu liczebność populacji zmniejsza się o 1 oraz rośnie prawdopodobieństwo wylosowania konkretnej jednostki.

  1. Losowanie systematyczne

Określenie systematyczne określa się do opisu sposób poruszania się w operacie losowania w celu dotarcia do wylosowanych jednostek populacji.

Technika składa się z trzech etapów:

- ustalenie interwału losowania (τ) ze wzoru: τ =liczebność populacji/liczebności próby

Otrzymaną wartość zaokrągla się w dół do pierwszej liczby całkowitej, ponieważ zaokrąglenie w gorę spowoduje, że liczebność próby będzie nie pełna

- losowy wybór jednostki populacji z pierwszego interwału losowania: czyli z przedziału obustronnie zamkniętego [1, τ] losuje się jednostkę (losowanie proste), przyjmijmy że wylosowane jednostkę k.

- wskazanie pozostałych jednostek, które zostaną włączone do próby o numerach: k+ τ, k+2 τ, k+3 τ,… k+(n-1)τ.

Jeżeli jednostki w operacie zostaną ułożone według cech malejących bezpośredni związek z badaną cechę, to losowanie systematyczne zwiększa reprezentatywność próby. Jeśli nie są uporządkowane wtedy efektywność losowania systematycznego jest podobna do efektywności losowania prostego.

Brak pełnej informacji o operacie losowania nie wyklucza stosowania techniki wyboru systematycznego jednostek próby.

  1. Losowanie warstwowe

Należy do najczęściej wykorzystywanych schematów wyboru próby w praktyce.

Zastosowanie tej metody charakteryzuje się:

- możliwością wykorzystania przy doborze próby różnorodnych informacji o badanej populacji,

- dużą efektywnością w przypadku populacji wewnętrznie niejednorodnych,

- możliwością stosowania różnych sposobów wyboru probabilistycznego jednostek z podzielonej na subpopulacje (warstwy)zbiorowości generalnej.

Losowanie warstwowe jest dwu stopniową procedurą, według której najpierw populację dzieli się na subpopulacje(warstwy), a następnie z poszczególnych warstw losuje się w sposób probabilistyczny elementy próby.

Celem podziału populacji na warstwy jest wyodrębnienie w zróżnicowanej zbiorowości możliwie jednorodnych grup jednostek po to aby każda z tych grub miała odpowiednią reprezentację w próbie. Takie działanie zwiększa reprezentatywność próby, zwłaszcza w populacjach silnie wewnętrznie niejednorodnych. Poszczególne warstwy powinny być zróżnicowane między sobą i homogeniczne wewnątrz. Warstwowanie musi zostać przeprowadzone w taki sposób, aby otrzymane warstwy były rozłączne, a warstwowanie wyczerpujące, czyli aby każda jednostka populacji należała do jednej i tylko jednej warstwy.

Jedną z najważniejszych kwestii zastosowania schematu losowania warstwowego jest tzw. alokacja próby, przez którą rozumie się rozmieszczenie elementów próby w poszczególnych warstwach. Badacz bowiem staje przed wyborem ile jednostek z każdej warstwy i w jaki sposób powinien wylosować.

Najbardziej powszechną metodą alokacji próby jest alokacja proporcjonalna: w próbie każda warstwa ma reprezentację proporcjonalną do udziału w populacji.

  1. Losowanie zespołowe i wielostopniowe

Losowanie zespołowe należy do jednego z najbardziej popularnych schematów losowania w tych badaniach opinii, w których badana populacja jest liczna a otrzymanie operatu losowania jest uwzględniającego wszystkie jednostki jest kosztowne.

Np. losując mieszkańców Katowic, najpierw losuje się dzielnice, potem ulice, a na ostatnim etapie mieszkańców.

Przed przystąpieniem do losowania ważne jest precyzyjne zdefiniowanie zespołów

Za stawaniem schematu losowania zespołowego jedno- lub wielostopniowego przemawiają przede wszystkim względy ekonomiczne i organizacyjne.

Losowanie zespołowe jest tym efektywniejsze im mniej wewnętrzne zróżnicowanie jednostek w zespołach jest większe, z różnicowanie między tymi zespołami mniejsze.

Losowanie zespołowe może być losowaniem jednostopniowym lub wielostopniowym. W przypadku, gdy do ostatecznej próby są włączone wszystkie jednostki z wylosowanych zespołów, losowanie nazywa się losowaniem jednostopniowym. Najczęściej jednak z zespołów będących jednostkami losowania pierwszego stopnia losuje się mniejsze zespoły, z nich jeszcze mniejsze, a na końcu tego łańcucha zostają wylosowane indywidualne jednostki badania. W zależności od etapów mówimy o losowaniu dwu-, trzy- czterostopniowym itd.

Jednostkom losowania pierwszego stopnia nadaje się prawdopodobieństwo proporcjonalne do ich wielkości, ale już jednostki losowania drugiego stopnia należy losować z jednakowym prawdopodobieństwem

  1. Generatory liczb losowych

Generatory liczb losowych: generatory komputerowe, tablice liczb losowych

Służą do tworzenia ciągu liczb losowych można zdefiniować jako ciąg, który nie może być określony żadnym ustalonym wzorcem (algorytmem). Można je zastosować w statystyce do wyboru jednostek do próby.

Podstawowym generatorem jest tablica liczb losowych. Pierwszą tablicę liczb losowych stworzył L.H.C. Tippett na początku XX, który na 24 stronach zwarł ponad 41 tyś cyfr (od 1 do 9).

Korzystając z tablic losowych należy przestrzegać następujących zasad:

- zamieszczony w tablicach zbiór cyfr należy traktować jako jeden, długi ciąg cyfr

- odczytywanie liczb losowych można rozpocząć w dowolnym miejscu w tablicy, jeżeli miejsce zostało już określone to nie wolno go zmieniać po odczytanie jednej lub kilku potrzebnych liczb losowych, nie wolno także pomijać żadnych cyfr

- biorąc pod uwagę liczebność próby należy zdecydować czy zamieszczone w tablicach cyfry łączyć w liczby dwucyfrowe (populacja ma jednostek mniej niż 100), trzycyfrowe, cztero itd.

Generatory sprzętowe działające na zasadzie obrazowania właściwości i parametrów fizycznego procesu stochastycznego, najczęściej szumu elektrycznego.

Generatory programowe - działające na zasadzie deterministycznego obliczania ciągu liczb, które "wyglądają", jak liczby losowe.

Zasadniczą zaletą generatora sprzętowego, szczególnie ważną w kryptografii, są nieprzewidywalność (unpredictability) i niereprodukowalność (nonreproductability) generowanych ciągów, wynikające z unikatowości realizacji fizycznego procesu stochastycznego w danym przedziale czasu.

Liczby pochodzące z generatora programowego zwane są liczbami pseudolosowymi, ponieważ faktycznie nie są dziełem przypadku, lecz wynikiem skomplikowanych procedur matematycznych.

Największą zaletą generatorów pseudolosowych jest ich szybkość, często też mają lepsze właściwości statystyczne niż generatory sprzętowe. Należy jednak zwrócić uwagę na fakt, że mając kontrolę lub znając wartości podawane na wejście generatora oraz jego stan wewnętrzny bez trudu można przewidzieć zwracane przezeń liczby. Z tego powodu decydując się na zastosowanie w systemie kryptograficznym generatora liczb pseudolosowych należy zachować szczególną ostrożność przy doborze zarówno samego algorytmu, jak i sposobu inicjowania oraz rodzaju wartości podawanych na jego wejście.

Literatura:

M. Szreder: Metody i techniki sondażowych badań opinii; PWE, Warszawa 2009.

A. Zeliaś, B. Pawełek, S. Wanat: Metody statystyczne: zadania i sprawdziany, PWE, Warszawa 2002;14-15.


Wyszukiwarka

Podobne podstrony:
NOTAKI Z TECHNIKI CYFROWEJ
techniki inchalacyjne
Mechanika techniczna(12)
W6 Technika harmonogramów i CPM
01 Podstawy i technika
Techniki unieszkodliwiania odpadów
techniki informacyjne
TECHNIKAa
Normy techniczne
TECHNIKA ROLNICZA literatura
PIT wyklad 1 planowanie infrastuktury technicznej
W11 Scinanie czyste i techniczne
20 Rysunkowa dokumentacja techniczna
3[1] c c wskazania technika
techniczne srodki zabezpieczenia(1)
sieci Techniki komutacji
Techniki ochrony gleb i gruntów przed erozją
Techniki wywierania wplywu oparte na dynamice interakcji

więcej podobnych podstron