Zrozumie膰 dane i wyniki
Wyja艣nianie zagadnie艅 zw. z przeprowadzeniem badania statystycznego, ze szczeg贸lnym uwzgl臋dnieniem gromadzenia danych, sposob贸w ich weryfikacji oraz interpretacji wynik贸w.
Etapy projektowania badania statystycznego:
przygotowanie badania
gromadzenie danych i ich weryfikacja;
analizy statystyczne
prezentacja wynik贸w
interpretacja wynik贸w
publikacja wynik贸w
Przygotowanie badania:
ocena aktualnego stanu wiedzy
powo艂anie zespo艂u badawczego
ustalanie wynik贸w cel贸w og贸lnych i szczeg贸艂owych
postawienie hipotez
opracowanie kwestionariuszy badawczych
przeprowadzenie badania pilota偶owego
korekta i druk kwestionariuszy
Gromadzenie danych i ich weryfikacja:
殴r贸d艂em danych o uczestnikach badania s膮 m.in.:
kwestionariusz badawczy
wywiad lekarski
wynika bada艅 laboratoryjnych
karty zgon贸w
karty szpitalne
roczniki statystyczne i inne publikacje
Pozyskiwanie danych wymaga odpowiedniego przygotowania, kt贸re obejmuje:
organizacj臋 zespo艂贸w badawczych
dob贸r pr贸by do badania
zgromadzenie sprz臋tu badawczego, okre艣lenie miejsca i czasu badania
szkolenie personelu badawczego
Populacja i pr贸ba:
Dwa znaczenia s艂owa populacja:
wszyscy mieszka艅cy danego kraju lub obszaru rozpatrywani 艂膮cznie;
liczba mieszka艅c贸w danego kraju lub obszaru;
ca艂kowity zbi贸r jednostek (鈥瀠niwersum鈥), z kt贸rego pr贸ba jest pobrana;
nie koniecznie musi to by膰 populacja os贸b; jednostkami mog膮 by膰 instytucje, dokumenty, zdarzenia. Pr贸ba ma w za艂o偶eniu dostarczy膰 wynik贸w, kt贸re s膮 reprezentatywne dla ca艂ej populacji.
Wiarygodno艣ci wynik贸w analiz dokonanych na pr贸bie z populacji;
Problem uog贸lnienia tych wynik贸w na populacj臋, z kt贸rej pobrana by艂a pr贸ba, na inn膮, podobna populacj臋 lub odpowiednio zdefiniowany podzbi贸r kt贸rej艣 z tych populacji.
Reprezentatywno艣膰:
krytyczna analiza pos艂ugiwania si臋 s艂owem 鈥瀝eprezentatywno艣膰鈥:
pi艣miennictwo nie naukowe
pi艣miennictwo naukowe z wy艂膮czeniem statystyki
pi艣miennictwo naukowe ze statystyk膮
7 kategorii reprezentatywno艣ci:
nieobecno艣膰 czynnik贸w selektywnych w doborze pr贸by;
miniatura populacji
przypadki typowe lub idealne
odwzorowania r贸偶norodno艣ci pulsacji
specyficzna metoda dobierania pr贸by
pr贸ba pozwalaj膮ca na dobre oszacowania badanych parametr贸w
pr贸ba odpowiednia dla celu, kt贸remu ma s艂u偶y膰
nieobecno艣膰 czynnik贸w selektywnych:
stronniczo艣膰 doboru pr贸by: stanowi systematyczny b艂膮d w badaniach naukowych gro藕ny dla wiarygodno艣ci i mo偶liwo艣ci uog贸lnienia wynik贸w;
polega on na tym, 偶e pr贸ba r贸偶ni si臋 od populacji, z kt贸rej zosta艂a wybrana pod wzgl臋dem cz臋sto艣ci wyst臋powania jakiej艣 istotnej cechy sprawiaj膮cej, 偶e charakterystyka pr贸by ze wzgl臋du na t膮 cech臋 r贸偶ni si臋 od charakterystyki populacji;
by zwi臋kszy膰 mo偶liwo艣膰 nie stronniczego doboru pr贸by stosowane s膮 losowe metody selekcji, czyli takie w kt贸rych ka偶da jednostka z populacji ma jednakow膮 szanse dostania si臋 do pr贸by, a prawdopodobie艅stwa wylosowania poszczeg贸lnych jednostek s膮 od siebie zale偶ne;
by zapewni膰 bli偶sze podobie艅stwo pr贸by i populacji stosowana jest metoda mieszana: pr贸bkowanie kwotowe; chc膮c wylosowa膰 pr贸b臋 w r贸wnych proporcjach sk艂adaj膮ca si臋 z kobiet i m臋偶czyzn mo偶emy wybra膰 losowo pewn膮 liczb臋 kobiet w艣r贸d kobiet i taka sam膮 liczb臋 m臋偶czyzn w艣r贸d m臋偶czyzn;
metoda taka mo偶e zagwarantowa膰 odtworzenie w pr贸bie rozk艂adu niekt贸rych cech w populacji, jednak w stosunku do innych cech nie obj臋tych kwotowaniem mo偶liwa jest przy tej metodzie bardzo du偶a stronniczo艣膰; im wi臋cej jest kategorii, kt贸rych proporcje z populacji chcemy uwzgl臋dni膰 w pr贸bie tym pr贸ba musi by膰 odpowiednio wi臋ksza, co podra偶a koszt badania;
miniatura populacji:
rezultatem wolnego od wszelkiej stronniczo艣ci doboru by艂aby pr贸ba,
w kt贸rej rozk艂ad wszystkich cech odpowiada dok艂adnie rozk艂adowi tych samych cech w populacji
problem stanowi kryterium zgodno艣ci rozk艂ad贸w populacji i pr贸by;
aby orzec t臋 zgodno艣膰 musieliby艣my zna膰 rozk艂ady wszystkich cech pop.
pr贸ba reprezentatywna jako typowa:
idea typowo艣ci opera si臋 na przekonaniu, 偶e mo偶na wybra膰 jaki艣 fragment wi臋kszej ca艂o艣ci, kt贸ry posiada niekt贸re wa偶ne cechy
i zale偶no艣ci mi臋dzy nimi takie same jak ca艂o艣膰;
typowo艣膰 cech pr贸by polega na wysokiej cz臋sto艣ci ich wyst臋powania
w populacji lub na tym, 偶e ich warto艣ci bliskie s膮 艣redniej dla populacji;
podstawowa trudno艣膰 w wykorzystaniu takich 鈥瀟ypowych鈥 pr贸b
w badaniach naukowych polega na tym, 偶e rzadko tak wybrana pr贸ba jest typowa pod ka偶dym wzgl臋dem;
odwzorowanie r贸偶norodno艣ci populacji:
w populacji podzielonej na kategorie pokrycie populacji przez pr贸b臋 rozumiane jest jako w艂膮czenie do pr贸by reprezentant贸w
lub przynajmniej jednego reprezentanta ka偶dej kategorii;
reprezentatywno艣膰 rozumiana jako pokrycie r贸偶norodno艣ci populacji jest odmienna od miniatury populacji, gdy偶 nie stawia wymogu proporcjonalnej reprezentacji wszystkich podgrup, a tylko w艂膮czenie do grupy ich przedstawicieli; jest te偶 sprzeczna z rozumieniem reprezentatywno艣ci jako doboru przypadk贸w typowych; nie o typowo艣膰 lub przeci臋tno艣膰 tu chodzi, a raczej o odwzorowanie r贸偶norodno艣ci;
Analizy statystyczne i prezentacja wynik贸w:
Przed przyst膮pieniem do analiz statystycznych nale偶y bardzo dok艂adnie przyjrze膰 si臋 zebranym danym. Omylno艣膰, zawodno艣膰 urz膮dze艅 pomiarowych, brak rzetelno艣ci i dok艂adno艣ci w przeprowadzania wywiadu lub zapisie danych w bazie komputerowej s膮 藕r贸d艂em b艂臋du.
W celu ich wykrycia mo偶na zasobowa metod臋 podw贸jnego kodowania, kt贸ra polega na wprowadzeniu do bazy przez dwie r贸偶ne osoby. Zbiory te
s膮 por贸wnywane, a niezgodno艣ci wyja艣niane i korygowane.
Inne metody pozwalaj膮ce na zweryfikowanie b艂臋d贸w to m.in.:
ustalenie zakresu dopuszczalnych warto艣ci
zbadanie powi膮za艅 logicznych
zbadanie sp贸jno艣ci danych
sprawdzenie warto艣ci minimalnej i maksymalnej
ustalenie sposobu zapisu braku danych
przygl膮dni臋cie si臋 obserwacjom odstaj膮cym oraz ustalenie sposobu post臋powania z nimi
Obserwacja odstaj膮ca to warto艣ci badanej cechy znacznie odbiegaj膮ce od wyznaczonego zakresu warto艣ci, le偶膮ce poza tzw. cia艂em danych. 殴r贸d艂em takich obserwacji mo偶e by膰 b艂膮d, wtedy jest to b艂膮d gruby, ale mo偶e to by膰 warto艣膰 rzeczywista, znacznie przekraczaj膮ca norm臋. B艂膮d gruby mo偶na skorygowa膰 jedynie w oparciu o dane 藕r贸d艂owe. Je偶eli dost臋p do nich nie jest mo偶liwy, to obserwacja taka traktowana jest jako brak danych.
Obserwacje rzeczywiste wymagaj膮 natomiast szczeg贸lnej uwagi przy analizie danych. U偶yteczn膮 metod膮 zidentyfikowania obserwacji odstaj膮cych jest narysowanie wykresu punktowego rozrzutu.
Obserwacje odstaj膮ce maj膮 du偶y wp艂yw na nachylenie linii regresji, a w konsekwencji wp艂yw na warto艣膰 wsp贸艂czynnika korelacji. Pojedyncza obserwacja odstaj膮ca jest w stanie bardzo zmieni膰 nachylenie linii regresji
i w konsekwencji warto艣膰 wsp贸艂czynnika korelacji.
Typy danych:
dane ilo艣ciowe (mierzalne): dane, kt贸re uzyskuje si臋 w wyniku pomiaru i wyra偶a w skali liczbowej; mog膮 by膰 ci膮g艂e, gdy przyjmuj膮 warto艣ci z pewnego przedzia艂u liczbowego lub dyskretne, gdy przyjmuj膮 warto艣ci liczb ca艂kowitych;
dane jako艣ciowe (niemierzalne): okre艣lane s膮 jedynie przez nazw臋; mog膮 by膰 podawane w skali nominalnej lub porz膮dkowej, gdy pr贸cz nazwy mo偶emy ustali膰 porz膮dek;
Statystyka opisowa:
dane ilo艣ciowe:
podanie og贸lnej liczby badanych,
podanie liczby obserwacji wa偶nych,
艣redniej arytmetycznej
odchylenia standardowego;
dane jako艣ciowe:
podanie og贸lnej liczby badanych,
liczb臋 jednostek wyr贸偶nionych,
procent obserwacji;
Prezentacja wynik贸w:
tabela liczno艣ci
statystyki opisowe
podsumowuj膮ca tabela dwudzielcza