Etapy realizacji badania

naukowego

• Planowanie badania

(zakres, populacja)

• Konstrukcja badania

(aparat losowania,

próba)

• Wykonanie badania

(baza danych)

• Analiza danych

(pakiet statystyczny)

• Prezentacja otrzymanych wyników
• Interpretacja

Konstrukcja badania

• Określenie badanej próby
• Reprezentatywność próby, aparat

losowania

• Określenie liczebności próby

Jaka ma być liczebność

próby?

• Zbyt duża – niepotrzebne koszty

badania

• Zbyt mała – uniemożliwia wykrycie

ważnych zjawisk medycznych

• Metoda obliczenia liczebności

próby zależy od stopnia złożoności
konstrukcji badania

• Przykłady obliczeń w STATISTICA

Analiza danych

• Dobór odpowiednich testów

statystycznych

• Przykłady obliczeń w STATISTICA:

test t Studenta i analiza wariancji
test chi-kwadrat
testy nieparametryczne
korelacja i regresja

Przedstawienie wyników i

interpretacja

• Wykresy
• Tabele

Cechy jakościowe:
płeć, zawód, diagnoza.szeregi
wielodzielcze.
-wyliczone wskaźniki struktury, natężenia i
poglądowości
-wykres słupkowy, kołowy.i inny
Cechy ilościowe: wzrost, masa ciała,wiek.

-wyliczone miary średnie i rozproszenia
bądź zestawienie wyników obserwacji w
szeregach szczegółowych, czy
rozdzielczych i wyliczanie wskaźników
struktury, natężenia i poglądowości
oraz wyliczanie miar średnich i
rozproszenia

Opis zebranego materiału

Cechy jakościowe

Częstość występowania, odsetki w

tablicach

Grupa

Kobiety

Mężczyźni

Razem

Cukrzyca

55,6

44,4

100,0

Bez

cukrzycy

60,0

40,0

100,0

Graficzna prezentacja

55,6

44,4

Kobiety Mężczyźni

Cukrzyca

Bez cukrzycy

55,6

44,4

Cechy ilościowe

• Średnia, odchylenie standardowe, mediana, rozstęp,

tablice, wykres ramka-wąsy, szereg rozdzielczy,
histogram.

• Rozstęp:R= wartość maks. – wartość minim
• Długość przedziału d =

• Liczba przedziałów l jest tak dobrana, by długość

przedziału d była łatwa do dodawania, czyli w
miarę całkowita, lub z niedużą liczbą miejsc
dziesiętnych, przy czym 6< l <12 w zależności od
liczby pomiarów.

•

1j.m. to jest 1 jednostka miary, np. jeżeli wysokość jest
mierzona w centymetrach z jednym miejscem dziesiętnym
23,4 cm; 24,0 cm itd., to 1 j.m. wynosi 0,1 cm.

Przykład –masa ciała dzieci

min=3,5; max=45,4; R=45,4-

13,5=31,9; d =

jeżeli l=8 to d=4

[

–

)

[

–

)

[

–

)

[

–

)

[

–

)

[

–

)

[

–

)

[

–

)

Graficzna prezentacja

0,2

0,4

eń

–

)

–

)

–

)

–

)

–

)

–

)

–

)

–

)

Próba – populacja

Miary położenia i rozproszenia

Średnia arytmetyczna i odchylenie standardowe w populacji: .

Średnia arytmetyczna i odchylenie standardowe z próby:





)

(









gdzie:

n- liczba elementów w próbie,

– wartość i-tego elementu z próby

Graficzna prezentacja

Wykres ramka-wąsy:

Średnia
Średnia±Błąd std
Średnia±1,96*Błąd std

(

)

Błąd standardowy SE=

Rozstęp = wartość największa-wartość
najmniejsza
Mediana Me=wartość środkowa w
posortowanych danych
Modalna – wartość najczęściej
występująca
Są to miary położenia i rozproszenia
(zmienności)
Zadanie: s=4; SE=?
125,134,146,134,130
Me=? Modalna=?

Przedział ufności dla średniej

w populacji





- nieznana średnia w populacji,

• , s średnia i odchylenie standardowe

obliczone z próby dla cechy X, mającej
rozkład normalny, to

• P( -1,96s<



< +1,96s)=0,95

• Przykład =175; s=10, to
• P(155,4<



< 194,6)=0,95

ANALIZA

WSPÓŁZALEŻNOŚCI

Analiza struktury zjawisk dotyczyła jednej

cechy. W praktyce jednak bywa tak, że
badane jednostki statystyczne
charakteryzowane są przez kilka cech.
Cechy te nie są od siebie odizolowane,
mają na siebie wpływ oraz posiadają
wzajemne uwarunkowania. Dlatego często
zachodzi potrzeba badania
współzależności między tymi cechami.

Kowariancja jest średnią arytmetyczną

iloczynu odchyleń zmiennych X i Y

od ich średnich arytmetycznych:

Rozpatrując kowariancję uzyskać

można następujące informacje o

istniejącym związku pomiędzy

zmiennymi X i Y:

1. Jeżeli cov(x,y)>0 – dodatnia korelacja
2. Jeżeli cov(x,y)<0 – ujmena korelacja
3. Jeżeli cov(x,y)=0 – brak korelacji







 

















cov

Przeprowadzając analizę można spotkać

dwa rodzaje współzależności zmiennych:

1. Współzależność funkcyjną, polegającą

na tym, że zmiana wartości jednej

zmiennej pociąga określoną zmianę

wartości drugiej zmiennej.

2. Współzależność stochastyczną

(probabilistyczną), polegającą na tym,

że wraz ze zmianą jednej zmiennej

zmienia się rozkład prawdopodobieństwa

drugiej zmiennej. Szczególnym

przypadkiem zależności

stochastycznej jest zależność

korelacyjna.

Zależności korelacyjne zachodzą

wówczas, gdy określonym wartościom
jednej zmiennej odpowiadają ściśle
określone średnie wartości
drugiej zmiennej.

Zdarzają się jednak sytuacje, w

których nie istnieje
współzależność (korelacja) ale ma
miejsce zbieżność występowania
zjawisk. Taką zbieżność określa się
mianem korelacji pozornej.

Najczęściej spotykanymi metodami

wykrywania związków korelacyjnych są:

Metoda porównywania

przebiegu szeregów statystycznych.

Metoda graficzna.

0 x

Związek ujemny (wzrost wartościchy X indukuje obniżanie

wartości cechy Y)

Związek dodatni

Brak związku

Cechę dwuwymiarową oznacza się jako

uporządkowaną parę (X,Y). Składowymi
mogą być zarówno cechy ilościowe
jak i jakościowe. To od tego, z jakimi cechami
mamy do czynienia zależy wybór sposobu
opisu współzależności.

Podstawą analizy jest zbiorowość

jednostek scharakteryzowanych parą
własności ,

gdzie i=1,2,...,n.
Badając zbiorowość jednostek pod względem

wyróżnionych cech otrzymuje się ciąg par wartości:



 







,...,





x ,

Tabele wielodzielcze (kontyngencji).

• Pierwszym krokiem jest przedstawienie zebranych danych

indywidualnych w postaci tabeli wielodzielczej (kontyngencji).

Wymaga to zliczenia jednostek w odpowiednich komórkach

tabeli z danymi. Zliczanie to bez użycia komputera jest

żmudne, zwłaszcza dla dużej liczby przypadków.

• Tabele wielodzielcze stanowią podstawę do obliczania

pozostałych statystyk określających siłę związku. Tabela

wielodzielcza przedstawia rozkład obserwacji ze względu na

kilka cech jednocześnie.

Załóżmy, że dysponujemy n obserwacjami dla jakościowej cechy

X (posiadającej kategorie X1, X2, ... Xk) i jakościowej cechy Y

(o kategoriach Y1, Y2, ...Yp) (tab. 1).

Liczebności nij określają liczbę elementów próby, dla których

cecha X ma wariant Xi i jednocześnie cecha Y - wariant Yj.

Tablica wielodzielcza pokazuje więc określony łączny rozkład

obu cech. Liczebności w ostatnim wierszu i w ostatniej

kolumnie nazywamy empirycznymi brzegowymi rozkładami,

odpowiednio cechy Y i cechy X.

Na przykład, chcąc ocenić wpływ używek (papieros, kawa,

alkohol) na pewną chorobę, zebraliśmy dane na temat ich

używania w grupie 90-osobowej. Zastosowano podział na 4

kategorie: nigdy (tzn. nie używano nigdy), niewiele (używano w

małych ilościach), średnio (używano w średnich ilościach) i

dużo (używano w dużych ilościach).

Tabele wielodzielcze

• Tabele wielodzielcze
• W wielu badaniach medycznych

gromadzimy dane będące

liczebnościami. Na przykład możemy

klasyfikować chorych w badanej próbie

do różnych kategorii pod względem

wieku, płci czy natężenia choroby.

Przedstawiane do tej pory w naszym

cyklu metody statystyczne stają się

bezużyteczne dla danych tego typu,

zwanych danymi jakościowymi.

Tabele wielodzielcze stanowią podstawę do

obliczania pozostałych statystyk

określających siłę związku.

gdzie E - oczekiwana liczebność komórki oraz O
lub nij - obserwowana liczebność komórki

MIARY

WSPÓŁZALEŻNOŚCI

Do badania zależności między zmiennymi

X i Y wykorzystuje się najczęściej
współczynnik korelacji liniowej
Pearsona, będący miarą siły związku
prostoliniowego między dwiema
cechami mierzalnymi. Współczynnik ten
wylicza się ze wzoru:

gdzie:
cov(x,y) - kowariancja zmiennych X i Y





   





cov

Kowariancja jest średnią

arytmetyczną iloczynu odchyleń
zmiennych X i Y od ich
średnich arytmetycznych:

 



 

















cov

Rozpatrując kowariancję uzyskać

można następujące informacje o
istniejącym związku pomiędzy
zmiennymi X i Y:

Jeżeli cov(x,y)>0 – dodatnia korelacja
Jeżeli cov(x,y)<0 – ujmena korelacja
Jeżeli cov(x,y)=0 – brak korelacji

Kowariancji nie można

stosować do bezpośrednich
porównań. Dlatego jest ona
standaryzowana przez odchylenia
standardowe, dzięki czemu otrzymuje
się współczynnik korelacji liniowej
Pearsona.

Właściwości współczynnika korelacji:
1.

Przyjmuje wartości z przedziału <-1;1>

Dodatni znak świadczy o dodatnim, zaś
ujemny o ujemnym związku korelacyjnym

Im tym związek
korelacyjny jest silniejszy.

Sposoby komentowania

współczynnika korelacji

- współzależność nie występuje,

b) - słaby stopień współzależności,
c)

- umiarkowany (średni) stopień

współzależności,

d) - znaczny stopień współzależności,
e)

- wysoki stopień współzależności,

- bardzo wysoki stopień

współzależności,

g) - całkowita (ścisła) współzależność
(zależność funkcyjna pomiędzy
badanymi cechami).





















• Współczynnik korelacji liniowej Pearsona

(dalej nazywany po prostu współczynnikiem

korelacji), wymaga, aby zmienne były

ciągłe. Określa on stopień proporcjonalnych

powiązań wartości dwóch zmiennych.

Wartość korelacji (współczynnik korelacji)

nie zależy od jednostek miary, w jakich

wyrażamy badane zmienne, np. korelacja

pomiędzy wzrostem i ciężarem będzie taka

sama bez względu na to, w jakich

jednostkach (cale i funty czy centymetry i

kilogramy) wyrazimy badane wielkości.

Określenie "proporcjonalne" znaczy zależne

liniowo, to znaczy, że korelacja jest silna,

jeśli może być opisana przy pomocy linii

prostej (nachylonej do góry lub na dół).

Analizę współzależności należy

uzupełnić o współczynnik
determinacji, będący kwadratem
współczynnika korelacji liniowej
Pearsona ( ).

Współczynnik determinacji

informuje, jaka część zmiennej
objaśnianej jest wyjaśniona przez
zmienną objaśniającą. Przy pomocy
tego współczynnika można
wnioskować, czy na zmienną
objaśniającą wpływają również inne
czynniki, nie podlegające badaniu.

Prosta regresji: y=ax+b,

gdzie

a = cov(x,y)/

S; b= - a

• Linia, o której mowa, nazywa się linią regresji

albo linią szacowaną metodą najmniejszych
kwadratów, ponieważ jej parametry określane są
w ten sposób, by suma kwadratów odchyleń
punktów pomiarowych od tej linii była
minimalna. Zwróćmy uwagę, że fakt podnoszenia
odległości do kwadratu powoduje, iż
współczynnik korelacji reaguje na sposób
rozmieszczenia danych (jak to zobaczymy w
dalszej części opisu).

•

W sytuacji, gdy obserwacje

statystyczne dotyczące badanych
zmiennych są liczne, bazowanie na
wartościach szczegółowych może być
uciążliwe. W celu zapewnienia
przejrzystości zebranych danych
sporządza się wówczas tablicę korelacyjną.

Na skrzyżowaniu kolumn z

wierszami wpisuje się liczebności
jednostek zbiorowości statystycznej, u
których zaobserwowano jednoczesne
występowanie określonych wartości
i .

Schemat tablicy

korelacyjnej:

...

n 



1

.
.
.

.
.
.
.
.
.

.
.
.

n 



1

…

Przykład tabeli korelacyjnej.

Wykształcenie badanych osób

przebywających w Domach Pomocy

Społecznej z uwzględnieniem płci

Wykształcenie

Płeć

Żeńska

Męska

Liczba
podstawowe
%

86,9%

43,2%

Liczba
zawodowe

3,3 %

37,8 %

Liczba
średnie
%

9,8 %

13,5 %

Liczba

wyższe
%

0,0 %

5,4 %

Liczba
Razem

100,0 %

W tablicy korelacyjnej zawarte są

rozkłady brzegowe i warunkowe.
Rozkład brzegowy (por. ostatnia
kolumna określa rozkład brzegowy
cechy X, ostatni wiersz – rozkład
brzegowy cechy Y) prezentuje
strukturę wartości jednej zmiennej (X
lub Y) bez względu na kształtowanie
się wartości drugiej zmiennej.

Rozkłady brzegowe i warunkowe

mogą być scharakteryzowane pewnymi
sumarycznymi wielkościami (najczęściej
są to średnie arytmetyczne)

Średnie arytmetyczne z

rozkładów brzegowych wyznacza
się ze wzorów:

Średnie arytmetyczne z

rozkładów warunkowych oblicza
się następująco:







1







1







1







1

W sytuacji, gdy wraz ze

wzrostem (spadkiem) wartości jednej
zmiennej następuje wzrost (spadek)
warunkowych średnich drugiej
zmiennej, wówczas można stwierdzić
istnienie korelacji dodatniej
między zmiennymi. W sytuacji,
kiedy występuje przeciwny kierunek
zmian, można mówić o korelacji
ujemnej.

Jeżeli różnice pomiędzy

średnimi są takie same, tzn.:

wówczas związek między

zmiennymi jest liniowy.

...











...











Innym miernikiem korelacyjnego związku cech

jest współczynnik korelacji rang
Spearmana. Współczynnik ten stosowany
jest głównie do badania współzależności
cech niemierzalnych, bądź cechy mierzalnej i
niemierzalnej. Może być on również
stosowany w badaniu związku
korelacyjnego pomiędzy cechami
mierzalnymi (szczególnie w przypadku małej
próby).

Konstrukcja współczynnika korelacji

rang opiera się na zgodności pozycji, którą
zajmuje każda z odpowiadających sobie
wielkości we wzrastającym lub
malejącym szeregu wartości cechy.

Współczynnik korelacji rang Spearmana

(Q) wylicza się w oparciu o wyznaczone
różnice rang ( ) oraz liczby par
obserwacji (n):

przy czym:

gdzie:
- rangi zmiennej X oraz Y (i=1,2,...n)

















v ,

gdy

Współczynnik korelacji rang

przyjmuje wartości z przedziału
, a jego interpretacja
jest analogiczna do
współczynnika korelacji Pearsona











Przykład. W celu zbadania, czy istnieje związek
między zdyscyplinowaniem pacjentów względem
zaleceń personelu medycznego a wynikami
terapii na pewną dolegliwość poddano
obserwacji 10 pacjentów. Otrzymano
następujące wyniki obserwacji zestawione w
tabeli

Pacjent

Ranga

zdyscyply-

-nowanie

Ranga

terapii

Różnica

rang (d)

Kwadrat

różnicy

rang (d

)

1
2
3
4
5
6
7
8
9

6
2
5
1

4
9
3
8
7

4
1
5
3

7
6
2
9
8

2
1
0

-2

-3

3
1

-1
-1

4
1
0
4
0
9
9
1
1
1

Razem

WSPÓŁCZYNNIK

KORELACJI RANG

SPEARMANA

• Współczynnik korelacji rang

Spearmana służy do opisu siły

korelacji dwóch cech w przypadku,

gdy:

• - cechy są mierzalne, a badana

zbiorowość jest nieliczna,

• - cechy mają charakter jakościowy i

istnieje możliwość ich

• uporządkowania.

Document Outline

Slide 1
Slide 2
Slide 3
Slide 4
Slide 5
Slide 6
Slide 7
Slide 8
Slide 9
Slide 10
Slide 11
Slide 12
Slide 13
Slide 14
Slide 15
Slide 16
Slide 17
Slide 18
Slide 19
Slide 20
Slide 21
Slide 22
Slide 23
Slide 24
Slide 25
Slide 26
Slide 27
Slide 28
Slide 29
Slide 30
Slide 31
Slide 32
Slide 33
Slide 34
Slide 35
Slide 36
Slide 37
Slide 38
Slide 39
Slide 40
Slide 41
Slide 42
Slide 43
Slide 44

Wyszukiwarka

Podobne podstrony:
wyklad 3a Etapy realizacji badania naukowego
wyklad 3 Etapy realizacji badania naukowego
Etapy badania naukowego, Resocjalizacja, Dydaktyka ogólna
T 14. ETYKA W BADANIACH NAUKOWYCH, LICENCJAT
Badania naukowe i innowacje
Formułowanie problemu w badaniach naukowych i diagnozie psychologicznej
72 badania naukowe, WSE ogólnodostepne materiały, Folie etyka
TEST badania naukowe(1), Medycyna, intensywna
Zadanie 4, Nauka, Doktorat II rok, Metody ilościowe w badaniach naukowych
Mikroskopia świetlna i elektronowa w badaniach naukowych
modelowanie konceptualne II, Nauka, Doktorat II rok, Metody ilościowe w badaniach naukowych
Badania naukowe w piel0001
Badania naukowe
Wyklad 11 Problemy etyczne w badaniach naukowych
Wykład V Etapy realizacji wymagań niezawodnosciowych ED
Problemy etyczne w badaniach naukowych
badania naukowe w pielęgniarstwie

więcej podobnych podstron