Metodologia ze statystyk, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką


Metodologia ze statystyką.

Wykład 1.

Zdrowy rozsądek: intuicja i doświadczenie - alternatywa dla badań naukowych w psychologii.

Zdrowy rozsądek a empiryczna psychologia

Tendencja do potwierdzania (confirmatory bias) - ludzie mają tendencję do poszukiwania argumentów potwierdzających hipotezę i do unikania argumentów podważających hipotezę.

-Tendencja do potwierdzania w szacowaniu introwersji/ekstrawersji(Synder, Swann, 1978).

Badani poproszeni byli o przeprowadzenie wywiadu z nieznajomą osobą celem stwierdzenia stopnia jej introwersji. Wynik był pozytywny.

Badania dodatkowe:

- efekt występuje nawet gdy badani spodziewają się nagrody za dobór pytań

- efekt występuje gdy badani są studentami jak i psychologami.

Wpływ na osoby udzielające wywiadu:

- osobom którym zadawano pytania sugerujące ekstrawersję oceniały się następnie jako bardziej ekstrawertywnie.

- osoby te zachowywały się bardziej ekstrawertywnie(krótka interakcja z osobą nieznajomą po zakończeniu wywiadu)

- implikacje dla rozwoju uprzedzeń i dyskryminacji

- osoba żywiąca przekonanie, że osoby rude mają zły charakter, łatwo znajdzie poparcie dla takiego przekonania.

- implikacje kliniczne

Czy obliczenia statystyczne da się zastąpić statystyczną intuicją?

PYTANIE

Czy ogólne wrażenie z rozmowy wstępnej z kandydatem do pracy pomaga przewidzieć późniejszą jakość pracy kandydata?

0,8 12/6=0,75 75%-dobry pracownik

16-dobre wrażenie-12 dobry pracownik

4- złe wrażenie 3:4=0,75 75%-dobry pracownik

Brak związku-0 korelacja pozorna

Korelacje pozorne - spostrzeganie związku między zmiennymi gdy w rzeczywistości żaden związek nie zachodzi. Występuje szczególnie wtedy gdy w obrębie każdej ze zmiennych jadna z kategorii jest szczególnie liczna.

By zapobiec korelacjom pozornym oblicza się wskaźnik związku

Korelacja pozorna a uprzedzenia wobec mniejszości

- prezentacja liczby zachowań dwóch hipotetycznych grup: X i Y

- 12 zachowań X-ów i 6 zachowań Y-ów

- 12 zachowań pozytywnych(np. Zwrócenie znalezionych pieniędzy) i 6 negatywnych(np. Chwalenie się)

Człowiek X

Człowiek Y

Zachowanie pozytywne

8

4

Zachowanie negatywne

4

2

Wyniki: Grupa X oceniona bardzie pozytywnie i lubiana bardziej niż grupa Y. = Korelacja pozorna.

Oceny kliniczne oparte na statystyce.

- Oceny kliniczne - oceniający dokonuje syntezy informacji w głowie (np. Agent ubezpieczeniowy decydujący o wystawieniu polisy w oparciu o ogólne wrażenie dotyczące stopnia ryzyka).

- Oceny statystyczne - syntezę informacji dokonuje się w oparciu o formułę statystyczną(np. Agent ubezpieczeniowy decydujący o wystawieniu polisy w oparciu policzenia “wskaźnika ryzyka”).

- Oceny kliniczne a oceny oparte na statystyce we wstępnym różnicowaniu między psychozą a nerwicą(Goldberg).

Profile MMPI i diagnozy końcowe użyte zostały do opracowania statystycznej “reguły Goldberga” - suma wyników 3 skal, minus wyniki 2 innych skal.

Trafność reguły Goldberga 70%

Średnia trafność 29-ciu klinicystów: 62%

Najtrafniejszy klinicysta 67%

Klinicyści z dużym stażem nie pracowali lepiej.

Poinformowanie klinicystów o regule Goldberga tylko nieco poprawiło trafność (ciągle jeszcze nikt nie osiągnął 70%).

Osobna reguła statystyczna została opracowana dla każdego klinicysty, reguła taka oparta była zawsze na statystycznej analizie ocen danego klinicysty.

Regresja statystyczna - sir francis Galton :Regresja do bylejakości. W przypadku zdarzeń które są przynajmniej częściowo losowe po zdarzeniu skrajnym, następuje zwykle zdarzenie mniej skrajne.

Regresja statystyczna spóźnianie się Harolda

Wykład 2.

1)-Hipoteza dotyczy zmiennych, które są manipulowalne lub/i mierzalne.

-Hipoteza postuluje istnienie związku między zmiennymi(nie jest hipotezą zerową).

Badanie empiryczne1

*Frustracja:dwie grupy, obu obiecujemy śniadanie, jedna grupa dostaje, druga nie.

*Agresja:wyniki w kwestionariuszu agresji.

Zmienna niezależna Zmienna zależna

Poziom teoretyczny Frustracja(przyczyna) Agresja (skutek)

Pojęcia teoretyczne

(konstrukty)

Poziom empiryczny Niemożność zjedzenia Wyniki w kwestionariuszu

wskaźniki empiryczne śniadania w tej agresji.

(definicje operacyjne) sytuacji.

(konkretne przykłady

konstruktów)

Operacjonalizacja- wymyślić definicje operacyjne.

2)Skale pomiarowe

-Nominalna (liczby jako etykiety)-liczba jako etykieta

np.: 1-kobieta

2-mężczyzna

-Porządkowa-liczby wyznaczają kolejność

-Przedziałowa-różne interwały

-Ilorazowa-(odległość od zera) czas reakcji, najdoskonalsza.

3)Dobór do grup

-dobór losowy a nie arbitralny

-grupa kontrolna i eksperymentalna to nie są prawdziwe grupy.

Przykładowe wyniki (średnie wskaźniki agresji)

*G1(frustracja) :7,01 ; G2(kontrolna):6,09

*G1(frustracja): 8,55 ; G2(kontrolna);5,51

4)Czy różnica jest istotna statystycznie

Prawdopodobieństwo, że różnica wystąpiła przez przypadek

-Wielkość różnicy

-Wielkość próby

-Zróżnicowanie wewnątrz grup

5)Miary tendencji centralnej:

-Tendencja centralna- przeciętna wartość wyników pomiarów.

-Średnia arytmetyczna

-Mediana to wartość środkowa

-Modalna, zwana też dominantą jest to wartość najczęściej występująca.

-W przypadku rozkładu(idealnie) normalnego, średnia, mediana i modalna są identyczne.

6)Rozkład normalny

7)Mediana (ME)

Mediana jest wartością dzielącą wszystkie pomiary na pół , tak że połowa pomiarów mieści się poniżej jej, a połowa powyżej. Medianę oblicza się najczęściej- wtedy gdy pojawiają się bardzo nietypowe wyniki.

-Znajdowanie mediany dla nieparzystej liczby pomiarów jest to wynik środkowego pomiaru (wyznaczenie mediany dla zarobków w tys. zł. 1,2,2,3,70 ME =2 M=15,5

-Znajdowanie mediany dla parzystej liczby pomiarów- jest to średni wynik 2 środkowych osób

(dla zarobków 1,2,3,70, ME = 2,5 (2+3)/2

8)Miary zmienności(rozproszenia) wyników rozkładu

-Ważna nie tylko tendencja centralna ale także zmienność (rozproszenie)

*Wyniki w grupie A: 4,4,4 rozstęp=0

Wyniki w grupie B: 2,4,6 rozstęp=6-2=4

PODSTAWOWE MIARY ZMIENNOŚCI

-rozstęp

-wariancja

-odchylenie standardowe

-Wariancja-jest to suma kwadratów odchyleń wszystkich wyników od średniej dzielona przez liczbę wyników minus1.

Wariancja= s²=Σ (x1-M)²/(N-1)

-Odchylenie standardowe

SD-standard deviation

to pierwiastek z wariancji SD=√(s²)

9)Kolejne kroki obliczania wariancji i odchylenia standardowego( na przykładzie wyników grupy B: 2,4,6 grupy A:4,4,4.)

1)obliczyć średnią (M=4)

2)obliczyć odchylenie od średniej(odjąć średnią od każdego wyniku:-2,0,2)

3)obliczyć kwadraty odchyleń od średniej (4,0,4)

4)obliczyć sumę kwadratów odchyleń od średniej (4+0+4=8)

5)obliczyć średnią kwadratów odchyleń od średniej (poprzednią sumę podzielić przez liczbę przypadków minus 1;8/2=4 ²√4=2 obliczyliśmy wariancję s²=4

6)obliczamy odchylenie standardowe= pierwiastek z wariancji SD=2

Wariancja i odchylenie standardowe dla wyników Grupy A=0

(brak zmienności wyników)

  1. Test T Studenta dla porównania średnich dwóch prób niezależnych

test odpowiada na pytanie:jakie jest prawdopodobieństwo, że różnica między 2 grupami w zakresie średniej powstała przez przypadek? (jakie jest prawdopodobieństwo, że różnica ta powstała w wyniku błędu losowego)

Test T Studenta dla porównania średnich w 2 próbach niezależnych.

Konieczne informacje:

-Średni poziom zmiennej zależnej w każdej z 2 grup.

-Wariancja zmiennej zależnej w każdej z 2 grup.

-Liczebność w każdej z 2 grup.

-Obliczenia T

1)obliczyć różnicę średnich M1-M2

2)Obliczyć błąd standardowy różnicy

0x08 graphic

3)obliczyć t: Różnica średnich podzielona przez błąd standardowy różnicy.

4)Obliczyć stopnie swobody

df=n1+n2-2

Interpretacja ilorazu różnicy średnich i błędu standardowego różnicy(+)

Gdy bardzo wiele razy pobierze się po 2 bardzo duże próby (G1iG2) z tej samej populacji (np. polacy) i za każdym razem porówna się średnie obu grup (np. Śr wzrost) to:

-średnia różnic między grupami wyniesie ok. 0

-będzie ok.5% przypadków gdy iloraz t co najmniej 1.96

-będzie ok. 1% przypadków gdy iloraz t wynosił co najmniej 2,58

Interpretacja ilorazu różnicy średnich i błędu standardowego różnicy (+) - małe próby.

Błąd pierwszego rodzaju

Błąd drugiego rodzaju

Założenia dotyczące charakteru rozkładów zmiennej zależnej.

Czy test jednorodności wariancji jest istotny(istotność niższa niż 0,05)?

Czy odpowiedni test t jest istotny(istotność niższa niż 0,05)?

Eksperyment Jednozmiennowy z powtarzanym pomiarem

Odmiany:

Wykład 3.

Mocne strony badań z powtarzanymi pomiarami.

Słaba strona badań z powtarzanymi pomiarami: forma czysta.

Słabe strony: losowa kolejność poziomów zmiennej niezależnej

SS: Matching

Test T studenta dla porównania średnich w 2 próbach zależnych: konieczne informacje.

Obliczenia.

Błąd losowy

Błąd systematyczny

Trafność wewnętrzna

Trafność konstruktów

Trafność zewnętrzna

Badanie empiryczne 2

Zależność empiryczna

Bociany > dzieci?

Niskie temperatury > bociany

Niskie temperatury > dzieci

Badenie 2: im wyższa frustracja, tym wyższa agresja

Badanie korelacyjne

Badanie 1 to eksperyment.

Przykład łączenia podejścia eksperymentalnego i korelacyjnego

Osiem czynników zakłócających trafność wewnętrzną.

Wykład 4.

Wykład 4

REGRESJA

-Osoby, które uzyskały ekstremalne wyniki za 1 razem, przez przypadek (błąd losowy) uzyskają prawdopodobnie mniej ekstremalne wyniki za drugim razem.

*Przykłady regresji do średniej w badaniach empirycznych

-Zależność pozorna:Wpływ uczestnictwa w grupach dla rodziców na redukcję nasilenia problemów wychowawczych.

-Pozorna niezależność: Wpływ uczestnictwa w programie head start na inteligencję i na poziom osiągnięć szkolnych.

Selekcja

-Grupy różniły się od siebie już na początku badania.

Palacze vs Niepalący

-palacze jedzą więcej białego pieczywa

-palacze używają więcej cukru, mięsa, tłustego mleka, mniej warzyw i owoców

Ubytek osób badanych

(śmiertelność)

-średnie wyniki w grupie ulegną zmianie gdyż część badanych odpada i zmienia się rozkład grupy.

Interakcja selekcji i dojrzewania

Przykład:

Wśród 4-klasistów chłopcy i dziewczynki mogą nie różnić się siłą fizyczną ale po kilku latach różnice bedą już znaczne.

Interakcja selekcji i innych czynników

*Eksperyment jednozmiennowy z więcej niż 2 grupami

-zmienna niezależna na 3 lub więcej poziomach

-przykład 1: Frustracja wysoka vs średnia vs brak frustracji

-przykład 2: Głód vs trudny egzamin vs brak frustracji.

Eksperyment jednozmiennowy z więcej niż 2 grupami:

Analiza wyników

Analiza wariancji

Co to jest wariancja

Zmienność (zróżnicowanie) wyników.

-Zmienność międzygrupowa

G1 G2 G3

5,0 5,3 5,4

5,2 5,1 5,2

Średnie 5,1 5,2 5,3

-Wpływ zmiennej niezależnej

-Błąd losowy ( różnice indywidualne, błąd pomiaru)

Ponieważ różnice między grupami mogą być wywołane błędem losowym, koniecznie użycie testów statystycznych.

G1 G2 G3

5,0 5,3 5,4

5,2 5,1 5,2

średnie 5,1 5,2 5,3

Źródła zmienności wewnątrzgrupowej

-Błąd losowy: różnice indywidualne, błąd pomiary itp.

Na pewno nie zróżnicowanie poziomów zmiennej niezależnej

G1 G2 G3

T1 5,0 5,3 5,4

T1 5,2 5,1 5,3

średnie 5,1 5,2 5,3

Czy zmienna niezależna miała wpływ na wynik?

Jeśli tak to: Efekt zmiennej niezależnej (T) + błąd losowy (E)>E

A więc...

Zmienność międzygrupowa (MG)>Zmienność wewnątrzgrupowa (WG)

Jeśli tak to:

F>1

F= Zmienność MG(T+E) / Zmienność WG (E)

F= Zmienność MG(?+E) / Zmienność WG (E) = E/E

Miary zmienności

Obliczanie MG SS (Treatment)

MGSS=E (Mi-M)² x Ng

Mi - średnia poszczególnych grup

M - średnia ogólna

Ng - Liczba osób w każda

Obliczanie WGSS (eror SS)

WGSS=E(X-Mi)²

X - Wyniki dla poszczególnych osób

Mi - średnia dla grupy i

Co to są stopnie swobody?

Załóżmy, że dwa pierwsze wyniki =10 10

Czy wiadomo jaki jest 3 wynik? Nie 10

Załóżmy, że trzy pierwsze wyniki =10 x

Czy wiadomo jaki jest 4 wynik? Tak y

_

40

Ilość stopni swobody między grupowych (treatment df)

6 grup, df=5

3 grupy, df=2

2 grupy, df=1

Reguła: df = ilość grup - 1

Całkowita ilość stopni swobody(total df)

ilość badanych - 1

Ilość badanych = 30, total df = 29

Ilość badanych = 15, total df 14

Ilość stopni swobody wewnątrzgrupowych (eror df)

Eror df = ilość badanych - ilość grup (przypomnienie w teście t, df = ilość badanych - 2)

30 badanych, 4gr, eror = 26

Source df

Mg treatment 3 4gr

WG eror 26

Total 29 30 badanych

Uwaga - w publikacjach podaje się zwykle treatment df oraz eror df : F(3,26)=

PRZYKŁAD 1

G1 G2 G3

2 5 5

3 6 6

4 7 7

M=3 M=6 M=6

MG SS =?

MG SS =18

0x08 graphic

[(3-5)² + (6-5)² + (6-5)² ] *3=18

0x08 graphic
0x08 graphic

MG df=?

Ilość grup-1

MG df=2

Source

SS df Ms F

Mg 18 2 ? 18/2=9

MSMG(MS międzygrupami)=9

(SSMG/ df MG=18/2=9)

WGSS( SS wewnątrz grup) =?

G1 G2 G3

(2-3)²=1 (5-6)²=1 (5-6)²=1

(3-3)²=0 (6-6)²=0 (6-6)²=0

(4-3)²=1 (7-6)²=1 (7-6)²=1

M=3 M=6 M=6

Suma kwadratów różnic wewnątrz grup=6

( 1+0 +1+1+0+1+1+0+1=6)

*WG(error) df? =6

9 badanych- 3 grupy

lub po 2 wyniki w każdej z 3 grup

WG(error) SS df MS F

6 6 1 9 (9/1)

MSWG (MS wewnątrz grup)= (SS WG/ df WG =6/6=1)

Uwaga: F=MS MG/ MS WG

F(2,6)=9,00 ; p<0,05

Przykład 2

G1 G2 G3

2 5 3

3 6 6

4 7 9

M=3 M=6 M=6

MG SS =18

Mgdf=2

MSMg= SSMG/ df MG= 18/2=9

G1 G2 G3

(2-3)²=1 (5-6)²=1 (3-6)²=9

(3-3)²=0 (6-6)²=0 (6-6)²=0

(4-3)²=1 (7-6)²=1 (9-6)²=9

M=3 M=6 M=6

SSWG=22

(1+0+1+1+0+1+9+0+9)

df WG=?

Df WG=6

(9 badanych -3 grupy)

MSWG (MS wewnątrz grup)?

22/6= 3,67(22/6)

F=(MS WG/ MS WG= 9/3,67)= 2,46

Ten wynik nie jest statystycznie istotny.

Słowniczek Słowniczek Słowniczek Słowniczek Słowniczek

-ŹRÓDŁO ZMIENNOŚCI= źródło = source

TEST T A TEST F

-w przypadku 2 grup

F=t²

Porównanie planowane

Porównania post hoc

-Wszystko ze wszystkim

-Zwykle stosuje się je po stwierdzeniu istotnego F.

-Alternatywa dla analizy wariancji?

Eksperyment Jednozmiennowy z powtarzanym pomiarem na więcej niż 2 poziomach

Analiza

Analiza wariancji z powtarzanymi pomiarami - 2 odmiany

Wykład 5.

Eksperyment wielozmiennowy

Eksperyment jednozmiennowy z 2 grupami.

0x08 graphic

Eksperyment jednozmiennowy z więcej niż dwoma grupami.

0x08 graphic

Eksperyment wielozmiennowy 2x2

0x08 graphic

Efekt główny a prosty efekt główny.

W eksperymencie 2x2 mamy do czynienia z:

z 2 parami efektów prostych(po 1dnej parze dla każdej z 2 zmiennych niezależnych

- W eksperymencie 2x3 jest 5 efektów prostych

- W eksperymencie 3x3 jest ich 6

Eksperyment 2x2 zawiera w sobie 4 eksperymenty

Schemat 2x2

0x08 graphic

Efekt Główny

Efekt Interakcji


W języku potocznym termin interakcji jest różny

Interakcja a trafność zewnętrzna

Interpretacja a sprzeczne wyniki badań

Czy to jest interakcja?

1. Czas dojazdu (w minutach) przez miasto w porze lub poza szczytem, w zależności od rodzaju transportu.

Poza szczytem

Szczyt

Samochód

10

30

Motor

20

20

Czy samochodem zawsze szybciej? Czy może zależy to od pory dnia?

Tu występuje interakcja.

2. Ilość bramek zdobytych przez gości lub gospodarzy w zależności od ilości kibiców na meczu.

Gospodarze

Goście

Mało kibiców

5

7

Dużo kibiców

7

5

Tu jest interakcja

3. Ilość publikacji po 4 latach od uzyskanie doktoratu przez kobietę lub mężczyznę w zależności od płci promotora.

Płeć doktoranta

Mężczyzna

Kobieta

Mężczyzna

6,15

2,07

Kobieta

0,43

2,00

Czy tu występują efekty główne? Czy efekt interakcji?

Lęk mały i lęk duży, frustracja mała i frustracja duża.

1.

Frustracja -

Frustracja +

Lęk -

20

20

0

Lęk +

20

20

0

0

0

Efekt główny Frustracji - Nie (0)

Efekt główny Lęku - Nie (0)

Efekt Interakcji - Nie

2.

Frustracja -

Frustracja +

Lęk -

20

40

+20

Lęk +

20

40

+20

0

0

Efekt główny Frustracji - Tak (20)

Efekt główny Lęku - Nie (0)

Efekt Interakcji - Nie*

* - +20 = +20 i 0 = 0

3.

Frustracja -

Frustracja +

Lęk -

20

20

0

Lęk +

40

40

0

+20

+20

Efekt główny Frustracji - Nie (0)

Efekt główny Lęku - Tak (20)

Efekt Interakcji - Nie

4.

Frustracja -

Frustracja +

Lęk -

20

40

+20

Lęk +

60

80

+20

+40

+40

Efekt główny Frustracji - Tak (+20)

Efekt główny Lęku - Tak (+40)

Efekt Interakcji - Nie

5.

Frustracja -

Frustracja +

Lęk -

20

40

+20

Lęk +

40

20

-20

+20

-20

Efekt główny Frustracji - Nie (0)

Efekt główny Lęku - Nie (0)

Efekt Interakcji - Tak

6.

Frustracja -

Frustracja +

Lęk -

20

40

+20

Lęk +

30

30

0

10

-10

Efekt główny Frustracji - Tak (10)

Efekt główny Lęku - Nie (0)

Efekt Interakcji - Tak

7.

Frustracja -

Frustracja +

Lęk -

20

30

+10

Lęk +

40

30

-10

+20

0

Efekt główny Frustracji - Nie (0)

Efekt główny Lęku - Tak (20)

Efekt Interakcji - Tak

8.

Frustracja -

Frustracja +

Lęk -

20

40

+20

Lęk +

50

100

+50

+30

+60

Efekt główny Frustracji - Tak (+35)

Efekt główny Lęku - Tak (+45)

Efekt Interakcji - Tak

Jeśli jest istotny efekt główny

Jeśli jest istotna interakcja.

Analiza wariancji dla 3 zmiennych niezależnych

Interakcje proste w analizie 2x2x2.

- dwie interakcje proste A*B (przy różnych poziomach zmiennej C)

- dwie interakcje proste A*C (przy różnych poziomach zmiennej B)

- dwie interakcje proste B*C (przy różnych poziomach zmiennej A)

Wykład 6.

Porównywanie rzeczy nieporównywalnych

Właściwości skali Z

Rozkład wyników skali Z

0x08 graphic

Wyniki standaryzowane - skala Z

Standaryzacja umożliwia porównanie na tle grupy.

Anna: x=5.0(M=4,5;SD=2)

Z=(5.0-4,5)/2=0,25

Marek: x=3,5(M=2,5;SD=2)

Z=3,5-2,5)/2=0,5

Tomek: x=3.0(M=4,0;SD=1)

Z=(3.0-4,0)/1= -1.0

Krysia: x=3,5(M=4,5;SD=2)

Z=3,5-4,5)/2= -0,5

Korelacja

Korelacja dodatnia

Korelacja ujemna

Brak korelacji

Związek krzywolinijny

Obliczanie współczynnika korelacji r Pearsona.

Kolejne kroki w liczeniu

Istotność statystyczna współczynnika korelacji

Korelacja a rodzaj skali pomiarowej

0x08 graphic

Korelacja a trafność wewnętrzna

*Współczynnik determinacji r²

proporcja zmienności jednej zmiennej dająca się przewidzieć na podstawie informacji o poziomie drugiej zmiennej

r²*100=procent wariancji wspólnej

IQ a średnia ocen

Współczynnik korelacji między ocenami a ilorazem inteligencji r=0,50. W jakiej mierze da się przewidzieć średnią ocen na podstawie IQ(lub odwrotnie)

r²=0,50²=0,25

25%wspólnej wariancji

*RÓWNANIE REGRESJI

Jeśli nie mamy informacji o żadnej zmiennej skorelowanej ze zmienną y to najlepszy sposób przewidzenia poziomu zmiennej y jest na podstawie średniej tej zmiennej.

Równanie regresji pozwala na dokładniejsze przewidywanie poziomu zmiennej y.

W równaniu regresji do przewidywania poziomu zmiennej y używa się informacji o średnim poziomie tej zmiennej w populacji oraz o poziomie zmiennej x.

Im silniej zmienna x skorelowana jest ze zmienną y tym lepsza predykcja.

Y przewidywane=My+b(x-Mx)

b=rxy(sy/sx)

My= średnia zmiennej y

x-Mx=różnica między zaobserwowanym poziomem zmiennej x a średnią zmiennejx.

Równanie regresji: przykład

-Średni uczeń klasy spędza My=5,3 godzin tygodniowo na odrabianiu lekcji, odchylenie standardowe sy=1,4

-Rodzice płacą dzieciom średnio Mx=1,32 zł. Za każdą ocenę b. dobrą lub celującą, sx=0,35zl

-Współczynnik korelacji między czasem odrabiania lekcji a płaceniem wynosi rxy=0,43

Równanie regresji zad1

My=5,3h; sy=1,4h;Mx=1,32zl; SX=0,35zl, rxy=0,43

-Ile średnio spędzają na odrabianiu lekcji dzieci, które otrzymują za oceny b.dobre i celujące po zł 1,5 (x=1,5)?

B=rxy(Sy/Sx)=0,43/1,4/0,35)=1,72

Zadanie 2

-My=5,3h -||-

-ile średnio spędzają czasu na odrabianiu lekcji dzieci, które nie otrzymują pieniędzy za oceny b dobre i celujące(x-0)?

B=rxy(Sy/Sx)=0,43(1,4/0,35)=1,72

y przewidywane=My+b(x-Mx)= 5,3+ 1,72 (0-1,32)=3,03

*ZALEŻNOŚĆ PRZYCZYNOWA

Możliwość przewidywania poziomu jednej zmiennej na podstawie innej zmiennej nie musi znaczyć , że zależność jest przyczynowa

Badanie zależności między dwiema zmiennymi mierzonymi na skali nominalnej:test chi-kwadrat.

Czy istnieje zależność między płcią a wyborem miejsca w klasie.

Aby sprawdzić czy uzyskany patern wyników nie powstał przez przypadek stosujemy test chi-kwadrat.

-Informacje konieczne do obliczania wartości chi-kwadrat

a) fo-liczebności zaobserwowane (dla każdej kratki tabeli)

b) fe-liczebności oczekiwane

fo-liczebności zaobserwowane:ile obserwacji(ile osób) znalazło się w każdej z 4 kratek tabeli

fe-liczebności oczekiwane:ile obserwacji (ile osób) powinno się było znaleźć w każdej z 4 kratek tabeli gdyby zmienne płeć i miejsce

Obliczenie liczebności oczekiwanych fe

-liczebność wiersza/całkowita liczebność x liczebność kolumny

np. oczekiwana liczebność kobiet siedzących z przodu

ilość kobiet/ ilość studentów ilość studentów z przodu

*Czy jest istotny związek w populacji? Oblicz chi-kwadrat

x²=∑(fo-fe)²/fe

x²-wartości statystyki chi kwadrat

fo-liczebność zaobserwowana

fe-liczebność oczekiwana

(chi kwadrat) x² może się wahać od 0 do nieskończoności

Poziom istotności można odczytać z tabeli istotności lub z wydruku SPSS.

Oblicz chi-kwadrat

sekret dla leniwych

x²=∑(fo-fe)²/fe

Dla tabeli 2*2 kwadraty różnicy (fo-fe)² są takie same w każdej kratce tabeli.

*Stopnie swobody dla testu chi-kwadrat

-przy odczytywaniu z tabeli istotności potrzeba inf o ilości stopni swobody (df)

-df to iloczyn ilości wierszy- 1 oraz ilości kolumn 1 w tabeli danych dla których obliczono chi-kwadrat.

W naszym przypadku

df=(2-1)*(2-1)=1

Jak silny jest związek, obliczanie współczynnika korelacji phi dla tabeli 2*2

Ø=√(x²/n)

Współczynnik phi można interpretować jak r pearsona i obliczyć współczynnik determinacji

0,315²=0,09

Wybór miejsca w klasie związany jest z płcią ale bardzo nieznacznie.

Demonstracja związek między wynikiem rozmowy kwalifikacyjnej z kandydatem do pracy a późniejszą jakością pracy.

*Dokładny test Fishera

-bardziej konserwatywny niż test chi kwadrat ( może zwiększyć prawdopodobieństwo błędu drugiego rodzaju)

-bardziej pracochłonne obliczenia

-powinien być używany zamiast chi kwadrat gdy:

podejście teoretyczne:co najmniej jedna z liczebności oczekiwanej jest niższa niż 5.

podejście nowsze: całkowita liczebność jest niższa niż 20.

*Nietypowe zastosowanie testu chi-kwadrat

Może być używany zamiast testu studenta dla prób niezależnych(dzielimy badanych na 4 grupy w zależności od manipulacji eksperymentalnej i od uzyskania w zmiennej zależnej wyniku powyżej lub poniżej mediany.

Może być używany zamiast współczynnika korelacji pearsona (np. Dzielimy badanych na 4 grupy w zależności od uzyskania wyników powyżej lub poniżej mediany w każdej z 2 mierzonych zmiennych.

Zaletą takich zastosowań jest prostota , wadą jest mniejsza moc testu (większe prawdopodobieństwo błędu drugiego rodzaju)

chi-kwadrat-inf dodatkowe

Jest testem nieparametrycznym, nie opiera się na założeniu o normalności rozkładu

Może być używany do tabel większych niż 2*2 (więcej niż 2 poziomy zmiennej i/lub więcej niż 2 zmienne)

Dane w poszczególnych kratkach tabeli muszą być od siebie niezależne?

Niektóre inne testy nie parametryczne



Wyszukiwarka

Podobne podstrony:
Pytania - Statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
metastata, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
Statystyka-opracowane, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyk
stata PYTANIA STATYSTYKA 2 SEMESTR(1), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodolo
HANDOUT (3), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką, Metodol
Handout (2), Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką, Metodol
Statystyka - Warszawa - Pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze
statystyka-pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
Laboratorium 4 statystyka, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze staty
Statystyka pytania opracowane-1[1], Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia
stata PYTstata, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
metodologia, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Metodologia ze statystyką
rr RĂłznice Indywidualne Wszytskie pytania, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Psy
wklad czynnika i metoda, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Psychologia Różnic Ind
A18I II Metody - techniki projekcyjne i analiza, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato)
funkcjonalne znaczenie temperamentu dodatek, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Ps
Encyklopedia prawa - materialy do kolokwium, Studia, Psychologia, SWPS, 2 rok, Semestr 04 (lato), Za

więcej podobnych podstron