Metodologia ze statystyką.
Wykład 1.
Zdrowy rozsądek: intuicja i doświadczenie - alternatywa dla badań naukowych w psychologii.
Zdrowy rozsądek a empiryczna psychologia
demonstracja: “Przysłowia mądrością narodów?” - własne doświadczenia
demonstracja “litery i cyfry”
Tendencja do potwierdzania (confirmatory bias) - ludzie mają tendencję do poszukiwania argumentów potwierdzających hipotezę i do unikania argumentów podważających hipotezę.
-Tendencja do potwierdzania w szacowaniu introwersji/ekstrawersji(Synder, Swann, 1978).
Badani poproszeni byli o przeprowadzenie wywiadu z nieznajomą osobą celem stwierdzenia stopnia jej introwersji. Wynik był pozytywny.
Badania dodatkowe:
- efekt występuje nawet gdy badani spodziewają się nagrody za dobór pytań
- efekt występuje gdy badani są studentami jak i psychologami.
Wpływ na osoby udzielające wywiadu:
- osobom którym zadawano pytania sugerujące ekstrawersję oceniały się następnie jako bardziej ekstrawertywnie.
- osoby te zachowywały się bardziej ekstrawertywnie(krótka interakcja z osobą nieznajomą po zakończeniu wywiadu)
- implikacje dla rozwoju uprzedzeń i dyskryminacji
- osoba żywiąca przekonanie, że osoby rude mają zły charakter, łatwo znajdzie poparcie dla takiego przekonania.
- implikacje kliniczne
psycholog który mniema, że osoby o niskiej samoocenie miały w dzieciństwie złe relacje ze swymi matkami, łatwo znajdzie potwierdzenie swoich przekonań.
Czy obliczenia statystyczne da się zastąpić statystyczną intuicją?
PYTANIE
Czy ogólne wrażenie z rozmowy wstępnej z kandydatem do pracy pomaga przewidzieć późniejszą jakość pracy kandydata?
0,8 12/6=0,75 75%-dobry pracownik
16-dobre wrażenie-12 dobry pracownik
4- złe wrażenie 3:4=0,75 75%-dobry pracownik
Brak związku-0 korelacja pozorna
Korelacje pozorne - spostrzeganie związku między zmiennymi gdy w rzeczywistości żaden związek nie zachodzi. Występuje szczególnie wtedy gdy w obrębie każdej ze zmiennych jadna z kategorii jest szczególnie liczna.
By zapobiec korelacjom pozornym oblicza się wskaźnik związku
Korelacja pozorna a uprzedzenia wobec mniejszości
- prezentacja liczby zachowań dwóch hipotetycznych grup: X i Y
- 12 zachowań X-ów i 6 zachowań Y-ów
- 12 zachowań pozytywnych(np. Zwrócenie znalezionych pieniędzy) i 6 negatywnych(np. Chwalenie się)
proporcja zachowań pozytywnych i negatywnych była tka sama u X i Y
|
Człowiek X |
Człowiek Y |
Zachowanie pozytywne |
8 |
4 |
Zachowanie negatywne |
4 |
2 |
Wyniki: Grupa X oceniona bardzie pozytywnie i lubiana bardziej niż grupa Y. = Korelacja pozorna.
Oceny kliniczne oparte na statystyce.
- Oceny kliniczne - oceniający dokonuje syntezy informacji w głowie (np. Agent ubezpieczeniowy decydujący o wystawieniu polisy w oparciu o ogólne wrażenie dotyczące stopnia ryzyka).
- Oceny statystyczne - syntezę informacji dokonuje się w oparciu o formułę statystyczną(np. Agent ubezpieczeniowy decydujący o wystawieniu polisy w oparciu policzenia “wskaźnika ryzyka”).
- Oceny kliniczne a oceny oparte na statystyce we wstępnym różnicowaniu między psychozą a nerwicą(Goldberg).
Profile MMPI i diagnozy końcowe użyte zostały do opracowania statystycznej “reguły Goldberga” - suma wyników 3 skal, minus wyniki 2 innych skal.
Niezależna próba 861 profili MMPI użyta do porównania trafności diagnoz wstępnych opartych o regułę Goldberga i diagnozę.
Trafność reguły Goldberga 70%
Średnia trafność 29-ciu klinicystów: 62%
Najtrafniejszy klinicysta 67%
Klinicyści z dużym stażem nie pracowali lepiej.
Poinformowanie klinicystów o regule Goldberga tylko nieco poprawiło trafność (ciągle jeszcze nikt nie osiągnął 70%).
Osobna reguła statystyczna została opracowana dla każdego klinicysty, reguła taka oparta była zawsze na statystycznej analizie ocen danego klinicysty.
Diagnoza uszkodzeń organicznych na podstawie wyników testów psychologicznych.
Trafność reguły statystycznej 83%
Trafność klinicystów o małym doświadczeniu 63%
Trafność klinicystów o dużym doświadczeniu 58%
Trafność klinicystów o małym doświadczeniu po zapoznaniu się z regułą statystyczną 68%.
Trafność klinicystów o dużym doświadczeniu po zapoznaniu się z regułą statystyczną - większa.
Regresja statystyczna - sir francis Galton :Regresja do bylejakości. W przypadku zdarzeń które są przynajmniej częściowo losowe po zdarzeniu skrajnym, następuje zwykle zdarzenie mniej skrajne.
Wzrost,
wyniki egzaminu,
wyniki sportowe,
samopoczucie,
“dobre” i “złe” zachowanie.
Regresja statystyczna spóźnianie się Harolda
Badani proszeni o oduczenie fikcyjnego ucznia Harolda od spóźniania się
Każdego dnia komputer prezentował godzinę przybycia Harolda do szkoły
Prezentowane godziny przybycia wybierane były losowo( 8.20-8.40)
Po prezentacji badany decydował o wielkości kary.
Na końcu oceniamy skuteczność kar i nagród dla Harolda-
kary oceniane jako skuteczne,
wysokie nagrody oceniane jako nieskuteczne.
Wykład 2.
1)-Hipoteza dotyczy zmiennych, które są manipulowalne lub/i mierzalne.
-Hipoteza postuluje istnienie związku między zmiennymi(nie jest hipotezą zerową).
Uwaga: Hipoteza o braku związku- (hipoteza zerowa) może być jedynie odrzucona, nie może zaś być empirycznie potwierdzona.
Badanie empiryczne1
*Frustracja:dwie grupy, obu obiecujemy śniadanie, jedna grupa dostaje, druga nie.
*Agresja:wyniki w kwestionariuszu agresji.
Zmienna niezależna Zmienna zależna
Poziom teoretyczny Frustracja(przyczyna) Agresja (skutek)
Pojęcia teoretyczne
(konstrukty)
Poziom empiryczny Niemożność zjedzenia Wyniki w kwestionariuszu
wskaźniki empiryczne śniadania w tej agresji.
(definicje operacyjne) sytuacji.
(konkretne przykłady
konstruktów)
Operacjonalizacja- wymyślić definicje operacyjne.
2)Skale pomiarowe
-Nominalna (liczby jako etykiety)-liczba jako etykieta
np.: 1-kobieta
2-mężczyzna
-Porządkowa-liczby wyznaczają kolejność
-Przedziałowa-różne interwały
-Ilorazowa-(odległość od zera) czas reakcji, najdoskonalsza.
3)Dobór do grup
-dobór losowy a nie arbitralny
-grupa kontrolna i eksperymentalna to nie są prawdziwe grupy.
Przykładowe wyniki (średnie wskaźniki agresji)
*G1(frustracja) :7,01 ; G2(kontrolna):6,09
*G1(frustracja): 8,55 ; G2(kontrolna);5,51
4)Czy różnica jest istotna statystycznie
Prawdopodobieństwo, że różnica wystąpiła przez przypadek
-Wielkość różnicy
-Wielkość próby
-Zróżnicowanie wewnątrz grup
5)Miary tendencji centralnej:
-Tendencja centralna- przeciętna wartość wyników pomiarów.
-Średnia arytmetyczna
-Mediana to wartość środkowa
-Modalna, zwana też dominantą jest to wartość najczęściej występująca.
-W przypadku rozkładu(idealnie) normalnego, średnia, mediana i modalna są identyczne.
6)Rozkład normalny
7)Mediana (ME)
Mediana jest wartością dzielącą wszystkie pomiary na pół , tak że połowa pomiarów mieści się poniżej jej, a połowa powyżej. Medianę oblicza się najczęściej- wtedy gdy pojawiają się bardzo nietypowe wyniki.
-Znajdowanie mediany dla nieparzystej liczby pomiarów jest to wynik środkowego pomiaru (wyznaczenie mediany dla zarobków w tys. zł. 1,2,2,3,70 ME =2 M=15,5
-Znajdowanie mediany dla parzystej liczby pomiarów- jest to średni wynik 2 środkowych osób
(dla zarobków 1,2,3,70, ME = 2,5 (2+3)/2
8)Miary zmienności(rozproszenia) wyników rozkładu
-Ważna nie tylko tendencja centralna ale także zmienność (rozproszenie)
*Wyniki w grupie A: 4,4,4 rozstęp=0
Wyniki w grupie B: 2,4,6 rozstęp=6-2=4
PODSTAWOWE MIARY ZMIENNOŚCI
-rozstęp
-wariancja
-odchylenie standardowe
-Wariancja-jest to suma kwadratów odchyleń wszystkich wyników od średniej dzielona przez liczbę wyników minus1.
Wariancja= s²=Σ (x1-M)²/(N-1)
-Odchylenie standardowe
SD-standard deviation
to pierwiastek z wariancji SD=√(s²)
9)Kolejne kroki obliczania wariancji i odchylenia standardowego( na przykładzie wyników grupy B: 2,4,6 grupy A:4,4,4.)
1)obliczyć średnią (M=4)
2)obliczyć odchylenie od średniej(odjąć średnią od każdego wyniku:-2,0,2)
3)obliczyć kwadraty odchyleń od średniej (4,0,4)
4)obliczyć sumę kwadratów odchyleń od średniej (4+0+4=8)
5)obliczyć średnią kwadratów odchyleń od średniej (poprzednią sumę podzielić przez liczbę przypadków minus 1;8/2=4 ²√4=2 obliczyliśmy wariancję s²=4
6)obliczamy odchylenie standardowe= pierwiastek z wariancji SD=2
Wariancja i odchylenie standardowe dla wyników Grupy A=0
(brak zmienności wyników)
Test T Studenta dla porównania średnich dwóch prób niezależnych
test odpowiada na pytanie:jakie jest prawdopodobieństwo, że różnica między 2 grupami w zakresie średniej powstała przez przypadek? (jakie jest prawdopodobieństwo, że różnica ta powstała w wyniku błędu losowego)
Test T Studenta dla porównania średnich w 2 próbach niezależnych.
Konieczne informacje:
-Średni poziom zmiennej zależnej w każdej z 2 grup.
-Wariancja zmiennej zależnej w każdej z 2 grup.
-Liczebność w każdej z 2 grup.
-Obliczenia T
1)obliczyć różnicę średnich M1-M2
2)Obliczyć błąd standardowy różnicy
3)obliczyć t: Różnica średnich podzielona przez błąd standardowy różnicy.
4)Obliczyć stopnie swobody
df=n1+n2-2
Interpretacja ilorazu różnicy średnich i błędu standardowego różnicy(+)
Gdy bardzo wiele razy pobierze się po 2 bardzo duże próby (G1iG2) z tej samej populacji (np. polacy) i za każdym razem porówna się średnie obu grup (np. Śr wzrost) to:
-średnia różnic między grupami wyniesie ok. 0
-będzie ok.5% przypadków gdy iloraz t co najmniej 1.96
-będzie ok. 1% przypadków gdy iloraz t wynosił co najmniej 2,58
Interpretacja ilorazu różnicy średnich i błędu standardowego różnicy (+) - małe próby.
Przy mniejszych próbach wysokie wartości ilorazów + pojawiać się będą nieco częściej.
Np. gdy mieliśmy po 10 osób w próbie (df=10+10-2=18)...
Będzie ok 5% przypadków gdy iloraz t wynosił co najmniej 2.10 ( a nie 1.96).
Będzie ok. 1% przypadków gdy iloraz t wynosił co najmniej 2,88(a nie 2,58).
Błąd pierwszego rodzaju
Uzyaskanie przez przypadek wyników statystycznie istotnych (np. statystyczne istotnej różnicy między średnimi) gdy w rzeczywistości zależność nie występuje
Prawdopodobieństwo określa poziom istotności
Zwyczajowo akcentowalny gdy p<0,05
Błąd drugiego rodzaju
Nie uzyskanie wyników statystycznie istotnych gdy w rzeczywistości występują
Sprzyja mu między innymi mała liczebność próby, słaba manipulacja eksperymentalna, niedokładny pomiar obecność losowych czynników zakładających niespełnienie założeń testu statystycznego
Dokładne prawdopodobieństwo da się określić
Założenia dotyczące charakteru rozkładów zmiennej zależnej.
Rozkład normalny
Równość wariancji
Założenia te dotyczą populacji, a nie próby
Pogwałcenie założeń w zasadzie nie prowadzi do poważnych konsekwencji
Założenie o równości wariancji ważniejsze gdy grupy znacznie różnią się liczebnością.
Istnieje wersja testu t dla różnych wariancji.
Czy test jednorodności wariancji jest istotny(istotność niższa niż 0,05)?
Jeśli nie, to można założyć równości wriancji i oprzeć się na orginalne wersji testu t (górny wiersz tabeli)
Jeśli tak, to nie można założyć równości wariancji i należy oprzeć się na alternatywnej wersji testu t(dolny wiersz tabeli).
Czy odpowiedni test t jest istotny(istotność niższa niż 0,05)?
Jeśli tak, to jest mało prawdopodobne (p<0,05) by różnica między grupami w zakresie średniego nasilenia agresji powstała przez przypadek tj. na skutek błędu losowego(różnica średniej jest statystycznie istotna)
Uwaga: to czy wartość T ma znak + czy -, nie ma znaczenia.
Wniosek: Frustracja prowadzi do wzrostu agresji.
T(30)=2,086, p<0,05
Eksperyment Jednozmiennowy z powtarzanym pomiarem
w swojej czystej formie nie jest to naprawdę eksperyment (brak losowego doboru grup)
Odmiany:
Losowa kolejność poziomów zmiennej niezależnej(np. Najpierw frustracja lub najpierw brak frustracji)
Matching czyli dobór parami(dla każdej osoby z grupy eksperymentalnej, pomiar jest powtarzany na jak najbardziej podobnej do niej osobie z grupy kontrolnej)
Wykład 3.
Mocne strony badań z powtarzanymi pomiarami.
Zmniejszenie lub wyeliminowanie wariancji błędu spowodowanej różnicami indywidualnymi.
W rezultacie wzrost mocy testu statystycznego(zmniejszenie ryzyka błędu drugiego rodzaju)
Słaba strona badań z powtarzanymi pomiarami: forma czysta.
Niska trafność wewnętrzna - efekt zmiennej niezależnej niemożliwy do oddzielenia od efektu kolejności
Zwiększone prawdopodobieństwo odgadnięcia hipotezy.
Słabe strony: losowa kolejność poziomów zmiennej niezależnej
trudna do zastosowania gdy efekt manipulacji jest długotrwały,
zwiększone prawdopodobieństwo odgadnięcia hipotezy.
SS: Matching
pracochłonna dla badacza.
Arbitralność kryteriów doboru par
Test T studenta dla porównania średnich w 2 próbach zależnych: konieczne informacje.
średnia różnic między obiema pomiarami zmiennej zależnej.
Wariancja różnic między oboma pomiarami zmiennej zależnej
liczebność (ilość par pomiarów)
Obliczenia.
obliczyć różnice dla każdej pary pomiarów
obliczyć średnią różnic
obliczyć SD różnic(każdą różnicę podnieść do kwadratu, zsumować je, podzielić przez ilość par - 1, wyciągnąć pierwiastek)
obliczyć błąd standardowej różnicy (SD różnic podzielić przez pierwiastek ilości par)
Obliczyć t: średnia różnic podzielona przez błąd standardowej różnicy.
Obliczyć stopnie swobody : df = N-2
Błąd losowy
Wszystko co wpływa na zmienną zależą a nie jest systematycznie związany z zmienną niezależną.
Np. różnice indywidualne, niedokładność pomiarów itp.
Nieunikniony
powoduje konieczność stosowania testów statystycznych
Błąd systematyczny
każdy czynnik systematycznie związany ze zmienną niezależną, który może mieć wpływ na zmienną zależną
Nieunikniony
Jego obecność uniemożliwia interpretację wyników w kategoriach przyczynowych
Trafność wewnętrzna
w jakim stopniu zebrane dane pozwalają na wyeliminowanie możliwość. Że to nie zmienna niezależna ale inne czynniki odpowiedzialne są za poziom zmiennej zależnej
Trafność konstruktów
w jakim stopniu użyte wskaźniki empiryczne (definicje operacyjne) uznać można za dobre egzemplifikacje pojęć teoretycznych.
Trafność zewnętrzna
w jakim stopniu stwierdzone wyniki można uogólnić na inne zbiorowości osób i na inne rodzaje sytuacji.
Badanie empiryczne 2
frustracja: wyniki w kwestionariuszu frustracji
Agresja: wyniki w kwestionariuszu agresji
wysoka trafność konstruktów
wysoka trafność wewnętrzna
wysoka trafność zewnętrzna
hipoteza teoretyczna: frustracja wywołuje agresje
wynik empiryczny: im wyższa frustracja tym wyższa agresja
Zależność empiryczna
im więcej gniazdujących bocianów tym więcej dzieci rodzi się p 9ciu miesiącach
Bociany > dzieci?
Niskie temperatury > bociany
Niskie temperatury > dzieci
Badenie 2: im wyższa frustracja, tym wyższa agresja
frustracja wywołuje agresję?
Agresja wywołuje frustrację?
Inne czynni (np. Niska inteligencja) wywołuje zarówno agresję ja i frustrację?
Wniosek: niska trafność wewnętrzna.
Badanie korelacyjne
brak doboru losowego do grup (często ich brak)
brak manipulacji eksperymentalnej
niska trafność wewnętrzna
wysoka trafność konstruktów
wysoka trafność zewnętrzna
Badanie 1 to eksperyment.
dobór losowy i manipulacja eksperymentalna. Zmienna niezależna manipulowana na podstawie losowania.
Zmienna zależna mierzona
wysoka trafność wewnętrzna
niska trafność konstruktów
niska trafność zewnętrzna
Przykład łączenia podejścia eksperymentalnego i korelacyjnego
modelowanie agresji
wpływ palenia na zapadalność na raka
wpływ samooceny na oceny na egzaminach
wpływ wspólnego spędzania czasu na poziom satysfakcji w małżeństwie.
Osiem czynników zakłócających trafność wewnętrzną.
Historia
Dojrzewanie
testowana
Instrumentarium
Regresja
Selekcja
Ubytek osób badanych
Interakcja selekcji i innych czynników
Wykład 4.
Wykład 4
REGRESJA
-Osoby, które uzyskały ekstremalne wyniki za 1 razem, przez przypadek (błąd losowy) uzyskają prawdopodobnie mniej ekstremalne wyniki za drugim razem.
*Przykłady regresji do średniej w badaniach empirycznych
-Zależność pozorna:Wpływ uczestnictwa w grupach dla rodziców na redukcję nasilenia problemów wychowawczych.
-Pozorna niezależność: Wpływ uczestnictwa w programie head start na inteligencję i na poziom osiągnięć szkolnych.
Przeciwstawne etykiety dla osób powyżej i poniżej mediany. Wpływ treningu wojskowego i wyjściowego poziomu autorytaryzmu na nasilenie autorytaryzmu u studentów szkoły oficerskiej.
Selekcja
-Grupy różniły się od siebie już na początku badania.
Palacze vs Niepalący
-palacze jedzą więcej białego pieczywa
-palacze używają więcej cukru, mięsa, tłustego mleka, mniej warzyw i owoców
Ubytek osób badanych
(śmiertelność)
-średnie wyniki w grupie ulegną zmianie gdyż część badanych odpada i zmienia się rozkład grupy.
Interakcja selekcji i dojrzewania
Grupy które na początku badania są do siebie podobne (ale nie identyczne) mogą w sposób naturalny oddalać się od siebie wraz z upływem czasu.
Przykład:
Wśród 4-klasistów chłopcy i dziewczynki mogą nie różnić się siłą fizyczną ale po kilku latach różnice bedą już znaczne.
Interakcja selekcji i innych czynników
Selekcja może też wchodzić w interakcje z innymi czynnikami: z historią (lokalna historia) z testowaniem, ze śmiertelnością.
*Eksperyment jednozmiennowy z więcej niż 2 grupami
-zmienna niezależna na 3 lub więcej poziomach
-przykład 1: Frustracja wysoka vs średnia vs brak frustracji
-przykład 2: Głód vs trudny egzamin vs brak frustracji.
Eksperyment jednozmiennowy z więcej niż 2 grupami:
Analiza wyników
Test T?
7 grup= 21 porównań.
Analiza wariancji
Co to jest wariancja
Zmienność (zróżnicowanie) wyników.
-Zmienność międzygrupowa
G1 G2 G3
5,0 5,3 5,4
5,2 5,1 5,2
Średnie 5,1 5,2 5,3
-Wpływ zmiennej niezależnej
-Błąd losowy ( różnice indywidualne, błąd pomiaru)
Ponieważ różnice między grupami mogą być wywołane błędem losowym, koniecznie użycie testów statystycznych.
Zmienność wewnątrzgrupowa
G1 G2 G3
5,0 5,3 5,4
5,2 5,1 5,2
średnie 5,1 5,2 5,3
Źródła zmienności wewnątrzgrupowej
-Błąd losowy: różnice indywidualne, błąd pomiary itp.
Na pewno nie zróżnicowanie poziomów zmiennej niezależnej
G1 G2 G3
T1 5,0 5,3 5,4
T1 5,2 5,1 5,3
średnie 5,1 5,2 5,3
Czy zmienna niezależna miała wpływ na wynik?
Jeśli tak to: Efekt zmiennej niezależnej (T) + błąd losowy (E)>E
A więc...
Zmienność międzygrupowa (MG)>Zmienność wewnątrzgrupowa (WG)
Jeśli tak to:
F>1
F= Zmienność MG(T+E) / Zmienność WG (E)
F= Zmienność MG(?+E) / Zmienność WG (E) = E/E
Miary zmienności
Miary zmienności używane w analizie wariancji to średnie kwadraty / MS
Aby obliczyć średni kwadrat trzeba najpierw obliczyć sumę kwadratów (SS) oraz stopnie swobody (df)
MS=SS/df
Obliczanie MG SS (Treatment)
MGSS=E (Mi-M)² x Ng
Mi - średnia poszczególnych grup
M - średnia ogólna
Ng - Liczba osób w każda
Obliczanie WGSS (eror SS)
WGSS=E(X-Mi)²
X - Wyniki dla poszczególnych osób
Mi - średnia dla grupy i
Co to są stopnie swobody?
Ilość wyników których wartość nie jest zdeterminowana przez średnią (ogólną lub grupową)
Całkowita ilość stopni swobody (total df) zależy od ilości badanych
Ilość stopni swobody między grupami (treatment df) zależy od ilości grup.
Przykład: Jeśli średnia 4 wyników = 10, ile wyników nie jest w pełni zdeterminowanych?
Załóżmy, że dwa pierwsze wyniki =10 10
Czy wiadomo jaki jest 3 wynik? Nie 10
Załóżmy, że trzy pierwsze wyniki =10 x
Czy wiadomo jaki jest 4 wynik? Tak y
_
40
Ilość stopni swobody między grupowych (treatment df)
6 grup, df=5
3 grupy, df=2
2 grupy, df=1
Reguła: df = ilość grup - 1
Całkowita ilość stopni swobody(total df)
ilość badanych - 1
Ilość badanych = 30, total df = 29
Ilość badanych = 15, total df 14
Ilość stopni swobody wewnątrzgrupowych (eror df)
Eror df = ilość badanych - ilość grup (przypomnienie w teście t, df = ilość badanych - 2)
30 badanych, 4gr, eror = 26
Source df
Mg treatment 3 4gr
WG eror 26
Total 29 30 badanych
Uwaga - w publikacjach podaje się zwykle treatment df oraz eror df : F(3,26)=
PRZYKŁAD 1
G1 G2 G3
2 5 5
3 6 6
4 7 7
M=3 M=6 M=6
MG SS =?
MG SS =18
[(3-5)² + (6-5)² + (6-5)² ] *3=18
MG df=?
Ilość grup-1
MG df=2
Source
SS df Ms F
Mg 18 2 ? 18/2=9
MSMG(MS międzygrupami)=9
(SSMG/ df MG=18/2=9)
WGSS( SS wewnątrz grup) =?
G1 G2 G3
(2-3)²=1 (5-6)²=1 (5-6)²=1
(3-3)²=0 (6-6)²=0 (6-6)²=0
(4-3)²=1 (7-6)²=1 (7-6)²=1
M=3 M=6 M=6
Suma kwadratów różnic wewnątrz grup=6
( 1+0 +1+1+0+1+1+0+1=6)
*WG(error) df? =6
9 badanych- 3 grupy
lub po 2 wyniki w każdej z 3 grup
WG(error) SS df MS F
6 6 1 9 (9/1)
MSWG (MS wewnątrz grup)= (SS WG/ df WG =6/6=1)
Uwaga: F=MS MG/ MS WG
F(2,6)=9,00 ; p<0,05
Przykład 2
G1 G2 G3
2 5 3
3 6 6
4 7 9
M=3 M=6 M=6
MG SS =18
Mgdf=2
MSMg= SSMG/ df MG= 18/2=9
G1 G2 G3
(2-3)²=1 (5-6)²=1 (3-6)²=9
(3-3)²=0 (6-6)²=0 (6-6)²=0
(4-3)²=1 (7-6)²=1 (9-6)²=9
M=3 M=6 M=6
SSWG=22
(1+0+1+1+0+1+9+0+9)
df WG=?
Df WG=6
(9 badanych -3 grupy)
MSWG (MS wewnątrz grup)?
22/6= 3,67(22/6)
F=(MS WG/ MS WG= 9/3,67)= 2,46
Ten wynik nie jest statystycznie istotny.
Słowniczek Słowniczek Słowniczek Słowniczek Słowniczek
-ŹRÓDŁO ZMIENNOŚCI= źródło = source
WG= wewnątrz grup=wewnątrz = within= within groups=error
MG= Między grupami= między= between= between groups=bg= treatment=(nazwa zmiennej niezależnej) w spss
Ogółem= total= overall
Stopnie swobody=df degrees of freedom
suma kwadratów= sum of s guares=SS
Średni kwadrat= mean square=MS
TEST T A TEST F
-w przypadku 2 grup
F=t²
Porównanie planowane
Z góry ustalone
często używa się testu T
Zwykle stosuje się po stwierdzeniu istotnego F
Alternatywa dla analizy wariancji
Porównania post hoc
-Wszystko ze wszystkim
-Zwykle stosuje się je po stwierdzeniu istotnego F.
-Alternatywa dla analizy wariancji?
Istnieje wiele testów post hoc. Najczęściej używany to test LSD, test Tulay'a, Test Scheffe, test Bonferoniego i test Duncana.
Test Duncana jest szczególnie liberalny i może prowadzić do błędu 1szego rodzaju
Test LSD jest także bardzo liberalny, ale stosuje się go zwykle, jedynie w przypadku 3 grup
Test Scheffe jest szczególnie konserwatywny
Eksperyment Jednozmiennowy z powtarzanym pomiarem na więcej niż 2 poziomach
Te same odmiany co w przypadku 2 poziomów
Te same mocne i słabe strony co w przypadku 2 poziomów
Analiza
Jednoczynnikowa analiza wariancji dla prób zależnych
Analiza wariancji z powtarzanymi pomiarami - 2 odmiany
Multivariate soolution (test wielu zmiennych)
Chiraviate solution (test efektów wewnątrzobiektowych)
W przypadku jednej zmiennej niezależnej wyniki identyczne
Wykład 5.
Eksperyment wielozmiennowy
2x2 - (2 zmienne niezależne, każda na 2wóch poziomach)
2x2x2 - (2 zmienne niezależne, każda na 2wóch poziomach i płeć)
2x2x2x3 - (2 zmienne niezależne, każda na 2wóch poziomach, płeć i narodowość)
Eksperyment jednozmiennowy z 2 grupami.
Eksperyment jednozmiennowy z więcej niż dwoma grupami.
Eksperyment wielozmiennowy 2x2
Efekt główny a prosty efekt główny.
Efekt główny(main effect) - wpływ danej zmiennej niezależnej na zmienną zależną.
Prosty efekt (główny)(simple main effect) - wpływ danej zmiennej niezależnej na zmienną zależną który zachodzi przy określonym poziomie innej zmiennej niezależnej.
W eksperymencie 2x2 mamy do czynienia z:
4 efektami prostymi tj.:
z 2 parami efektów prostych(po 1dnej parze dla każdej z 2 zmiennych niezależnych
- W eksperymencie 2x3 jest 5 efektów prostych
- W eksperymencie 3x3 jest ich 6
Eksperyment 2x2 zawiera w sobie 4 eksperymenty
Schemat 2x2
Efekt Główny
Średnia efektów prostych dla danej zmiennej niezależnej stanowi efekt główny tej zmiennej.
W eksperymencie dwuzmiennowym (np. 2x3) mamy dwa efekty główne
Efekt główny danej zmienne niezależnej informuje nas o wpływie tej zmienne “w ogóle” tj. gdy nie bierzemy pod uwage poziomu drugiej zmiennej niezależnej.
Efekt Interakcji
Jeśli efekty proste danej zmiennej niezależnej są istotnie różne, znaczyło to że występuje istotny efekt interakcjii.
Efekt interakcji informuje nas o tym, czy wpływ jednej zmiennej niezależnej na zmienną zależną jest różny w zależności od poziomu innej zmiennej niezależnej.
W eksperymencie dwuzmiennowym (np. 2x2) jest tylko 1 efekt interakcji
W języku potocznym termin interakcji jest różny
interakcje między ludźmi - wpływ na siebie.
interakcja leków - w połączeniu z innym lekiem, może spowodować zły efekt.
Interakcja a trafność zewnętrzna
niska trafność zewnętrzna oznacza, że efekt uzyskany w badaniu zależny jest od dodatkowych wyników(a więc że występuje interakcja).
Interpretacja a sprzeczne wyniki badań
Sprzeczne wyniki badań sugerują że(różne) efekty uzyskane w różnych badaniach zależne są od dodatkowych czynników(a więc że występuje ukryta interakcja)
Czy to jest interakcja?
1. Czas dojazdu (w minutach) przez miasto w porze lub poza szczytem, w zależności od rodzaju transportu.
|
Poza szczytem |
Szczyt |
Samochód |
10 |
30 |
Motor |
20 |
20 |
Czy samochodem zawsze szybciej? Czy może zależy to od pory dnia?
Tu występuje interakcja.
2. Ilość bramek zdobytych przez gości lub gospodarzy w zależności od ilości kibiców na meczu.
|
Gospodarze |
Goście |
Mało kibiców |
5 |
7 |
Dużo kibiców |
7 |
5 |
Tu jest interakcja
3. Ilość publikacji po 4 latach od uzyskanie doktoratu przez kobietę lub mężczyznę w zależności od płci promotora.
Płeć doktoranta |
Mężczyzna |
Kobieta |
Mężczyzna |
6,15 |
2,07 |
Kobieta |
0,43 |
2,00 |
Czy tu występują efekty główne? Czy efekt interakcji?
Lęk mały i lęk duży, frustracja mała i frustracja duża.
1.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
20 |
0 |
Lęk + |
20 |
20 |
0 |
|
0 |
0 |
|
Efekt główny Frustracji - Nie (0)
Efekt główny Lęku - Nie (0)
Efekt Interakcji - Nie
2.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
40 |
+20 |
Lęk + |
20 |
40 |
+20 |
|
0 |
0 |
|
Efekt główny Frustracji - Tak (20)
Efekt główny Lęku - Nie (0)
Efekt Interakcji - Nie*
* - +20 = +20 i 0 = 0
3.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
20 |
0 |
Lęk + |
40 |
40 |
0 |
|
+20 |
+20 |
|
Efekt główny Frustracji - Nie (0)
Efekt główny Lęku - Tak (20)
Efekt Interakcji - Nie
4.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
40 |
+20 |
Lęk + |
60 |
80 |
+20 |
|
+40 |
+40 |
|
Efekt główny Frustracji - Tak (+20)
Efekt główny Lęku - Tak (+40)
Efekt Interakcji - Nie
5.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
40 |
+20 |
Lęk + |
40 |
20 |
-20 |
|
+20 |
-20 |
|
Efekt główny Frustracji - Nie (0)
Efekt główny Lęku - Nie (0)
Efekt Interakcji - Tak
6.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
40 |
+20 |
Lęk + |
30 |
30 |
0 |
|
10 |
-10 |
|
Efekt główny Frustracji - Tak (10)
Efekt główny Lęku - Nie (0)
Efekt Interakcji - Tak
7.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
30 |
+10 |
Lęk + |
40 |
30 |
-10 |
|
+20 |
0 |
|
Efekt główny Frustracji - Nie (0)
Efekt główny Lęku - Tak (20)
Efekt Interakcji - Tak
8.
|
Frustracja - |
Frustracja + |
|
Lęk - |
20 |
40 |
+20 |
Lęk + |
50 |
100 |
+50 |
|
+30 |
+60 |
|
Efekt główny Frustracji - Tak (+35)
Efekt główny Lęku - Tak (+45)
Efekt Interakcji - Tak
Jeśli jest istotny efekt główny
Gdy zmienna dla której jest istotny efekt główny ma tylko 2 poziomy, zrozumienie efektu wymaga jedynie w której grupie występuje wyższa średnia.
Gdy zmienna ma więcej niż 2 poziomy należy dokonać dodatkowej analizy wariancji, z pominięciem jednego z poziomów. Można tu użyć procedury “wybierz obserwacje”.
Jeśli jest istotna interakcja.
Jeśli interakcja jest istotna, należy policzyć efekty proste. Przy schemacie 2x2 można to zrobić użyć testu T studenta po uprzednio zastosowanej procedury w SPSS “podziel na podzbiory”.
Przy schemacie 2x3 można policzyć 3 efekty proste dla pierwszej zmiennej, używając testu T studenta i procedury “podziel na podzbiory”, lub
można policzyć 2 efekty proste dla drugiej zmiennej używając jednozmiennowej analiz wariancji.
Analiza wariancji dla 3 zmiennych niezależnych
Trzy efekty główne (A,B,C),
Trzy interakcje dwóch zmiennych (A*B, A*C, C*B),
Interakcja 3 zmiennych (A*B*C),
Istotna interakcja 3 zmiennych, znaczy że wpływ interakcji 2 zmiennych niezależnych na zmienną zależną, zależy od 3 zmiennych niezależnych.
Interakcje proste w analizie 2x2x2.
Interakcja prosta dwóch zmiennych, to interakcja zachodząca przy danym poziomie 3 zmiennej,
W schemacie badawczym 2x2x2, można doliczyć się 6 prostych interakcji:
- dwie interakcje proste A*B (przy różnych poziomach zmiennej C)
- dwie interakcje proste A*C (przy różnych poziomach zmiennej B)
- dwie interakcje proste B*C (przy różnych poziomach zmiennej A)
Istotna interakcja A*B*C oznacza że interakcje wchodzące w skład danej pary są różne
Wykład 6.
Porównywanie rzeczy nieporównywalnych
Wyniki standaryzowane (skala Z)
Właściwości skali Z
średnia = 0
wariancja = 1
Rozkład wyników skali Z
Wyniki standaryzowane - skala Z
Zi (Xi - M)/ SD
M - średnia
SD - odchylenie standardowe
Standaryzacja umożliwia porównanie na tle grupy.
Anna i Marek zdawali egzamin z Metodologii i statystyki u różnych profesorów
Anna otrzymała 5 z egzaminu(średnia w jej grupie 4.5, a odchylenie 2)
Marek otrzymał 3,5 a średnia w jego grupie 2,5.
Anna: x=5.0(M=4,5;SD=2)
Z=(5.0-4,5)/2=0,25
Marek: x=3,5(M=2,5;SD=2)
Z=3,5-2,5)/2=0,5
Lepszą ocenę(bardziej wartościową) otrzymał Marek.
Tomek: x=3.0(M=4,0;SD=1)
Z=(3.0-4,0)/1= -1.0
Krysia: x=3,5(M=4,5;SD=2)
Z=3,5-4,5)/2= -0,5
Korelacja
Miara statystyczna określająca siłę związku między zmiennymi, mieszcząca się w granicach (-1,1).
Korelacja dodatnia
Wzrostowi jednej zmiennej np. Stopnie, towarzyszy wzrost innej zmiennej np. Samoocena.
Korelacja ujemna
Wzrostowi jednej zmiennej np. Stopnie, towarzyszy spadek innej zmiennej np. nadużywanie alkoholu.
Brak korelacji
Zmienne są ze sobą niepowiązane, np. Stopnie, a numer buta
Współczynnik korelacji jest bliski zera.
Związek krzywolinijny
Np. Związek między poprzednim poziomem wykonania zadania: w miarę wzrostu pobudzenia wykonanie jest coraz lepsze, osiąga maksimum po czym zaczyna się pogarszać.
Współczynnik korelacji(liniowej) będzie bliski zeru(nie istotny).
Obliczanie współczynnika korelacji r Pearsona.
r=(E ZX ZY)/n
r= współczynnika korelacji Pearsona
ZX= dla każdego przypadku zmienna X
ZY= dla każdego przypadku zmienna Y
N= liczba przypadków(liczba par z obserwacji)
Kolejne kroki w liczeniu
przekształcić wszystkie wyniki w wartość Z
policzyć moment ilorazowy(cross product) dla każdego przypadku.
zsumować momenty iloczynowe
podzielić tę sumę przez liczbę przypadków
Istotność statystyczna współczynnika korelacji
Im większa próba tym bardziej istotny wynik.
Korelacja a rodzaj skali pomiarowej
r Pearsona zakłada pomiar obu zmiennych, na skali przedziałowej
Gdy jedna zmienna na skali nominalnej jest dychotoniczna (płeć), istotność statystyczna taka jak przy teście T
Korelacja a trafność wewnętrzna
Współczynnik korelacji obliczany jest zwykle (ale nie zawsze) w badaniach korelacyjnych.
Badana korelacyjne odznaczają się niską trafnością wewnętrzną
Badania korelacyjne vs. Eksperyment - lepszy eksperyment, gdyż wyjaśnia kwestie przyczynowo - skutkowe.
Analiza korelacji - porównanie grup
*Współczynnik determinacji r²
proporcja zmienności jednej zmiennej dająca się przewidzieć na podstawie informacji o poziomie drugiej zmiennej
r²*100=procent wariancji wspólnej
IQ a średnia ocen
Współczynnik korelacji między ocenami a ilorazem inteligencji r=0,50. W jakiej mierze da się przewidzieć średnią ocen na podstawie IQ(lub odwrotnie)
r²=0,50²=0,25
25%wspólnej wariancji
*RÓWNANIE REGRESJI
Jeśli nie mamy informacji o żadnej zmiennej skorelowanej ze zmienną y to najlepszy sposób przewidzenia poziomu zmiennej y jest na podstawie średniej tej zmiennej.
Równanie regresji pozwala na dokładniejsze przewidywanie poziomu zmiennej y.
W równaniu regresji do przewidywania poziomu zmiennej y używa się informacji o średnim poziomie tej zmiennej w populacji oraz o poziomie zmiennej x.
Im silniej zmienna x skorelowana jest ze zmienną y tym lepsza predykcja.
Y przewidywane=My+b(x-Mx)
b=rxy(sy/sx)
My= średnia zmiennej y
x-Mx=różnica między zaobserwowanym poziomem zmiennej x a średnią zmiennejx.
Równanie regresji: przykład
-Średni uczeń klasy spędza My=5,3 godzin tygodniowo na odrabianiu lekcji, odchylenie standardowe sy=1,4
-Rodzice płacą dzieciom średnio Mx=1,32 zł. Za każdą ocenę b. dobrą lub celującą, sx=0,35zl
-Współczynnik korelacji między czasem odrabiania lekcji a płaceniem wynosi rxy=0,43
Równanie regresji zad1
My=5,3h; sy=1,4h;Mx=1,32zl; SX=0,35zl, rxy=0,43
-Ile średnio spędzają na odrabianiu lekcji dzieci, które otrzymują za oceny b.dobre i celujące po zł 1,5 (x=1,5)?
B=rxy(Sy/Sx)=0,43/1,4/0,35)=1,72
y przewidywane= My+b(x-Mx)=5,3+1,72(1,5-1,32)=5,61
Zadanie 2
-My=5,3h -||-
-ile średnio spędzają czasu na odrabianiu lekcji dzieci, które nie otrzymują pieniędzy za oceny b dobre i celujące(x-0)?
B=rxy(Sy/Sx)=0,43(1,4/0,35)=1,72
y przewidywane=My+b(x-Mx)= 5,3+ 1,72 (0-1,32)=3,03
*ZALEŻNOŚĆ PRZYCZYNOWA
Możliwość przewidywania poziomu jednej zmiennej na podstawie innej zmiennej nie musi znaczyć , że zależność jest przyczynowa
Badanie zależności między dwiema zmiennymi mierzonymi na skali nominalnej:test chi-kwadrat.
Czy istnieje zależność między płcią a wyborem miejsca w klasie.
Aby sprawdzić czy uzyskany patern wyników nie powstał przez przypadek stosujemy test chi-kwadrat.
-Informacje konieczne do obliczania wartości chi-kwadrat
a) fo-liczebności zaobserwowane (dla każdej kratki tabeli)
b) fe-liczebności oczekiwane
fo-liczebności zaobserwowane:ile obserwacji(ile osób) znalazło się w każdej z 4 kratek tabeli
fe-liczebności oczekiwane:ile obserwacji (ile osób) powinno się było znaleźć w każdej z 4 kratek tabeli gdyby zmienne płeć i miejsce
Obliczenie liczebności oczekiwanych fe
-liczebność wiersza/całkowita liczebność x liczebność kolumny
np. oczekiwana liczebność kobiet siedzących z przodu
ilość kobiet/ ilość studentów ilość studentów z przodu
*Czy jest istotny związek w populacji? Oblicz chi-kwadrat
x²=∑(fo-fe)²/fe
x²-wartości statystyki chi kwadrat
fo-liczebność zaobserwowana
fe-liczebność oczekiwana
(chi kwadrat) x² może się wahać od 0 do nieskończoności
Poziom istotności można odczytać z tabeli istotności lub z wydruku SPSS.
Oblicz chi-kwadrat
sekret dla leniwych
x²=∑(fo-fe)²/fe
Dla tabeli 2*2 kwadraty różnicy (fo-fe)² są takie same w każdej kratce tabeli.
*Stopnie swobody dla testu chi-kwadrat
-przy odczytywaniu z tabeli istotności potrzeba inf o ilości stopni swobody (df)
-df to iloczyn ilości wierszy- 1 oraz ilości kolumn 1 w tabeli danych dla których obliczono chi-kwadrat.
W naszym przypadku
df=(2-1)*(2-1)=1
Jak silny jest związek, obliczanie współczynnika korelacji phi dla tabeli 2*2
Ø=√(x²/n)
Współczynnik phi można interpretować jak r pearsona i obliczyć współczynnik determinacji
0,315²=0,09
Wybór miejsca w klasie związany jest z płcią ale bardzo nieznacznie.
Demonstracja związek między wynikiem rozmowy kwalifikacyjnej z kandydatem do pracy a późniejszą jakością pracy.
*Dokładny test Fishera
-bardziej konserwatywny niż test chi kwadrat ( może zwiększyć prawdopodobieństwo błędu drugiego rodzaju)
-bardziej pracochłonne obliczenia
-powinien być używany zamiast chi kwadrat gdy:
podejście teoretyczne:co najmniej jedna z liczebności oczekiwanej jest niższa niż 5.
podejście nowsze: całkowita liczebność jest niższa niż 20.
*Nietypowe zastosowanie testu chi-kwadrat
Może być używany zamiast testu studenta dla prób niezależnych(dzielimy badanych na 4 grupy w zależności od manipulacji eksperymentalnej i od uzyskania w zmiennej zależnej wyniku powyżej lub poniżej mediany.
Może być używany zamiast współczynnika korelacji pearsona (np. Dzielimy badanych na 4 grupy w zależności od uzyskania wyników powyżej lub poniżej mediany w każdej z 2 mierzonych zmiennych.
Zaletą takich zastosowań jest prostota , wadą jest mniejsza moc testu (większe prawdopodobieństwo błędu drugiego rodzaju)
chi-kwadrat-inf dodatkowe
Jest testem nieparametrycznym, nie opiera się na założeniu o normalności rozkładu
Może być używany do tabel większych niż 2*2 (więcej niż 2 poziomy zmiennej i/lub więcej niż 2 zmienne)
Dane w poszczególnych kratkach tabeli muszą być od siebie niezależne?
Niektóre inne testy nie parametryczne
Test U Manna - Whitney'a - podobny do testu T studenta dla prób niezależnych, ale zmienna zależna ma postać rang.
Test Wilcoxa oraz test znaków - podobny do testu T studenta dla prób zależnych, ale zmienna niezależna ma postać rang.
Współczynnik korelacji rang Spearmana - podobny do współczynnika korelacji Pearsona, ale obie zmienne mają postać rang
W porównaniu do testu Ch-kwadrat, inne testy nieparametryczne są stosunkowo rzadko używane.
Testy nieparametryczne są z reguły prostsze w użyciu.
Mają zwykle niższą moc niż odpowiednie testy parametryczne
Gdy odstępstwa od testów parametrycznych są bardzo znaczne, testy nieparametryczne mogą mieć większą moc niż odpowiednie testy parametryczne.