2011-03-22
Statystyka
Wykład 4
Dr Małgorzata Gut
Katedra Psychologii Poznawczej WSFiZ
Wskazniki opisu statystycznego
" Miary poło\enia (miary tendencji centralnej)
pokazują, co w badanej próbie jest typowe,
najczęstsze, przeciętne
" Miary rozproszenia (=zró\nicowania, dyspersji)
pokazują jaki jest rozrzut wartości zmiennej wokół
tendencji centralnej, na ile próba jest jednorodna
lub zró\nicowana
" Miary skośności (asymetrii) pokazują stopień
przewagi wartości niskich lub wysokich
" Miary koncentracji pokazują na ile rozkład
wartości zmiennej jest wysmukły lub spłaszczony
Jeszcze raz o tym, co to jest rozkład
wartości zmiennej
Poziom zmiennej (np. czas wykonania zadania [min])
1
2011-03-22
Rozkład normalny, prawo- i lewoskośny
Normalny rozkład wartości zmiennej
(krzywa normalna, krzywa dzwonowata)
Krzywa jest symetryczna. Średnia, mediana i
wartość modalna zbiegają się w jednym punkcie.
Rozkład normalny wartości zmiennej
(krzywa normalna, krzywa
dzwonowata)
Krzywa jest symetryczna. Średnia,
mediana i wartość modalna zbiegają
się w jednym punkcie.
Rozkład prawoskośny
Rozkład niesymetryczny. Przewaga
wyników niższych od średniej. Średnia
nie jest tą samą wartością zmiennej co
mediana i dominanta.
Stromy stok z lewej i łagodny - z prawej.
Góra przesunięta na lewo, zaś ogon krzywej wyciągnięty z prawej
2
2011-03-22
Rozkład lewoskośny
Rozkład niesymetryczny. Przewaga
wyników wyższych od średniej. Średnia
nie jest tą samą wartością zmiennej co
mediana i dominanta.
Stromy stok z prawej i łagodny - z lewej.
Góra przesunięta na prawo, zaś ogon krzywej wyciągnięty z lewej
Skośność
Najprostszy wskaznik: mieszany współczynnik skośności:
" Wartość współczynnika informuje o sile skośności
" Znak (+ lub -) o kierunku skośności
Jeżeli wartość współczynnika = 0
x - D
to znaczy, że rozkład pod
WSK =
względem asymetrii jest
S
rozkładem normalnym
n
1
2
S = - x)2
2
"(xi
S = S
N -1
i=1
Skośność
WSK
" Jeżeli ma znak dodatni rozkład jest
prawoskośny (więcej wyników niższych od
średniej)
WSK
" jeżeli ma znak ujemny rozkład jest
lewoskośny (więcej jest wyników wyższych od
średniej)
WSK
" Jeżeli wartość nie przekracza 1 ani -1, to
oznacza, że pod względem asymetrii rozkład
wartości zmiennej jest zbliżony do normalnego
" Jeżeli przekracza mówimy że rozkład jest silnie
prawo- lub lewoskośny
3
2011-03-22
Zadanie 1
Oblicz skośność dla rozkładu wartości dla zmiennej poziom
odporności psychicznej (przykład 7. z wykładu 3.)
l.p xi xi - (x- )2
x x
x - D
1 2 -1,6 2,56
WSK =
2 3 -0,6 0,36
S
3 3 -0,6 0,36
4 4 +0,4 0,16
5 6 +2,4 5,76
x = 3,6
"
N=5 18 0 9,2
S =1,52
D = 3
Wynik i interpretacja:
3,6 - 3
Wsk = = 0,39
1,52
Rozkład wartości tej zmiennej uzyskanych przez
badanych jest (pod względem asymetrii rozkładu)
prawoskośny (= jest więcej wartości niższych od
średniej), ale zbliżony do normalnego, ponieważ 0,39
nie przekracza 1.
Zadanie 2
Oblicz wartość współczynnika skośności dla
rozkładu wartości dla zmiennej liczba
rodzeństwa . Sformułuj interpretację
uzyskanego wyniku.
l.p xi
Wartości tej zmiennej w zbadanej próbie
zestawiono w tabeli: 1 2
2 0
3 2
4 2
5 1
6 0
7 2
N=7
4
2011-03-22
Współczynnik asymetrii (A)
Dokładna klasyczna miara asymetrii rozkładu
m3
m3 - 3. moment centralny
A =
S3
1
m3 = - x)3
"(xi
N -1
Zadanie 3
Oblicz współczynnik A dla rozkładu zmiennej liczba rodzeństwa
(z zadania 2)
l.p xi
m3
1 2
A =
2 0
S3
3 2
4 2
1
5 1
m3 = - x)3
"(xi
6 0
N -1
7 2
N=7
Kurtoza
" To miara koncentracji rozkładu wartości
zmiennej wokół średniej (wartości przeciętnej)
" Wartość kurtozy K i jej znak (+ lub -) informuje
o sile i kierunku koncentracji/rozproszenia
rozkładu wyników osób badanych
m4
m4 4 moment centralny
'
K = - 3
4 S4 odchylenie standardowe do 4 potęgi
S
1
m4 =
"(xi - x)4
N -1
5
2011-03-22
Rozkład normalny, skoncentrowany i
rozproszony
Jeżeli wartość K = 0 to
znaczy, że rozkład pod
względem koncentracji jest
rozkładem normalnym
Kurtoza
" Jeżeli K ma znak dodatni rozkład jest
skoncentrowany, wysmukły (więcej wyników
skupionych wokół średniej, próba badanych jest
jednorodna)
" Jeżeli K ma znak ujemny rozkład jest rozproszony,
spłaszczony (więcej jest wyników dalekich od średniej,
próba badanych jest zróżnicowana)
" Jeżeli wartość K nie przekracza 1 ani -1, to oznacza, że
pod względem koncentracji rozkład wartości zmiennej
jest zbliżony do normalnego
" Jeżeli przekracza mówimy że rozkład jest silnie
skoncentrowany lub rozproszony
Zadanie 4
Oblicz kurtozę dla rozkładu zmiennej liczba rodzeństwa
(z zadania 2). Sformułuj interpretację wyniku
l.p xi
x = 1,29 1 2
m4
'
2 0
K = - 3
4
3 2
S = 0,95 S
4 2
5 1
6 0
1
m4 =
"(xi - x)4 7 2
N=7
N -1
6
2011-03-22
Zadanie 5
Oblicz kurtozę dla rozkładu
l.p. xi
zmiennej temperatura
ciała pacjentów .
1 38,8
2 36,1
Sformułuj interpretację
3 36,9
wyniku. Wartości
4 36,6
zmiennej uzyskane przez
5 39,3
6 38,7
badanych zestawiono w
7 39,9
tabeli:
8 38,6
N=8
Wnioskowanie statystyczne
Uogólnianie wyników na populację
" Z reguły nie badamy całej interesującej nas (ze względu
na postawiony problem badawczy) populacji
" Zamiast tego pobieramy z populacji próbę i u niej
dokonujemy pomiaru/obserwacji wartości
interesujących nas zmiennych
" Obliczone miary opisu statystycznego są dla nas
informacją jak wygląda rozkład wartości danej
zmiennej lub ile wynosi wartość przeciętna,
dominująca, itd. ale tylko w tej PRÓBIE
" Takich wyników nie uogólniamy na populację, bo nie
zbadaliśmy całej populacji
7
2011-03-22
Kiedy wynik analizy mówi coś o
populacji?
" Jeżeli dokonujemy samego opisu statystycznego
(np. obliczamy przeciętny wynik testu osobowości
dla próby badanych, albo sprawdzamy jak bardzo
zróżnicowana jest próba pod względem tej
zmiennej) wyniki analiz dotyczą tylko tej
przebadanej próby, są opisem przebadanej przez
nas grupy
" Aby móc wnioskować na podstawie wyników
analiz na temat całej populacji (z której pobrano
próbę) trzeba przeprowadzić wnioskowanie
statystyczne
Po co się to robi?
" Badania psychologiczne prowadzone są po to, aby
dowiedzieć się czegoś o całej populacji, a nie tylko
o konkretnej przebadanej próbie
" Dlatego bada się próbę, ale potem próbuje się
odnieść wyniki z próby do ogółu poprzez
zastosowanie testów statystycznych służących do
określenia, w jakim stopniu wyniki próby
odzwierciedlają to co jest obecne w populacji
" Bez wnioskowania statystycznego nie wolno nam
wyciągać wniosków na temat populacji!!!
Na przykład&
Jeżeli badacz chce wiedzieć czy schizofrenicy różnią się od osób
zdrowych pod względem poziomu kreatywności, powinien:
" Pobrać z populacji schizofreników reprezentatywną próbę do badań.
Tak samo z populacji osób zdrowych
" Sprawdzić jak wygląda rozkład zmiennej poziom kreatywności w
obu próbach (=dokonać opisu statystycznego)
" Postawić HIPOTEZ (założyć czego się spodziewa, jakich różnic; i czy
w ogóle spodziewa się różnic między pacjentami i osobami
zdrowymi w poziomie kreatywności)
" Zweryfikować tę hipotezę = sprawdzić za pomocą wnioskowania
statystycznego, czy grupy się różnią i w jaki sposób
" Wynik odpowiedniego testu służącego wnioskowaniu
statystycznemu pozwala stwierdzić - z określonym
prawdopodobieństwem że np. schizofrenicy są bardziej kreatywni
niż osoby zdrowe. I ten wynik już jest wynikiem mówiącym o
populacji, nie tylko o przebadanej próbie (jest wnioskiem, który
możemy odnieść do populacji)
8
2011-03-22
Centralne twierdzenie graniczne
Lindeberga-Lvy'ego
" To teoretyczna podstawa wnioskowania
statystycznego
" Mówi, że jeżeli liczebność próby zmierza do
nieskończoności rozkład z próby zbliża się do
rozkładu normalnego, ze średnią = średniej z
populacji () oraz odchyleniem standardowym
= ilorazowi odchylenia z populacji i
pierwiastka z liczebności z próby:
Jaką mamy pewność, że wiemy wtedy
coś o populacji?
" Niestety nigdy nie jest to pewność 100%-towa
" Wynik testu statystycznego (przy wnioskowaniu
statystycznym) pozwala nam tylko na
sformułowanie wniosku, że np. z 95%
prawdopodobieństwem możemy uznać, że
pacjenci są bardziej kreatywni niż osoby zdrowe
" Jest to wynik uprawdopodobniony (bo próba nie
przedstawia całej populacji, więc trzeba założyć
pewien margines błędu = tzw. błąd
wnioskowania)
Hipoteza a test statystyczny
" Hipoteza statystyczna przypuszczenie
dotyczące rozkładu cechy (zmiennej) w
interesującej nas populacji na podstawie
rozkładu obecnego w próbie
" Test statystyczny procedura sprawdzania
(weryfikowania) hipotezy statystycznej na
bazie wyników osób badanych z próby
9
2011-03-22
Hipoteza
ZEROWA
ALTERNATYWNA
(weryfikowana) H0
(BADAWCZA) H1
Mówi o czymś przeciwnym
To stwierdzenie, które
do tego, czego się
możemy przyjąć (z
spodziewamy. Zakłada np.
określonym
brak różnic między
grupami (=populacjami)
prawdopodobieństwem!)
w poziomie jakiejś cechy
jeżeli odrzucamy hipotezę
albo brak związku między
zerową
jakimiś zmiennymi w
Np. Schizofrenicy
populacji
charakteryzują się istotnie
Np. Schizofrenicy nie różnią
się od osób zdrowych pod
wyższą kreatywnością niż
względem poziomu
osoby zdrowe
kreatywności
Na ile możemy zaufać wynikowi testu
statystycznego? ;-)
" Poziom istotności (ą) prawdopodobieństwo
popełnienia błędu pierwszego rodzaju,
polegającego na odrzuceniu poprawnej hipotezy
zerowej. Zwykle oznaczany jako p
(= prawdopodobieństwo, że wynik jaki uzyskaliśmy
jest artefaktem, jest kwestią przypadku)
" Poziom ufności (1-ą) prawdopodobieństwo
poprawnego wnioskowania
Błąd I rodzaju
" Polega na odrzuceniu hipotezy zerowej, gdy jest ona w
rzeczywistości prawdziwa (np. grupy nie różnią się pod
względem IQ , albo nie istnieje związek miedzy
kobiecością i empatią )
" Prawdopodobieństwo popełnienia tego błędu to ą
(czyli p, poziom istotności)
" Na ogół zależy nam aby p < 0,05. To oznacza, że jest 5%
prawdopodobieństwa (ryzyka) błędu w naszym
wnioskowaniu o populacji. Czyli: w 5% przypadków
wynik może być fałszywy, zaś w 95% - prawdziwy (95%
poziom ufności = 95% prawdopodobieństwa, że dane w
populacji są takie jak w przebadanej próbie)
10
2011-03-22
Błąd II rodzaju
" Polega na przyjęciu hipotezy zerowej, gdy w
rzeczywistości jest ona fałszywa (np. przyjmujemy, że
grupy się nie różnią, mimo, że w rzeczywistości różnice
występują)
" Prawdopodobieństwo popełnienia tego błędu to
" Wartość wzrasta wraz ze zmniejszaniem się ą. Więc
gdy przyjmiemy zbyt surowy poziom istotności (ą czyli
p), możemy nie odrzucić hipotezy zerowej, podczas gdy
należało to zrobić (istnieją różnice między grupami, lub:
istnieje związek miedzy zmiennymi)
" Im mniejsza próba, tym większe (i np. mimo dużej
różnicy między grupami, trudno będzie ją udowodnić,
przy małej próbie)
Obszar krytyczny i obszar przyjęć
" Obszar przyjęć ten zbiór wartości, które
przemawiają za przyjęciem hipotezy zerowej
" Obszar krytyczny zbiór wartości, które
przemawiają za odrzuceniem hipotezy zerowej
Poziom istotności a poziom ufności
(ą poziom istotności)
(ą
(ą
(ą
0,5
obszar przyjęć
0,4
0,3
0,2
1- ą poziom ufności
1- ą
1- ą
1- ą
0,1
ą/2 ą/2
ą/2 ą/2
ą/2 ą/2
ą/2 ą/2
Przedział ufności
0
-3 SD -2 SD -1 SD 1 SD 2 SD 3 SD
Obszar krytyczny Obszar krytyczny
11
2011-03-22
Hipoteza zerowa: próba nie różni się od populacji
Obszar odrzucenia (ą/2 = p/2)
0,5
odrzucamy hipotezę zerową,
przyjmujemy alternatywną
obszar przyjęć
przyjmujemy
0,4
hipotezę
zerową
0,3
H0 = = 0
H = `" 0
A
0,2
1- ą poziom ufności
1- ą
1- ą
1- ą
0,1
ą/2 ą/2
ą/2 ą/2
ą/2 ą/2
ą/2 ą/2
Przedział ufności
0
-3 SD -2 SD -1 SD 1 SD 2 SD 3 SD
Obszar krytyczny Obszar krytyczny
Hipoteza statystyczna jednostronna
(kierunkowa)
(ą poziom istotności)
(ą
(ą
(ą
H0 : = 0
0,5
obszar przyjęć
( e" 0)
0,4
H : < 0
0,3
A
0,2
1- ą poziom ufności
1- ą
1- ą
1- ą
0,1
ą
ą
ą
ą
Przedział ufności
0 1-ą (=1-p) z jakim prawdopodobieństwem możemy
-3 SD -2 SDuznać, że próba ma niższy wynik od populacji? (np. IQ
-1 SD 1 SD 2 SD 3 SD
próby jest niższe od IQ w populacji)
Obszar krytyczny lewostronny
Hipoteza statystyczna jednostronna
(kierunkowa)
(ą poziom istotności)
(ą
(ą
(ą
H0 : d" 0
0,5
obszar przyjęć
( = 0 )
0,4
H1 : > 0
0,3
0,2
1- ą poziom ufności
1- ą
1- ą
1- ą
Przedział ufności
0,1
ą
ą
ą
ą
1-ą0 z jakim prawdopodobieństwem możemy uznać,
(=1-p)
-3 SD -2 SD -1 SD 1 SD 2 SD 3 SD
że próba ma wyższy wynik od populacji? (np. zarobki
zbadanej próby są wyższe od zarobków w populacji)
Obszar krytyczny prawostronny
12
2011-03-22
Hipotezy statystyczne:
" Dwustronna (bezwarunkowa) próba różni się od
populacji (np. próba różni się pod względem poziomu
asertywności od średniej populacyjnej)
" Jednostronna (kierunkowa) próba ma wyższy
(hipoteza prawostronna) lub niższy (hipoteza
lewostronna) wynik niż średnia populacyjna
" Aby sprawdzić (przetestować, zweryfikować) hipotezę
wykonuje się zatem testy statystyczne dwustronne lub
jednostronne
H0 jest H1 jest
prawdziwa prawdziwa
Przyjęcie H1 Błąd I rodzaju Decyzja
prawidłowa
Przyjęcie H0 Decyzja Błąd II rodzaju
prawidłowa
13
Wyszukiwarka
Podobne podstrony:
Stat wyklad2 11 na notatkiStat wyklad3 11 na notatkiWykład 11 stolarka okienna i drzwiowaWYKŁAD 11MapyMysli czyli jak zyskac czas na notatkachwyklad 11 psychosomatykaPLC mgr wyklad 11 algorytmyCHEMIA dla IBM Wyklad 8) 11 2013Wyklad 11Wyklad 11 stacj Genetyka i biotechnologie lesne(Uzupełniający komentarz do wykładu 11)wyklad10 11 ME1 EiTWYKŁAD 11 2wyklad dzialania na zbiorachwykład 11 WmMetodologia wykład 11 12 TabelaWyklad 4 11więcej podobnych podstron