2011-03-22
Statystyka
Wykład 3
Dr Małgorzata Gut
Katedra Psychologii Poznawczej WSFiZ
Wskazniki opisu statystycznego
" Miary poło\enia (miary tendencji centralnej)
pokazują, co w badanej próbie jest typowe,
najczęstsze, przeciętne
" Miary rozproszenia (=zró\nicowania, dyspersji)
pokazują jaki jest rozrzut wartości zmiennej wokół
tendencji centralnej, na ile próba jest jednorodna
lub zró\nicowana
" Miary skośności (asymetrii) pokazują stopień
przewagi wartości niskich lub wysokich
" Miary koncentracji pokazują na ile rozkład
wartości zmiennej jest wysmukły lub spłaszczony
Opis dla danych zmierzonych na skali
ilościowej
I. Miary tendencji centralnej:
" Miary pozycyjne: 1) dominanta (modalna, moda)
wartość występująca najczęściej (D)
2) mediana wartość środkowa, dzieląca szereg
wartości zmiennej uzyskanych przez badanych z próby
na pół połowa wyników badanych jest przed
medianą, zaś połowa za medianą (Me)
" Miara klasyczna: średnia arytmetyczna
x
1
2011-03-22
II. Miary zróżnicowania (rozproszenia, dyspersji):
" Miara pozycyjna: rozstęp różnica między wartością
maksymalna i minimalną, odległość między skrajnymi
wynikami
" Miary klasyczne: 1) wariancja; 2) odchylenie standardowe
informują, jak przeciętnie w zbadanej próbie wyniki osób
badanych są rozproszone, odchylają się od średniej
III. Miary asymetrii i koncentracji rozkładu wartości zmiennej:
" Skośność informuje o stopniu asymetrii rozkładu (czyli
ewentualnej przewadze wartości niskich lub wysokich)
" Kurtoza miara koncentracji rozkładu (skupieniu wartości
zmiennej uzyskanych przez badanych wokół jednej wartości
lub przeciwnie: rozproszeniu ich)
Dominanta
Przykład 1: Zmienna liczba posiadanych dzieci
Wartości u poszczególnych badanych:
1, 3, 2, 2, 2, 1, 4, 1, 1, 0, 1, 1, 2, 2, 2, 3, 0, 2, 1, 0, 2
Wartość występująca najczęściej: 2
Interpretacja: Dominuje posiadanie dwójki dzieci (najwięcej badanych ma 2 dzieci)
UWAGA: Przy małej liczbie badanych dominantę widać na oko , ale jak próba jest duża, liczenie
w szeregu wartości uzyskanych przez wszystkich badanych która wartość występuje
najczęściej byłoby raczej trudne.
Wtedy dużym dobrodziejstwem dla badacza jest
Program SPSS :-)
Przykład 2: Ta sama zmienna, ale N = 456
Dominanta D = 0
Najwięcej badanych ma 0 dzieci
Mediana
Przykład 3: Zmienna liczba zdanych egzaminów w sesji
Wartości u poszczególnych badanych:
2, 5, 4, 5, 2, 3, 4, 5, 6, 1, 5 (szereg danych indywidualnych nieuporządkowanych)
Aby wyliczyć medianę, najpierw trzeba szereg uporządkować:
1, 2, 2, 3, 4, 4, 5, 5, 5, 5, 6
(szereg danych indywidualnych uporządkowanych)
N = 11
Mediana (Me) dzieli wyniki na pół w szeregu uporządkowanym
Jeżeli danych jest mało i jest ich nieparzysta liczba, można to zrobić szybko odliczając na
piechotę pozycję w połowie szeregu: wartość znajdująca się tam (na pozycji 6) będzie
medianą, czyli Me = 4
Warto zauważyć, że tym przypadku Me `" D (bo wcale nie musi tak być!)
2
2011-03-22
Mediana
Można też posłużyć się wzorem na obliczenie pozycji wartości Me:
" Dla nieparzystej liczby danych:
N +1
poz.Me =
W omawianym przykładzie (3):
2
11+1
poz.Me = = 6
Szósta w szeregu jest wartość 4, więc Me = 4.
2
Interpretacja: Połowa badanych zdała w sesji co najwyżej 4 egzaminy (4 lub mniej) zaś połowa co
najmniej 4 egzaminy (4 lub więcej)
N +1
" Dla parzystej liczby danych: poz.Me =
2
Przykład 4: zmienna liczba wypalanych dziennie papierosów ; N = 8
8 +1
poz.Me = = 4,5
Szereg danych indywidualnych uporządkowanych: 4, 4, 5, 8, 12, 19, 23, 27 2
Nie ma pozycji 4 i pół, a więc patrzymy na pozycję 4 i 5 i obliczamy średnią z wartości, które się tam
8 +12
znajdują, a więc:
Me = =10
2
Interpretacja: Połowa badanych wypala dziennie co najwyżej 10 papierosów (10 lub mniej) zaś
połowa co najmniej 10 (10 lub więcej)
Zadanie 1
Wskaż wartość występującą najczęściej oraz wartość środkową w
przypadku następujących wartości zmiennej liczba
poprawnie rozwiązanych w ciągu godziny zadań logicznych :
Wartości badanych z próby: 4, 3, 7, 4, 2, 8, 2, 1, 4, 7
Zadanie 2
Wskaż wartość występującą najczęściej oraz wartość środkową w
przypadku następujących wartości zmiennej liczba
posiadanych kart kredytowych :
Wartości badanych z próby: 2, 1, 2, 3, 0, 2, 1, 0, 2, 1, 0
Średnia
Średnia dla indywidualnych danych ilościowych:
n
1
X = xi
"
N
i=1
x1 + x2 +...+ xn
x =
czyli:
N
2 +1 + 2 + 3 + 0 + 2 +1 + 0 + 2 +1 + 0
Dla przykładu z zad. 2:
x =
11
14
x = E" 1,27
11
3
2011-03-22
Średnia dla nietypowego rozkładu danych:
" Rozkład z dużą przewagą wartości skrajnych:
Średnia = 3,87 jest
Np. zmienna liczba przeczytanych w ciągu roku książek :
niewiarygodna, bo nie
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 17, 28 jest prawdą, że
przeciętnie każdy badany
D = 1 przeczytał ok. 4 książki w
1+1+1+1+1+1+1+1+1+1+1+1+1+17 + 28
x =
Me = 1 15 ciągu roku
58
x = = 3,87
15
Średnia wyniosła ok. 20, ale z
" Rozkład siodłowy:
rozkładu widać, że ta wartość
występuje wśród badanych
najmniej licznie (zatem: średnia
niewiarygodna)
Im bardziej odbiegają od siebie wartości średniej,
mediany i dominanty tym bardziej rozkład odbiega
od rozkładu normalnego
Rozkład normalny
Rozkład normalny wartości zmiennej
(krzywa normalna, krzywa dzwonowata)
Krzywa jest symetryczna. Średnia, mediana i
wartość modalna zbiegają się w jednym punkcie.
Rozkład empiryczny
Krzywa rozkładu może być niesymetryczna, albo bardziej
spłaszczona lub wysmukła niż z przypadku rozkładu
normalnego albo posiadać kilka wartości modalnych
4
2011-03-22
Rozproszenie rozkładu
Rozkład wartości jakiejś
zmiennej w przebadanej
próbie może mieć różne
rozproszenie: być bardziej
skoncentrowany wokół jednej
wartości (badani mają dość
podobne wyniki), albo być
bardziej rozproszony (próba
badanych jest bardzo
zróżnicowana pod względem
tej zmiennej)
Miary rozproszenia (zróżnicowania)
" Miara pozycyjna: rozstęp różnica między
wartością maksymalna i minimalną,
odległość między skrajnymi wynikami
" Miary klasyczne: 1) wariancja; 2) odchylenie
standardowe informują, jak przeciętnie w
zbadanej próbie wyniki osób badanych są
rozproszone, odchylają się od średniej
Rozstęp
Przykład 5: Wyniki kwestionariusza oceniającego dojrzałość społeczną wyniosły w
przebadanej próbie: 14, 17, 15, 19, 23, 15, 27, 24, 16, 13, 18, 26, 22, 23, 15
Najniższy wynik (minimum): 13
Najwyższy wynik (maksimum): 27
Rozstęp: 27 - 13 = 14
Przykład 6: Zmienna czas reakcji na bodziec . Wartości uzyskane przez badanych
wyniosły (w milisekundach): 467, 500, 350, 376, 342, 366, 441, 503, 477, 390
Najniższy wynik (minimum): 342
Najwyższy wynik (maksimum): 503
Rozstęp: 503 342 = 161
5
2011-03-22
Wariancja
" Przyjmuje wartość minimalną = 0 gdy w próbie
nie ma żadnego zróżnicowania. Nie ma
natomiast określonej wartości maksymalnej
" Im większa wariancja tym większe
zróżnicowanie wyników osób badanych
n
1
Obliczamy ją z następującego wzoru:
2
S = - x)2
"(xi
N -1
i=1
Zadanie 3
" Oblicz wariancję dla rozkładu
wartości dla 2 zmiennych:
poziom męskości i poziom
kobiecości obliczonych na
podstawie kwestionariusza
płci psychologicznej
" Badani uzyskali następujące
wartości (tabela)
n
1
2
S = - x)2
"(xi
N -1
i=1
N = 10 męsk. = 52,2 kob. = 55
x x
Odchylenie standardowe (SD)
" Informuje, jakie jest przeciętne odchylenie
wyników od średniej w próbie
" Prawa Czebyszewa: W rozkładzie normalnym
ok. 68% populacji mieści się w 1 SD; w zakresie
dwóch SD mieści się ok. 95% populacji; w
zakresie trzech SD ok. 99,7% populacji
6
2011-03-22
Prawa Czebyszewa:
0,5
0,4
0,3
0,2
0,1
68%
95,5%
99,7%
0
-3 SD -2 SD -1 SD 1 SD 2 SD 3 SD
Oblicza się je ze wzoru:
2
S = S
Przykład 7:
Zmienna: poziom odporności psychicznej (wyniki wahają się w zakresie 0 10)
l.p xi xi - x x (Przeciętny wynik uzyskany w próbie
(x- )2
18
1 2 -1,6 2,56
x = = 3,6 to 3,6 punktu)
2 3 -0,6 0,36 5
3 3 -0,6 0,36
4 4 +0,4 0,16
1
5 6 +2,4 5,76 2
S = - x)2
"(xi
S = S2
N -1
" N=5 18 0 9,2 S =1,52
9,2
2
S = = 2,3
4
Interpretacja wartości odchylenia standardowego: Liczba
x ą S
uzyskanych punktów (wynik w teście) u poszczególnych osób
3,6 ą1,52
odchyla się przeciętnie o 1,52 punktu w górę lub w dół
(prawo lub w lewo) od średniej
7
2011-03-22
Obszar przeciętnej zmienności
S
xtyp obszar wyników najbardziej zbliżonych do średniej
v = "100%
x
x - S < xtyp < x + S
1,52
3,6 - 1,52 3,6 + 1,52
v = "100% = 42,2
3,6
2,08 < xtyp < 5,12
Interpretacja: v informuje, że zróżnicowanie liczby uzyskanych punktów
mierzone odchyleniem standardowym stanowi 42,2% ze średniej , a więc
badana grupa 5 osób jest umiarkowanie zróżnicowana ze
v zróżnicowanie
względu na odporność psychiczną. 0 brak
0,01-10% nikłe
11-33,3 % słabe
33,4- 68 % umiarkowane
69-90 % silne
91-100 % bardzo silne
pow.100 % ekstremalnie silne
Zadanie 4
Oblicz odchylenie standardowe oraz określ obszar przeciętnej zmienności dla
poziomu kobiecości uzyskanego przez próbę z zadania 3.
v zróżnicowanie
= 55
x 0 brak
0,01-10% nikłe
N = 10
11-33,3 % słabe
33,4- 68 % umiarkowane
69-90 % silne
91-100 % bardzo silne
pow.100 % ekstremalnie silne
2
S = S
n
1
2 S
S = - x)2
"(xi v = "100%
N -1
i=1
x
8
Wyszukiwarka
Podobne podstrony:
Stat wyklad2 11 na notatkiStat wyklad4 11 na notatkiWykład 11 stolarka okienna i drzwiowaWYKŁAD 11MapyMysli czyli jak zyskac czas na notatkachwyklad 11 psychosomatykaPLC mgr wyklad 11 algorytmyCHEMIA dla IBM Wyklad 8) 11 2013Wyklad 11Wyklad 11 stacj Genetyka i biotechnologie lesne(Uzupełniający komentarz do wykładu 11)wyklad10 11 ME1 EiTWYKŁAD 11 2wyklad dzialania na zbiorachwykład 11 WmMetodologia wykład 11 12 TabelaWyklad 4 11więcej podobnych podstron