Stat wyklad3 2011 na notatki


2011-03-22
Statystyka
Wykład 3
Dr Małgorzata Gut
Katedra Psychologii Poznawczej WSFiZ
Wskazniki opisu statystycznego
" Miary poło\enia (miary tendencji centralnej) 
pokazują, co w badanej próbie jest typowe,
najczęstsze, przeciętne
" Miary rozproszenia (=zró\nicowania, dyspersji) 
pokazują jaki jest rozrzut wartości zmiennej wokół
tendencji centralnej, na ile próba jest jednorodna
lub zró\nicowana
" Miary skośności (asymetrii)  pokazują stopień
przewagi wartości niskich lub wysokich
" Miary koncentracji  pokazują na ile rozkład
wartości zmiennej jest wysmukły lub spłaszczony
Opis dla danych zmierzonych na skali
ilościowej
I. Miary tendencji centralnej:
" Miary pozycyjne: 1) dominanta (modalna, moda) 
wartość występująca najczęściej (D)
2) mediana  wartość środkowa, dzieląca szereg
wartości zmiennej uzyskanych przez badanych z próby
na pół  połowa wyników badanych jest przed
medianą, zaś połowa za medianą (Me)
" Miara klasyczna: średnia arytmetyczna
x
1
2011-03-22
II. Miary zróżnicowania (rozproszenia, dyspersji):
" Miara pozycyjna: rozstęp  różnica między wartością
maksymalna i minimalną,  odległość między skrajnymi
wynikami
" Miary klasyczne: 1) wariancja; 2) odchylenie standardowe 
informują, jak przeciętnie w zbadanej próbie wyniki osób
badanych są rozproszone, odchylają się od średniej
III. Miary asymetrii i koncentracji rozkładu wartości zmiennej:
" Skośność  informuje o stopniu asymetrii rozkładu (czyli
ewentualnej przewadze wartości niskich lub wysokich)
" Kurtoza  miara koncentracji rozkładu (skupieniu wartości
zmiennej uzyskanych przez badanych wokół jednej wartości
lub przeciwnie: rozproszeniu ich)
Dominanta
Przykład 1: Zmienna  liczba posiadanych dzieci
Wartości u poszczególnych badanych:
1, 3, 2, 2, 2, 1, 4, 1, 1, 0, 1, 1, 2, 2, 2, 3, 0, 2, 1, 0, 2
Wartość występująca najczęściej: 2
Interpretacja: Dominuje posiadanie dwójki dzieci (najwięcej badanych ma 2 dzieci)
UWAGA: Przy małej liczbie badanych dominantę widać  na oko , ale jak próba jest duża, liczenie
w szeregu wartości uzyskanych przez wszystkich badanych która wartość występuje
najczęściej byłoby raczej trudne.
Wtedy dużym dobrodziejstwem dla badacza jest
Program SPSS :-)
Przykład 2: Ta sama zmienna, ale N = 456
Dominanta D = 0
Najwięcej badanych ma 0 dzieci
Mediana
Przykład 3: Zmienna  liczba zdanych egzaminów w sesji
Wartości u poszczególnych badanych:
2, 5, 4, 5, 2, 3, 4, 5, 6, 1, 5 (szereg danych indywidualnych nieuporządkowanych)
Aby wyliczyć medianę, najpierw trzeba szereg uporządkować:
1, 2, 2, 3, 4, 4, 5, 5, 5, 5, 6
(szereg danych indywidualnych uporządkowanych)
N = 11
Mediana (Me) dzieli wyniki na pół w szeregu uporządkowanym
Jeżeli danych jest mało i jest ich nieparzysta liczba, można to zrobić szybko odliczając  na
piechotę pozycję w połowie szeregu: wartość znajdująca się tam (na pozycji 6) będzie
medianą, czyli Me = 4
Warto zauważyć, że tym przypadku Me `" D (bo wcale nie musi tak być!)
2
2011-03-22
Mediana
Można też posłużyć się wzorem na obliczenie pozycji wartości Me:
" Dla nieparzystej liczby danych:
N +1
poz.Me =
W omawianym przykładzie (3):
2
11+1
poz.Me = = 6
Szósta w szeregu jest wartość 4, więc Me = 4.
2
Interpretacja: Połowa badanych zdała w sesji co najwyżej 4 egzaminy (4 lub mniej) zaś połowa co
najmniej 4 egzaminy (4 lub więcej)
N +1
" Dla parzystej liczby danych: poz.Me =
2
Przykład 4: zmienna  liczba wypalanych dziennie papierosów ; N = 8
8 +1
poz.Me = = 4,5
Szereg danych indywidualnych uporządkowanych: 4, 4, 5, 8, 12, 19, 23, 27 2
Nie ma pozycji 4 i pół, a więc patrzymy na pozycję 4 i 5 i obliczamy średnią z wartości, które się tam
8 +12
znajdują, a więc:
Me = =10
2
Interpretacja: Połowa badanych wypala dziennie co najwyżej 10 papierosów (10 lub mniej) zaś
połowa co najmniej 10 (10 lub więcej)
Zadanie 1
Wskaż wartość występującą najczęściej oraz wartość środkową w
przypadku następujących wartości zmiennej  liczba
poprawnie rozwiązanych w ciągu godziny zadań logicznych :
Wartości badanych z próby: 4, 3, 7, 4, 2, 8, 2, 1, 4, 7
Zadanie 2
Wskaż wartość występującą najczęściej oraz wartość środkową w
przypadku następujących wartości zmiennej  liczba
posiadanych kart kredytowych :
Wartości badanych z próby: 2, 1, 2, 3, 0, 2, 1, 0, 2, 1, 0
Średnia
Średnia dla indywidualnych danych ilościowych:
n
1
X = xi
"
N
i=1
x1 + x2 +...+ xn
x =
czyli:
N
2 +1 + 2 + 3 + 0 + 2 +1 + 0 + 2 +1 + 0
Dla przykładu z zad. 2:
x =
11
14
x = E" 1,27
11
3
2011-03-22
Średnia dla nietypowego rozkładu danych:
" Rozkład z dużą przewagą wartości skrajnych:
Średnia = 3,87 jest
Np. zmienna  liczba przeczytanych w ciągu roku książek :
niewiarygodna, bo nie
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 17, 28 jest prawdą, że
przeciętnie każdy badany
D = 1 przeczytał ok. 4 książki w
1+1+1+1+1+1+1+1+1+1+1+1+1+17 + 28
x =
Me = 1 15 ciągu roku
58
x = = 3,87
15
Średnia wyniosła ok. 20, ale z
" Rozkład siodłowy:
rozkładu widać, że ta wartość
występuje wśród badanych
najmniej licznie (zatem: średnia
niewiarygodna)
Im bardziej odbiegają od siebie wartości średniej,
mediany i dominanty tym bardziej rozkład odbiega
od rozkładu normalnego
Rozkład normalny
Rozkład normalny wartości zmiennej
(krzywa normalna, krzywa dzwonowata)
Krzywa jest symetryczna. Średnia, mediana i
wartość modalna zbiegają się w jednym punkcie.
Rozkład empiryczny
Krzywa rozkładu może być niesymetryczna, albo bardziej
spłaszczona lub wysmukła niż z przypadku rozkładu
normalnego albo posiadać kilka wartości modalnych
4
2011-03-22
Rozproszenie rozkładu
Rozkład wartości jakiejś
zmiennej w przebadanej
próbie może mieć różne
rozproszenie: być bardziej
skoncentrowany wokół jednej
wartości (badani mają dość
podobne wyniki), albo być
bardziej rozproszony (próba
badanych jest bardzo
zróżnicowana pod względem
tej zmiennej)
Miary rozproszenia (zróżnicowania)
" Miara pozycyjna: rozstęp  różnica między
wartością maksymalna i minimalną,
 odległość między skrajnymi wynikami
" Miary klasyczne: 1) wariancja; 2) odchylenie
standardowe  informują, jak przeciętnie w
zbadanej próbie wyniki osób badanych są
rozproszone, odchylają się od średniej
Rozstęp
Przykład 5: Wyniki kwestionariusza oceniającego dojrzałość społeczną wyniosły w
przebadanej próbie: 14, 17, 15, 19, 23, 15, 27, 24, 16, 13, 18, 26, 22, 23, 15
Najniższy wynik (minimum): 13
Najwyższy wynik (maksimum): 27
Rozstęp: 27 - 13 = 14
Przykład 6: Zmienna  czas reakcji na bodziec . Wartości uzyskane przez badanych
wyniosły (w milisekundach): 467, 500, 350, 376, 342, 366, 441, 503, 477, 390
Najniższy wynik (minimum): 342
Najwyższy wynik (maksimum): 503
Rozstęp: 503  342 = 161
5
2011-03-22
Wariancja
" Przyjmuje wartość minimalną = 0 gdy w próbie
nie ma żadnego zróżnicowania. Nie ma
natomiast określonej wartości maksymalnej
" Im większa wariancja  tym większe
zróżnicowanie wyników osób badanych
n
1
Obliczamy ją z następującego wzoru:
2
S = - x)2
"(xi
N -1
i=1
Zadanie 3
" Oblicz wariancję dla rozkładu
wartości dla 2 zmiennych:
 poziom męskości i  poziom
kobiecości obliczonych na
podstawie kwestionariusza
płci psychologicznej
" Badani uzyskali następujące
wartości (tabela)
n
1
2
S = - x)2
"(xi
N -1
i=1
N = 10 męsk. = 52,2 kob. = 55
x x
Odchylenie standardowe (SD)
" Informuje, jakie jest przeciętne odchylenie
wyników od średniej w próbie
" Prawa Czebyszewa: W rozkładzie normalnym
ok. 68% populacji mieści się w 1 SD; w zakresie
dwóch SD mieści się ok. 95% populacji; w
zakresie trzech SD  ok. 99,7% populacji
6
2011-03-22
Prawa Czebyszewa:
0,5
0,4
0,3
0,2
0,1
68%
95,5%
99,7%
0
-3 SD -2 SD -1 SD 1 SD 2 SD 3 SD
Oblicza się je ze wzoru:
2
S = S
Przykład 7:
Zmienna:  poziom odporności psychicznej (wyniki wahają się w zakresie 0  10)
l.p xi xi - x x (Przeciętny wynik uzyskany w próbie
(x- )2
18
1 2 -1,6 2,56
x = = 3,6 to 3,6 punktu)
2 3 -0,6 0,36 5
3 3 -0,6 0,36
4 4 +0,4 0,16
1
5 6 +2,4 5,76 2
S = - x)2
"(xi
S = S2
N -1
" N=5 18 0 9,2 S =1,52
9,2
2
S = = 2,3
4
Interpretacja wartości odchylenia standardowego: Liczba
x ą S
uzyskanych punktów (wynik w teście) u poszczególnych osób
3,6 ą1,52
odchyla się przeciętnie o 1,52 punktu w górę lub w dół
(prawo lub w lewo) od średniej
7
2011-03-22
Obszar przeciętnej zmienności
S
xtyp  obszar wyników najbardziej zbliżonych do średniej
v = "100%
x
x - S < xtyp < x + S
1,52
3,6 - 1,52 3,6 + 1,52
v = "100% = 42,2
3,6
2,08 < xtyp < 5,12
Interpretacja: v informuje, że zróżnicowanie liczby uzyskanych punktów
mierzone odchyleniem standardowym stanowi 42,2% ze średniej , a więc
badana grupa 5 osób jest umiarkowanie zróżnicowana ze
v zróżnicowanie
względu na odporność psychiczną. 0 brak
0,01-10% nikłe
11-33,3 % słabe
33,4- 68 % umiarkowane
69-90 % silne
91-100 % bardzo silne
pow.100 % ekstremalnie silne
Zadanie 4
Oblicz odchylenie standardowe oraz określ obszar przeciętnej zmienności dla
poziomu kobiecości uzyskanego przez próbę z zadania 3.
v zróżnicowanie
= 55
x 0 brak
0,01-10% nikłe
N = 10
11-33,3 % słabe
33,4- 68 % umiarkowane
69-90 % silne
91-100 % bardzo silne
pow.100 % ekstremalnie silne
2
S = S
n
1
2 S
S = - x)2
"(xi v = "100%
N -1
i=1
x
8


Wyszukiwarka

Podobne podstrony:
Stat wyklad2 11 na notatki
Stat wyklad4 11 na notatki
Wykład 11 stolarka okienna i drzwiowa
WYKŁAD 11
MapyMysli czyli jak zyskac czas na notatkach
wyklad 11 psychosomatyka
PLC mgr wyklad 11 algorytmy
CHEMIA dla IBM Wyklad 8) 11 2013
Wyklad 11
Wyklad 11 stacj Genetyka i biotechnologie lesne
(Uzupełniający komentarz do wykładu 11)
wyklad10 11 ME1 EiT
WYKŁAD 11 2
wyklad dzialania na zbiorach
wykład 11 Wm
Metodologia wykład 11 12 Tabela
Wyklad 4 11

więcej podobnych podstron