skośność i kurtoza 4 dla studentów


Overview

Problem skośności
Skośność - interpretacja
SAGS 2008
rozstępy


Sheet 1: Problem skośności

Dlaczego "nie wychodzą", lub są gorsze od spodziewanych - obliczenia wykorzystujące tzw. statystyki parametryczne


















1.Jest to spowodowane obecnością w macierzy tzw. "przypadków odstających - outliers"; są to odpowiedzi mało rzetelne, przypadkowe, o niskiej wartości diagnostycznej.


















2.Jeśli jest dużo takich przypadków odstających, należy je usunąć


















3.Po takim zabiegu wszystkie statystyki wychodzą +lepsze+.









Uwaga: być może zajdzie taka potrzeba aby zabieg powtórzyć kilka razy …

















4.Jak znaleźć takie przypadki?





























operacji należy dokonać na wartościach surowych, (chodzi o surowe sumy skalowe)








wybrać kolejno zakładki:









Analiza









Opis statystyczny









Eksploracja









wstawić wybrane zmienne do okna "zmienne zależne"









zahaczyć - wykresy








opcje - histogram


















po obliczeniu, w raporcie wyświetlą się "wykresy skrzynkowe", na których będą wyświetlone numery "przypadków odstających"








przypadki te należy wyłączyć z dalszych obliczeń, gdyż psują one zarówno skośność jak i kurtozę








Z konieczności można dopuścić sytuacje kiedy wartości skośność/błąd std. zawiera się w granicach ( - 3) i ( +3), oznacza to jednak bardzo znaczące odejście od symetrii








Dopiero na takiej "wyczyszczonej" macierzy należy dokonać standaryzacji, a także ewentualnych dalszych obliczeń, np. rzetelności, mocy dyskryminacyjnych dla pytań itp.









Należy pamiętać, że w kwestionariuszach diagnozujących symptomy kliniczne skośności będą dodatnie, gdyż osób z symptomami klinicznycznymi jest obiektywnie mniej.









(przyjmując, że odpowiedź na dany item, który jest empirycznym wskaźnikiem symptomu klinicznego - będzie np. taka, iż:








po lewej stronie skali będzie 0 lub 1, bądź NIE albo RZADKO a po prawej 3, lub 4, bądź BARDZO CZĘSTO lub ZAWSZE)







Dlatego tego rodzaju sytuację należy interpretować jako dopuszczalną, licząc się jednak z jej konsekwencjami, tzn. ogólnie "gorszych" wyników w testach statystycznych,









których zastosowanie wymaga sepełnienia kryterium "normalności" rozkładu (w domyśle - symetrii)










Ponieważ ważniejszym problemem jest skośność niż kurtoza, należy poprawić symetrię rozkładu; oczywiście można rozkład logarytmować, aby móc później zastosować statystyki wymagające rozkładu "normalnego",









ale bardziej naturalnym zabiegiem jest usunięcie przypadków odstających, tak jak to opisałem w w/w przykładowej procedurze





































Zanim przeprowadzi się powyższy zabieg, należy najpierw obliczyć wspomniane: skośność i kurtozę




















Analiza









Opis statystyczny









Częstości









wstawić wybrane zmienne do okna "zmienne"









zahaczyć przyciski:










statystyki









skośność









kurtoza


















wykresy histogram









z krzywą normalną

Sheet 2: Skośność - interpretacja

Skośność



































Skośność (skew). Miara asymetrii rozkładu. Rozkład traktowany jest jako normalny jeśli jest symetryczny i posiada współczynnik skośności równy 0.
Gdy zaś współczynnik jest ujemny, rozkład ma długi ogon z lewej strony.
Rozkład o znaczącej wartości dodatniej współczynnika skośności ma długi ogon z prawej strony.







































lewoskośność













prawoskośność













































skośność =
-0,935


skośność =
-0,002


skośność =
0,316


bł std skośności =
0,109


bł std skośności =
0,109


bł std skośności =
0,109


skośność/błąd =
-8,6


skośność/błąd =
0,0


skośność/błąd =
2,9




















dominują wyniki wysokie










dominują wyniki niskie




długi ogon z lewej strony










długi ogon z prawej strony









































Jeśli wartości skośność/błąd std. dla skośności przekraczają granice ( - 1) i ( +1), oznacza to odstawanie wyników od rozkładu normalnego


































Jeśli wartości skośność/błąd std. dla skośności przekraczają granice ( - 2) i ( +2), oznacza to znaczące odejście od symetrii

































"skośność" - wydłużone ramię się liczy; tzn.:

















jak jest dłuższe prawe ramię - mówimy o prawoskośności; dominują wtedy wyniki niskie, a liczebności osób o wynikach wysokich są niewielkie; wartość statystyki jest wtedy dodatnia,
















jak jest dłuższe lewe ramię - mówimy o lewoskośności; dominują wtedy wyniki wysokie, a liczebności osób o wynikach niskich są niewielkie; wartość statystyki jest wtedy ujemna,




































































Kurtoza Kurtoza (kurtosis) - Miara stopnia koncentracji obserwacji wokół pozycji centralnej.


































Rozkład normalny (mezokurtyczny), wtedy kiedy wartość kurtozy oscyluje wokół zera (0).


































Rozkład leptokurtyczny - obserwacje są silniej skoncentrowane wokół środka skali; rozkład taki ma także dłuższe ogony, niż w przypadku rozkładu normalnego, wartość statystyki (+)


































Rozkład platykurtyczny - obserwacje liczebnościowo są porównywalnie skoncentrowane wokół wszystkich punktów na skali; rozkład taki jest "płaski", ma krótkie ogony, wartość statystyki (-)
















Sheet 3: SAGS 2008

Statystyki opisowe (DESCRIPTIVES)




















Statystyka Błąd standardowy
















SAGS_F1 Średnia
16,5671641791045 0,258448751496223


SAGS_F1

SAGS_F2

SAGS_F3

SAGS_F4

SAGS_F1234

95% przedział ufności dla średniej Dolna granica 16,0593005320644



















Górna granica 17,0750278261445


















5% średnia obcięta
16,2587064676617



Statystyka Błąd standardowy
Statystyka Błąd standardowy
Statystyka Błąd standardowy
Statystyka Błąd standardowy
Statystyka Błąd standardowy

Mediana
16

Skośność
0,73 0,11
0,62 0,11
1,27 0,11
0,23 0,11
0,59 0,11

Wariancja
31,3272101033295

Kurtoza
0,03 0,23
0,29 0,23
1,26 0,23
-0,58 0,23
-0,06 0,23

Odchylenie standardowe
5,59707156496409


















Minimum
9

Skośność/błąd
6,49

5,53

11,29

2,04

5,21

Maksimum
36


















Rozstęp
27


















Rozstęp ćwiartkowy
8


















Skośność
0,731550616280091 0,112747417875978

















Kurtoza
0,026010034613786 0,225022697469607
















SAGS_F2 Średnia
14,5287846481876 0,209013420677644

















95% przedział ufności dla średniej Dolna granica 14,1180636929068



















Górna granica 14,9395056034684


















5% średnia obcięta
14,2858327410566


















Mediana
14


















Wariancja
20,4890201009604


















Odchylenie standardowe
4,52647987965929


















Minimum
8


















Maksimum
32


















Rozstęp
24


















Rozstęp ćwiartkowy
6


















Skośność
0,623418321223243 0,112747417875978

















Kurtoza
0,294239433656934 0,225022697469607
















SAGS_F3 Średnia
8,08102345415778 0,153547418320795

















95% przedział ufności dla średniej Dolna granica 7,77929573672627



















Górna granica 8,38275117158929


















5% średnia obcięta
7,73750296138356


















Mediana
7


















Wariancja
11,0575237366282


















Odchylenie standardowe
3,32528551204678


















Minimum
5


















Maksimum
20


















Rozstęp
15


















Rozstęp ćwiartkowy
5


















Skośność
1,27273137121739 0,112747417875978

















Kurtoza
1,25735962731938 0,225022697469607
















SAGS_F4 Średnia
8,72494669509595 0,130770538069724

















95% przedział ufności dla średniej Dolna granica 8,46797659171958



















Górna granica 8,98191679847231


















5% średnia obcięta
8,65517649846008


















Mediana
8


















Wariancja
8,02033787108414


















Odchylenie standardowe
2,83202010428672


















Minimum
4


















Maksimum
16


















Rozstęp
12


















Rozstęp ćwiartkowy
4


















Skośność
0,229766571904118 0,112747417875978

















Kurtoza
-0,584878329149446 0,225022697469607
















SAGS_F1234 Średnia
47,9019189765458 0,604298986518472

















95% przedział ufności dla średniej Dolna granica 46,7144437598186



















Górna granica 49,0893941932731


















5% średnia obcięta
47,3218431651268


















Mediana
47


















Wariancja
171,268137335301


















Odchylenie standardowe
13,0869453019145


















Minimum
26


















Maksimum
95


















Rozstęp
69


















Rozstęp ćwiartkowy
19


















Skośność
0,5875349616943 0,112747417875978

















Kurtoza
-0,057664568891085 0,225022697469607

















Sheet 4: rozstępy

Rozstęp ćwiartkowy (lub inaczej rozstęp kwartylny) to różnica pomiędzy trzecim i pierwszym kwartylem.








Ponieważ pomiędzy tymi kwartylami znajduje się z definicji 50% wszystkich obserwacji, dlatego im większa szerokość rozstępu ćwiartkowego, tym większe zróżnicowanie cechy.





























Informacja o analizowanych danych








Obserwacje








Uwzględnione
Wykluczone
Ogółem




N Procent N Procent N Procent


SAGS_F1234 469 100 0 0 469 100






















Statystyki opisowe (DESCRIPTIVES)








Statystyka Błąd standardowy




SAGS_F1234 Średnia
47,9019189765458 0,604298986518472





95% przedział ufności dla średniej Dolna granica 46,7144437598186







Górna granica 49,0893941932731






5% średnia obcięta
47,3218431651268






Mediana
47






Wariancja
171,268137335301






Odchylenie standardowe
13,0869453019145






Minimum
26

45 64 83


Maksimum
95






Rozstęp
69

= min + 1 rozstęp



Rozstęp ćwiartkowy
19


= min + 2 rozstępy


Skośność
0,5875349616943 0,112747417875978


= min + 3 rozstęp


Kurtoza
-0,057664568891085 0,225022697469607



































SAGS_F1234
osoba nr 468 ma =
86 wynik przekracza 3 rozstępy kwartylowe, dlatego ta osoba znalazła się wśród outliers na wykresie skrzynkowym



SAGS_F1234
osoba nr 469 ma =
95 wynik przekracza 3 rozstępy kwartylowe, dlatego ta osoba znalazła się wśród outliers na wykresie skrzynkowym


Wyszukiwarka

Podobne podstrony:
skośność i kurtoza 3 dla studentów
gruźlica dla studentów2
Prezentacja 2 analiza akcji zadania dla studentow
Kosci, kregoslup 28[1][1][1] 10 06 dla studentow
higiena dla studentów 2011 dr I Kosinska
Wyklad FP II dla studenta
Materiały dla studentów ENDOKRYNOLOGIA
JP Seminarium 9 wersja dla studentów
wyklad 1,2,3,4,5 dla studentow
Przebieg porodu dla studentów
Leki hipolipemizujące wersja dla studentów
ćw 3 dla studentów
Genetyka ogólna dla studentów cz 2
Nieplodnosc dla studentow1
materiały dla studentów 8

więcej podobnych podstron