Jadłospis na dzisiaj:
Jadłospis na dzisiaj:
Dania z zeszłego tygodnia: powtórka
Przystawka: Miary kształtu rozkładu
Danie główne : Sztuczki i kruczki SPSS
–
Standaryzacja
–
Graficzne prezentacje danych:
–
Dzielenie na podzbiory
–
Filtrowanie obserwacji
Dania z zeszłego tygodnia: powtórka
Jakie znasz grupy statystyk?
MTC to?
O czym informuje nas odchylenie standardowe?
Wariancja to...?
Mediana to ...?
Co to jest dolny kwartyl?
Charakterystyki rozkładów cd:
Miary kształtu rozkładu
STATYSTYKI – kształt rozkładu
SKOŚNOŚĆ
odnosi się do symetryczności rozkładu, wyznacza ją
proporcja odchyleń od średniej powyżej średniej do
proporcji odchyleń poniżej średniej (podniesione do
trzeciej potęgi). Można powiedzieć też, że rozkład,
który jest skośny, jest niesymetryczny. Oznacza, to, że
np. pewne wartości po jednej ze stron średniej są
bardziej skrajne (osiągają bardziej ekstremalne wartości
– dla określonej zmiennej).
STATYSTYKI – kształt rozkładu
SKOŚNOŚĆ
●
dodatnia:dużo niskich wartości, mało wysokich
(powyżej średniej) – wartości ekstremalne znajdują
się powyżej średniej
g1 > 0 – np. rozkład ocen z klasówki o wysokiej
trudności – dużo osób nie zalicza, mało dostaje
najwyższe oceny.
STATYSTYKI – kształt rozkładu
SKOŚNOŚĆ
●
ujemna: dużo wysokich wartości, mało niskich
(poniżej średniej) – wartości ekstremalne znajdują
się poniżej średniej
g1 < 0 – np. rozkład optymizmu w społeczeństwie –
bardzo mało jest osób, które są skrajnie
pesymistyczne, natomiast większość ludzi jest
pozytywnie nastawiona do otaczającego świata.
STATYSTYKI – kształt rozkładu
KURTOZA - szpiczastość rozkładu zmiennej
●
dodatnia: g2 > 0 – rozkład szpiczasty, leptokurtyczny
– w takim rozkładzie istnieje jedna, lub kilka grup
ustawionych koło siebie, które wybijają się powyżej
innych.
Np. kiedy w ciągu określonego miesiąca mieliśmy
przewagę dni o określonej temperaturze,
niekoniecznie wysokiej, albo niskiej (czyli mieliśmy
do czynienia z rozkładem symetrycznym).
STATYSTYKI – kształt rozkładu
KURTOZA - szpiczastość rozkładu zmiennej
Ujemna– g2 < 0 – rozkład płaski, platykurtyczny – w
takim rozkładzie nie ma jakichś silnie wybijających
się wartości.
Przykładem może być miesiąc o bardzo umiarkowanej
temperaturze, gdzie była podobna ilość dni ciepłych,
zimnych i letnich.
symulacja
STATYSTYKI – kształt rozkładu
KURTOZA i SKOŚNOŚĆ
w spss
g1 i g2 należą do miar rozkładu, a więc > częstości >
statystyki... (i swiat w 1995)
Otwórz dane > SPSS > Świat95
Zadanie: Porównaj ze sobą, pod względem znanych ci
miar rozkładu, zmienne:
- death_rt vs birth_rt
- lit_male vs lit_fema
STATYSTYKI – rozkładu podsumowanie 1
●
Średnia, mediana, modalna, wariancja, rozstęp,
odchylenie standardowe zależą od skali
pomiarowej – oznacza to, że nie możemy
bezpośrednio porównywać rozkładów o różnych
skalach. Np. nie ma sensu porównanie odchylenia
standardowego zarobków (skala 0 – 10000) i
wzrostu (0 – 255)
●
Skośność i kurtoza mogą być porównywane
niezależnie od użytej skali
STATYSTYKI – rozkładu podsumowanie 2
●
Gdy rozkład jest skośny dodatnio (większe
ekstremum po stronie wysokich) to MO < ME <
ŚR (temperatury w zimnym miesiącu)
●
Gdy rozkład jest skośny ujemnie (większe
ekstremum po stronie niskich) to MO > ME > ŚR
(temperatury w gorącym miesiącu)
●
Gdy rozkład jest normalny, symetryczny to MO =
ME = ŚR (oceny z plasytki).
STATYSTYKI – rozkładu podsumowanie 3
●
Dodawanie stałej zmienia: średnią, medianę i
modalną, ale nie zmienia SD i wariancji
●
Co to znaczy, jeśli wszyscy zaczną zarabiać o 1000
zł więcej? – średnia wzrośnie o 1000, tak samo
mediana i modalna, a rozkład zarobków będzie tak
samo rozproszony jak był
●
Jeżeli mnożymy wartości zmiennej to zmieni się
wszystko (me mo śr s i sd).
STATYSTYKI – zastosowania praktyczne
STANDARYZACJA
●
Zamiana wyników surowych na wyniki
standaryzowane. Cel: możliwość porównywania
wartości zmiennych niezależnie od skali pomiarowej!
●
Siła PSI
magazyn Wróżka: wynik Wojtka = 15
Książka „siła Psi”: wynik Zosi = 8
STATYSTYKI – zastosowania praktyczne
STANDARYZACJA
●
Sama informacja bez kontekstu nic nam nie mówi!
●
Potrzebujemy znać: Śr i SD
Magazyn Wróżka: wynik Wojtka = 15; M=12; SD=1,5
Książka „siła Psi”: wynik Zosi = 8: M = 4; SD = 2
Kto ma więcej PSI?....
STATYSTYKI – zastosowania praktyczne
STANDARYZACJA
●
Zadanie: Oblicz wyniki Z oceny z klasówki ze
statystyki:
Marek = 4; M=3; SD=0,5
Zenek = 5: M = 6; SD = 1
Kto powinien się bardziej cieszyć?
Notatka do zajęć
–
Jak uzyskać miary: skośności i kurtozy w spss
(ścieżka dostępu)?
–
Czym się różnią od siebie skośność i kurtoza?
–
Co to jest rozkład platykurtyczny?
–
Po co standaryzuje się zmienne?
Co czytać? “Wieczorkowska” s. 99 – 111 (rozdział
3 – wizualizacja danych)
Praca domowa
–
W dowolnym pliku z danymi wyszukaj trzy takie
zmienne, które będą skośne ujemnie i trzy, które będą
płaskie.
–
Dla tych 6 zmiennych oblicz wszystkie (uwaga na
poziom pomiaru) miary rozkładu
–
Napisz krótkie podsumowanie na temat dwóch
wybranych zmiennych