Jadłospis na dzisiaj:
Dania z zeszłego tygodnia: powtórka
Danie główne 1: rozkład częstości
–
Graficzne prezentacje częstości
–
Tabelaryczne prezentacje częstości
Przerwa
Danie główne 2: Prawdopodobieństwo
–
Jakie jest prawdopodobieństwo X
–
Ile osób na sto / na dziesięć... ma szansę na X
Dania z zeszłego tygodnia: powtórka
Jakie znasz okna w spssie?
Jakie są i do czego służą zakładki w edytorze
danych?
Co to jest deklaracja braków danych?
–
po co deklaruje się braki?
–
Jak kodujemy braki danych – nr telefonu; skala
stenowa (1 – 10); skala staninowa (1 – 9); iloraz
inteligencji (wechsler)
Spss też ma swój zapis braków danych:
–
systemowy brak danych:
,
Danie główne: rozkład częstości cz. 1
Graficzna prezentacja danych w postaci
liczebności dla poszczególnych wystąpień
zmiennej to rozkład częstości.
–
Na osi X (oś kategorii) wypisane są poszczególne
wystąpienia (kategorie) zmiennej.
–
Na osi Y pokazana jest liczba osób w danej kategorii
–
Np. ile osób przeżyło katastrofę Tytanika?
Katastrofa Titanica
czy osoba przezyla
tak
nie
L
ic
z
e
b
n
o
ś
ć
2200
2090
1980
1870
1760
1650
1540
1430
1320
1210
1100
990
880
770
660
550
440
330
220
110
0
711
1490
Tytuł wykresu
Etykieta zmiennej
Etykieta kategorii (wartości)
Oś kategorii (X)
Oś
liczebności
(Y)
SKALA
0 – max
Słupki z informacją
o liczebności
Co
przedstawia
oś Y
Danie główne: rozkład częstości cz. 2
TABELARYCZNY rozkład częstości:
–
Tabelaryczna prezentacja danych w postaci
liczebności dla poszczególnych wystąpień
zmiennych, zawierająca dodatkowo informacje o
procentowym udziale poszczególnych wystąpień.
Danie główne: rozkład częstości cz. 3
TABELARYCZNY rozkład częstości
zawiera pięć kolumn:
–
Wartości zmiennej (lub etykiety wartości)
–
Częstość występowania
–
Procent
–
Procent ważny
–
Procent skumulowany
czy osoba przezyla
1490
67.7
67.7
67.7
711
32.3
32.3
100.0
2201
100.0
100.0
nie
tak
Ogółem
Ważne
Częstość
Procent
Procent
ważnych
Procent
skumulowany
Tytuł tabeli
Etykiety
wartości
Liczebność
Procent łącznie
z brakami danych
Procent z pominięciem
braków danych
67,7
+ 32,3
= 100
Procent łączny
Danie główne: rozkład częstości cz. 4
Tabelaryczny rozkład częstości:
–
Zawiera bardzo dużo niezbędnych
informacji
–
Trudniejszy do odczytania
–
Dokładny
–
Zawiera informacje o procentach
Danie główne: rozkład częstości cz. 5
Przykład w spss
–
Włącz spss
–
Otwórz dane TYTANIC.SAV
●
/moje miejsca sieciowe/venus /wykladowca/
qba2 /spss_mat/dane+ /tytanic /tytanic.sav
●
/.../dane+ /tytanic /tytanic.sav
Danie główne: rozkład częstości cz. 6
Sprawdzamy kodowanie:
–
Narzędzia > zmienne
Jak zrobić rozkład częstości?
–
Analiza>opis statystyczny > częstości
●
Wybieramy zmienne – np.: klasa
●
Zaznaczamy opcję wykresy > słupkowy > częstości
czestosci
Danie główne: rozkład częstości cz. 7
Odpowiedz na pytania:
–
Ile osób płynęło w pierwszej klasie?
–
Jaki procent osób to załoga?
–
Jaki procent wszystkich osób to osoby z klasy
drugiej i trzeciej?
–
Ile osób płynęło w klasie pierwszej i drugiej?
–
Jaki procent osób to kobiety?
–
Ile na pokładzie było dzieci?
Danie główne: rozkład częstości cz. 8
Jak odpowiadać na pytania o przedziały?:
–
Odpowiedź znajduje się na następnym slajdzie
ZAROBKI
1
2.4
2.6
2.6
1
2.4
2.6
5.1
1
2.4
2.6
7.7
1
2.4
2.6
10.3
4
9.5
10.3
20.5
1
2.4
2.6
23.1
1
2.4
2.6
25.6
1
2.4
2.6
28.2
2
4.8
5.1
33.3
1
2.4
2.6
35.9
1
2.4
2.6
38.5
1
2.4
2.6
41.0
1
2.4
2.6
43.6
1
2.4
2.6
46.2
1
2.4
2.6
48.7
1
2.4
2.6
51.3
1
2.4
2.6
53.8
1
2.4
2.6
56.4
1
2.4
2.6
59.0
1
2.4
2.6
61.5
1
2.4
2.6
64.1
1
2.4
2.6
66.7
1
2.4
2.6
69.2
1
2.4
2.6
71.8
1
2.4
2.6
74.4
1
2.4
2.6
76.9
1
2.4
2.6
79.5
1
2.4
2.6
82.1
2
4.8
5.1
87.2
1
2.4
2.6
89.7
1
2.4
2.6
92.3
1
2.4
2.6
94.9
1
2.4
2.6
97.4
1
2.4
2.6
100.0
39
92.9
100.0
3
7.1
42
100.0
735.00
803.00
818.00
861.00
868.00
871.00
893.00
900.00
1000.00
1009.00
1057.00
1070.00
1126.00
1195.00
1196.00
1254.00
1285.00
1298.00
1338.00
1424.00
1425.00
1445.00
1506.00
1586.00
1747.00
1768.00
1824.00
1873.00
1884.00
2117.00
2139.00
2153.00
2181.00
2183.00
Ogółem
Ważne
999998.00
Braki danych
Ogółem
Częstość
Procent
Procent
ważnych
Procent
skumulowany
Jakie jest prawdopodobieństwo
spotkania osób zarabiających
od 1000 do 2000 zł?
Albo:
(19x2.6)+(2x5.1)=~0,59
albo:
87.2 – 28.2 =~0,59
zasada:
to co nas interesuje
minus to co nas
nieinteresuje
Danie główne 2: prawdopodobieństwo
Jak się oblicza procent:
% = (x/n)*100
Procent uratowanych =
= liczba uratowanych /całkowita liczba osób * 100 =
= 711/2201*100 = 32.3
Informacja o procencie to informacja o
prawdopodobieństwie
Danie główne 2: prawdopodobieństwo
Jakie było prawdopodobieństwo uratowania
się z tonącego Tytanika?
●
P = 711/2201*100 = 32.3
●
Około 1/3 (dokładnie 32,3 osoby na sto)
–
Jakie było prawdopodobieństwo nie uratowania
się?
●
????????? (ile osób na sto?)
Notatka do zajęć
–
Jak się robi rozkład częstości w spss (ścieżka
dostępu)?
–
Do czego służy rozkład częstości?
–
Jaka jest różnica między tabelą a wykresem?
–
Czym się różni procent ważny od procenta zwykłego?
–
Jak tworzony jest procent skumulowany?
–
Z której kolumny należy skorzystać jeśli musimy
odczytać określony przedział wartości (odpowiedzieć
na pytanie o łączną wielkość kilku kategorii
zmiennej)?
GDZIE ZNALEŹĆ INFO? “Wieczorkowska” s.
45 – 50 (rozdział 2 – rozkład częstości)
Praca domowa
Praca domowa:
–
Za pomocą ankiety przebadaj pięć osób
–
Ze strony www.qstat.prv.pl pobierz plik
dzien_dwa.sav (z podstrony WAŻNE).
–
w pliku:
●
zamień systemowe braki danych na odpowiednie wartości
●
nowe wartości braków danych, zadeklaruj
●
w zmiennej ZAROBKI zmień nieprawidłowe kodowanie
odpowiedzi “nie wiem”
●
w zmiennej ZADOWOLENIE przypisz etykiety
wartościom skrajnym i środkowym.