Karolina Nurkowska
Socjologia II rok
WSE
Wprowadzenie do Statystycznej Analizy Danych
Dzienniczek analityczny
1. Rozkład jednej zmiennej
1.1 Zmienne ilorazowe
Zmienna babies, rok badania 2008:
Liczba osób w gospodarstwie do lat 6.
|
Częstość |
Procent |
Procent ważnych |
Procent skumulowany |
|
Ważne |
0 NIE MA DZIECI W TYM WIEKU |
1110 |
85,8 |
85,8 |
85,8 |
|
1 JEDNO |
153 |
11,8 |
11,8 |
97,6 |
|
2 DWOJE |
26 |
2,0 |
2,0 |
99,6 |
|
3 TROJE |
5 |
,4 |
,4 |
100,0 |
|
Ogółem |
1293 |
100,0 |
100,0 |
|
N |
Ważne |
1293 |
|
Braki danych |
0 |
Średnia |
,17 |
|
Mediana |
,00 |
|
Dominanta |
0 |
|
Odchylenie standardowe |
,451 |
|
Rozstęp |
3 |
|
Minimum |
0 |
|
Maksimum |
3 |
|
|
|
Wszystkich badanych było 1293. Z powyższej tabelki możemy się dowiedzieć, że największą grupę, aż 85,8% rodziny bezdzietne. Na drugim stanowisku plasują się rodziny z tylko jednym potomkiem (11,8%) Jest to dość interesujące zjawisko. Pozostaje nam się zastanowić, dlaczego tak wygląda sytuacja posiadania dzieci. Być może ankietowani posiadają potomstwo w wyższym wieku, bądź są nastawieni na karierę, przez co nie mają czasu na opiekę, wychowanie i rodzenie dzieci.
1.2 Zmienne porządkowe
Zmienna padeg, rok badania 2008:
Poziom wykształcenia ojca
|
Częstość |
Procent |
Procent ważnych |
Procent skumulowany |
|
Ważne |
0 Brak wykształcenia szkolnego |
23 |
1,8 |
2,0 |
2,0 |
|
1 Niepełne podstawowe |
100 |
7,7 |
8,4 |
10,4 |
|
2 Podstawowe |
441 |
34,1 |
37,1 |
47,5 |
|
3 Zasadnicze zawodowe |
367 |
28,4 |
31,0 |
78,5 |
|
4 Niepełne średnie |
10 |
,8 |
,8 |
79,3 |
|
5 Średnie ogólnokształcące |
32 |
2,5 |
2,7 |
82,0 |
|
6 Średnie zawodowe |
129 |
10,0 |
10,9 |
92,9 |
|
7 Policealne/ pomaturalne |
13 |
1,0 |
1,1 |
94,0 |
|
8 Nieukończone studia wyższe |
23 |
1,8 |
1,9 |
95,9 |
|
9 Ukończone wyższe magisterskie |
49 |
3,8 |
4,1 |
100,0 |
|
Ogółem |
1187 |
91,8 |
100,0 |
|
Braki danych |
-9 BD/BRAK OJCA/OPIEKUNA |
94 |
7,3 |
|
|
|
98 NIE WIEM |
12 |
1,0 |
|
|
|
Ogółem |
106 |
8,2 |
|
|
Ogółem |
1293 |
100,0 |
|
|
Zmienna madeg, rok badania 2008:
Poziom wykształcenia matki
|
Częstość |
Procent |
Procent ważnych |
Procent skumulowany |
|
Ważne |
0 Brak wykształcenia szkolnego |
36 |
2,8 |
2,8 |
2,8 |
|
1 Niepełne podstawowe |
117 |
9,1 |
9,2 |
12,0 |
|
2 Podstawowe |
569 |
44,0 |
44,5 |
56,5 |
|
3 Zasadnicze zawodowe |
240 |
18,6 |
18,8 |
75,3 |
|
4 Niepełne średnie |
16 |
1,2 |
1,2 |
76,5 |
|
5 Średnie ogólnokształcące |
90 |
7,0 |
7,1 |
83,6 |
|
6 Średnie zawodowe |
125 |
9,7 |
9,8 |
93,4 |
|
7 Policealne/ pomaturalne |
24 |
1,9 |
1,9 |
95,3 |
|
8 Nieukończone studia wyższe |
14 |
1,1 |
1,1 |
96,4 |
|
9 Ukończone wyższe magisterskie |
46 |
3,5 |
3,6 |
100,0 |
|
Ogółem |
1278 |
98,9 |
100,0 |
|
Braki danych |
-9 BD/BRAK MATKI/OPIEKUNKI |
8 |
,6 |
|
|
|
98 NIE WIEM |
7 |
,5 |
|
|
|
Ogółem |
15 |
1,1 |
|
|
Ogółem |
1293 |
100,0 |
|
|
Dzięki uzyskanym danym możemy porównać, jak wygląda kwestia wykształcenia wśród matek oraz wśród ojców. Wynika z nich, że większy procent (44%) kobiet uzyskuje wykształcenie podstawowe zaś wśród tatusiów jest to 34,1%. Jednak im wyższe wykształcenie tym mężczyźni są bardziej widoczni. Więcej tatusiów posiada wykształcenie wyższe 3.8% podczas gdy wykształconych matek mamy o 0,3% mniej. Spowodowane może to być skupienie się na domu, wychowywaniu się dziećmi i zajmowaniu się mężem.
1.3 Zmienne interwałowe
Zmienna savemont, rok badania 2008:
Oszczędności: na ile mies wystarczyłyby
|
Częstość |
Procent |
Procent ważnych |
Procent skumulowany |
|
Ważne |
1 1 MIES |
15 |
1,1 |
7,4 |
7,4 |
|
2 |
18 |
1,4 |
8,9 |
16,3 |
|
3 |
32 |
2,5 |
16,3 |
32,6 |
|
4 |
11 |
,9 |
5,7 |
38,3 |
|
5 |
13 |
1,0 |
6,6 |
44,9 |
|
6 6 MIES |
50 |
3,9 |
25,5 |
70,4 |
|
7 |
1 |
,1 |
,5 |
71,0 |
|
8 |
2 |
,2 |
1,1 |
72,0 |
|
10 |
7 |
,5 |
3,5 |
75,5 |
|
11 |
1 |
,1 |
,6 |
76,1 |
|
12 12 MIES |
37 |
2,9 |
19,0 |
95,1 |
|
15 |
1 |
,1 |
,5 |
95,5 |
|
18 |
2 |
,2 |
1,2 |
96,7 |
|
20 |
1 |
,1 |
,4 |
97,1 |
|
24 24 MIES |
2 |
,2 |
1,2 |
98,3 |
|
36 36 MIES |
1 |
,0 |
,3 |
98,6 |
|
48 48 MIES |
2 |
,1 |
,9 |
99,5 |
|
60 |
1 |
,1 |
,5 |
100,0 |
|
Ogółem |
196 |
15,2 |
100,0 |
|
Braki danych |
-1 ND:BRAK OSZCZĘDNOŚCI |
1018 |
78,7 |
|
|
|
995 NA KILKA LAT |
32 |
2,5 |
|
|
|
996 NA WIELE LAT |
5 |
,4 |
|
|
|
998 TRUDNO POWIEDZIEĆ |
42 |
3,2 |
|
|
|
Ogółem |
1097 |
84,8 |
|
|
Ogółem |
1293 |
100,0 |
|
|
Statystyki
Oszczędności: na ile mies wystarczyłyby
N |
Ważne |
196 |
|
Braki danych |
1097 |
Średnia |
7,13 |
|
Dominanta |
6 |
|
Odchylenie standardowe |
7,204 |
|
Rozstęp |
59 |
Trudno jest jednoznacznie odpowiedzieć na pytanie dotyczące, czasu na jak długo starczyło by respondentom ich oszczędności. Odpowiedzi są dosyć zróżnicowane. Odchylenie standardowe wynosi 7,204 co przy rozstępie 59 jest dosyć dużym wskaźnikiem. Najczęściej wskazywaną odpowiedzią było 6 msc, przy czym średnia wynosi 7,13 msc. Istotnym punktem jest fakt, że aż 78,7% respondentów nie posiada żadnych oszczędności. Odpowiedź „na kilka lat”, czy „na wiele lat” trafiały się rzadko, stanowiły one odpowiednio 2,5% i 0,4% odpowiedzi.
Test T
Zmienne: testowa -czas wywiadu PGSS (lenpgss)oraz grupowa - płeć(sex).
Statystyki dla grup |
|||||
|
Płeć respondenta: 1=M, 2=KOB |
N |
Średnia |
Odchylenie standardowe |
Błąd standardowy średniej |
Czas wywiadu PGSS (minuty) |
MĘŻCZYZNA |
623 |
64,14 |
20,483 |
,821 |
|
KOBIETA |
670 |
63,41 |
18,847 |
,728 |
Test dla prób niezależnych |
||||
|
|
|
Czas wywiadu PGSS (minuty) |
|
|
|
|
Założono równość wariancji |
Nie założono równości wariancji |
Test Levene'a jednorodności wariancji |
F |
4,052 |
|
|
|
Istotność |
,044 |
|
|
Test t równości średnich |
T |
,671 |
,669 |
|
|
Df |
1291 |
1260,512 |
|
|
Istotność (dwustronna) |
,502 |
,504 |
|
|
Różnica średnich |
,734 |
,734 |
|
|
Błąd standardowy różnicy |
1,094 |
1,097 |
|
|
95% przedział ufności dla różnicy średnich |
Dolna granica |
-1,412 |
-1,418 |
|
|
Górna granica |
2,880 |
2,886 |
Czy płeć ma wpływ na czas udzielania wywiadu?
Hipoteza zerowa - Płeć nie ma wpływu na czas udzielania wywiadu
Hipoteza alternatywna- Płeć wpływa na czas trwania wywiadu
W teście T istotność wyniosła 0,502 zatem wynik ten nie jest istotny statystycznie, możemy przyjąć hipotezę zerową, mówiącą, że pleć nie ma wpływu na czas udzielania wywiadu.
Tabele krzyżowe
Hipoteza zerowa: mówi o tym, że nie ma zależności między szansą utraty pracy wśród mężczyzn i wśród kobiet.
Istotność asymptotyczna wynosi 0,044 zatem możemy odrzucić hipotezę zerową ponieważ istotność jest mniejsza niż dopuszczalny błąd, który wynosi 0,05.
Informacja o analizowanych danych |
||||||
|
Obserwacje |
|||||
|
Uwzględnione |
Wykluczone |
Ogółem |
|||
|
N |
Procent |
N |
Procent |
N |
Procent |
Szansa utraty pracy * Płeć respondenta: 1=M, 2=KOB |
544 |
42,1% |
749 |
57,9% |
1293 |
100,0% |
Tabela krzyżowa Szansa utraty pracy * Płeć respondenta: 1=M, 2=KOB |
|||||
|
|
|
Płeć respondenta: 1=M, 2=KOB |
Ogółem |
|
|
|
|
MĘŻCZYZNA |
KOBIETA |
|
Szansa utraty pracy |
Bardzo prawdopodobne |
Liczebność |
19 |
9 |
28 |
|
|
% z Płeć respondenta: 1=M, 2=KOB |
6,4% |
3,7% |
5,1% |
|
Raczej prawdopodobne |
Liczebność |
36 |
42 |
78 |
|
|
% z Płeć respondenta: 1=M, 2=KOB |
12,1% |
17,1% |
14,3% |
|
Niezbyt prawdopodobne |
Liczebność |
131 |
87 |
218 |
|
|
% z Płeć respondenta: 1=M, 2=KOB |
44,0% |
35,4% |
40,1% |
|
W ogóle nieprawdopodobne |
Liczebność |
112 |
108 |
220 |
|
|
% z Płeć respondenta: 1=M, 2=KOB |
37,6% |
43,9% |
40,4% |
Ogółem |
Liczebność |
298 |
246 |
544 |
|
|
% z Płeć respondenta: 1=M, 2=KOB |
100,0% |
100,0% |
100,0% |
Testy Chi-kwadrat |
|||
|
Wartość |
df |
Istotność asymptotyczna (dwustronna) |
Chi-kwadrat Pearsona |
8,090a |
3 |
,044 |
Iloraz wiarygodności |
8,150 |
3 |
,043 |
Test związku liniowego |
,844 |
1 |
,358 |
N Ważnych obserwacji |
544 |
|
|
a. ,0% komórek (0) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 12,66. |
Z powyższych danych wynika, że istnieje zależność pomiędzy płcią a szansą utraty pracy. Bardziej narażone na utratę pracy są kobiety 20,8%.
POZIOM WYKSZTAŁCENIA A KORZYSTANIE Z ROZYWKI: CHODZENIE DO KINA
Hipoteza zerowa: nie istnieje zależność między poziomem wykształcenia, a chodzeniem do kina.
Możemy odrzucić hipotezę zerową, zatem istnieje zależność między poziomem wykształcenia a chodzeniem do kina.
Informacja o analizowanych danych |
||||||
|
Obserwacje |
|||||
|
Uwzględnione |
Wykluczone |
Ogółem |
|||
|
N |
Procent |
N |
Procent |
N |
Procent |
POZIOM WYKSZTAŁCENIA RESPONDENTA * Chodzenie do kina |
1281,920a |
99,1% |
11,080 |
,9% |
1293,000 |
100,0% |
a. Liczba ważnych obserwacji jest różna od całkowitej liczebności w tabeli krzyżowej, ponieważ liczebności w komórkach zostały zaokrąglone. |
Tabela krzyżowa POZIOM WYKSZTAŁCENIA RESPONDENTA * Chodzenie do kina |
||||||
|
|
Chodzenie do kina |
Ogółem |
|||
|
|
Kilka razy na tydzień |
Kilka razy na miesiąc |
Kilka razy na rok lub rzadziej |
Nigdy |
|
POZIOM WYKSZTAŁCENIA RESPONDENTA |
podstawowe |
3 |
3 |
20 |
227 |
253 |
|
|
1,2% |
1,2% |
7,9% |
89,7% |
100,0% |
|
zasadnicze zaw |
8 |
32 |
153 |
222 |
415 |
|
|
1,9% |
7,7% |
36,9% |
53,5% |
100,0% |
|
Średnie |
4 |
23 |
153 |
130 |
310 |
|
|
1,3% |
7,4% |
49,4% |
41,9% |
100,0% |
|
pomaturalne |
1 |
30 |
109 |
33 |
173 |
|
|
,6% |
17,3% |
63,0% |
19,1% |
100,0% |
|
Wyższe |
1 |
21 |
96 |
13 |
131 |
|
|
,8% |
16,0% |
73,3% |
9,9% |
100,0% |
Ogółem |
17 |
109 |
531 |
625 |
1282 |
Testy Chi-kwadrat |
|||
|
Wartość |
df |
Istotność asymptotyczna (dwustronna) |
Chi-kwadrat Pearsona |
334,223a |
12 |
,000 |
Iloraz wiarygodności |
375,811 |
12 |
,000 |
Test związku liniowego |
211,871 |
1 |
,000 |
N Ważnych obserwacji |
1282 |
|
|
a. 20,0% komórek (4) ma liczebność oczekiwaną mniejszą niż 5. Minimalna liczebność oczekiwana wynosi 1,74. |
Z powyższych danych uzyskanych w tabeli wynika, że częściej do kina uczęszczają osoby o wyższym wykształceniu. 63% deklaruje, że przynajmniej parę razy do roku odwiedza kino. Ciekawy jest fakt iż osoby z najniższym wykształceniem (podstawowym) nigdy nie chodzą do kina 89,7%. Wiążąc się to może z możliwościami finansowymi.
1