WPROWADZENIE DO STATYSTYCZNEJ ANALIZY DANYCH
Przykłady pytań egzaminacyjnych
1.
Określ typ zmiennych powstałych w oparciu o następujące pytania/polecenia:
(N
– nominalna, D – dychotomiczna, P – porządkowa, I – interwałowa lub ilorazowa)
a) przez ile godzin ty
godniowo korzystasz przeciętnie z internetu?
N
D
P
I
b)
czy masz rodzeństwo?
N
D
P
I
c)
w jakich językach potrafisz się porozumieć?
N
D
P
I
d)
jak często zdarza ci się przechodzić na czerwonym świetle (nigdy – rzadko – czasami –
dość często – bardzo często)?
N
D
P
I
e)
którą z dwu sytuacji wolisz: A) niskie podatki i niskie wydatki państwa na cele społeczne,
czy raczej B) wysokie podatki i wysokie wydatki państwa na cele społeczne?
N
D
P
I
2.
Dla poniższej macierzy wylicz następujące wartości
(pamiętaj, że i to wskaźnik wierszy, a j – kolumn):
X
1
X
2
X
3
k
1
2
4
1
k
2
3
5
2
k
3
3
2
2
3
1
3
1
i
j
ij
x
3
1
1
j
j
x
2
1
3
2
i
j
ij
x
3.
Medianę można wyliczyć :
a) tylko dla zmiennej nominalnej
b)
dla zmiennej nominalnej i porządkowej
c)
dla zmiennej porządkowej i interwałowej
d)
tylko dla zmiennej porządkowej
4.
Przeczytaj uważnie poniższe zdanie i zaznacz odpowiedź, która jest NA PEWNO prawidłowa:
„W państwie A średni plon jęczmienia wynosi 18 kwintali z hektara, choć w pewnych
regionach jest nieco wy
ższy.”
a) tyle
samo regionów ma plon poniżej 18, co powyżej 18 kwintali z hektara
b) w
żadnym regionie plon nie przekracza 36 kwintali z hektara
c) w
większości regionów plon wynosi 18 kwintali z hektara
d)
w niektórych regionach państwa A plon jest niższy niż 18 kwintali z hektara
5. W pewnej firmie
wszystkim osobom obniżono zarobki o 50 złotych. Zaznacz symbolem „+” te
wartości, które w związku z tym ulegną zmianie, a znakiem „-” te, które się nie zmienią:
a)
rozstęp
b)
średnia
c) wariancja
d) modalna
6.
Siedmiu uczniów zapytano o liczbę książek przeczytanych w ciągu ostatniego półrocza.
Uzyskano następujące odpowiedzi: 4, 6, 1, 7, 0, 13, 4.
Zaznacz kółkiem prawidłową wartość statystyki:
a) mediana:
3
4
5
6
b) modalna:
0
1
2
4
b) średnia:
3
4
4,5
5
c) rozstęp:
0
1
10
13
d) odchylenie standardowe:
2,87
3,33
4,00
4,25
7.
Na podstawie 78 kwestionariuszy badacz wyliczył, że średni dochód w badanej grupie
wynosi 1400 złotych. Spóźnieni ankieterzy donieśli jeszcze dwa kwestionariusze: jedna
osoba zarabiała 4000 złotych, a druga 7800. Ile będzie wynosić nowa średnia?
Nowa średnia = ………………
8.
Stosowanie testów statystycznych w przypadku próby nielosowej:
a)
nie daje miarodajnych rezultatów
b)
daje miarodajne rezultaty przy dużych próbach (n>100)
c)
zwiększa błąd standardowy oszacowania
d)
zwiększa szanse na odrzucenie hipotezy zerowej
9.
Standaryzacja zmiennej polega na przekształceniu jej do postaci, w której:
a)
średnia = 0, a odchylenie standardowe = 1.
b)
średnia = 1, a odchylenia standardowe = 0.
c)
średnia = 0, a odchylenie standardowe = 1,96.
d)
średnia = 1, a odchylenie standardowe = 1,96.
10.
Odchylenie standardowe równe –1 oznacza, że:
a)
rozkład jest skośny ujemnie
b)
zmienna nie ma rozkładu normalnego
c)
większość obserwacji leży poniżej średniej
d)
popełniono błąd w rachunkach.
11.
Poniższy wykres przedstawia dwie zmienne o rozkładzie normalnym. Porównaj je pod
względem średniej (μ) i odchylenia standardowego (σ), wstawiając odpowiedni znak
nierówności (> albo <).
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
zmienna X
zmienna Y
μ(X) … μ(Y)
σ(X) … σ(X)
12.
Błąd standardowy estymatora średniej zależy od:
a)
odchylenia standardowego zmiennej i liczebności próby
b)
średniej i odchylenia standardowego zmiennej
c)
średniej i liczebności próby
d)
średniej, odchylenia standardowego i liczebności próby
13.
Hipoteza zerowa testu χ2 (chi kwadrat) brzmi:
a) w
populacji istnieje zależność między zmiennymi
b)
w próbie istnieje zależność między zmiennymi
c)
w populacji nie istnieje zależność między zmiennymi
d)
w próbie nie istnieje zależność między zmiennymi
14.
Przy użyciu testu χ2 sprawdzono zależność między noszeniem okularów a kierunkiem studiów
na losowej próbie 600 słuchaczy krakowskich uczelni wyższych. Prawdopodobieństwo testowe
wyliczone przez komputer wyniosło 0,25. Jaki wyciągamy stąd wniosek?
a)
stwierdzamy istnienie związku przy poziomie istotności α = 0,05
b) stwier
dzamy istnienie związku przy poziomie istotności α = 0,01
c)
nie stwierdzamy istnienia związku przy poziomie α = 0,05
d)
siła związku między zmiennymi wynosi 0,25.
15.
Jaka jest minimalna i maksymalna wartość V Cramera?
a)
minimum = 0, maksimum zależy od wymiarów tabeli
b) minimum =
–1, maksimum = 1.
c)
minimum zależy od wymiarów tabeli, maksimum = 1.
d) minimum = 0, maksimum = 1.
16.
W poniższej tabeli chcemy sprawdzić, w jaki sposób mieszkanie w młodości z wujem wpłynęło
na przekonanie respondenta o
tym, że krajem powinni rządzić mężczyźni. Jakie procentowanie
powinniśmy w tym celu zastosować?
Liczebność
27
21
2
50
704
727
125
1556
731
748
127
1606
Tak
Nie
14L: Mieszkał
z wujem
Ogółem
Zgadzam sie
Nie zgadzam sie
NIE JESTEM PEWIEN/A
Rządzenie krajem pozostawić mężczyznom
Ogółem
a) kolumnowe b) wierszowe c) kierunkowe
d) całości
17.
W powyższej tabeli występuje pewna, choć niezbyt silna, zależność. Zaznacz jaka:
a) Mieszkanie z wujem
zwiększa szansę na zgadzanie się.
b) Mieszkanie z wujem
zwiększa szansę na niezgadzanie się.
c) Mieszkanie bez wuja zmniejsza
szansę na niezgadzanie się.
d) Mieszkanie bez wuja zmniejsza
szansę na wyrażanie niepewności.
18.
Dla poniższej tabeli wylicz współczynnik λ (lambda), za zmienną niezależną przyjmując liczbę
egzaminów, a za zmienną zależną kierunek studiów:
Kierunek
Liczba egzaminów w sesji
Ogółem
trzy
cztery
pięć
sześć
siedem
Socjologia
3
7
10
Fizyka
6
4
10
Medycyna
10
10
Ogółem
3
6
7
10
4
30
wartość λ wynosi:
–1,00
0,00
0,65
1,00
19.
Osoba A waży 50 kg i ma 165 cm wzrostu, osoba B waży 165 kg i ma 210 cm wzrostu. Jest to
przykład pary:
a) zgodnej
b) niezgodnej
c)
o rangach związanych na zmiennej waga
d)
o rangach związanych na obu zmiennych.
20. Docent O
strzany badał związek między długością przemówienia prelegentów (krótkie, średnie,
długie) a długością ich krawatów (krótkie, średnie, długie). W tym celu obliczył V Cramera,
które dało wynik +0,87. Oznacza to, że:
a)
im dłuższy krawat, tym dłuższe przemówienie.
b)
im dłuższy krawat, tym krótsze przemówienie.
c)
związek między długością krawata a długością przemówienia jest nieistotny statystycznie.
d)
właściciele różnych krawatów wygłaszają referaty różnej długości.
21.
W grupie 50 osób było 30 kobiet i 20 mężczyzn. Spośród mężczyzn 16 posiadało prawo jazdy.
Ile kobiet powinno mieć prawo jazdy, jeśli nie ma żadnego związku między płcią a posiadaniem
prawa jazdy? Zapisz wyliczenie i zaznacz właściwą odpowiedź:
a) 15
b) 18
c) 20
d) 24
22.
Dysponując danymi z losowej próby młodych małżeństw dr Całujek obliczyła średnią liczbę
pocałunków w ciągu dnia oraz błąd standardowy tej średniej. Na tej podstawie ustaliła, że 95%
przedział ufności dla średniej liczby pocałunków w ciągu dnia wynosi 26±6 pocałunków.
Oznacza to, że:
a) mamy
95% pewności, że w populacji młodych małżeństw średnia liczba pocałunków w
ciągu dnia wynosi między 20 a 32
b)
95% młodych małżeństw całuje się między 20 a 32 razy dziennie
c)
możemy odrzucić hipotezę, że w populacji małżeństwa całują się dokładnie 26 razy
dziennie
d)
liczba pocałunków w populacji młodych małżeństw jest o 6 większa niż w populacji starych
małżeństw
23. Jaka jest hipoteza zerowa analizy wariancji?
24.
Jakie są założenia analizy wariancji?
25.
W jaki sposób zmiana jednostki miary z centymetrów na milimetry wpłynie na współczynnik
zmienności?
26.
Na czym polega błąd II rodzaju?
27. Czym
w teście t Studenta hipoteza alternatywna kierunkowa różni się od bezkierunkowej ?
28.
Jaka jest konieczna wielkość próby dla populacji dorosłych Polaków, by szacować procenty z
ufnością 95% i dokładnością ±2%?
29.
Czy większą próbę musimy losować z populacji skończonej (małej) czy nieskończonej (bardzo
dużej)?
30. N
a czym polega różnica między testem t Studenta dla prób zależnych i niezależnych?
31.
Przeanalizuj tabelę i odpowiedz na pytania.
Tabela krzyżowa NA KOGO GLOSOWAL W WYB PREZYDEN 2000 * ZA CZY PRZECIW SOCJALIZMOWI
0
6
22
9
3
13
53
,0%
11,3%
41,5%
17,0%
5,7%
24,5%
100,0%
,0%
2,3%
2,9%
3,2%
2,1%
4,5%
2,9%
,0%
,3%
1,2%
,5%
,2%
,7%
2,9%
0
2
13
13
32
5
65
,0%
3,1%
20,0%
20,0%
49,2%
7,7%
100,0%
,0%
,8%
1,7%
4,6%
21,9%
1,7%
3,6%
,0%
,1%
,7%
,7%
1,8%
,3%
3,6%
69
232
572
152
55
189
1269
5,4%
18,3%
45,1%
12,0%
4,3%
14,9%
100,0%
86,3%
87,2%
75,4%
53,3%
37,7%
65,2%
69,5%
3,8%
12,7%
31,3%
8,3%
3,0%
10,4%
69,5%
4
3
6
4
1
9
27
14,8%
11,1%
22,2%
14,8%
3,7%
33,3%
100,0%
5,0%
1,1%
,8%
1,4%
,7%
3,1%
1,5%
,2%
,2%
,3%
,2%
,1%
,5%
1,5%
0
7
69
66
26
21
189
,0%
3,7%
36,5%
34,9%
13,8%
11,1%
100,0%
,0%
2,6%
9,1%
23,2%
17,8%
7,2%
10,4%
,0%
,4%
3,8%
3,6%
1,4%
1,2%
10,4%
3
6
24
16
13
9
71
4,2%
8,5%
33,8%
22,5%
18,3%
12,7%
100,0%
3,8%
2,3%
3,2%
5,6%
8,9%
3,1%
3,9%
,2%
,3%
1,3%
,9%
,7%
,5%
3,9%
2
7
37
15
4
37
102
2,0%
6,9%
36,3%
14,7%
3,9%
36,3%
100,0%
2,5%
2,6%
4,9%
5,3%
2,7%
12,8%
5,6%
,1%
,4%
2,0%
,8%
,2%
2,0%
5,6%
80
266
759
285
146
290
1826
4,4%
14,6%
41,6%
15,6%
8,0%
15,9%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
100,0%
4,4%
14,6%
41,6%
15,6%
8,0%
15,9%
100,0%
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
KALINOWSKI,
JAROS
KRZAKLEWSKI,
MARIAN
KWASNIEWSKI,
ALEKSANDER
LEPPER,
ANDRZEJ
OLECHOWSKI,
ANDRZEJ
WALESA,LECH
NIE PAMIETAM
Ogółem
Zdec za
Raczej
za
Ani za ani
przeciw
Raczej
przeciw
Zdec
przeciw
NIE
WIEM/x,y
ZA CZY PRZECIW SOCJALIZMOWI
Ogółem
1.
Jaka jest modalna dla zmiennej „prezydent” a jaka dla zmiennej „socjalizm”?
2.
Jakie są mediany dla tych zmiennych?
3. Jaki procen
t wyborców Wałęsy był zdecydowanie za socjalizmem?
4.
Jaki procent niewiedzących, czy są za czy przeciw socjalizmowi, stanowili wyborcy
Olechowskiego?
5.
Jaki procent próby stanowili „nie pamiętający” na kogo głosowali?
6.
Jaki procent próby stanowili wyborcy Krzaklewskiego nie będący ani za, ani przeciw
socjalizmowi?
7.
Co oznacza wartość 100% w prawym górnym rogu?
8.
Przeanalizować wszystkie wartości w komórce Olechowski & raczej przeciw.
9.
Biorąc pod uwagę kombinację obydwu zmiennych, jaki typ wyborcy był w próbie
najczęstszy? Jaki stanowił odsetek całości?
10.
Jaki elektorat dominuje wśród „zdecydowanych socjalistów”?
11.
Jaki elektorat dominuje wśród „zdecydowanych przeciwników socjalizmu”?
12.
Który elektorat najbardziej odstawał od pozostałych? Pod jakim względem?
13. W kt
órym elektoracie najczęściej uchylano się od odpowiedzi?
14.
Do których wyborców najbardziej podobni są ci, którzy „nie pamiętają”?