11.03.2013 Wykład 3
1) Wybrane funkcje arkusza kalkulacyjnego:
- sortowanie danych
- ile. niepustych – zaznaczamy zakres do zliczenia
- suma
- licz.jeżeli – zaznaczamy zakres oraz wybieramy kryteria zliczenia (używamy
symbolu $.
$ zawsze blokuje to co znajduje się za nim.) np. $A1 – zablokowana
kolumna A, A$1, zablokowany wiersz 1, $A$1 – zablokowana jedna komórka w
Excelu)
- DŁ
- znajdź
- średnia
- odch. standardowe
2) Statystyczna analiza liczebności
- wyniki odnosimy do liczby odpowiedzi, a nie liczby ankiet
3) ANALIZA WYBORÓW ROZŁĄCZNYCH
Dane sumują się do liczby odpowiedzi (?) (do 100%)
Jeżeli H0 nie jest odrzucona, czyli nie ma zróżnicowania to obliczamy frakcję
odpowiedzi „Tak” do całości liczebności i frakcję „nie” do całości liczebności.
- Analiza tablic wielodzielnych np.: 2x3, 2x4, 3x3 itd. (takie które będą miały
więcej niż 1 stopień swobody= df)
Najczęściej są to pytania z kafeterią pojedynczego wyboru.
K
M
SUMA
A
10
32
42
B
28
22
50
C
48
16
64
SUMA 86
70
156
Analiza funkcji chi – kwadrat (funkcją G)
Jeżeli tabela ma
2 lub więcej stopni swobody wówczas możliwe są 3 sytuacje:
I. obliczona wartość G jest mniejsza niż 3,84 (wartość dla 1 stopnia swobody) to
wynik taki oznacza, że w tabeli danych brak jakichkolwiek znamiennych zróżnicowań
II. obliczona wartość G jest między 3,84, a wartością tablicową dla danej liczby stopni
swobody. Wynik taki oznacza, że niektóre dane w tabeli mogą być znamiennie
zróżnicowane
III. obliczona wartość G jest większa lub równa wartości tablicowej danej liczby stopni
swobody (np. dla df = 2 będzie to 5,99). Wynik taki oznacza, że niektóre dane w
tabeli na pewno są znamiennie zróżnicowane.
W przypadku 2 i 3 należy prowadzić dalszą analizę.
W pierwszym przypadku (I.) mogę kategorycznie przyjąć hipotezę zerową. W drugim
(II.) przypadku też jest to możliwe.
Przykład 1.
H0: Na jakie zajęcia sportowo – rekreacyjne uczęszczasz najczęściej? (wybierz 1
odpowiedź)
Tabelka nr. 1
K
M
SUMA
A
10
32
42
B
28
22
50
C
48
16
64
SUMA 86
70
156
df = 2
G
obli
=27,9
G
tabl
= 5,99
G dla df = 1 3,84
Jest to sytuacja trzecia. G obliczone jest większe niż G tablicowe. Znajduje się
pomiędzy 3,84, a 5,99. Na pewno występują znamienne zróżnicowania. G
obliczamy tak samo.
K
M
SUMA
A
10
32
42
B+C
76
38
114
SUMA 86
70
156
G
A/B+C
= 23,4
G dla df = 1 3,84
G a/b+c > G tabl.
K
M
SUMA
B
28
22
50
A+C
58
48
106
SUMA 86
70
156
G
B/A+C
= 0,02
G dla df = 1 3,84
G
B/A
+c < G tabl.
K
M
SUMA
C
48
16
84
A+B
38
54
82
SUMA
86
70
156
G
C/A+B
= 17,9
G dla df = 1 3,84
G
B/A
+c > G tabl.
%
FRAKCJA
K
M
A
12
46
B
13
31
C
56
28
Ta tabela odnosi się do ogólnej informacji, czyli tabelki nr. 1
Odpowiedź A: znamienne zróżnicowanie. Mężczyźni znamiennie częściej niż
kobiety uczęszczają na siłownię.
Odpowiedź B: brak różnic
Odpowiedź C: Kobiety znamiennie częściej niż mężczyźni uczęszczają na fitness.
Przykład 2
K
M
SUMA
A
10
32
42
B
28
22
50
C
48
18
65
SUMA
86
70
156
df = 2
G dla df = 5,99
df= 1
G dla df = 3,84
G oblicz. = 3,74 G obl. < G tablic.
Mniejsze od 5,84, mniejsze od 3,84
Nie prowadzimy dalszej analizy.
Przeprowadzenie pełnej analizy
Obliczamy wartości funkcji G dla całej tablicy i oceniamy wynik.
Jeżeli mamy sytuację 1 to nie prowadzimy dalszej analizy. Jeżeli mamy sytuację 2
lub 3 prowadzimy dalszą analizę, która polega na redukcji do tablic 2x2, df =1
Konieczność przeprowadzenia pełnej analizy .
Poprzestać na obliczeniu funkcji G dla całej tablicy o wymiarach większych niż 2x2
może dać jedynie podpowiedź, że dane w tabeli są znamiennie zróżnicowane.
Jest to niewystarczająca informacja, ponieważ trzeba wskazać, które konkretnie
elementy są znamiennie zróżnicowane.