2009-04-18
1
32
Pytania sonda
ż
u konsumenckiego
Wskaźnik optymizmu konsumentów (WOK)
1. Jak ocenia Pan(i) zmian
ę
sytuacji
gospodarczej w Polsce w ci
ą
gu ostatnich
12 miesi
ę
cy?
+ poprawiła si
ę
~ nie zmieniła si
ę
– pogorszyła si
ę
(nie czytane) 4. trudno powiedzie
ć
2. Jak Pan(i) s
ą
dzi, jak sytuacja
gospodarcza w Polsce b
ę
dzie si
ę
zmienia
ć
w ci
ą
gu najbli
ż
szych 12
miesi
ę
cy?
+ poprawi si
ę
~ nie zmieni si
ę
– pogorszy si
ę
(nie czytane) 4. trudno powiedzie
ć
3. Jak ocenił(a)by Pan(i) sytuacj
ę
materialn
ą
w swoim domu, gdy porówna j
ą
Pan(i) z sytuacj
ą
sprzed 12 miesi
ę
cy?
+ poprawiła si
ę
~ nie zmieniła si
ę
– pogorszyła si
ę
(nie czytane) 4. trudno powiedzie
ć
4. Jak Pan(i) s
ą
dzi, jaka b
ę
dzie sytuacja
materialna w Pana(i) domu za 12
miesi
ę
cy?
++ nast
ą
pi wyra
ź
na poprawa
+ nast
ą
pi lekka poprawa
~ b
ę
dzie bez zmian
– nast
ą
pi lekkie pogorszenie
–– nast
ą
pi wyra
ź
ne pogorszenie
(nie czytane) 6. trudno powiedzie
ć
5. Czy Pana(i) zdaniem, obecnie jest
dobry okres na kupowanie przedmiotów
trwałego u
ż
ytku?
+ tak, to dobry okres na takie zakupy
~ to okres ani szczególnie dobry, ani
szczególnie zły na takie zakupy
– nie, to zły okres na takie zakupy
(nie czytane) 4. trudno powiedzie
ć
33
k
x
x
x
suma
+
+
+
=
....
2
1
1
....
1
2
2
1
1
=
+
+
+
=
∑
=
k
i
i
k
k
w
x
w
x
w
x
w
Dobór wag subiektywny
Pomiar postaw - Skale sumaryczne:
skalowanie Likerta
Suma wa
ż
ona
2009-04-18
2
34
Skale sumaryczne:
dobór wag obiektywny
Skala czynnikowa:
Metoda głównych składowych (Principal components)
k
k
x
w
x
w
x
w
PC
+
+
+
=
....
2
2
1
1
35
Podstaw
ą
konstrukcji dobre jako
ś
ci skali sumarycznej
jest by
wariancja sumy
pozycji skali była ró
ż
na od
sumy wariancji
ka
ż
dej pozycji:
D
2
(P
1
+P
2
…. +P
k
)
≠≠≠≠
D
2
(P
1
) + D
2
(P
2
)+…. +D2(P
k
)
Miara rzetelno
ś
ci: współczynnik alfa-Cronbacha
−
−
=
∑
∑
=
=
)
(
)
(
1
1
1
2
1
2
k
i
i
k
i
i
P
D
P
D
k
k
α
2009-04-18
3
36
Descriptive Statistics
N
Variance
wa
ż
ne by piernik był słodki
1280
10,94361
wa
ż
ne by piernik był aromatyczny
1280
6,081274
wa
ż
ne by piernik był z bakaliami
1279
6,485974
wa
ż
ne by piernik był znanej marki
1279
9,487512
wa
ż
ne by przy sprzeda
ż
y oferowano bonusy
1277
9,663456
wa
ż
ne by piernik był wykonany z surowców naturalnych
1279
8,022499
wa
ż
ne by technologia produkcji była ekologiczna
1279
8,980201
59,66452
suma
1273
147,4464
Reliability Statistics
,695
7
Cronbach's
Alpha
N of Items
Case Processing Summary
1273
99,3
9
,7
1282
100,0
Valid
Excluded
a
Total
Cases
N
%
Listwise deletion based on all
variables in the procedure.
a.
37
1
;
0
2
2
2
∈
+
=
∑ ∑
∑ ∑
∑ ∑
≠
≠
≠
≠
≠
≠
j
i
i
j
ij
j
i
i
j
ij
j
i
i
j
ij
a
r
r
KMO
Podstawą konstrukcji dobrej jakości skali czynnikowej jest
odpowiednia natura korelacji między pozycjami skali
statystyka Kaisera-Mayera-Olkina
2009-04-18
4
Skale
stosunkowe
(ilorazowe)
1 6 . P r o s z ę
p o d a ć n a jb a r d z i e j k o r z y s tn e
o r a z
n a jm n ie j
k o r z y s tn e
( a le
je s z c z e
m o ż l i w e
d o
z a a k c e p t o w a n i a )
z d a n i e m
P a ń s t w a
s t a łe
o p r o c e n to w a n ie
d l a
c e r t y fi k a t u
d e p o z yt o w e g o ,
z a k ł a d a ją c ,
ż
e
m u s i
b yć
o n o
n i ż s z e
o d
o p r o c e n to w a n ia l o k a t t e r m i n o w yc h :
6 8
n a jb a r d z i e j k o r z ys t n e
,
%
6 9
n a jm n i e j k o r z ys t n e
,
%
1 7 . J a k ą w i e l k o ś ć n a d w yż k i fin a n s o w e j b y li b y ś c ie
P a ń s tw o
s k ł o n n i
p r z e z n a c z y ć
n a
z a k u p
c e r t y fi k a t ó w d e p o z yt o w y c h p r z y s t a ł ym p o z i o m ie
o p r o c e n to w a n ia n a ta k im p o z io m i e , k t ó r y je s t d l a
P a ń s tw a :
7 0
n a jb a r d z i e j k o r z ys t n e
.. ....... ........ ...t ys . z ł
7 1
n a jm n i e j k o r z ys t n e
.. ....... ........ ...t ys . z ł
7 2
p o n iż e j n a jm n ie j
k o r z y s tn e g o ,
u w z g lę d n i a ją c t e n d e n c ję
z w i ą z a n ą z e s p a d k i e m
s t ó p p r o c e n to w yc h
.. ....... ........ ...t ys . z ł
1 8 .
J a k ą
c z ę ś ć
ś
r o d k ó w
z
i n n y c h
lo k a t
p r z e s u n ę li b y ś c ie
P a ń s t w o
z
in n yc h
lo k a t
t e r m i n o w yc h n a z a k u p c e r t yfi k a t ó w d e p o z yt o w y c h ,
z g a d z a ją c s i ę n a n i ż s z ą r e n t o w n o ś ć w z a m i a n z a
w y s o k ą p ł yn n o ś ć , p r z y
o p r o c e n to w a n i u ,
k t ó r e
u z n a l i ś c i e P a ń s t w o z a :
7 3
n a jb a r d z i e j k o r z ys t n e
,
%
7 4
n a jm n i e j k o r z ys t n e
,
%
7 5
p o n iż e j n a jm n ie j
k o r z y s tn e g o
u w z g lę d n i a ją c t e n d e n c ję
z w i ą z a n ą z e s p a d k i e m
s t ó p p r o c e n to w yc h
,
%
Typ danych:
Mierniki analizy struktury zbiorowości:
Dane nominalne
Wskaźniki struktury (procentowe),
dominanta
Dane porządkowe
Wskaźniki struktury (procentowe),
dominanta, percentyle, z których
najpopularniejszą jest mediana
Dane przedziałowe i ilorazowe
Wskaźniki struktury (procentowe),
dominanta, percentyle, średnia i
odchylenie standardowe
Sposób analizy struktury zjawisk
zależy od rodzaju danych, które te zjawiska opisują!
Analiza struktury
2009-04-18
5
40
Cecha
Cecha niezależne
zależna
Dane nominalne
Dane porządkowe
Dane przedziałowe
lub ilorazowe
Dane nominalne
Współczynnik
V Cramera
Współczynnik
V Cramera
Dane porządkowe
Współczynnik
V Cramera
Współczynnik
korelacji rang
Spearmana
Dane przedziałowe
lub ilorazowe
Współczynnik eta
Współczynniki eta
Współczynnik
korelacji
Miary współwystępowania
Sposób pomiaru współwystępowania zjawisk
zależy od rodzaju danych, które te zjawiska opisują!
W zbiorze danych występuje podział na zmienne zależne
i zmienne niezależne
Zmienna lub zmienne
zależne
Zmienna lub zmienne niezależne
Nominalna
Porządkowa
Przedziałowa lub
ilorazowa
Nominalna
Analiza dyskryminacji,
Regresja logitowa lub
probiotwa
Analiza dyskryminacji,
Regresja logitowa lub
probiotwa
Analiza dyskryminacji
Porządkowa
Analiza conjoint
Analiza conjoint
Analiza dyskryminacji
Przedziałowa lub
ilorazowa
Analiza wariancji
Analiza wariancji,
Analiza conjoint
prosta regresja lub
regresja wieloraka
W zbiorze danych brak wskazanych podział
ó
w na zmienne zależne i zmienne niezależne
Pomiar
wielowymiarowy
Analiza korespondencji
Skalowanie
wielowymiarowe
Analiza czynnikowa,
Analiza skupień
2009-04-18
6
42
Najpopularniejsze sposoby oceny wyników eksperymentu
w schematach prawdziwych
Skala pomiaru
wyników
eksperymentu
(
typ zmiennej zależnej
)
Pomiar niezależny
Pomiar zależny
Nominalna
ryzyko względne
test U dla dwóch frakcji,
test niezależności
chi-kwadrat,
test McNemara,
test Cochrana
Porządkowa
test serii Walda–
Wolfowitza,
test Kołmogorowa–
Smirnowa,
test Kruskal’a–Wallis’a
test Friedmana
Przedziałowa lub
ilorazowa
test U lub t dla dwóch
ś
rednich,
analiza wariancji dla
doboru całkowicie
losowego
test t,
analiza wariancji dla
schematów blokowych,
analiza conjoint
43
Skale pomiarowe
Skale mocne
Skale słabe
Skala
nominalna
Skala
porządkowa
Skala
przedziałowa
Skala
ilorazowa
Transformować można jedynie skale mocniejszą
na skalę słabszą
2009-04-18
7
44
Określenie cech zewnętrznych
kwestionariusza
TYTUŁ BADANIA
PREAMBUŁA
(wyjaśnia cel i intencje badacza,
może być zastąpiona listem intencyjnym)
BLOKI PYTAŃ
METRYCZKA
Zespół badawczy Instytutu Statystyki i Dem ografii Szkoły Głównej Handlowej w W arszawie, realizuje
badanie mające na celu określenie uwarunkowań oraz stabilności zachowań, jak również potrzeb firm
względem dostępnych produktów i usług bankowych. Integralnym elementem tego badania jest
identyfikacja odbioru oferty z zakresu pracy opiekunów rachunków oraz wskazanie oczekiwań w tym
zakresie.
Od strony merytorycznej badanie prowadzi prof. dr hab. M ałgorzata Rószkiewicz, Instytut Statystyki i
Dem ografii, SGH, W arszawa, zaś od strony organizacyjnej badanie realizuje Polskie Towarzystwo
Statystyczne.
OCENA PRODUKTÓ W I USŁUG BANKOW YC H
JAK O ŚCIO W A OCENA ZAK RESU DZIAŁAŃ OPIEK UNÓW RACHUNK U (ACO UNT M ANAG ERS)
Określenie cech zewnętrznych kwestionariusza
preambuła i tytuł badania
2009-04-18
8
46
Określenie cech zewnętrznych kwestionariusza
1. Pozwala budować klasyfikacje odpowiedzi na pytania.
2. Pozwala zweryfikować adekwatność zbadanej grupy
respondentów względem zbiorowości, z której
pochodzą.
METRYCZKA - funkcje
Dane
Pełne
Cz
ęś
ciowe
Jakie jest typ danych, którymi dysponujemy?
Podsumowanie i ilustracja
tego co wiemy o całej zbiorowo
ś
ci
Opis
i statystyczna analiza danych,
analiza dynamiki
Ustalenie wiedzy o całej zbiorowo
ś
ci
bez mo
ż
liwo
ś
ci dotarcia
do ka
ż
dej jednostki
Wnioskowanie
statystyczne
Typ danych rozstrzyga o metodzie analizy danych!
2009-04-18
9
Wnioskowanie statystyczne
polega na
określeniu właściwości populacji
(
typ rozkładu oraz wartości parametrów
)
na podstawie próby losowej
Rzeczywista struktura
populacji:
Struktura sugerowana
na podstawie próby:
Płeć
Liczba osób Odsetek
Kobiety
110
52,9
Mężczyźni
98
47,1
Ogółem
208
100,0
Płeć
Liczba osób Odsetek
Kobiety
12
60,0
Mężczyźni
8
40,0
Ogółem
20
100,0
Metody statystyczne nie daj
ą
mo
ż
liwo
ś
ci ustalenia wiedzy o
populacji z całkowit
ą
pewno
ś
ci
ą
, ale sugeruj
ą
c posta
ć
rozkładu populacji,
Jedynie metody wnioskowania statystycznego dostarczaj
ą
Informacji o dokładno
ś
ci uzyskanej informacji o rozkładzie badanej
populacji
pozwalaj
ą
równie
ż
okre
ś
li
ć
jakim bł
ę
dem statystycznym
obarczone jest rozwi
ą
zanie
?
2009-04-18
10
Model prawdopodobie
ń
stwa
zdefiniowany w
teorii rachunku
prawdopodobie
ń
stwa i wyja
ś
niaj
ą
cy prawidłowo
ś
ci
w kształtowaniu si
ę
warto
ś
ci zmiennej losowej
Rozkład zmiennej losowej
Model opisuj
ą
cy populacj
ę
Rozkład cechy w populacji
k
n
k
q
p
k
n
k
X
P
−
⋅
⋅
=
=
)
(
Rozkład Bernoulliego - dwumianowy
Rozkład Poissona
)
(
!
)
(
)
(
p
n
k
e
k
p
n
k
X
P
⋅
−
⋅
=
=
Rozkład Gaussa ( normalny)
∫
∞
−
⋅
−
−
⋅
=
<
0
2
2
2
)
(
0
2
1
)
(
x
m
x
dx
e
x
X
P
σ
π
σ
Rozkład
zero-jedynkowy P(X=1) = p , P(X=0) = 1-p
2009-04-18
11
Jakim rozkładem prawdopodobieństwa należy
posłużyć się w wyznaczaniu liczebności
teoretycznych?
•
Dwumianowy?
•
Poissona?
•
Normalny?
•
Chi-kwadrat?
•
........
•
Jakie
p
?
•
Jakie
λ
= np
?
•
jakie
m
oraz
σ
?
•
Jakie
ν
?
•
.........
Wnioskowanie
nieparametryczne
Wnioskowanie
parametryczne
53
Wynikiem
błędu losowego
jest niska precyzja
wynikiem
błędu systematycznego
jest niska trafność
.
Obiektywną konsekwencją
własności badanej populacji
,
fragmentaryczności badania
oraz
składu wylosowanej do
badania grupy
jest błąd losowy.
Konsekwencją
subiektywnych wyborów
dokonanych
przez osoby uczestniczące w badaniu i ich
błędnych
decyzji
jest błąd systematyczny
.
2009-04-18
12
54
Niska precyzja jest wynikiem błędu losowego
Niska trafność jest wynikiem błędu systematycznego
Wysoka precyzja
i wysoka trafno
ść
Niska precyzja,
wysoka trafno
ść
Wysoka precyzja
Niska trafno
ść
55
•
•
•
•
•
••
•
•
•
•
•
•
•
•
•
losowy
systematyczny
•
•
Niech:
x - wartość prawdziwa cechy X
x’= x + d - wartość obserwowana cechy X
x’ - x = d - błąd losowy i/lub systematyczny
0
≠
d
-obciążenie systematyczne:
wyniki niedoszacowane lub przeszacowane
Bł
ą
d
2009-04-18
13
Błędy
losowe
Błędy
nielosowe
Bł
ę
dy w badaniach ilo
ś
ciowych
Bł
ę
dy w badaniach ilo
ś
ciowych
Bł
ę
dy w badaniach ilo
ś
ciowych
57
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Błędy losowe małe i duże
Lepiej!
Wyniki są mniej
zróżnicowane
Gorzej!
Wyniki są bardziej
zróżnicowane.
Zakres rozrzutu jest miarą efektywności
wnioskowania na podstawie próby.
Jest to tzw. standardowy błąd szacunku
(SE) reguły jego obliczania są znane.
2009-04-18
14
58
•
•
•
•
•
•
•
•
•
•
Błąd losowy: jak go mierzyć?
•
Θ
T
n
Bł
ą
d
ś
redniokowadratowy:
)
(
)
(
)
(
2
2
n
n
n
T
D
T
E
T
MSE
=
−
=
θ
T
n
-
Θ
59
Błąd sredniokowadratowy:
)
(
)
(
)
(
2
2
n
n
n
T
D
T
E
T
MSE
=
−
=
θ
informuje jak daleko odbiegają oceny t
n
od
θ
Z dwóch rodzajów błędów
tylko poziom
błędu losowego może być oszacowany!
2
2
2
2
2
)
(
)
(
)
(
)
(
SE
d
T
D
T
E
T
MSE
x
n
n
n
≈
+
=
=
=
−
=
σ
θ
Jeśli x’= x + d jest wartością obserwowaną cechy X w próbie n elementowej i wartości
obserwowane agreguje się do oceny t
n
estymatora T
n
, to:
2009-04-18
15
Poziom błędu standardowego z próby prostej
•
Dla wartości średniej:
•
Dla frakcji:
n
x
S
n
x
S
N
n
SE
MSE
)
(
)
(
1
≈
−
=
=
n
w
w
n
w
w
N
n
SE
MSE
i
i
i
i
)
1
(
)
1
(
1
−
≈
−
−
=
=
Bł
ą
d wzgl
ę
dny:
n
n
T
SE
T
V
=
)
(
Do 7,5% - estymacja precyzyjna
od 7,5 do 15% - estymacja dostateczna
powy
ż
ej 15% - estymacja niedostateczna
61
•
Jest funkcją
zróżnicowania populacji
⇒ z populacji bardziej
jednorodnej otrzymujemy próby dające błędy mniejsze.
•
Jest funkcją
rozmiarów próby
⇒ duża próba daje błąd
mniejszy niż próba mała.
•
Jest funkcją
techniki losowania
⇒ dodatkowa informacja
pozwala zastosować bardziej efektywne techniki losowania
Od czego zależy precyzja czyli błąd
standardowy (SE)
n
x
S
SE
np
)
(
.
≈
n
x
S
SE
typuA
próba
)
(
≠
2009-04-18
16
Błędy
losowe
Zróżnicowanie
populacji
Rozmiar próby
Metoda
estymacji
Metoda
losowania
Błędy
nielosowe
Bł
ę
dy w badaniach ilo
ś
ciowych
Bł
ę
dy w badaniach ilo
ś
ciowych
63
2
2
2
2
2
2
)
(
)
(
)
(
d
SE
d
T
D
T
E
T
MSE
x
n
n
n
+
=
+
σ
=
=
=
θ
−
=
′
Tylko ten składnik MSE zależy
od zróznicowania populacji, wielkości próby i
techniki losowania.
Wzrost liczebności próby nie musi i nie poprawi
dokładności badania
Jeśli x’= x + d jest wartością obserwowaną cechy X w próbie n elementowej,
i wartości obserwowane agreguje się do oceny t
n
estymatora T
n
, to:
2009-04-18
17
64
WNIOSKOWANIE Z PRÓBY NA POPULACJĘ
Liczebność próby a maksymalny błąd oszacowań w %
0
1
2
3
4
5
6
7
8
9
10
100
200
300
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
wielkość próby
błąd (%)
Bł
ą
d
systematyczny
(nielosowy)
65
Błąd badania fragmentarycznego
Skala badania
Błąd losowy
Błędy nielosowe
mała
du
ż
a
2009-04-18
18
Błędy
losowe
Zróżnicowanie
populacji
Rozmiar próby
Metoda
estymacji
Metoda
losowania
Błędy
nielosowe
Błędy treści
Błędy pokrycia
Bł
ę
dy w badaniach ilo
ś
ciowych
Bł
ę
dy w badaniach ilo
ś
ciowych
Zbiorowość
zdefiniowana
w celu badania
Prawda
Badana zbiorowość
Wynik badania
Błędy
pokrycia
Błąd
struktury
Błąd wybory
Błąd braku
reakcji
Błąd
zagubienia
Błąd
odrzucenia
Błędy
treści
Błąd
pomiaru
Błąd analizy
Błąd
interpretacji