BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
1
Badania preferencji (ćwiczenia)
Studia stacjonarne II stopnia
Kierunek Ekonomia
II rok, III semestr (zimowy)
Dr hab. Andrzej Bąk, prof. UE
Katedra Ekonometrii i Informatyki
Konsultacje: piątki, 9.00-11.00, A82
email:
andrzej.bak@ue.wroc.pl
www:
http://www.ezit.ue.wroc.pl/
Wydział EZiT
http://keii.ue.wroc.pl
Katedra EiI
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
2
Tradycyjna metoda conjoint analysis
Podstawowe cechy:
liczba atrybutów uwzględnionych w badaniu jest ograniczona zwykle do 6,
profile przedstawiane respondentom do oceny są opisane wszystkimi atrybutami,
profile są generowane na podstawie ortogonalnych układów czynnikowych,
profile wygenerowane na podstawie układów ortogonalnych są wzajemnie maksymalnie zróżnicowane,
w modelu conjoint analysis można uwzględnić, oprócz efektów głównych, również efekty interakcji atrybutów,
wszyscy respondenci oceniają ten sam zbiór profilów,
model conjoint analysis reprezentuje tzw. podejście dekompozycyjne, tzn. na podstawie empirycznych użyteczności
całkowitych profilów szacuje się użyteczności cząstkowe poziomów atrybutów,
można wykorzystać różne metody gromadzenia danych ze źródeł pierwotnych,
poszczególne etapy procedury conjoint analysis są rozdzielone (tj. przygotowanie profilów, gromadzenie danych,
estymacja parametrów, symulacja udziałów w rynku).
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
3
Procedura badawcza conjoint analysis
Lp.
Etap procedury
Krok procedury
1
Specyfikacja zadania
badawczego
zmienna objaśniana
zmienne objaśniające (atrybuty)
2
Określenie postaci
modelu
model zależności zmiennych objaśniających (efektów głównych lub z interakcjami)
model preferencji (liniowy, kwadratowy, użyteczności cząstkowych)
3
Gromadzenie danych
metody gromadzenia danych (pełne profile, porównywanie profilów parami,
prezentacja par atrybutów, dane symulacyjne)
metody generowania profilów (układy czynnikowe, próba losowa)
4
Prezentacja profilów
forma prezentacji (opis słowny, rysunek, model, produkt fizyczny)
forma badań (wywiad bezpośredni, poczta, telefon, komputer, Internet)
5
Wybór skali pomiaru
preferencji
skale niemetryczne (nominalna, porządkowa)
skale metryczne (przedziałowa, ilorazowa)
6
Estymacja modelu
modele niemetryczne (MONANOVA, PREFMAP)
modele metryczne (MNK)
modele probabilistyczne (LOGIT, PROBIT)
7
Analiza i interpretacja
wyników
analiza preferencji (ocena ważności atrybutów)
symulacja udziałów w rynku
segmentacja
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
4
1. Specyfikacja zadania badawczego
Sformułowanie zadania badawczego
polega na:
postawieniu hipotezy badawczej (np. produkt o określonych cechach znajdzie nabywców na rynku, określone cechy produktu decydują o
jego zakupie przez konsumentów),
zdefiniowaniu przedmiotu badań i określeniu grupy respondentów (cała populacja, próba), która będzie objęta badaniem.
Zdefiniowanie przedmiotu badań
polega głównie na doborze zmiennych objaśniających i zdefiniowaniu zmiennej objaśnianej.
Zdefiniowanie zmiennej objaśnianej
polega na wyborze skali pomiaru preferencji. Może to być skala przedziałowa (oceny punktowe
produktów), porządkowa (ranking produktów) lub nominalna (wybór produktów). Skala pomiaru preferencji ma istotny wpływ na stosowane w
dalszych krokach procedury metody gromadzenia danych i metody szacowania użyteczności cząstkowych.
Dobór grupy respondentów
, którzy zostaną objęci badaniem, jest następnym problemem do rozstrzygnięcia przed przystąpieniem do
badania.
Bardzo rzadko badana grupa stanowi jednocześnie całą populację (badania wyczerpujące). Najczęściej w badaniu uwzględniana jest określona
próba
(badania reprezentacyjne), a w związku z tym pojawia się problem jej doboru. Zbiorowość tworząca próbę powinna być na tyle liczna i
zróżnicowana (reprezentująca określone przekroje demograficzne, socjologiczne i in.), aby uzyskane wyniki można było uogólnić na zbiorowość
generalną (populację).
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
5
W tradycyjnej metodzie conjoint analysis opartej na kompletnych profilach buduje się model regresji wielorakiej, uwzględniający tylko efekty
główne. Użyteczności cząstkowe poziomów atrybutów w tym modelu są szacowane klasyczną metodą najmniejszych kwadratów na poziomie
indywidualnym i zagregowanym.
Przyjmuje się zatem, że minimalna liczba profilów ocenianych przez każdego respondenta wynika z nierówności:
1
m
p
n
,
gdzie:
n
liczba profilów,
p
łączna liczba poziomów wszystkich atrybutów,
m
liczba atrybutów.
Np. p=11, m=4, to n=11–4+1=8
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
6
2. Określenie postaci modelu
W procedurze badawczej conjoint analysis, zmierzającej do identyfikacji struktury preferencji konsumentów, formułuje się dwa rodzaje
modeli:
model reprezentujący zależności między zmiennymi (relacje między atrybutami oraz między atrybutami a użytecznościami całkowitymi
profilów);
model opisujący związek między poziomami atrybutu a użytecznościami cząstkowymi tych poziomów
(model preferencji).
W tradycyjnej conjoint analysis stosuje się addytywny model liniowy i najczęściej dyskretny model preferencji.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
7
3. Gromadzenie danych
W literaturze przedmiotu z zakresu conjoint analysis wymienia się najczęściej następujące metody gromadzenia danych:
metodę profilów pełnych,
metodę porównywania profilów parami,
metodę porównywania atrybutów parami (metodę korzystającą z macierzy kompromisów, metodę prezentacji dwóch atrybutów
jednocześnie),
metodę wyboru ze zbiorów profilów pełnych (metoda ta dotyczy podejścia opartego na wyborach).
W tradycyjnej conjoint analysis wykorzystywana jest
metoda profilów pełnych
, która obejmuje zbiór wszystkich możliwych wariantów,
będących kombinacją atrybutów i ich poziomów.
W metodzie profilów pełnych respondent dokonuje oceny przedstawionych mu wariantów, zgodnie z własnymi preferencjami wyrażonymi na
podstawie zaprezentowanych mu atrybutów i ich poziomów, w zakresie: określenia porządku rangowego profilów (na skali porządkowej) lub
określenia względnej atrakcyjności profilów (np. na skali pozycyjnej).
Stosuje się układy planowania eksperymentu w celu redukcji liczby profilów.
4. Prezentacja profilów
Opis w kwestionariuszu ankiety.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
8
5. Wybór skali pomiaru preferencji
Najczęściej w badaniach empirycznych pomiar wartości zmiennej objaśnianej (pomiar preferencji respondentów) jest przeprowadzany na
skali rang (skala niemetryczna) lub skali ratingowej (pozycyjnej, która może mieć konstrukcję niemetryczną lub metryczną).
Skala rang
umożliwia uporządkowanie profilów (rosnąco lub malejąco) zgodnie z preferencjami respondentów. Podstawą porządkowania są
cechy charakteryzujące profile (np. w przypadku produktów mogą to być: marka, cena, opakowanie itp.). Istotnym mankamentem skali rang jest
malejąca, w miarę wzrostu liczby porządkowanych profilów, rzetelność pomiaru. W badaniach prowadzonych na użytek conjoint analysis liczba
profilów ocenianych na skali rangowej powinna wahać się w granicach od kilku do kilkunastu.
Skala ratingowa
(skala ocen, skala szacunkowa) umożliwia wyrażenie przez respondenta oceny danego obiektu (profilu) np. za pomocą
liczby mieszczącej się w określonym przedziale (np. od 0 do 100), którego granice wyznaczają biegunowo odmienne preferencje.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
9
6. Estymacja modelu
Celem estymacji parametrów modelu conjoint analysis jest oszacowanie wartości poziomów atrybutów interpretowanych tutaj jako tzw.
użyteczności cząstkowe poziomów atrybutów. Użyteczności cząstkowe są szacowane dla każdego respondenta z osobna oraz jako wartości
średnie dla badanej próby.
Znajomość użyteczności cząstkowych umożliwia z kolei oszacowanie następujących wartości:
użyteczności całkowitych profilów w przekroju respondentów,
średnich użyteczności całkowitych w badanej próbie,
względnej ,,ważności” poszczególnych atrybutów,
udziałów w rynku badanych profilów oraz symulację udziałów w rynku,
wielkości segmentów,
średnich użyteczności całkowitych w grupach (segmentach) respondentów.
W tradycyjnej conjoint analysis formułuje się liniowy model regresji wielorakiej, którego parametry (użyteczności cząstkowe poziomów
atrybutów) szacuje się klasyczną metodą najmniejszych kwadratów (MNK).
W analizie regresji wielorakiej zmienna objaśniana przyjmuje wartości (np. oceny punktowe lub rangi) przypisane przez danego respondenta
poszczególnym profilom przedstawionym do oceny. Wpływ każdego poziomu poszczególnych zmiennych objaśniających (atrybutów
niemetrycznych) na ocenę przypisaną profilom przez danego respondenta uwzględnia się przez wprowadzenie do modelu regresji sztucznych
zmiennych objaśniających.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
10
Liniowy addytywny model regresji wielorakiej conjoint analysis określony jest ogólnie (z uwzględnieniem rzeczywistych atrybutów produktów
lub usług) wzorem:
p
k
k
k
Z
Y
1
0
,
gdzie:
Y
zmienna objaśniana, której wartościami są preferencje empiryczne respondentów,
0
wyraz wolny modelu,
p
,
,
1
parametry modelu,
p
Z
Z
,
,
1
zmienne objaśniające (atrybuty opisujące profile produktów lub usług),
p
k
,
,
1
numer zmiennej objaśniającej (atrybutu),
składnik losowy modelu.
Atrybuty niemetryczne
p
Z
Z
,
,
1
są następnie kodowane za pomocą zmiennych sztucznych, które wskazują na występowanie określonych
poziomów atrybutów w poszczególnych profilach.
Wykorzystuje się w tym celu najczęściej metody kodowania zero-jedynkowego, quasi-eksperymentalnego lub ortogonalnego.
Kodowanie prowadzi do zastąpienia
p
atrybutów (
p
Z
Z
,
,
1
) nowymi zmiennymi sztucznymi (
m
X
X
,
,
1
), których liczba wynosi
p
k
k
p
L
m
1
, gdzie:
k
L
liczba poziomów
k -tego atrybutu. Wynika stąd, że do zakodowania wszystkich poziomów danego atrybutu
wystarcza liczba zmiennych sztucznych o 1 mniejsza od liczby poziomów tego atrybutu
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
11
Kodowanie atrybutów za pomocą zmiennych sztucznych
Atrybut
Zmienne sztuczne
kodowanie zero-jedynkowe
kodowanie quasi-
eksperymentalne
1
Z
1
X
2
X
3
X
1
X
2
X
3
X
poziom 1
1
0
0
1
0
0
poziom 2
0
1
0
0
1
0
poziom 3
0
0
0
1
1
1
Zmienna
3
X w obu sposobach kodowania jest zbędna, ponieważ każdy poziom atrybutu
1
Z
jest jednoznacznie wskazywany za pomocą
wartości zmiennych
1
X
i
2
X
.
Uwzględnienie w modelu zmiennych zbędnych zwiększa zjawisko współliniowości, co ma wpływ na jakość szacowanego modelu regresji.
Dlatego do modelu conjoint analysis wprowadza się w przypadku atrybutu 3-poziomowego 2 zmienne sztuczne, natomiast poziom trzeci jest
tzw. poziomem odniesienia.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
12
Po przekodowaniu atrybutów model conjoint analysis ze zmiennymi sztucznymi można przedstawić w następującej formie:
m
j
j
j
X
b
b
Y
1
0
ˆ
,
gdzie:
Yˆ
wartości teoretyczne zmiennej objaśnianej,
0
b
wyraz wolny modelu,
m
b
b
,
,
1
parametry modelu,
m
X
X
,
,
1
zmienne sztuczne reprezentujące poziomy atrybutów niemetrycznych,
m
j
,
,
1
numer zmiennej sztucznej.
Model ten jest szacowany na poziomie zagregowanym (w przekroju wszystkich respondentów stanowiących badaną próbę). Modele conjoint
analysis szacuje się także na poziomie indywidualnym (dla każdego respondenta z osobna).
Model regresji dla wybranego respondenta można przedstawić w następującej postaci:
m
j
j
js
s
s
X
b
b
Y
1
0
ˆ
,
gdzie:
S
s
,
,
1
numer respondenta,
S
liczba respondentów.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
13
7. Analiza i interpretacja wyników
W wyniku oszacowania modelu otrzymuje się wartości parametrów
m
b
b
,
,
0
, które są interpretowane jako
użyteczności cząstkowe
poziomów atrybutów
.
Użyteczności cząstkowe poziomów odniesienia
(związane ze zmiennymi sztucznymi pominiętymi w procesie kodowania) są obliczane w
zależności od przyjętego sposobu kodowania.
W tablicy przedstawiono sposób obliczania użyteczności cząstkowych dla atrybutu o trzech poziomach w przypadku kodowania zero-
jedynkowego i quasi-eksperymentalnego z uwzględnieniem poziomu odniesienia (poziom 3,
3
3
X
b
,
3
U ) w polach zacieniowanych.
Sposób obliczania użyteczności cząstkowych dla atrybutu o trzech poziomach
Atrybut
Zmienne sztuczne
kodowanie zero-jedynkowe
kodowanie quasi-eksperymentalne
1
Z
1
1
X
b
2
2
X
b
3
3
X
b
1
1
X
b
2
2
X
b
3
3
X
b
poziom 1
1
b
0
1
1
b
U
1
b
0
1
1
b
U
poziom 2
0
2
b
2
2
b
U
0
2
b
2
2
b
U
poziom 3
0
0
0
3
U
1
b
2
b
2
1
3
b
b
U
3
2
1
,
,
U
U
U
użyteczności cząstkowe poziomów atrybutu
1
Z
.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
14
Użyteczności cząstkowe oblicza się na poziomie
zagregowanym
(szacuje się jeden model dla całej próby) i
indywidualnym
(szacuje się tyle
modeli, ilu jest respondentów).
Znajomość użyteczności cząstkowych umożliwia oszacowanie
teoretycznych użyteczności całkowitych profilów
stanowiących przedmiot
badań.
Użyteczność całkowitą i-tego profilu dla s-tego respondenta (
s
i
U
) oblicza się na podstawie wzoru:
m
j
s
jl
s
s
i
i
j
U
b
U
1
0
,
gdzie:
s
b
0
wyraz wolny dla s-tego respondenta,
s
jl
i
j
U
użyteczność cząstkowa l-tego poziomu j-tego atrybutu i-tego profilu dla s-tego respondenta,
i
j
l
numer poziomu j-tego atrybutu w i-tym profilu.
Przeciętną teoretyczną użyteczność całkowitą (na poziomie zagregowanym, a więc dla całej próby liczącej S respondentów) i-tego profilu
(
i
U ) oblicza się na podstawie wzoru:
S
s
m
j
s
jl
s
i
i
j
U
b
S
U
1
1
0
1
.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
15
Znajomość użyteczności cząstkowych umożliwia także oszacowanie znaczenia (tzw. „ważności” atrybutu, attribute importance) każdego z
atrybutów w ocenie profilów stanowiących przedmiot badań.
Relatywną ważność j-tego atrybutu
dla s-tego respondenta (
s
j
W
) oblicza się na podstawie wzoru:
%
100
min
max
min
max
1
m
j
s
jl
l
s
jl
l
s
jl
l
s
jl
l
s
j
i
j
j
i
j
j
i
j
j
i
j
j
U
U
U
U
W
.
Przeciętną „ważność” poszczególnych atrybutów w przekroju całej próby liczącej S respondentów (
j
W
) oblicza się na podstawie wzoru:
S
s
s
j
j
W
S
W
1
1
.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
16
Symulacyjne badanie udziałów w rynku
umożliwia oszacowanie użyteczności całkowitej dodatkowych profilów, które nie były oceniane
przez respondentów w badaniu ankietowym. Prognozowany udział w rynku wybranych profilów szacuje się na podstawie modeli:
użyteczności maksymalnej, zgodnie z którym oblicza się odsetek respondentów, dla których dany produkt otrzymał najwyższą ocenę
użyteczności całkowitej wśród produktów będących przedmiotem symulacji:
razie
przeciwnym
w
,
0
max
gdy
,
1
s
i
s
i
is
U
U
P
,
gdzie:
is
P
prawdopodobieństwo wyboru i-tego profilu przez s-tego respondenta,
probabilistycznego BTL (Bradley’a-Terry’ego-Luce’a), zgodnie z którym użyteczność całkowitą, odpowiadającą danemu profilowi, dzieli
się przez sumę użyteczności całkowitych profilów będących przedmiotem symulacji (obliczenia wykonuje się osobno dla każdego respondenta, a
następnie oblicza się ich wartość przeciętną):
n
i
s
i
s
i
is
U
U
P
1
,
gdzie: n
liczba profilów,
logitowego, zgodnie z którym w obliczeniach, w odróżnieniu od probabilistycznego modelu BTL, stosuje się logarytmy naturalne wartości
użyteczności całkowitych zamiast samych użyteczności:
n
i
s
i
s
i
is
U
U
P
1
exp
exp
.
BADANIA PREFERENCJI – Studia stacjonarne II stopnia, Kierunek „Ekonomia”, II rok, semestr zimowy
Prof. UE dr hab. Andrzej Bąk
17
Wartości parametrów oszacowanego modelu conjoint analysis (oszacowane użyteczności cząstkowe i całkowite) mogą stanowić podstawę
segmentacji
konsumentów, ponieważ odwzorowują preferencje respondentów, wyrażone w badaniu w odniesieniu do określonych profilów
produktów lub usług (rzeczywistych albo hipotetycznych).
W praktycznych badaniach segmentacyjnych, korzystających z metod conjoint analysis, najczęściej stosowane jest podejście post hoc, w
którym do podziału zbioru respondentów na klasy (segmenty) na podstawie użyteczności cząstkowych wykorzystuje się metody klasyfikacji
danych.
Ze względu na pewne szczególne własności (jednoznaczna kwalifikacja obiektów do grup, efektywne przetwarzanie dużych zbiorów danych)
często stosuje się metodę k-średnich, która należy do grupy metod optymalizacji iteracyjnej.