INSTRUMENTU
POMIAROWEGO
W naukach ekonomiczno-społecznych oraz praktyce pomiar jest zagadnieniem skomplikowanym i wcale nie jednoznacznym. Dużo prościej wygląda to w przypadku takich nauk jak chemia czy fizyka. Nauki te, a także podporządkowana im praktyka, dysponują wieloma bardzo precyzyjnymi narzędziami i instrumentami do pomiaru cech fizycznych, takich jak dla przykładu czas, temperatura, przyspieszenie czy ciężar. W ich przypadku wynik pomiaru jest jednoznaczy a także wyrażony w odpowiednich parametrach, jak gramy, sekundy, metry lub odpowiednio innych skonkretyzowanych danych liczbowych. W dziedzinach ekonomiczno-społecznych pomiar od dawna jest przedmiotem bardzo ostrych, choć na pewno konskruktywnych, dyskusji naukowych. Krytycy pomiaru w zakresie nauk społecznych i odpowiednich do nich praktyk, przekonani są o tym, iż ,, ...wielkości, które się usiłuje mierzyć w tych naukach, nie są addytywne, czyli inaczej, nie istnieje operacja ich łączenia, która by odpowiadała arytmetycznej operacji dodawania... ''1. Za mierzalne uważano zjawiska, których cechy były w pełni addytywne. Dzięki temu właśnie możliwe było pełne i wiarygodne odwzorowanie między mierzonym obiektem a określonym działaniem arytmetycznym2. Takie właśnie stanowisko zajmował K.Ajdukiewicz, który podał definicję pomiaru: ,, ...zmierzyć jakąś wielkość rodzaju P, to znaczy przyporządkować jej jako miarę pewną liczbę rzeczywistą wedle takiej zasady, która stosunki arytmetyczne między liczbami rzeczywistymi odwzorowuje w sposób izomorficzny na odpowiednich stosunkach fizycznych między wielkościami rodzaju P... ''. Jednostkę miary zawsze traktowano jako podstawowy i główny atrybut zjawiska mierzalnego, natomiast większość zjawisk ekonomicznych, społecznych i psychologicznych takiej jednostki nie posiada.
Fundamentalnym przykładem zjawiska mierzalnego w ekonomii jest wartość oraz jej formy przejawiania się, jak chociażby koszty, ceny, dochody czy wydatki. Przykładową jednostką miary zdecydowanie jest jednostka określonej waluty. Jednak w tym momencie pojawia się pytanie w jaki sposób zmierzyć to, co wydaje się intuicyjnie niemierzalne oraz co może stanowić przedmiot badań marketingowych? Otóż zjawiskami takimi mogą być jakość, postawa, potrzeba, opinia, skłonność a także wybór. Z tego właśnie powodu ekonomiści, w tym przypadku zgodnie teoretycy i praktycy, w pełni korzystają z osiągnięć oraz doświadczeń psychologii i socjologii, gdyż w tych dziedzinach właśnie notowane są szczególnie duże i wiarygodne postępy w zakresie pomiaru.
UOGÓLNIENIE POJĘCIE POMIARU
Znalezienie zasad, które w wiarygodny sposób przyporządkowałyby liczby mierzonym cechom badanych zjawisk jakościowych, jest głównym problemem jaki spędza sen z powiek uczonym z zakresu nauk społecznych. Początkowo, bardzo rygorystycznie przestrzegano zasad jakie stosowane były w pomiarach typowo fizycznych. Głównym przedstawicielem tego trendu był N.R.Campbell, który pomiar definiował jako: ,, ...zgodne z zasadami przyporządkowanie liczb cechom osób, rzeczy, stanów lub zdarzeń...''3. Twierdził on, że mierzenie jest niemożliwe, gdy nie można zastosować odpowiedniego działania arytmetycznego.
S.S.Stevens4 wprowadzając różne zasady pomiaru w postaci klasyfikacji skal pomiarowych, spowodował odejście od powyższych rygorystycznych zasad. Zdecydowanie był to pierwszy krok w kierunku pełniejszego uogólnienia pojęcia pomiaru. Polegało to w dużej mierze na zmianie interpretacji wymogu addytywności. Doprowadził on do stwierdzenia, iż przyporządkowanie liczb mierzonych cechom może się opierać na różnych właściwościach zbioru liczb, począwszy od właściwości ,,słabych”, a skończywszy na właściwościach liczb ,,mocnych”. Podział ten zatem jest stopniowalny, a S.S.Stevens uwzględnił to podczas budowy skal oraz ich klasyfikacji. Jego koncepcja pomiaru, bardzo rozszerzona jest dziś szeroko stosowana w naukach społecznych, skąd w pewnym okresie przeniesiona została do praktyki i teorii badań marketingowych5.
Znacznie wyższy stopień uogólnienia wprowadził P.Abell6, dokonując omówienia procedury pomiaru poprzez odwzorowanie jednego zbioru na drugi. Odwzorowanie to nie zawsze jest jednoznaczne. Bardzo często określane jest mianem pomiaru strukturalnego. Jednakże najwyższy znany do tej pory stopień uogólnienia pojęcia pomiaru jest zasługą R.Grupińskiego7, który w swojej pracy liczb nie trakuje jako koniecznego i wystarczającego warunku do pomiaru. Stwierdził on, że: ,, ...pomiar jest to taki sposób manipulowania symbolami, w którym istotne relacje między symbolami pozostają takie same, jak relacje między przedstawionymi przez te symbole rzeczami...”.
Według M.Mazura pomiar : ,, ...jest torem oddziaływań służących do przenoszenia informacji. Początkiem tego toru jest obiekt mierzony. Końcem toru jest człowiek dokonujacy tego pomiaru. Pośrodku jest cała aparatura pomiarowa...”8. Wynika z tego logiczny wniosek, iż w każdym procesie pomiaru udział biorą zmysły, które mogą być wzmocnione instrumentem pomiarowym.
W sytuacji gdy do bezpośrednich obserwacji (pomiarów) używamy wzroku, to właśnie wrażenia wzrokowe określa się używając takich nazw jak czysty, ładny, kolorowy czy wyraźny. W rezultacie powstają ogólne, abstrakcyjne pojęcia jak ,,estetyczny” lub ,,piękny”. Tak uogólnione pojęcia nazywamy zmiennymi, a poszczególne słowa je charakteryzujące określamy jako wartości zmienne. Definicja pomiaru ma wówczas, w/g R.Grupińskiego, nastepującą postać: ,,zmienna o określonym zbiorze wartości, za której pomocą określamy daną rzecz, nazywamy miarą tej rzeczy, natomiast czynność odwzorowania danej rzeczy w jedną z wartości zmiennej – pomiarem tej rzeczy”.
Poniżej dokonam prezentacji pomiaru w sensie ogólnym za pomocą tzw. monitora emocjonalnego pobudzenia (warmth monitor). W tym przypadku stosunek (reakcja) do potencjalnie oglądanego filmu reklamowego, a raczej zawartej w nim treści, można zmierzyć za pomocą zmiennej (od braku pobudzenia aż po silne wzruszenie) pozwalają w pełni różnicować ten pomiar.
Monitor składa się z czterech części, które odpowiadają wartościom zmiennej ,,pobudzenie emocjonalne”9. Wartości te tworzą czteroprzedziałową skalę:
brak pobudzenia
reakcja neutralna
ciepłe przyjęcie
silne wzruszenie
Respondent, w trakcie ogladania telewizyjnego filmu reklamowego (comercials) rysuje linię. Przedmiotowa linia odchyla się w lewo lub prawo w zależności od stopnia emocjonalnego pobudzenia respondenta w trakcie prezentacji filmów reklamowych, przy czym ważne by respondenci kierowali się odczuciem, a nie racjonalnymi ocenami tego, czy dany film jest dobry czy zły. Gdy projekcja filmu kończy się, respondent rysuje poziomą linię rozgraniczającą. Na początku badania respondenci pouczeni zostają o tym, by zachować stałą szybkość kreślenia krzywej oraz by nie odrywać wzroku od prezentowanego materiału reklamowego. W trakcie setek tego typu badań przy zastosowaniu monitora uzyskano doświadczenie wskazujące na łatwość zastosowania i zrozumienia tej metody przez uczestniczących respondentów. Na rysunku poniżej dokonałem prezentacji linii ilustrujących reakcje emocjonalne czysto hipotetycznego respondenta oglądającego dwa filmy reklamowe : Firmy ALFA i Firmy BETA.
Zastosowanie liczb w pomiarach ma bardzo dużo zalet. Zauważalna jest potrzeba zwiekszania ich udziału w badaniach marketingowych. Jest to o tyle istotne, że liczby umożliwiają zastosowanie metod ilościowych i wyeliminowanie zbyt nadmiernej subiektywności.
PRZEDMIOT POMIARU
Przedmiotem (obiektem) badań nie są osoby, rzeczy, stany czy zdarzenia, lecz cechy wymienionych kategorii. Cecha danej rzeczy jest m.in. to co orzeka się o przedmiocie, odpowiadając na pytanie, jaki on jest.
Wniosek z powyższego jest taki, że cechą danej rzeczy jest wrażenie, jakie ta rzecz wywołuje w porównaniu z innymi takimi samymi rzeczami. Dzieląc cechy grupujemy je na jakościowe i ilościowe. Dla przykładu nie mierzy sie danej osoby, a jej cechy ilościowe, dla przykładu wzrost, wymiary, wiek, wagę, lub cechy jakościowe, do których zaliczyć możemy potrzeby, motywy, postawy, zainteresowania czy skłonności. Na rysunku poniżej dokonałem prezentacji kilku grup cech ilościowych i jakościowych człowieka, które z powodzeniem mogą stanowić bazę dla pomiarów w badaniach marketingowych.
Waga
Bardzo istotnym warunkiem podczas pomiaru jest bardzo dokładne określenie obiektu (cechy) pomiaru. Osoba badająca musi uświadomić sobie obiekt, który ma zostać poddany pomiarowi, w postaci pewnej określonej konstrukcji myślowej, nazywanej pojęciem. W momencie gdy obiekt ten zostanie dokładnie sformułowany w języku mówionym lub pisanym, to dane pojęcie przyjmuje postać definicji.
Zastosowanie pomiarów w ramach badań marketingowych stawia przed nami wymóg zastosowania dwóch rodzajów definicji:
definicji teoretycznych
definicji operacyjnych
DEFINICJE TEORETYCZNE zajmują się opisem pojęcia za pomocą innych przyjetych przez badajacego za zrozumiałe. W systemach myślowych pewne pojęcia określone jako aksjomaty, przyjmujemy bez definicji. W definicjach teoretycznych osoba badająca stara się trafnie wyrazić istotę pojęcia. Dobra definicja teoretyczna ma to do siebie, że opisuje ważniejsze cechy danego obiektu, co w pełni pozwala odróżnić go od innych, dość podobnych obiektów.
Bardzo dobrym w tym momencie przykładem jest pojęcie popytu. Znane nam jest bardzo dużo teoretycznych definicji tego pojęcia. Istnieją definicje mówiące: ,,popyt jako zamiar kupna”, ,,popyt jako forma ujawniania się potrzeb”, czy też ,,popyt jako strumień pieniądza przeznaczonego na zakupy”. Istnieją też inne definicje: ,,popyt jako ilość towaru, którą kupujący są gotowi nabyć przy danej cenie” jak i wiele innych. W tym momencie popyt w rozumieniu różnych autorów to ,,zapotrzebowanie”, ,,zamiar kupna”, ,,strumień pieniądza”, czy też ,,ilość towaru”.
DEFINICJE OPERACYJNE konstruowane są po przyjęciu lub sformułowaniu nowej definicji teoretycznej. Istotą definicji operacyjnej jest to, iż sformułowana ona jest tak, by zawierała zalecenia służące pomiarowi definiowanej cechy. Definicja operacyjna dokonuje przemiany abstrakcyjnych pojęć w zdarzenia, które mogą być poddane pomiarowi. Według Z.Pawłowskiego teoretyczna definicja popytu brzmi11: ,,Popytem konsumpcyjnym na określone dobro nazywamy tę ilość danego dobra, jaką określona grupa konsumentów w określonym odcinku czasu postanawia nabyć na rynku”. Powyższa definicja jest na tyle ścisła i zwięzła, że pozwala na zbudowanie kilku definicji operacyjnych oraz na odrzucenie wielu innych zupełnie nie przydatnych w trakcie badań marketingowych. Definicji operacyjnych zazwyczaj może być więcej. Ich wielość często jest dość kłopotliwa, chociażby ze względu na bardzo różne wyniki pomiarowe tego samego obiektu. W przypadku badań marketingowych priorytetowymi kryteriami są cele badania oraz koszty zastosowania odpowiednich i wiarygodnych metod. W tabeli poniżej przedstawiłem przykłady definicji operacyjnych popytu ściśle związanych z definicją teoretyczną12.
Rodzaje definicji |
Treść definicji popytu |
Definicja teoretyczna |
...popyt określonego produktu lub określonej usługi jest to ilość lub wartość tego produktu lub usługi, jaką określona grupa nabywców kupuje w danym segmencie rynku... |
Definicja operacyjna – popyt efektywny |
...ilość lub wartość produktów (usług) zakupiona przez określoną grupę nabywców w danym segmencie rynku w ciągu określonego czasu przeszłego... |
Definicja operacyjna – popyt potencjalny |
...ilość lub wartość produktów (usług), jaką określona grupa nabywców ma zamiar kupić w danym segmencie rynku w określonym czasie przyszłym... |
Definicja operacyjna – popyt potencjalny realistyczny |
...ilość lub wartość produktów (usług), jaką określona grupa nabywców zamierza nabyć w określonym czasie za bieżące lub potencjalne fundusze pieniężne... |
PRZEDMIOT POMIARU
Dokonanie pomiaru nie jest głównym celem badania marketingowego. Jest tom pewien zasadniczy proces pomiaru, a jego wstępny etap kończy się zawsze zebraniem surowych danych. W tym układzie człowiek i stosowany instrument pomiarowy tworzą w tym procesie zasadniczą całość. W sytuacji gdy do tego układu dołączymy przedmiot pomiaru, a jest nim w tym wypadku osoba – respondent, mówić możemy o szczególnym procesie komunikacyjnym. Potwierdzeniem tego jest teoria M.Mazura, która określa istotę pomiaru jako szereg czynności służących do przenoszenia poszczególnych danych. Na początku procesu znajduje obiekt, natomiast na samym końcu – osoba dokonująca pomiaru. W samym środku umiejscowiony jest instrument pomiarowy. Proces ten zilustrowałem na schemacie poniżej13:
Postaram się teraz omówić poszczególne etapy składające się na proces pomiaru.
W trakcie pierwszego etapu instrument pomiarowy odbiera sygnały jakie zawarte są w mierzonym obiekcie lub przez niego emitowane. Procesu pomiaru możemy dokonać dopiero po uprzedniej interwencji instrumentu w mierzony obiekt. Sama interwencja przybierać może róznorodne formy, a mianowicie od destrukcji mierzonego obiektu aż po praktycznie niezauważalne efekty. Interwencja sama w sobie często jest źródłem błędu pomiaru i to zupełnie niezależnie od tego czy jest to instrument czysto konwencjonalny czy też mechaniczny. Osoba prowadząca pomiar lub interweniujący instrument, zawsze powodują zmianę wyniku pomiaru niezależnie od klasy jakości instrumentu pomiarowego. Czyli zatem mierzone są cechy obiektu, które uległy już zmianie pod wpływem samej interwencji. Osoba – respondent poddany pomiarowi kwestionariuszowemu w formie wywiadu osobistego lub rozmowy, nim udzieli odpowiedzi, w pewien sposób jest wytrącany z równowagi poprzez zadawanie różnych pytań i wybór odpowiedzi określonych przez osobę badającą w ramach odpowiednio skonstruowanej skali.
W ramach drugiego etapu zastosowany instrument pomiarowy zamienia odebrane sygnały na sygnały – nośniki (czyli dane), które następnie odbierane są przez osobę prowadzącą pomiar. Sposób transformacji jest różnorodny, w zależności od rodzaju zastosowanego instrumentu pomiarowego oraz formy pomiaru. W sytuacji gdy obiektem jest człowiek, stosowany instrument może mieć znaczenie czysto pomocnicze, np. zastosowanie instrukcji podczas wywiadu pogłebionego, niestandaryzowanego.
Na trzecim etapie osoba prowadząca pomiar odbiera wskazania instrumentu pomiarowego, a po uprzedniej analizie zebranych danych dokonuje przekształcenia ich w informacje.
Osobę prowadzącą pomiar i obiekt pomiaru oddziela przestrzeń nazywana kanałem komunikacyjnym14. W znaczeniu węższym funkcje kanałów komunikacyjnych spełniają z powodzeniem środki masowego przekazu (prasa, radio, telewizja) a także inne sposoby przekazu (poczta, telefon, sieć sprzedaży). Kanał komunikacyjny sam w sobie jest czynnikiem formującym pomiar, właśnie stąd wywodzi się termin ,,forma pomiaru”. O zastosowaniu określonych metod pomiaru decyduje zastosowany w pomiarze środek lub sposób przekazu danych. Wybór kanału komunikacyjnego również istotnie wpływa na wybór i zaprojektowanie instrumentu pomiarowego. Rodzaj zastosowanego instrumentu pomiarowego zwiększa precyzję i zasięg zmysłów człowieka, dokonując obiektywizacji naturalnego sposobu pomiaru za pomocą zmysłów. Zmysły, które biorą udział w każdym procesie pomiaru bez względu na zastosowanie instrumentu sztucznego. Taki właśnie punkt widzenia stał się przyczynkiem uogólnienia pojęcia pomiaru. W sytuacji gdy do zbierania informacji używamy zmysłów, a zwłaszcza wzroku, to taki pomiar określimy mianem obserwacji, pozyskaniem danych ze źródeł wtórnych czy też degustacji. Coraz częstszą metodą pomiaru w badaniach marketingowych jest stosowanie instrumentów mechanicznych, takich jak wizometry, psychogalwanometry, skanery czy specjalne kamery filmowe. Ich zdecydowana większość wyniki pomiaru prezentuje za pomocą wskaźników ekranowych i cyfrowych, świateł kontrolno – sygnalizacyjnych. Wyniki pomiarów, które wykonano za pomocą instrumentów mechanicznych, nie są dziś czymś szczególnym. Podobnymi instrumentami są także urządzenia konwencjonalne, takie jak kwestionariusz, dziennik czy test. Osoba – respondent poddana pomiarowi za pomocą testu odpowiada na wiele pytań, a w zamian otrzymuje określoną liczbę punktów, które zlicza się zgodnie z przyjętymi regułami i otrzymuje się jedną liczbę opisującą dany parametr, np. stopień niechęci do nowego produktu. Jeżeli osoba prowadząca badanie będzie przestrzegać zasad posługiwania sie testem, to ten instrument pomiarowy można będzie przyrównać do wagi strzałkowej, gdyż wynik pojawi się automatycznie, nie na tarczy, ale we właściwej rubryce. Podsumowując, naczelnym warunkiem prawidłowej konstrukcji instrumentu, zwłaszcza konwencjonalnego, jest dostosowanie odpowiednich skal. Czynność ta nazwana została cechowaniem instrumentu. Konstruowanie instrumentu pomiarowego musi być poprzedzone konstruowaniem odpowiednich skal, w zależnościod tego jak zostały sformułowane pytania lub innych bodźców. W sytuacji nieprzestrzegania warunków budowy instrumentów pomiarowych, dochodzi do popełniania błędów oraz znacznego obniżenia wiarygodności badania.
POZIOMY I WIARYGODNOŚĆ POMIARU15
W zależności od rodzaju symboli (znaki, nazwy, liczby, itp.) oraz sposobu ich przyporządkowania cechom mierzonych obiektów wyróżnia się cztery poziomy pomiaru. Wspomniane poziomy pomiaru wyznaczane są przez zastosowane skale pomiarowe:
nominalną
porządkową
przedziałową
stosunkową
Poniżej dokonam prezentacji w/w skal podając dodatkowo ich charakterystykę. Kolejność przedmiotowych skal jest nieprzypadkowa. Począwszy od skali nominalnej, a zakończywszy na skali stosunkowej, zasady pomiaru są coraz to bardziej rygorystyczne i w związku z tym wymagają coraz bardziej skomplikowanych działań arytmetycznych.
SKALE |
GŁÓWNE OPERACJE EMPIRYCZNE |
ZASTOSOWANIA I PRZYKŁADY |
METODY STATYSTYKI OPISOWEJ (0) I INDUKCYJNEJ (I) |
Skala nominalna |
Stwierdzenie równości i różności |
Klasyfikacja dwudzielna, klasyfikacja wielodzielna, numeracja pozycji (grup) nie uporządkowanych |
Liczebność i proporcje Frakcje I procenty Dominanta Wskaźniki (stosunki) Testy nieparametryczne |
Skala porządkowa |
Stwierdzenie równości, różności, większości i mniejszości |
Numeracja pozycji (grup) uporządkowanych, rangi (pozycja na rynku, miary postaw, preferencje) |
Mediana Centyle, decyle, kwantyle Korelacja rangowa testy nieparametryczne |
Skala przedziałowa |
Stwierdzenie równości przedziałów i równości różnic |
Temperatury (C,R.F), daty kalendarza, miary postaw, skale Thurstone'a, indeksy |
Średnia arytmetyczna Wariancja Odchylenie standardowe Stosunki korelacyjne Testy nieparametryczne Testy parametryczne |
Skala stosunkowa |
Stwierdzenie równości stosunków między wartościami skali |
Temperatura (K), cechy rzeczy, wartość, cechy fizyczne człowieka |
Średnia geometryczna Średnia harmoniczna Współczynnik zmienności Testy nieparametryczne Testy parametryczne |
Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
POZIOMY POMIARU16
Wszystkie poziomy pomiaru same ze swojej istoty tworzą skalę kumulatywną. Każdy z wyższych poziomów pomiaru ma szczególne właściwości pomiarów niższych stopni. Skala porządkowa ma w tym przypadku właściwości skali porządkowej oraz jednostkę miary. Skala stosunkowa ma natomiast właściwości skali przedziałowej, a ponadto absolutny punkt zerowy. Kumulatywność oznacza, że zawsze dla danego poziomu pomiaru można używać metod stosowanych podczas analizy danych otrzymanych z pomiarów na niższych poziomach. Istotne jest jednak by stosować metody przeznaczone dla ściśle określonego poziomu pomiaru, gdyż w innym razie dojdzie do utraty danych informacji.
Skala jest to odwzorowanie, czyli model rzeczywistych zjawisk i ich relacji. Skale buduje się, przyporządkowując symbole mierzonym cechom w/g określonych zasad17.
W sytuacji gdy dokonujemy czynności odwzorowania mierzonej cechy za pomocą wybranej skali, mamy do czynienia ze skalowaniem. Skale pomiarowe koniecznie musimy odróżnić od instrumentu pomiarowego. W rzeczywistości skale są składnikiem konstrukcji instrumentu pomiarowego, a nie samym instrumentem. Stopień, w jakim skale odzwiercieldlają rzeczywiste cechy, jest kryterium ich podziału na cztery typy. Poniżej postaram się dokonać ich klasyfikacji uzupełniejąc to schematami i danymi tabelowymi. Musze zaznaczyć, iż w tym momencie posiłkuję się źródłem w postaci pozycji książkowej autorstwa Stanisława Kaczmarczyka pt. ,,Badania marketingowe – metody i techniki” oraz pozostałymi pozycjami uwzględnionymi w przypisach.
Skale nominalne stanowią najniższy hierarchicznie typ skali pomiarowej, z tego powodu pozwalają one jedynie na stwierdzenie różności lub równości mierzonych w badaniu cech. W tym przypadku podstawą przyporządkowania są jakościowe, a nie ilościowe cechy zjawisk. Jeżeli dla przykładu pomiarowi poddana jest pewna wytypowana losowo grupa osób jednak z uwzględnieniem ,,płci”, to do cechy tej można przyporządkować na skali jeden z trzech symboli. Sytuację taką obrazuje poniższy rysunek. Podane w skali symbole odzwiercieldlają jedynie fakt różnicowania między mężczyzną a kobietą. Jest to klasyczny przykład klasyfikacji dwudzielnej. W trakcie budowy skali nominalnej dokonujemy jednocześnie klasyfikacji mierzonej cechy.
Poniżej przedstawiłem przykłady cechowania kwestionariusza w/g skal nominalnych alternatywnych (z klasyfikacją dwudzielną), które wybrane zostały z różnych, stosowanych w praktyce, kwestionariuszy ankietowych18 :
P.1. Czy kupował(-a) Pan(-i) już jakąkolwiek licencję w Polsce?
(proszę zaznaczyć właściwą odpowiedź znakiem X)
1 TAK
2 NIE
P.2. Gdzie został zarejestrowany Wasz znak firmowy?
1 W KRAJU
2 ZA GRANICĄ
Skale nominalne niealternatywne (z klasyfikacją wielodzielną) mają co najmniej trzy klasy. Dość szczególną cechą tej skali, w zupełnym odróżnieniu od skal porządkowych i przedziałowych, istnieje dowolna kolejność klas (permutacja Pn=n!). Jedynym istotnym tu warunkiem jest jednoznaczność klasyfikacji. Wspomniana klasyfikacja jednoznaczna jest równocześnie wyczerpująca i rozłączna, gdzie żaden przypadek nie może znaleźć jednocześnie w dwóch lub więcej klasach. Spełnienie tego warunku jest koniecznym wymogiem zastosowania metod statystycznych do analizy danych z pomiaru nominalnego. Poniżej prezentuję fragmenty kwestionariuszy ankietowych wycechowanych w/g skali nominalnych niealternatywnych19.
P.1. Jakiego innego stałego elementu promocji poza znakiem firmowym używa Wasza firma?
1 SYMBOL
2 LOGOTYP
3 KOLOR
4SLOGAN
5 INNY (proszę podać jaki) ........................................................................................
P.2. Który z podanych czynników zadecydował o wyborze przez Pana (-ią) hotelu Marina?
1 REKLAMA ZEWNĘTRZNA
2 BLISKOŚĆ MORZA
3 CENA
4 WYGLĄD HOTELU
5 POLECENIE HOTELU PRZEZ INNYCH
6 REKLAMA RADIOWA LUB TV
7 BASEN PŁYWACKI
8 INFORMACJA TURYSTYCZNA
9 INNE CZYNNIKI (jakie?)......................................................................................
Dane zebrane za pomocą skal nominalnych podlegają kwantyfikacji, czyli liczeniu a nie mierzeniu.
Skale porządkowe umożliwiają nie tylko odwzorowanie równości i różności, ale także a nawet przede wszystkim uporządkowanie mierzonych cech. W tym przypadku, podobnie jak przy pomiarze nominalnym, mierzone cechy są klasyfikowane, a ponadto porządkowane są w/g relacji ,,większy – mniejszy”, ,,silny – słaby” czy ,,mało – dużo” zgodnie z daną cechą. W sytuacji, gdy pomiarowi poddajemy np. określoną grupę ludzi ze względu na cechę „pozycja spo-łeczno-ekonomiczna rodzin", można wprowadzić następujące klasy (przedziały) skali porządkowej: „wyższa", „wyższa średnia", „średnia", „niższa średnia", „niższa". Można ten pomiar ograniczyć do trzech klas: „wyższa", „średnia", „niższa", ale wówczas wyniki dają mniej informacji. Na przykład badania pozycji społeczno-ekonomicznej rodzin we Wspólnocie Europejskiej były już prowadzone w latach osiemdziesiątych w celu unifikacji poszczególnych grup społecznych w ramach jednej skali porządkowej. Skala taka została utworzona dzięki danym uzyskanym z pomiaru stanu posiadania określonego koszyka dóbr konsumpcyjnych trwałego użytku. Na rysunku 3.4 przedstawiono dwa warianty takiej skali w społeczeństwie francuskim w 1990 roku. W skład wspomnianego koszyka weszło 7 produktów: telefon, jeden samochód, radio samochodowe, karta kredytowa, zmywarka do naczyń kuchennych, kilka samochodów, komputer.
Pomiar porządkowy nie daje informacji o wielkości kolejnych różnic między przedziałami. Wiadomo, że A jest większe od B, ale nie wiadomo, o ile jest większe. Nie można powiedzieć, że nierówność (A - B) > (C - D) jest prawdziwa. Obrazuje to poniższy schemat, z którego wynika, że nie można dodawać i odejmować odległości na skali porządkowej:
Przyczyną jest brak jednostki miary. Działania arytmetyczne można przeprowadzać w bardzo ograniczonym zakresie, np. AD = AB + BC + CD. Nie można jednak porównywać odległości AB i CD. Przekształcając relacje porządkowe w liczby, nie można na nich wykonywać działań arytmetycznych. Można natomiast zastosować relacje „mniejszy niż" oraz „większy niż". Skale porządkowe mają duże zastosowanie w badaniach marketingowych, ponieważ służą głównie do pomiaru preferencji i postaw nabywców20. Wyróżnia się następujące rodzaje skal porządkowych ze względu na różnice w ich konstrukcji i przeznaczeniu:
skale jednobiegunowe
skale dwubiegunowe
skale stopniowe
skale ciągłe
Klasyfikacja skal porządkowych nie jest klasyfikacją rozłączną, ponieważ zarówno skale stopniowe, jak i ciągłe mogą być skalami jednobiegunowymi lub dwubiegunowymi, co ilustruje poniższy rysunek, przedstawiający klasyfikację skal porządkowych:
Budowa skali jednobiegunowej polega na tym, że przy danym jednym biegunie, drugi biegun jest jego negacją, przez co ten drugi zostaje z góry określony. Schemat tej skali jest następujący:
Konstrukcja skali dwubiegunowej polega na tym, że drugi biegun skali nie jest określony. Drugi biegun jest zwykle przeciwieństwem, ale nie negacją. Oto schemat tej skali:
Skale stopniowe zbudowane są w ten sposób, że niezależnie od rodzajów biegunów — są podzielone na kilka stopni w formie przedziałów. W praktyce odwzorowywane odległości nie są równe. Jednak podczas cechowania instrumentu rysuje się je jako równe. Widać to na poniższym rysunku, który przedstawia skale porządkowe opisane liczbowo i werbalnie:
Nie można powiedzieć, że odległość między cechą „średni" i „mały" jest taka sama, jak między cechami „duży" i „średni", chociaż w kwestionariuszu odległości te rysuje się jako jednakowe. Ma to na celu min. niesugerowanie respondentowi określonego wyboru na skali. Skale ciągle nie mają wyodrębnionych stopni. Stanowią one pewne continuum od stopnia najwyższego do najniższego lub na odwrót. Przykładem fizycznym takiej skali jest widmo ciągłe widzialnego światła białego. Oto schemat skali ciągłej:
Dalej podajemy trzy fragmenty kwestionariuszy ankietowych wycechowanych według skal porządkowych. Dwa pierwsze to skale stopniowe jednobiegunowe, a trzeci — skala stopniowa dwubiegunowa.
P.1 Czy Wasze przedsiębiorstwo byłoby zainteresowane utworzeniem spółki z przedsiębiorstwem państwowym w Polsce, z maksymalnym udziałem własnym 49%? (proszę oznaczyć właściwy przedział znakiem x)
P.2 Jak często spotyka Pan(-i) nazwę „Centromor" w jakimkolwiek środku masowego przekazu?
co tydzień
co miesiąc
2 – 4 razy w roku
mniej niż raz w roku
nigdy nie spotykam
P.3 Jaką rolę odgrywa Polska w długookresowych planach handlowych Waszej firmy?
bardzo dużą
dużą
ani małą, ani dużą
małą
bardzo małą
Do analizy danych otrzymanych z pomiaru porządkowego można stosować dominantę i medianę, ale nie można obliczyć np. średniej arytmetycznej. Narzędziami służącymi do weryfikacji hipotez związanych z pomiarami nominalnym i porządkowym są statystyczne testy nieparametryczne.
SKALE PRZEDZIAŁOWE. Skale przedziałowe (interwałowe lub jednostkowe) pozwalają osiągnąć wyższy poziom pomiaru w porównaniu ze skalami porządkowymi. Umożliwiają one stwierdzenie nie tylko relacji mniejszości i większości, lecz także równości odstępów między przedziałami skali. W tym przypadku można używać terminu „pomiar" w ścisłym znaczeniu ze względu na to, że określenie równości między mierzonymi cechami jest możliwe dzięki przyjętej jednostce miary i przyjętemu umownie punktowi zerowemu. Stosunek między dwoma dowolnymi przedziałami jest niezależny od jednostki miary i punktu zerowego. Przykładami skal przedziałowych są skale temperatur Celsjusza, Fahrenheita i Reaumura. Mają one różne, ustalone arbitralnie, punkty zerowe i jednostki miary. Podobne właściwości pomiarowe mają daty kalendarza.
Oto przykład cechowania kwestionariusza według skali przedziałowej:
P.1
W którym roku zamierza Pan(-i) zastąpić swój
dotychczasowy samochód nowym
modelem?
2001
2002
2003
...
nie wiem
Zdarza się bardzo często w badaniach marketingowych, że skale porządkowe traktuje się jako przedziałowe, czyli próbuje się mierzyć cechy, które nie mają jednostki miary. Przy konstruowaniu tych skal zakłada się, że różnice między sąsiednimi klasami są równe. Przykładem może być pomiar nastawienia respondenta względem określonego środka reklamy przez przyporządkowanie jednej z wymienionych wartości:
zdecydowanie pozytywne,
pozytywne,
raczej pozytywne,
obojętne,
raczej negatywne,
negatywne,
zdecydowanie negatywne.
Nie można twierdzić, że odległości między tymi przedziałami są równe, ponieważ mierzona cecha nie ma jednostki miary. Wielu badaczy traktuje dane uzyskane z pomiaru porządkowego jako dane z pomiaru przedziałowego i stosuje wówczas metody statystyczne przeznaczone do analizy danych uzyskanych z pomiaru przedziałowego. Takie postępowanie może być usprawiedliwione, gdy badacz wykaże, że różnice między przedziałami są tak niewielkie, iż nie wpłynie to na obniżenie poprawności wyników analizy. Zastosowanie skali przedziałowej w pomiarach daje rzeczywiście ilościowe dane. Do ich analizy można zastosować szeroki zakres metod statystyki opisowej i indukcyjnej. Z arsenału tej ostatniej można już stosować testy parametryczne. Poza wszystkimi metodami stosowanymi w odniesieniu do dotychczas omówionych skal, tutaj można także zastosować średnią arytmetyczną, odchylenie standardowe, współczynniki korelacji oraz niektóre inne metody statystyczne używane w badaniach marketingowych. Do analizy danych z pomiaru przedziałowego nie należy natomiast stosować takich statystyk, jak średnia geometryczna, średnia harmoniczna czy też współczynniki zmienności (wariancji).
SKALE STOSUNKOWE. Skale stosunkowe, nazywane również skalami proporcjonalnymi lub ilorazowymi, umożliwiają dokonywanie pomiarów na najwyższym poziomie. Jest to możliwe dzięki istnieniu stałego, naturalnego punktu zerowego i naturalnej jednostki miary21. Jednostka taka jest przyjęta powszechnie i stosowana wielokrotnie, dając takie same wyniki. Na przykład długość mierzy się w metrach, ciężar w gramach, temperaturę absolutną w kelwinach, dochód w jednostkach waluty. W skalach stosunkowych relacja każdych dwóch punktów na skali jest niezależna od jednostki miary. Poniżej graficznie prezentuję przykład cechowania kwestionariusza według skali stosunkowej:
RYSUNEK koło przykadu 3.2.2.
Na skali stosunkowej można porównywać pomiary, obliczając ich stosunek. Można twierdzić, że jeden pomiar jest kilka razy większy od drugiego, co nie było dozwolone na skali przedziałowej. Za pomocą skali stosunkowej można mierzyć takie cechy, jak wielkość sprzedaży, udział w danym rynku, liczba nabywców, koszty, a nawet standaryzowane postawy nabywców. Dane uzyskane z pomiaru stosunkowego mogą być analizowane za pomocą wszystkich dostępnych metod statystyki opisowej i indukcyjnej.
Wiarygodność pomiaru
Decydenci mogą się posługiwać wynikami pomiarów w badaniach marketingowych wówczas, gdy wyniki te zasługują na zaufanie. Są dwa aspekty wiarygodności pomiaru: rzetelność i trafność. Dotyczą one instrumentów pomiarowych. Instrument daje wyniki trafne, gdy mierzy się tę cechę, którą chce się zmierzyć. Wyniki trafne są pozbawione błędów systematycznych. Instrument daje wyniki rzetelne, gdy przez powtórzenie pomiaru w tych samych warunkach otrzymuje się ten sam rezultat. Wyniki rzetelne są pozbawione błędów przypadkowych. Na rysunku 3.7 zilustrowano cztery główne kombinacje błędów systematycznych i przypadkowych:
pomiary trafne i rzetelne, których rezultatem są małe błędy systematycznei przypadkowe; wyniki badania będą zgodne z celami badania;
pomiary trafne, ale nierzetelne, których rezultatem są małe błędy systematyczne oraz poważne błędy przypadkowe; ze względu na to, że mała rzetelność zmniejsza trafność pomiaru, wyniki nie zapewniają osiągnięcia celu badania;
pomiary rzetelne, ale nietrafne, dające małe błędy przypadkowe oraz poważne błędy systematyczne; rezultat takich pomiarów nie zawsze przekreśla wytyczony cel;
pomiary nierzetelne i nietrafne dające błędy zarówno przypadkowe, jaki systematyczne; rezultat takich pomiarów jest całkowicie nieprzydatnyz punktu widzenia celu badania.
Rysunek 3.7
Kombinacje błędów systematycznych i przypadkowych
Stopień rzetelności i trafności pomiaru można zmierzyć. W badaniach marketingowych pomiar ten jest często zaniedbywany. Brak określenia stopnia wiarygodności danego pomiaru może być przyczyną podjęcia błędnych decyzji. Opracowano liczne metody oceny zarówno rzetelności, jak i trafności pomiaru.
Rzetelność pomiaru. Wymóg rzetelności dotyczy dokładności i konsekwencji pomiaru danej cechy. Znanych jest wiele metod szacowania rzetelności pomiaru22. Oto cztery najbardziej znane.
Metoda powtarzania pomiaru. Metoda polega na powtórzeniu pomiaru za pomocą tego samego instrumentu w możliwie tych samych warunkach. Wyniki pomiarów są porównywane punkt po punkcie, dając pewien stopień korelacji, zwany współczynnikiem rzetelności. Współczynnik ten powinien wynosić co najmniej 0,80-0,90. Im większe są różnice między porównywanymi pomiarami, tym mniejsza jest rzetelność pomiaru. Metoda ta ma kilka wad. Po pierwsze, niektóre cechy mogą być mierzone tylko jeden raz, np. jakakolwiek pierwsza, niepowtarzalna reakcja człowieka — reakcja na nowy produkt czy reakcja na nowe opakowanie. Po drugie, powtórny pomiar powoduje zmianę wyników uzyskanych w pomiarze pierwszym, np. respondent może okazywać niezadowolenie, brak zainteresowania, dawać te same odpowiedzi jak przy pierwszym pomiarze.
Metoda pomiarów równoległych. Wymaga ona budowy dwóch równoważnych instrumentów pomiarowych, za których pomocą przeprowadza się pomiar w pewnym odstępie czasu. Wyniki pomiarów porównuje się tak samo, jak w pierwszej metodzie. Otrzymany wskaźnik nazywa się współczynnikiem równoważności. Wadami metody są wybór czasu między kolejnymi pomiarami, budowa dwóch ekwiwalentnych instrumentów oraz dodatkowe koszty.
Metoda połówkowa. Zgodnie z tą metodą „przepoławia się" losowo dany instrument. Zwykle oddziela się pozycje o numerach parzystych od pozycji nieparzystych. Otrzymane połówki traktuje się jako oddzielne instrumenty. Dalej postępuje się tak samo, jak w dwóch pierwszych metodach. Niski współczynnik korelacji oznacza, że dany instrument jest niespójny — wszystkie pozycje instrumentu nie mierzą danej cechy w tym samym stopniu. Wymaga się, aby w danym instrumencie było co najmniej od 16 do 20 pozycji.
Metoda połówkowa mierzy przede wszystkim wewnętrzną spójność instrumentu. Wynik tego pomiaru zależy głównie od sposobu, w jaki poszczególne pozycje instrumentu zostały podzielone (losowo, parzyście lub nieparzyście itp.). Popularną metodą ułatwiającą ten pomiar jest współczynnik alfa, zwany współczynnikiem Cronbacha, który jest wynikiem średnim otrzymanym ze wszystkich możliwych współczynników korelacji obliczonych dla różnych wersji połówkowych danego instrumentu. Współczynnik alfa przyjmuje wartości od 0 do 1, ale dopiero wartości powyżej 0,6 świadczą o wysokiej rzetelności. W przykładzie 3.3 zilustrowano użycie współczynnika alfa w przypadku zastosowania skal pomiarowych złożonych z wielu pozycji.
Metoda Kudera-Richardsona. Opiera się ona na założeniu, że instrument można podzielić na tyle części, ile jest w nim pozycji, czyli zadań lub pytań. Każda pozycja jest traktowana jako równoległa względem pozostałych. Przy założeniu, że wszystkie pozycje mają jednakową średnią i jednakową wariancję, Kuder i Ri-chardson wprowadzili wiele wzorów do ustalenia współczynników rzetelności pomiaru. Najczęściej jest stosowany wzór dwudziesty oznaczony symbolem KR20.
TRAFNOŚĆ POMIARU. Trafność pomiaru jest to dokładność, z jaką dany instrument mierzy to, co ma mierzyć23. Jest wiele rodzajów oceny trafności pomiaru. Najczęściej są stosowane cztery metody oceny trafności.
Trafność prognostyczna. Ocena trafności prognostycznej pomiaru polega na obliczeniu korelacji między wynikami pomiaru a kształtowaniem się mierzonej cechy w późniejszym okresie. Należy sprawdzić, w jakim stopniu prognoza opracowana na podstawie pomiaru zostanie potwierdzona przez dalsze zachowanie się mierzonej cechy, która w późniejszym okresie może być w tym celu poddana ponownemu pomiarowi.
Trafność diagnostyczna. Ustalenie trafności diagnostycznej pomiaru polega na obliczeniu korelacji między wynikami pomiarów a kształtowaniem się danej cechy, w tym samym czasie mierzonej inną metodą. Warunkiem trafności diagnostycznej jest, aby ten drugi pomiar, zwany kryterium zewnętrznym, był również trafny. Otrzymany współczynnik trafności diagnostycznej pozwala określić stopień, w jakim wynik pomiaru może być podstawą diagnozy.
Trafność wewnętrzna. Pomiar jest trafny wewnętrznie, gdy nie chodzi o stopień dokładności pomiaru, lecz o jego przedmiot. Badacz stara się więc zwrócić szczególną uwagę na definicję operacyjną przedmiotu pomiaru. Definicja jest zwykle lepsza, gdy opiera się na wypróbowaniu instrumentu w wielu odrębnych pomiarach.
Trafność teoretyczna. W wielu przypadkach występuje brak zaufania do trafności ustalonej przez przyrównanie do kryterium zewnętrznego, którego trafność jest niepewna. Wówczas stosuje się metody trafności teoretycznej. Polegają one na wykazaniu, że wnioski teoretyczne dotyczące danego pomiaru potwierdzają się w serii pomiarów próbnych lub kontrolnych.
Między rzetelnością a trafnością zachodzą ilościowe współzależności. Zwiększenie objętości instrumentu powoduje wzrost jego rzetelności i trafności. Wzrost ten nie jest jednak proporcjonalny. Rzetelność pomiaru rośnie bardziej równomiernie niż jego trafność, która szybciej osiąga swoją górną granicę. Nie jest wskazane zwiększanie objętości instrumentu w celu osiągnięcia wysokiej rzetelności, ponieważ po przekroczeniu pewnej granicy pomiar może się okazać nietrafny.
Metody budowy kwestionariusza
Kwestionariusz jest podstawowym instrumentem pomiarowym stosowanym w badaniach marketingowych. Używa się go w różnych formach pomiaru. Projektowanie kwestionariusza wymaga bardzo dobrej znajomości i umiejętności skalowania, a także uwzględnienia określonych zasad budowy kwestionariusza. W odróżnieniu od instrumentów mechanicznych ten sam kwestionariusz nie może być wielokrotnie stosowany w różnych badaniach. Każde badanie, nawet dotyczące tego samego tematu, wymaga budowy nowego kwestionariusza lub modyfikacji dotychczasowego.
W podrozdziale tym zostaną omówione następujące problemy: istota kwestionariusza, zasady zadawania pytań respondentom, metody skalowania odpowiedzi oraz sposoby testowania kwestionariusza próbnego. Zagadnienie skalowania odpowiedzi jest istotne na tyle, że zostanie dokładniej omówione w następnym podrozdziale dotyczącym pomiaru postaw.
Istota kwestionariusza
Kwestionariusz jest to zbiór pytań zapisanych w określony sposób na kartkach papieru lub w innej formie w celu wywołania żądanych odpowiedzi.
W ankietowych formach pomiaru pytania odczytuje respondent i on też udziela odpowiedzi pisemnej, mając kwestionariusz w ręku. Instrument używany w tych formach pomiaru nazywa się kwestionariuszem ankietowym. W wywiadach pytania zadaje prowadzący wywiad, odczytując je z kwestionariusza, który nazywa się kwestionariuszem wywiadu24.
S. Nowak proponuje nazwać kwestionariuszem „wszelki uprzednio przygotowany, podporządkowany celom badania zbiór pytań, bez względu na to, czy pytania są mniej lub bardziej sprecyzowane, czy oczekuje się na nie długiej i wyczerpującej odpowiedzi, czy też tylko podkreślenia jednej odpowiedzi uprzednio przygotowanej, wreszcie czy odpowiedź wpisywana jest przez badanego, czy też przez ankietera lub też osobę prowadzącą wywiad"25.
Podstawową funkcją kwestionariusza jest pomiar. Pomiar odbywa się tutaj przez ingerowanie instrumentu w świadomość poddanego pomiarowi człowieka. W przypadku pomiaru przeprowadzanego za pomocą instrumentów mechanicznych ingeruje się głównie w cechy fizyczne człowieka lub rzeczy.
Większość cech człowieka, zwłaszcza cech psychicznych, może być zmierzona jedynie za pomocą kwestionariusza lub testu. W badaniach marketingowych kwestionariusza używa się do pomiaru cech psychicznych, fizycznych, demograficznych, ekonomicznych i innych cech wymienionych na rysunku 3.1 (s. 78). Szczególne i rosnące znaczenie ma pomiar postaw nabywców. W ostatnim czasie nastąpił bardzo duży postęp w metodach skalowania odpowiedzi.
Istotą pomiaru przeprowadzanego za pomocą kwestionariusza jest zadanie pytania. Pytanie jest adresowane do respondenta i jest zasadniczym elementem kwestionariusza. Pytanie bezpośrednio ingeruje w świadomość respondenta, pobudzając go do odpowiedzi. Rodzaj pytania oraz sposób jego budowy mają zatem duży wpływ na wyniki całego badania. W związku z tym mogą powstać dwa rodzaje błędów: błąd odpowiedzi oraz błąd pomiaru. Błąd pomiaru jest jedną z przyczyn krytyki kwestionariusza jako instrumentu pomiarowego. Wykazano, że dwa jednakowe pytania, których odpowiedzi zostały wyskalowane niejednakowo, ale równoważnie, mogą dać istotne różnice w odpowiedziach.
Kwestionariusz buduje się stopniowo. Różni autorzy podają odmienne liczby etapów jego budowy. Rysunek 3.8 ilustruje siedmioetapowy proces budowy kwestionariusza. W praktyce badacz nie zawsze przestrzega tej kolejności, zwłaszcza w odniesieniu do pierwszych czterech etapów. Ponadto projektant kwestionariusza, po sprawdzeniu próbnego egzemplarza instrumentu, często wraca do pierwszych etapów w celu ich modyfikacji.
Siedmioetapowy proces budowy kwestionariusza
Kwestionariusz jest jednym z najważniejszych elementów wiążących proces badania marketingowego z procesem podejmowania decyzji. Projektant kwestionariusza musi więc zwrócić szczególną uwagę na problemy badawcze, które wynikają z listy rodzajów potrzebnych informacji. Pracując nad kwestionariuszem, musi zatem brać pod uwagę postanowienia podjęte podczas projektowania badania. Im dokładniej opracowano projekt badania, tym łatwiej będzie zbudować dobry kwestionariusz. Decyzje dotyczące projektu instrumentu pomiarowego nie mogą być sprzeczne z innymi aspektami projektu badawczego. Przejście od określenia celu i problemu badawczego do ustalenia informacji dla decydentów, pokazane na rysunku 3.9, uwzględnia ten postulat.
Miejsce kwestionariusza w procesie badawczym
Już na etapie projektowania badania należy zebrać wystarczające wiadomości pozwalające na sformułowanie hipotez, które pomagają zwiększyć trafność badania. Hipotezy pełnią podobną funkcję wobec kwestionariusza, pomagając w formułowaniu właściwych pytań. Ułatwiają określenie rodzajów i źródeł potrzebnych informacji dzięki sprecyzowaniu zakresu badanych współzależności między zmiennymi. Jeżeli w trakcie projektowania badania badacz stosował pomiar i analizę imitacyjną, to sprawa zarówno ustalenia listy potrzebnych informacji, jak i sprawdzenia sformułowanych hipotez staje się dużo łatwiejsza. Dzięki temu hipotezy mają wpływ na to, jakie pytania i skale odpowiedzi będą formułowane w kwestionariuszu.
W pierwszej fazie budowy kwestionariusza badacz już wie, jakie dane należy zebrać, z jakich źródeł oraz za pomocą jakich metod. Kwestie te zostały opisane w rozdziale 2. Pane otrzymane z pomiaru przeprowadzonego za pomocą kwestionariusza nie będą miały wartości, jeżeli będą nie na temat lub niekompletne. W pierwszym przypadku mamy do czynienia z błędem problemu badawczego. Dlatego podstawową czynnością na pierwszym etapie budowy kwestionariusza jest dokładne ustalenie, jakie dane będą niezbędne do rozwiązania określonego problemu. Kwestionariusz, który dostarcza danych niepotrzebnych, powoduje tylko wzrost kosztów badania.
Przed przystąpieniem do formułowania wstępnej listy pytań i wstępnego skalowania odpowiedzi należy także określić formę i metodę zbierania danych oraz wynikający stąd rodzaj kwestionariusza. Jeżeli postanowimy zbierać dane za pomocą metody ankiety pocztowej lub prasowej, gdzie respondent otrzymuje kwestionariusz do ręki i gdzie nie ma ankietera, to jest oczywiste, że kwestionariusz musi być zbudowany inaczej niż w przypadku wywiadu osobistego, gdzie respondent nie ma kwestionariusza w ręku. W przypadku kwestionariusza ankietowego większego znaczenia nabierają zatem następujące jego elementy:
instrukcje dla respondenta,
konieczność dokładnego skalowania odpowiedzi w ramach pytań zamkniętych,
bardzo dobra jakość papieru i druku,
układ i kolejność pytań,
jednoznaczność i prostota pytań,
liczba pytań.
W kwestionariuszu wywiadu większość tych elementów nie ma tak dużego znaczenia ze względu na obecność ankietera i fakt, że respondent nie musi dawać pisemnych odpowiedzi. Jeszcze inne elementy bierze się pod uwagę przy projektowaniu kwestionariusza do wywiadu telefonicznego. Różnice między kwestionariuszem ankietowym a kwestionariuszem wywiadu są widoczne w załączniku F na końcu książki.
Na początkowym etapie budowy kwestionariusza należy zatem dokładnie ustalić strukturę obiektu pomiaru oraz formę pomiaru. Struktura obiektu pomiaru jest zwykle dokładnie określona przez dobraną próbę. Za pomocą kwestionariusza powinno się mierzyć możliwie jednorodną próbę. Im próba jest bardziej zróżnicowana, tym trudniej jest zbudować dobry kwestionariusz. Jeżeli np. w skład próby wchodzą osoby w wieku powyżej 15 lat, to należy zaprojektować co najmniej dwa kwestionariusze: dla dorosłych i dla młodzieży; przy czym trzeba również ustalić granicę wieku między tymi dwiema grupami respondentów. Ustalenia te są podstawą do sformułowania — już na drugim etapie budowy kwestionariusza — wstępnej listy pytań.
Rodzaje pytań i zasady ich budowy
Pytania w kwestionariuszu spełniają dwa zadania: po pierwsze, są tak formułowane, aby odpowiedzi na nie dostarczały potrzebnych danych; po drugie stwarzają warunki, w których poddany pomiarowi respondent wypowie się swobodnie i wyczerpująco.
W związku z tym osoba projektująca pytania kwestionariuszowe podejmuje wiele decyzji dotyczących treści pytań, sposobu ich formułowania, kolejności pytań oraz skalowania odpowiedzi.
TREŚĆ PYTAŃ. Układając pytanie, należy się zastanowić min. nad tym, czy jest ono niezbędne i co daje oraz czy respondent będzie zdolny i skłonny dokładnie na nie odpowiedzieć.
Niezbędność pytania. Każde pytanie ma swoje ściśle określone znaczenie. Pytanie należy odrzucić, jeżeli nie potrafimy ustalić, do czego będą służyły dane otrzymane z odpowiedzi. Każde pytanie dostarcza danych na temat tylko jednego, wąskiego i ściśle określonego zagadnienia. Mogą też powstać wątpliwości: czy pytanie dostarczy wymaganych danych, czy też należy w jego miejsce postawić dwa lub więcej pytań? Czy pytanie nie obejmuje zbyt szerokiego zakresu? Czy ustalony problem badawczy nie wymaga innego zestawu pytań? Czy potrzebne są pytania dodatkowe?
Są dwa wyjątki od zasady niezbędności. W pierwszym przypadku na początku kwestionariusza można postawić jedno lub więcej pytań neutralnych w celu przygotowania respondenta do odpowiedzi na pytania drażliwe lub kontrowersyjne. Pytań takich należy jednak używać rzadko. W drugim przypadku pytań neutralnych używa się po to, aby ukryć cel pomiaru lub sponsora badania.
Zdolność respondenta do udzielenia dokładnych odpowiedzi. Gdy badacz się upewni, że pytania są niezbędne i dostarczają potrzebnych danych, rozpatruje zdolność respondenta do udzielenia dokładnych odpowiedzi na zaprojektowane pytania. Opracowując pytania, należy więc pamiętać, że:
respondent może nie znać odpowiedzi na dane pytanie; zadawanie nieprzemyślanych pytań może być źródłem błędu pomiaru, ponieważ respondent, nie chcąc się przyznać do niewiedzy na określony temat, da jakąkolwiek odpowiedź, zwłaszcza wtedy, kiedy pytanie sugeruje, że respondent powinien znać odpowiedź (problem ten został zilustrowany bliżej w przykładzie 3.4);
respondent może nie pamiętać określonych faktów; nie udzieli on odpowiedzi lub udzieli odpowiedzi nieprawidłowej, jeżeli nie przypomni sobie określonego faktu przez niedostatki pamięci, przeoczenie lub zniekształcenie czasu, zwane efektem teleskopii;
respondent może sformułować odpowiedź niedokładnie, co jest zwykle wynikiem bezpośredniego pytania o motywy, których respondent nie zawsze jest świadomy lub nie chce ich wyjawić, dając odpowiedź ogólną, wymijającą lub konwencjonalną bez podania rzeczywistych przyczyn; w celu uniknięcia błędu pomiaru należy zastosować pytania pośrednie lub techniki projekcyjne.
Ze zdolnością respondenta do udzielania dokładnych odpowiedzi wiąże się szczególny rodzaj pytań, jakimi są pytania filtrujące.
Rozważmy następujące pytanie: „Których producentów konserw rybnych pamięta Pani najlepiej?". Pytanie to ma tę wadę, że sugeruje zdolność respondenta do odpowiedzi. Aby uniknąć błędu, należy przed tym pytaniem zadać pytanie filtrujące, pozwalające oddzielić respondentów znających lub pamiętających dane zdarzenie od pozostałych. Wyniki badania rynku konserw rybnych w Polsce wykazały, że aż 65% gospodyń kupuje konserwy rybne, ale tylko 28% z nich pamięta przynajmniej jednego producenta tych wyrobów26. Aby jednak otrzymać tak dokładną liczbę, należy wpierw zadać pytanie filtrujące, które pozwala się upewnić i dokładnie poznać, ilu respondentów pamięta lub zna określony fakt. Rozważane przez nas pytanie powinno więc być usytuowane w kwestionariuszu następująco:
P.9 Czy pamięta Pani któregoś z producentów spożywanych konserw rybnych?
1 □ TAK
2 □ NIE (przejdź do P.11)
P.10 Których producentów konserw rybnych pamięta Pani najlepiej?
1 .........................................................................................
2 .........................................................................................
3 .........................................................................................
P.11 Dlaczego kupuje Pani konserwy rybne?
1 □ BO SĄ TANIE
2 □ MOŻNA SZYBKO PRZYGOTOWAĆ POSIŁEK
3 □ SĄ POŻYWNE I ZDROWE
4 □ LUBIĘ KONSERWY RYBNE
5 □ KONSERWY RYBNE LUBI KTOŚ Z RODZINY
6 □ Z PRZYZWYCZAJENIA
7 □ DLA UROZMAICENIA JADŁOSPISU
8 □ INNY POWÓD (jaki?)................................................................
Pytania filtrujące mogą mieć inną postać (nie muszą się zaczynać wyrazem „czy"), np.: „Kto kupuje konserwy rybne w Pani gospodarstwie domowym?" albo nawet „Jaka jest Pani opinia o konserwach rybnych produkowanych przez...?", jeżeli chcemy następnie zapytać o konkretną sprawę. Eksperymenty przeprowadzone w Stanach Zjednoczonych wykazały, że jeśli pytamy respondenta o jego opinię na jakiś temat, to o 20-25% wzrasta liczba odpowiedzi typu „nie mam zdania 27.
Skłonność respondenta do udzielenia dokładnych odpowiedzi. Zdolność do odpowiedzi na pytanie nie oznacza jeszcze, że respondent będzie chciał na nie odpowiedzieć. Respondent zwykle nie jest skłonny do udzielania odpowiedzi na pytania dotyczące danych personalnych28, pytania kłopotliwe i drażliwe, pytania dotyczące prestiżu29 lub pewnych norm zachowania się.
W przypadku pytań dotyczących danych personalnych istnieje zasada umieszczania tego rodzaju pytań na końcu kwestionariusza. Należy je wyjaśnić respondentowi i przekonać go o słuszności celów, jakim służą dane personalne. Przejście od pytań merytorycznych do personalnych nie może być nagłe. W przypadku pytań kłopotliwych i drażliwych respondent może udzielić odpowiedzi nieprawdziwych lub tendencyjnych, zwłaszcza gdy są stosowane bezpośrednie formy pomiaru. Przykładami tematów kłopotliwych lub drażliwych są:
konsumpcja napojów alkoholowych,
problemy seksualne,
używanie środków higieny osobistej,
konsumpcja niedozwolonych używek,
postawy antyrządowe,
uprzedzenia rasowe i religijne
Rozwinięto wiele metod formułowania pytań minimalizujących błąd pomiaru cech drażliwych i kłopotliwych. Jedną z nich jest metoda stawiania długich pytań otwartych zawierających zwroty stwarzające atmosferę zaufania. Podobny efekt można osiągnąć przez wydłużenie skali odpowiedzi. Drugą metodą, której popularność wzrasta, jest metoda odpowiedzi losowanych {randomized response tech-niąue). Polega ona na zaprezentowaniu respondentowi dwóch pytań, z których jedno (A) jest kłopotliwe lub drażliwe, a drugie (B) — neutralne lub nieistotne. Respondent losowo (np. rzucając monetą) wybiera jedno z dwóch pytań, na które odpowiada TAK lub NIE bez ujawnienia prowadzącemu pomiar, na które z pytań odpowiedział. W celu oszacowania proporcji respondentów z próby, którzy odpowiedzieli pozytywnie na pytanie A, stosuje się następujący wzór:
WZÓR (3.1)
gdzie:
nA — proporcja odpowiedzi TAK na pytanie A,
A — proporcja odpowiedzi TAK na pytania A i B łącznie,
P — prawdopodobieństwo wyboru pytania A,
1 - P — prawdopodobieństwo wyboru pytania B,
HB — proporcja odpowiedzi TAK na pytanie B.
FORMUŁOWANIE PYTAŃ. Formułowanie pytań polega na przekształcaniu opracowanej treści na zdania pytające lub oznajmujące, zrozumiałe dla respondentów. Poza pewnymi wyjątkami, zdania powinny być jak najkrótsze i najprostsze. Zadaniem badacza jest sformułowanie pytania tak, aby wszyscy respondenci zrozumieli je jednakowo. Jednoznaczność pytania osiąga się przez zwrócenie szczególnej uwagi na dobór odpowiedniego słownictwa, sugestywność i emocjonalność w zdaniu, bezpośredniość i pośredniość pytań, jednoznaczność zbioru alternatyw oraz punkt odniesienia20.
Dobór słownictwa. Wyrazy lub frazy w pytaniu należy dostosować do poziomu i rodzaju wykształcenia respondentów, a w przypadku próby niejednorodnej — do grupy o najniższym wykształceniu. Wyrazy specjalistyczne dobrze jest bliżej wyjaśnić za pomocą ilustracji lub przykładu. Zdania należy budować prosto i zwięźle, aby dokładnie i jednoznacznie było wiadomo, o co chodzi. W wyniku dobrania słownictwa może powstać pewna liczba pytań równoważnych. Decyzję wyboru jednego z nich można pozostawić do etapu testowania kwestionariusza próbnego, który może być sprawdzany w kilku wersjach. Jednym z podstawowych warunków formułowania pytań kwestionariuszowych jest to, aby każdy respondent rozumiał dane pytanie jednakowo, zgodnie z intencją badacza. „Warunek ten może się wydawać prosty i oczywisty. Praktyka uczy nas jednak, że jego realizacja wcale nie jest łatwa i wymaga sporej wyobraźni. W badaniach prowadzonych w latach siedemdziesiątych badanym zadano pytanie, czy robotnicy w ich zakładzie pracy są solidarni. Większość badanych odpowiedziała twierdząco. Dopiero w dalszej części wywiadu okazało się, że respondenci (...) termin solidarni rozumieli jako solidnie pracujący. Badanie, o którym mowa, miało charakter próbny: jego celem było m.in. sprawdzenie rozumienia terminów i tylko dlatego nieporozumienie z solidarnością wyszło na jaw. Gdyby jednak nie wyszło na jaw i badacz zinterpretowałby wyniki zgodnie ze swoim rozumieniem terminu solidarność, wyniki byłyby kompletnie niezgodne z rzeczywistością! (...) Jak wskazują wyniki ostatnich badań, do terminów bynajmniej nie tak powszechnie rozumianych należą nawet tak popularne, jak aborcja czy inflacja"30.
Sugestywność i emocjonalność pytań. Pytanie sugestywne narzuca tendencyjną odpowiedź zgodnie z zamierzoną lub niezamierzoną sugestią osoby projektującej kwestionariusz. Oto przykłady pytań sugerujących odpowiedź: „Większość ludzi w obecnych czasach wierzy w integrację rasową, czy Pan(-i) również w to wierzy? Czy jest Pan(-i) przeciwko nadaniu większej siły i samodzielności związkom zawodowym?".
Wyraz, fraza lub zdanie mogą mieć również zabarwienie emocjonalne, które automatycznie narzuca respondentowi akceptację lub jej brak. Przykładami wyrazów o zabarwieniu emocjonalnym są: biedny, luksusowy, kryzys, głód, socjalistyczny, imperialistyczny, łamistrajk. Nazwy organizacji społecznych lub grup mogą mieć również emocjonalne zabarwienie. Na stopień emocjonalności wyrazu lub frazy może mieć wpływ kontekst. Poza tym wyraz lub fraza mogą być obojętne dla jednych, a nieobojętne dla innych ludzi. Pytania sugestywne i o zabarwieniu emocjonalnym są źródłem błędów i należy ich starannie unikać Bezpośredniość i pośredniość pytań. Większość pytań w kwestionariuszu to pytania bezpośrednie. Odpowiadając na nie, respondent jest całkowicie świadomy celu pomiaru. Respondentowi jest łatwiej na nie odpowiedzieć. Są one także łatwiejsze do jednoznacznego sformułowania, a odpowiedzi nie sprawiają kłopotów podczas ich interpretacji. Pomiar pewnych cech będzie jednak dawał błędy spowodowane zniekształconymi odpowiedziami w przypadkach, gdy respondent jest indagowany o podświadome motywy lub inną cechę, co do której trudno byłoby uzyskać prawdziwą odpowiedź przez pytanie wprost. W takich przypadkach lepsze wyniki daje stosowanie pytań pośrednich.
Pytania pośrednie ukrywają przed respondentem rzeczywisty cel pomiaru. Często stosowaną metodą jest pytanie respondenta o cechy innych osób lub ich stosunek do rzeczy przez nich posiadanych lub do osób trzecich. Respondent, opisując postępowanie, zachowanie i inne cechy osób i rzeczy, pośrednio ujawnia swoje cechy, nie zdając sobie z tego sprawy. Zadawanie pytań pośrednich należy jednak ograniczyć do przypadków koniecznych. Ich projektowanie i stosowanie wymaga też pomocy doświadczonych specjalistów. Projektowanie pytań pośrednich wymaga rozważenia problemów technicznych i moralnych. Czy z danych uzyskanych za pomocą pytań pośrednich można bezpiecznie wyciągnąć wnioski? Czy zadane pytanie pośrednie nie zniekształci odpowiedzi? Czy pytanie nie wywoła podejrzenia respondenta o nieuczciwe lub podstępne działanie?
Układ odniesienia. Trudniejszym zadaniem jest zbudowanie pytania tak, aby uwzględniało ono punkt widzenia, jaki wobec problemu badawczego przyjmuje respondent. Kwestionariusz projektuje się więc tak, by odpowiadał percepcji respondenta i uwzględniał jego poglądy na cechy poddane pomiarowi. Układ odniesienia może również wpłynąć na skłonność respondenta do udzielenia odpowiedzi, jeżeli nie widzi on związku między pytaniem a własnym pojmowaniem celu pomiaru. Rozwijanie pomiaru w kolejnych pytaniach kwestionariusza nie tylko może zatem odpowiadać wymogom logiki i poprawności uznanej przez badacza, lecz także musi w wielu przypadkach odpowiadać punktowi widzenia respondenta.
Kolejność pytań. Kolejność pytań w kwestionariuszu ustala się, biorąc pod uwagę również punkt widzenia respondenta. Układ pytań ma stanowić dla niego logiczną całość. Kryterium kolejności pytań w kwestionariuszu nie jest proces badawczy, lecz proces pomiaru. Dobrze zbudowany instrument ułatwia respondentowi przechodzenie od jednego pytania do następnego, a czasami pozwala przewidzieć następne pytanie, gdyż wydaje mu się ono logicznym następstwem poprzedniego.
Zasada przechodzenia od pytań ogólnych do szczegółowych. Zgodnie z tą zasadą pierwsze pytania są ogólniejsze, o szerszym zakresie, a następne coraz bardziej szczegółowe. Zasada ta pozwala zarówno uniknąć sytuacji, w której pierwsze pytania wyznaczałyby treść odpowiedzi na następne, jak i oddziaływać na punkt odniesienia respondenta za pomocą wcześniejszych pytań.
Zasada wzbudzania zainteresowania. Pierwsze pytania kwestionariusza są proste, jasne i interesujące dla respondenta; wzbudzają jego zainteresowanie celem pomiaru oraz wprowadzają go stopniowo w proces pomiaru. Pierwsze pytania wzbudzają ponadto zaufanie, chęć do odpowiadania oraz rozpraszają ewentualne wątpliwości i podejrzenia. Kilka pierwszych pytań nadaje zatem ton całemu pomiarowi.
Zasada stopniowego wyczerpywania tematu. Kolejne pytania w logicznym ciągu przechodzą od jednego zagadnienia do następnego: pytania obejmują następne zagadnienie po całkowitym wyczerpaniu poprzedniego. Pytania najtrudniejsze i pytania kontrowersyjne umieszcza się bliżej końca kwestionariusza. Dzięki temu nie oddziałują one negatywnie na poprzednie pytania. Z tych samych powodów na końcu kwestionariusza umieszcza się pytania dotyczące danych personalnych respondenta.
Instrukcje kwestionariuszowe. Niezbędnym uzupełnieniem prawidłowo zbudowanych pytań i układu kwestionariusza są instrukcje, czyli wskazówki dla respondenta oraz — w przypadku wywiadu osobistego lub telefonicznego — dla prowadzącego wywiad. W kwestionariuszu ankietowym zastępują one prowadzącego wywiad. Ich głównym celem jest wyjaśnienie pytań, kierowanie procesem pomiaru oraz podtrzymywanie zainteresowania respondenta. Największe zastosowanie mają instrukcje:
informujące o sposobie udzielania odpowiedzi, np.: „Wybierz ten produkt, który preferujesz", „Proszę zaznaczyć właściwą odpowiedź, stawiając znak ,,x", „Proszę zaznaczyć tylko jedną odpowiedź";
kierujące procesem pomiaru, np.: „Jeżeli nie, proszę przejść do pytania 16", „Jeżeli tak, proszę wskazać jedną spośród wymienionych niżej możliwości";
wyjaśniające bliżej określone pytanie, np.: „Jaki jest przybliżony dochódPana(-i) rodziny, dochód Pana(-i) plus dochód żony (męża) lub innej osoby utrzymującej gospodarstwo domowe?";
kierujące uwagą respondenta, np.: „Zanim odpowie Pan(-i) na poniższe pytania dotyczące... prosimy o ponowne przejrzenie naszego listu przewodniego wyjaśniającego...", „Kilka następnych pytań jest natury personalnej; odpowiedzi na nie są dla nas bardzo istotne i będą użyte tylko do celów statystycznych".
Skalowanie odpowiedzi
Odpowiedź na określone pytanie jest drugą fazą procesu pomiaru wybranych cech respondenta. Wyróżnia się dwa rodzaje odpowiedzi: niewyskalowane i wyskalowa-ne. W zależności od rodzaju żądanej odpowiedzi pytania dzieli się odpowiednio na otwarte i zamknięte. Odpowiedź na pytanie otwarte jest odpowiedzią niewyskalo-waną, a odpowiedź na pytanie zamknięte — odpowiedzią wyskalowaną.
PYTANIA OTWARTE. Odpowiedź na pytanie otwarte jest wypowiedzią swobodną całościowo sformułowaną przez respondenta. Jest to odpowiedź niewyskalo-wana, nie ograniczona ani co do treści, ani co do sposobu budowy zdań, ani co do czasu wypowiedzi.
Wszystkie pytania otwarte różnią się jednak stopniem otwartości i — w związku z tym — pozwalają na różną swobodę wypowiedzi. Na przykład pytanie: „Co sądzisz o napojach chłodzących firmy XT' jest pytaniem, na które respondent może odpowiedzieć bardzo swobodnie i szeroko. Natomiast pytanie: „Które napoje chłodzące firmy X zwykle pijesz?" daje dużo mniejszą swobodę wypowiedzi. Odpowiedź respondenta ograniczy się do wyliczenia jednego lub kilku napojów chłodzących, które pije on najczęściej.
Zaletą pytań otwartych jest to, że zachęcają one respondenta do odpowiadania zgodnie z jego wolą, możliwością wypowiedzi i jego punktem widzenia. Wypowiedź respondenta nie jest ograniczona żadnymi warunkami, ani kategoriami, które mogłyby być zawarte w pytaniu. Odpowiedzi na pytania otwarte są bardzo zróżnicowane, każda odpowiedź na to samo pytanie jest inna. Dzięki tej różnorodności możliwe jest odkrycie układu odniesienia i motywacji respondentów. Pytania otwarte nadają się więc, zwłaszcza w badaniach wstępnych, np. do poszukiwania problemu decyzyjnego i badawczego lub do projektowania kwestionariusza.
Budując kwestionariusz, należy w wielu przypadkach zaczynać od pytań ogólnych, aby potem przejść do pytań szczegółowych. Na przykład pytanie otwarte: „Jaka firma (marka) przychodzi Panu do głowy, gdy myśli Pan o samochodzie?" może dostarczyć odpowiedzi odzwierciedlających układ odniesienia respondentów i dać konkretne podstawy do interpretacji odpowiedzi na następne pytania. Pytania otwarte są także często zadawane do sondowania w celu uzyskania dalszych, dokładniejszych odpowiedzi, np.: „Dlaczego? W jaki sposób mógłby Pan to wyrazić inaczej? Proszę to wyjaśnić bliżej". Wadą pytań otwartych jest niechęć respondentów do udzielania długich wypowiedzi pisemnych, które trzeba samodzielnie budować. We wszystkich formach pomiaru, zwłaszcza pośredniego, należy więc pytań otwartych unikać. Jeżeli pytania te są niezbędne, powinny to być pytania o małym stopniu otwartości. Inną wadą pytań otwartych jest to, że są one źródłem poważnych błędów pomiaru. Błąd powstaje w wyniku dużego rozproszenia odpowiedzi, które nie zawsze opisują mierzoną cechę. Ponadto dane zebrane z odpowiedzi na te pytania stwarzają dużo kłopotów na etapie redukcji i analizy.
PYTANIA ZAMKNIĘTE. W odróżnieniu od pytań otwartych odpowiedzi na pytania zamknięte są wyskalowane. Dobór i przystosowanie odpowiednich skal do odpowiedzi na wszystkie pytania w kwestionariuszu to — jak już wspomniano — cechowanie kwestionariusza. Czasami może być konieczne inne sformułowanie zaprojektowanego wcześniej pytania w celu przystosowania go do odpowiedniej skali. W skalowaniu odpowiedzi mają zastosowanie wszystkie omówione wcześniej typy skal: nominalne, porządkowe, przedziałowe i stosunkowe31. Pytania zamknięte mają więcej zalet niż pytania otwarte. Pytania zamknięte są łatwiejsze w stosowaniu zarówno dla prowadzącego pomiar, jak i dla respondenta. Jeżeli zostały dobrze zaprojektowane, są źródłem niewielkich błędów pomiaru. Eliminują przede wszystkim brak zdolności respondenta do wypowiedzenia się, dają mu pełny wybór możliwych odpowiedzi. Ponadto w wyniku skalowania odpowiedzi znacznie ułatwia się klasyfikację, kodowanie, redukcję i analizę danych. Bez skalowania niemożliwe jest zastosowanie komputerów na etapie redukcji i analizy.
Podstawową wadą pytań zamkniętych są problemy związane ze skalowaniem odpowiedzi. Skalowanie wymaga bowiem w wielu przypadkach przedwstępnego pomiaru z zastosowaniem pytań otwartych. Wydłuża to czas badania i zwiększa jego koszty. Ponadto ukazanie respondentowi skali możliwych odpowiedzi jest źródłem różnych zniekształceń wyników pomiaru.
Kwestionariusz próbny
Wstępna lista pytań i wyskalowane wstępnie odpowiedzi są szkicem kwestionariusza, który jest następnie sprawdzany. Pierwsze sprawdzenie wykonuje badacz--projektant. Polega ono na ponownym przeanalizowaniu każdego pytania i wyska-lowanej odpowiedzi. Szczególnie bierze się tutaj pod uwagę wszystkie zasady projektowania kwestionariusza z uwzględnieniem konieczności minimalizacji błędu pomiaru.
Podczas opracowywania szkicu kwestionariusza przystosowuje się go do wybranej formy pomiaru (drogi, jaką trafi on do respondenta) i sposobu pomiaru. Od tych czynników zależą: układ, instrukcje, struktura, objętość kwestionariusza i sposób skalowania odpowiedzi. Na przykład kwestionariusz zastosowany w ankiecie pocztowej należy szczególnie poprawnie projektować ze względu na układ, instrukcje dla respondentów, skalowanie odpowiedzi, a także jakość papieru i druku. Takie czynniki mogą bowiem decydować o liczbie zwróconych kwestionariuszy.
Następnym krokiem jest sprawdzenie szkicu kwestionariusza przez praktyków i teoretyków, którzy mają pewne doświadczenie i wiedzę w projektowaniu tych instrumentów. Sprawdzenia mogą się podjąć zarówno inni badacze, jak i kierownictwo przedsiębiorstwa. Czasami szkic jest również sprawdzany przez teoretyków podczas konsultacji z nimi. Inne spojrzenie na szkic kwestionariusza może wykazać jego niedostatki, które należy wyeliminować. Wynikiem przeprowadzonego sprawdzenia jest kwestionariusz próbny.
Żadne sprawdzenie przez znawców i teoretyków nie może zastąpić reakcji prawdziwych respondentów. Próbka do pomiaru pilotowego jest częścią próby dobranej do pomiaru właściwego. Im bardziej różnorodna jest ostateczna próba, tym większa jest próbka do pomiaru pilotowego.
Testowanie kwestionariusza wymaga odpowiedzi na pięć pytań.
Po pierwsze, które elementy kwestionariusza powinny być sprawdzone. Praktycznie sprawdzeniu podlegają wszystkie jego elementy (długość kwestionariusza, układ, kolejność pytań, treść i sposób sformułowania pytań) oraz sposób wyskalo-wania odpowiedzi na pytania. Każde pytanie jest sprawdzane pod względem reakcji i uwag, jakie ono wywołało.
Po drugie, jakich form pomiaru używa się do testowania kwestionariusza. Bez względu na to, jaka forma pomiaru będzie zastosowana w pomiarze ostatecznym, do testowania stosuje się najczęściej wywiad osobisty lub telefoniczny, rzadziej — ankietę pocztową. Wywiad osobisty pozwala bowiem prowadzącemu wywiad na bezpośrednie obserwowanie reakcji, wahań i wątpliwości respondenta; obserwacja taka nie jest możliwa w drodze komunikacji telefonicznej lub pocztowej. Obserwacje są dokładnie notowane przez osobę prowadzącą wywiad. Przeprowadzenie wywiadów nie wyklucza zastosowania dodatkowego próbnego pomiaru w takiej formie, w jakiej będzie przeprowadzony pomiar ostateczny.
Po trzecie, kto powinien przeprowadzić pomiar próbny. Wywiady osobiste lub telefoniczne przeprowadzają osoby regularnie zajmujące się tą formą pomiaru. W celu nie tylko sprawdzenia samego kwestionariusza, lecz także w celu odpowiedniego pomiaru, np. jego czasu i kosztów, stopnia reakcji respondentów oraz błędów spowodowanych przez prowadzącego pomiar, mogą być włączone osoby z różnym doświadczeniem.
Po czwarte, kto ma być poddany pomiarowi próbnemu za pomocą testowanego kwestionariusza. Przestrzega się tu zasady, że struktura próbki odzwierciedla strukturę próby ostatecznej. Każda istotna cecha populacji badanej powinna być więc odzwierciedlona w próbce stosowanej do testowania kwestionariusza.
Po piąte, jak liczna ma być próbka do pomiaru próbnego. Nie ma zgodnych odpowiedzi na to pytanie. Według ocen różnych autorów liczebność próbki waha się od 12 do 30 jednostek. Podkreśla się, że liczebność próbki zależy wprost proporcjonalnie od różnorodności badanej populacji oraz stopnia skomplikowania i wyjątkowości kwestionariusza.
Testowanie kwestionariusza próbnego należy traktować jako element badania pilotowego, w którym sprawdzeniu podlegają pozostałe etapy badania, takie jak analiza danych, kodowanie i tabulacja, formułowanie i sprawdzanie hipotez itd.
W Roku 2005 przeprowadzony został pewien ciekawy eksperyment dotyczący stopnia i jakości reakcji respondentów na różne rodzaje błędów kwestionariusza oraz wpływu zastosowanej metody zbierania danych na stopień rozpoznania tych błędów. Zastosowany w eksperymencie kwestionariusz składał się z podanych niżej pytań32.
P,1 Co powinniśmy zrobić w związku z poważnym zagrożeniem Ameryki przez obce potęgi militarne:
1 □ zwiększyć wydatki na zbrojenia
2 □ zmniejszyć wydatki na zbrojenia
3 □ pozostawić je nie zmienione
R2
Jeżeli nasze zaopatrzenie w importowaną
ropę
naftową
zostałoby
odcięte, czy był
byś
za
użyciem siły militarnej w celu zapewnienia dostaw ropy?
1 □
tak
2
□ nie
3 □ nie wiem
P.3 Jak oceniasz zaradność prezydenta Cartera w sprawach krajowych i zagranicznych?
1 □ bardzo dobrze
2 □ dobrze
3 □ średnio
4 □ źle
5 □ bardzo źle
P.4
Czy uważasz, że Carter będzie nominowany i ponownie wybrany?
1
Q tak
2
□ nie
3 □ nie wiem
R5
Czy kupiłeś wyposażenie
domowe w ciągu ostatnich 6 miesięcy?
1 □
tak
2
□ nie
P.6 Jak potoczą się sprawy następnego lata w porównaniu z obecnym?
1 □ znacznie lepiej
2 a lepiej
3 a tak samo
4 □ gorzej
5 □ znacznie gorzej
P.7 Czym jest spowodowana obecna inflacja kosztami?
1 □ większym popytem
2 □ zarówno jednym, jak i drugim
3 □ większymi kosztami
— większym popytem czy większymi
P.8
Czy uważasz, że stopa dyskontowa jest za wysoka?
1 a
tak
2
□ nie
3 □ nie wiem
P.9 Jeżeli nastąpiłby kryzys gospodarczy, to policja powinna otrzymać:
1 □ dużo większy zakres władzy
2 □ nieco większy zakres władzy
3 □ zakres władzy nie powinien być zmieniony
P.10
Czy głosujesz na republikanów, czy na demokratów?
1
□ R
2 □ D
Wszystkie pytania i skale odpowiedzi tego kwestionariusza zawierają błędy. Pytanie pierwsze i drugie są pytaniami sugestywnymi, pytanie trzecie i czwarte — wieloznacznymi (zawierającymi w sobie dwa pytania), piąte i szóste — niejasnymi (możliwych jest kilka interpretacji), siódme i ósme — z trudną dla respondenta terminologią oraz dziewiąte i dziesiąte — z niepełną skalą odpowiedzi. Metoda ankiety bezpośredniej polega na tym, że respondent sam wypełnia kwestionariusz, a ankieter obserwuje respondenta i notuje jego uwagi.
Skale do pomiaru postaw
Przedmiotem większości pomiarów w badaniach marketingowych są postawy nabywców różnych dóbr. Stąd większość pytań w kwestionariuszach dotyczy tej cechy psychicznej respondentów. Poznanie postaw pozwala na bliższe określenie późniejszego zachowania się. Jeżeli ktoś lubi daną markę, to prawdopodobnie w przyszłości dokona zakupu towaru opatrzonego tym znakiem. Pomiar postaw, w odróżnieniu od pomiaru zachowania się, daje odpowiedź na pytanie o przyczyny określonego zachowania się i ma znaczenie diagnostyczne.
Kategoria postaw
E.R. Hilgard określa postawę jako „pozytywne lub negatywne ustosunkowanie się do pewnego przedmiotu, pojęcia lub sytuacji, jak również gotowość do reagowania w pewien z góry określony sposób na te (lub związane z nimi) przedmioty, pojęcia lub sytuacje"33. Postawy kształtują się w wyniku wzajemnego oddziaływania danej jednostki i jej otoczenia. Psychologowie wyróżniają trzy podstawowe, związane ze sobą składniki postaw: przekonania, emocje i zachowanie się.
Człowiek ma już wyrobione przekonania związane z danym przedmiotem, zdarzeniem lub daną sytuacją. Przekonania powstają wskutek nie tylko bezpośredniego, lecz także pośredniego oddziaływania; wskutek doświadczenia i wiedzy. Potencjalny nabywca ma określone przekonania o danym produkcie, będzie oczekiwał, że produkt spełni jego potrzeby w pewnym stopniu. Emocje przejawiają się w upodobaniach i preferencjach. Element behawiorystyczny postawy natomiast decyduje o zachowaniu się nabywcy przed dokonaniem zakupu, w czasie jego trwania i po dokonaniu zakupu. Postawy przyjmują wartości mieszczące się między wielkościami skrajnymi: postawą zdecydowanie pozytywną a postawą zdecydowanie negatywną. Dzięki temu postawy i inne cechy psychologiczne mogą być poddane pomiarom za pomocą różnego rodzaju skal, głównie porządkowych. Wnioski wyciągnięte na podstawie wyników pomiarów pozwalają wykorzystać postawy i oddziaływać na nie.
Zasady skalowania
Przy skalowaniu odpowiedzi w pomiarach postaw bierze się pod uwagę kilka podstawowych zasad dotyczących wszystkich rodzajów skal począwszy od nominalnej, a skończywszy na stosunkowej. Zasady te mają zresztą zastosowanie nie tylko do pomiaru postaw. W literaturze wymienia się najczęściej pięć zasad: skalowanie zrównoważone i niezrównoważone, graficzną formę skali, liczbę kategorii skali, parzystą lub nieparzystą liczbę kategorii, skalowanie wymuszające i nie wymuszające.
Skalowanie zrównoważone i niezrównoważone. Skalowanie zrównoważone wymaga ustalenia klasy środkowej oraz wyznaczenia jednakowej liczby klas (przedziałów) o jednakowej intensywności po obu stronach ustalonej klasy środkowej. Jeżeli po obu stronach skali występuje różna liczba klas lub występują
klasy o niejednakowej intensywności albo różnych jednostkach miary, to takie skalowanie nazywa się skalowaniem niezrównoważonym.
Przy projektowaniu kwestionariusza należy dążyć do zrównoważonego skalowania odpowiedzi. Takie postępowanie zmniejsza błąd pomiaru i ułatwia zastosowanie metod statystycznych na etapie redukcji i analizy danych. Nie wszystkie jednak możliwe odpowiedzi dają się wyskalować w sposób zrównoważony. Dotyczy to zwłaszcza prób z populacji nieskończonych lub częściowo nieznanych. W konkretnych badaniach mogą również wystąpić inne przyczyny zastosowania skalowania niezrównoważonego. Przykładem mogą być trudności ze skalowaniem odpowiedzi respondentów, dotyczących ich wieku, zwłaszcza górnych i dolnych jego przedziałów.
Liczba KATEGORII SKALI. Liczba kategorii między biegunami skali zależy od postawy respondenta, formy pomiaru i metody analizy danych. Niekiedy wystarcza zastosowanie skali nominalnej alternatywnej. Do pomiaru innych cech trzeba zastosować dziesięć lub więcej kategorii. Jeżeli badacz zadowoli się ogólnymi danymi, to może on stosować trzy kategorie. Jeżeli jednak pragnie się dowiedzieć więcej na temat postaw, to powinien stosować pięć lub siedem kategorii.
PARZYSTA LUB NIEPARZYSTA LICZBA KATEGORII. Wybór tej liczby przesądza o tym, czy skala będzie zawierała środkową, neutralną pozycję. Zwolennicy stosowania parzystej liczby kategorii argumentują to tym, że postawy nie mogą być neutralne. Inni twierdzą, że nie ma większej różnicy w przyjmowaniu liczby kategorii. Skalowanie odpowiedzi zaczyna się często od wyboru kategorii środkowej. Wybór ten nie dotyczy jedynie skalowania nominalnego, gdzie porządkowanie nie występuje. Respondenci wykazują tendencję do wyboru tych kategorii, które są bliżej środka danej skali. Nieprzemyślane zaprojektowanie środkowej klasy może zatem spowodować powstanie błędu pomiaru. Szczególną ostrożność należy zachować przy projektowaniu neutralnych kategorii środkowych, ponieważ ich wybór jest wygodny dla części respondentów. Na rysunku 3.12 przedstawiono trzy równoważne formy skali nieparzystej ze środkową pozycją neutralną. Są to jednocześnie trzy różne graficzne postaci tej samej skali.
Rysunek 3.12
Trzy równoważne skale pięcioprzedziałowe (nieparzyste)
Skala A |
Skala B |
|
|
Skala C |
© |
---- +2 |
1 |
□ |
Bardzo dobry |
© |
---- +1 |
2 |
□ |
Dobry |
© |
---- 0 |
3 |
□ |
Ani dobry, ani niedobry |
© |
__ _-| |
4 |
□ |
Niedobry |
© |
— -2 |
5 |
□ |
Bardzo niedobry |
Skalowanie wymuszające i nie wymuszające. Skalowanie wymuszające ma na celu wykazanie przez respondenta ściśle określonej kategorii na skali odpowiedzi. Gdy respondent nie jest w stanie wyrazić swojej postawy, stosuje się skalowanie nie wymuszające, umożliwiające respondentowi zajęcie stanowiska neutralnego. Respondenci, którzy nie mogą wyrazić swojej opinii, ponieważ nie podróżowali samolotami innych linii, wybierają ocenę neutralną, w tym przypadku „nie wiem". Dzięki temu można ich wyróżnić spośród respondentów, którzy wyrazili konkretne opinie.
Wielowymiarowe skale do pomiaru postaw
Za pomocą omówionych skal jednowymiarowych wyniki pomiarów i analiz można ująć w postaci jednej liczby lub prostego jednowymiarowego wykresu. Badacz wie zawczasu, jaki wymiar będzie stosował w pomiarach. Pomiar przeprowadzony za pomocą skal wielowymiarowych ma natomiast naturę kompleksową, składa się z wielu skomplikowanych matematycznie technik.
Graficzną ilustracją wyników analiz jest obraz wielowymiarowy. Zwykle jest to obraz dwuwymiarowy lub trójwymiarowy, gdzie wymiarami nie są, jak na układzie współrzędnych, jednostki miary, lecz jakościowe wielkości niemierzalne związane z postawami.
Skalowanie wielowymiarowe zalicza się do najnowszych metod, które znalazły zastosowanie w pomiarach i analizach postaw nabywców. W literaturze, zwłaszcza amerykańskiej, lat sześćdziesiątych i siedemdziesiątych pojawiły się pierwsze opisy i zastosowania tych metod w badaniach marketingowych. Wyróżnia się zwłaszcza dwie metody: skalowanie wielowymiarowe {multidimensional sca-ling — MDS) oraz pomiar wieloczynnikowy (conjoinł measurement). Obie metody mają zastosowanie zarówno do danych metrycznych otrzymanych z pomiaru inter-wałowego, jak i do danych jakościowych otrzymanych z pomiarów nominalnego i porządkowego.
SKALOWANIE WIELOWYMIAROWE. MDS wymaga stosowania metod statystycznych przy użyciu komputerów. Celem analiz jest przekształcenie zebranych z pomiaru danych, dotyczących preferencji i percepcji nabywców, w spójny i czytelny obraz w przestrzeni wielowymiarowej. Obraz ten odzwierciedla prawidłowości zachodzące w sferze postaw nabywców względem różnych obiektów i ich cech, głównie produktów.
Rozpatrzmy przykład analizy MDS dotyczący rynku samochodowego w Stanach Zjednoczonych34. Przedmiotem pomiaru i analizy były postawy użytkowników wobec 11 amerykańskich marek samochodów. Pomiar postaw został przeprowadzony za pomocą znanej metody porównywania parami: każdy samochód był porównywany z innym, co dawało 55 możliwych porównań. Respondent dokonywał więc 55 porównań, począwszy od pierwszej pary samochodów najbardziej podobnych, drugiej pary mniej podobnych itd.
Uzyskane z pomiaru dane zostały w wyniku analizy ilościowej przekształcone w graficzny dwuwymiarowy układ preferencji podobieństw, przedstawiony na rysunku 3.15. Z układu wynika, że respondenci w swoich ocenach zastosowali dwa wymiary (cechy): luksusowość i popularność samochodów. Każdy model samochodu jest reprezentowany na układzie w postaci punktu, utworzonego przez kombinację wspomnianych wymiarów. Na przykład respondenci ocenili samochód Lincoln Continental jako bardzo luksusowy, ale raczej niesportowy.
Rysunek 3.15
Ilustracja przestrzeni preferencji i podobieństw
Sportowy
°7
■ / Punkt idealny
01
04
Zwykły
09
Luksusowy
011
o10 Popularny
Modele samochodów z 1986 roku
1. Ford Taunus 5. Ford Escort
2. Mercury Sable 6. Cadillac Eldorado
3. Lincoln Continental 7. Jaguar XJ Sedan
4. Ford Thunderbird 8. AMC Alliance
Źródło: T.C. Kinnear, J.R. Taylor, jw., s. 532.
9. Plymouth Reliant
10. Buick Le Sabre
11. Chevrolet Cavalier
Punkt idealny, oznaczony na rysunku literą /, oblicza się z danych otrzymanych z pomiarów przeprowadzanych za pomocą skal rang. Reprezentuje on idealną kombinację cech luksusu i sportu w odniesieniu do samochodów. Z rysunku widać, że najbliższy idealnego samochodu — zgodnie z oceną respondentów — jest Ford Thunderbird, a następnie Jaguar XJ Sedan; najmniej zbliżony do idealnego jest Ford Escort. Dystans między punktem idealnym a danym modelem odzwierciedla preferencje respondentów, a odległość między dwoma modelami — podobieństwa w odczuciu respondentów. Grupa podobnych marek wskazuje jednocześnie na konkurencję między nimi.
Wartość informacji otrzymanych z pomiaru MDS, zwłaszcza gdy odnosi się ona do całych segmentów rynku, jest bardzo duża dla decydentów. Mogą się oni dowiedzieć, jakich „wymiarów" używają nabywcy w ocenach produktów, jaką pozycję zajmują ich produkty w układzie wielowymiarowym oraz jakie segmenty rynku nie są jeszcze zajęte przez konkurencję. Na przykład producent samochodu Jaguar może być zainteresowany w zmianie image 'u swojego samochodu na mniej sportowy, aby przybliżyć się do segmentu idealnego, wciąż jeszcze mało konkurencyjnego.
POMIAR WIELOCZYNNIKOWY. Podobnie jak w przypadku opisanych wcześniej skal i metod, również i ta metoda umożliwia pomiar, zebranie i analizę danych. Skalowanie wielowymiarowe zakładało porównywanie przez respondentów kilku produktów. Pomiar wieloczynnikowy polega natomiast na pomiarze preferencji respondentów względem kilku powiązanych ze sobą czynników (cech) jednego produktu. Głównym zastosowaniem pomiaru wieloczynnikowego jest więc testowanie nowych produktów i środków reklamy. Rezultatem pomiaru i analizy są dane tworzące skalę przedziałową.
Pomiar wieloczynnikowy polega na tym, że respondentowi prezentuje się do oceny wybrane cechy produktu. Pomiar może być przeprowadzony w dowolnej formie, najlepiej bezpośredniej: wywiadu grupowego lub osobistego. Załóżmy, że producent i eksporter pasty do podłóg chce przetestować nowy produkt na nowym rynku. Producent jest zainteresowany tym, jakie preferencje potencjalni nabywcy mogą przyjąć wobec sześciu niżej wymienionych cech, z których każdą charakteryzuje kilka wartości:
1. Cena -3 (10 USD, 20 USD, 30 USD)
2. Pojemność -3 (1 1, 3 1, 5 1)
3. Opakowanie -3 (plastikowe, blaszane, szklane)
4. Kształt opakowania -4 (okrągły, kwadratowy, prostokątny, owalny)
5. Dodatek owadobójczy -2 (tak, nie)
6. Konsystencja pasty -2 (płynna, stała)
Dla prostoty przykładu załóżmy, że producent jest szczególnie zainteresowany trzema pierwszymi cechami. Dzięki temu respondent będzie oceniał tylko 27 kombinacji (3 x 3 x 3), zamiast 432 (3x3x3x4x2x2). W drugim przypadku konieczna byłaby redukcja możliwych kombinacji do niezbędnego minimum, co można osiągnąć drogą eksperymentu. Badacz ponadto dobiera tyle wartości w ramach każdej cechy, aby możliwe było określenie użyteczności każdej cechy i kształtu krzywej charakteryzującej tę użyteczność. Na rysunku 3.16a krzywa ma charakter nieliniowy. Jej określenie wymaga doboru co najmniej trzech wartości. W przypadku linii prostej (rysunek 3.16b) wystarczą dwie wartości. Praktycznie dobiera się więc 2-4 wartości35.
Rysunek 3.16
Możliwe kształty krzywej użyteczności dla różnych pojemności opakowań
pasty do podłóg
|
b)
3 5 Pojemność (w I |
3 5 Pojemność (w I) |
INajczęściej stosowaną metodą pomiaru jest prezentowanie respondentowi pełnego profilu wyboru cech. Inną metodą jest możliwość porównań wszystkich cech parami w sposób zilustrowany na rysunku 3.17.
Rysunek 3.17
Pomiar preferencji za pomocą porównań parami
o I «
I
Cena 10 20 30
|
10 |
Cena 20 |
30 |
(/) |
|
|
|
|
|
|
|
O. |
|
|
|
$
o
I co
s. |
CD
Opakowanie p b s
p — plastikowe, b — blaszane, s — szklane.36
Analiza wieloczynnikowa polega głównie na znalezieniu użyteczności dla poszczególnych wartości cech produktu i zaprezentowaniu ich w formie przedziałowej. Podobnie jak w przypadku skalowania wielowymiarowego do obliczeń jest niezbędny komputer z odpowiednim programem. Najczęściej stosowaną metodą analizy jest monofoniczna analiza wariancji (MONANOVA). Program komputerowy znajduje pierwsze rozwiązanie, które jest następnie modyfikowane drogą kolejnych iteracji przybliżających rozwiązanie optymalne, w którym obliczone użyteczności będą maksymalnie korelowały z rangami nadanymi przez respondentów. W punkcie wyjściowym (przed procesem iteracji) suma arbitralnie ustalonych użyteczności poszczególnych wartości równa się całkowitej użyteczności danej cechy.
Komputer drogą wielu iteracji wykrywa funkcję najlepiej odzwierciedlającą współzależność między poszczególnymi parami współrzędnych i znajduje ostatecznie najlepsze rozwiązanie. Rezultatem tego procesu są indywidualne funkcje użyteczności obliczone dla poszczególnych cech produktu. Funkcje te informują badacza, czy preferencje określonych respondentów są monotoniczne oraz jakie są względne różnice w indywidualnych ocenach ważności cech produktu.
1Źródło: T.Pawłowski, ,,Pojęcia i metody współczesnej humanistyki”, Ossolineum, Wrocław 1977
2Żródło: K.Ajdukiewicz, ,,Język i poznanie”, PWN, Warszawa 1965, s. 365
3Żródło: N.R.Campbell, ,,Symposium: Measurement and Its Importance for Philosophy, Proceedings of the Aristelian Society”, Supplement, t. XVII, London 1940
4Żródło: S.S.Stevens, ,,On the Theory of Scales of Measurement”, Science 1946, vol.103, No. 2684, 7 June
5Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
6Źródło: P.Abell, ,,Modele w socjologii”, PWN, Warszawa 1965
7 Źródło: R.Grupiński, ,,Opis statystyczny w badaniach prawoznawczych”, Wydawnictwo Prawnicze, Warszawa 1981
8Źródło: M.Mazur, ,,Cybernetyka i charakter”, PIW, Warszawa 1976
9Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
10Źródlo: D.A.Aaker, D.M.Stayman, M..R.Hagerty, ,,Warmth in Advertising, Measurement, Impact and Sequence Effects, ,,Journal of Consumer Research”, 1986
11Źródło: Z.Pawłowski, ,,Ekonometria”, PWN, Warszawa 1975
12Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
13Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
14Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
15Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
16 Źródło: S.Kaczmarczyk, ,,Pomiar w badaniach marketingowych”, Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk 1987
17Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
18Część przykładów pochodzi z opracowanego przez S.J.Paliwodę kwestionariusza ,,Survey of Trading Relationsships Between UK-based Companies and Polish Enterpries” w Uniwersity of Bradford Management Centre oraz pracy M.Rydla ,,Tworzenie obrazu marki w koncepcjach promocji eksportu towarów przemysłowych ze szczególnym uwzględnieniem statków”, Zeszyty Naukowe Wydziału Ekonomiki Transportu, Ekonomika Handlu Zagranicznego, UG Gdańsk 1980
19Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
20Źrodło: S.Kaczmarczyk, ,,Badania marketingowe, metody i techniki”, Polskie Wydawnictwo Ekonomiczne, Warszawa 2002
21Niektórzy autorzy nie przypisują skalom stosunkowym naturalnej jednostki miary – wyodrębniają jedynie dodatkowo wyższy rodzaj skali – skalę absolutną
22Metody szacowania rzetelności i trafności pomiaru opisują m.in. M. Choynowski, Problemy psychologii matematycznej, pod red. J. Kozieleckiego, PWN, Warszawa 1971, s. 84-115 oraz D. Magnusson, Wprowadzenie do teorii testów, PWN, Warszawa 1981, cz. II i III
23J. Jacoby twierdzi z naciskiem, że prawie wszystkie pomiary w badaniach marketingowych są „uświęcone i nietykalne", czyli nie są poddawane ocenie ze względu na ich trafność {Consumer Research. How Valid and Useful Are Ali Our Consumer Behaviour Research Findings, „Journal of Marketing" 1978, April).
24Nazwy te zaproponował dużo wcześniej S. Nowak w: Metody badań socjologicznych, praca zbiorowa pod red. S. Nowaka, PWN, Warszawa 1965, s. 66.
25Ibiden - s. 65.
26Rynek konserw rybnych w Polsce, raport sporządzony przez Instytut Usług Marketingowych EUROTEST na zlecenie GFKM, Gdańsk, styczeń 2004r.
27 Źródło: S.Kaczmarczyk, ,,Pomiar w badaniach marketingowych”, Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk 1987
28Są to dane na temat wieku, płci, wymiarów fizycznych, stanu cywilnego, liczby dzieci, zajęć nieprofesjonalnych, głowy rodziny, imienia i nazwiska, miejsca zamieszkania itp.
29Do danych prestiżowych można zaliczyć wykształcenie, pochodzenie, rasę, narodowość, dochody i wydatki, czas poświęcany na kulturę itp.
30Wyczerpujący i przystępnie opracowany przegląd zagadnień omawiających te problemy zawiera napisany przez P.B. Sztabińskiego i F. Sztabińskiego artykuł pod tytułem Kto pyta też błądzi („Rzeczpospolita" z 15 lipca 1993).
31Zarówno w literaturze obcej, jak i rodzimej pytania zamknięte dzieli się na pytania wieloalternatywne (multiple choice ąuestions), nazywane czasem pytaniami kafeteryjnymi, oraz pytania alternatywne lub dychotomiczne (dichotomous ąuestions). Pytania dychotomiczne wymagają odpowiedzi alternatywnej, czyli wyboru jednej z dwóch możliwości. Do skalowania odpowiedzi na te pytania mają więc zastosowanie skale nominalne alternatywne. Do skalowania odpowiedzi na pozostałe pytania mają natomiast zastosowanie skale nominalne niealternatywne oraz wszystkie pozostałe typy skal.
32 Źródło: S.Kaczmarczyk, ,,Pomiar w badaniach marketingowych”, Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk 1987
33E.R.Hilgard, ,,Wprowadzenie do psychologii”, PWN, Warszawa 1972, s. 834
34Analizy dokonali w 1968 roku P.E. Green, F.J. Carmone (Multidimensional Scaling and Relation Techniąues in Marketing Analysis, Allyn and Bacon, Boston 1970, s. 34) oraz T.C. Kinnear, J.R. Taylor, jw., s. 536-538. Por. również S. Mynarski, Metody badań marketingowych, Akademia Ekonomiczna, Kraków 1986, s. 65-77.
35Szerzej na ten temat pisze D.R. Lehmann (Market Research and Analysis, R.D. Irwin, Inc., Homewood 1985, s. 659). Por. również P.E. Green, Y. Wind, New Way to Measure Consumers
36Judgements, „Harvard Business Review" 1975, My-August, s. 107-117. W polskiej literaturze problem pomiaru i analizy wieloczynnikowej wyczerpująco prezentują M. Walesiak, A. Bąk, Realizacja badań marketingowych metodą conjoint analysis z wykorzystaniem pakietu statystycznego SPSS for Windows, Akademia Ekonomiczna, Wrocław 1997