Wybrane metody oceny jakościowej
Metody punktowe
Metody punktowe należą do metod skalowania. W ocenie jakości sensorycznej zajmują szczególne miejsce, bowiem ujmują wszystkie oceniane oddzielnie cechy produktu w jedną liczbę, która kompleksowo wyraża jakość ogólną badanego produktu.
Skale punktowe łączą zalety skal werbalnych i skal liczbowych. Każdy punkt skali ma umowne liczby oraz odpowiadające im określenie (lub określenia) słowne. Precyzja uzyskanych wyników zależy od poprawnego zdefiniowania poszczególnych poziomów jakości i jest to pierwszy warunek by uzyskać poprawne wyniki. Drugim warunkiem jest wyszkolenie zespołu oceniającego, pozwalające na jednoznaczne rozumienie definicji poszczególnych cech obiektu. Definicje nie mogą zawierać pojęć o charakterze emocjonalnym i zbyt ogólnym.
Poprawnie skonstruowana skala punktowa powinna spełniać cztery warunki:
każdy stopień skali powinien odpowiadać odmiennemu poziomowi jakości uchwytnemu dla oceniającego;
każdemu punktowi skali (czyli każdemu poziomowi jakości) powinna odpowiadać jednoznaczna definicja jakości;
liczba punktów skali powinna być ograniczona i nie powinna przekraczać 11 stopni, a dla seryjnych, rutynowych oznaczeń zalecana jest skala pięciopunktowa;
wszystkie cechy powinny być oceniane na skali o jednakowej liczbie punktów.
Skale punktowe różnią się pod względem stopnia ich rozbudowania, konstrukcji oraz powiązania z klasami jakościowymi; to zróżnicowanie ma wpływ na otrzymywane wyniki. Znane jest zjawisko niechęci oceniających do korzystania ze skrajnych stopni skali. Na przykład w skalach stupunktowych rzadko wykorzystywanych jest pierwszych i ostatnich 25 punktów. Przyjmuje się w tych skalach następujące klasy jakości:
0-20 punktów - jakość zła;
21-40 punktów - jakość niezadowalająca;
41-60 - jakość dostateczna;
61-80 - jakość dobra;
81-100 - jakość bardzo dobra.
Ponieważ oceniający najczęściej korzystają z środkowych 50 punktów, więc produkt jest oceniany tylko na trzech poziomach: niezadowalającym, dostatecznym i dobrym. Poza tym wątpliwa jest zdolność oceniających do zdefiniowania i rozróżnienia 100 punktów skali. O wiele prostszą i łatwiejszą do zastosowania w praktyce jest metoda oceny pięciopunktowej, w której skala została sprowadzona do 5 stopni, a ważność poszczególnych cech jest określana przez odpowiadające im współczynniki ważkości.
Ocena pięciopunktowa została zaproponowana w 1957 roku przez prof. Damzego Tilgnera. Nawiązuje do systemu ocen szkolnych i dlatego czasem jest nazywana skalą szkolną. Obejmuje pięć klas jakości:
5 - jakość bardzo dobra;
4 - jakość dobra;
3 - jakość dostateczna;
2 - jakość niedostateczna;
1 - jakość zła.
Poziom każdej cechy określony jest odpowiednią definicją.
W pierwszym etapie następuje wybór cech charakterystycznych i istotnych dla jakości danego produktu.
W drugim etapie ustalane są definicje dla pięciu poziomów jakości każdej wybranej cechy. Gdy konieczne jest wyodrębnienie większej liczby poziomów i jest możliwe określenie definicji tych poziomów, wówczas skale można rozszerzyć, stosując oceny pośrednie: 4,5; 3,5; 2,5; 1,5.
W trzecim etapie należy dokonać weryfikacji skonstruowanego układu skali punktowej przez kilkakrotne, (co najmniej, dwukrotne) przeprowadzenie próbnych ocen produktu. Oceny powinny być dokonane przez pięcioosobowe zespoły ekspertów (pożądana jest większą liczba osób), którzy po ukończeniu oceny mają wydać opinie o poprawności definicji i dokonać ewentualnej korekty.
W czwartym etapie następuje ustalenie współczynników ważkości (nazywanych też współczynnikami wagowymi) poszczególnych cech, z uwzględnieniem ważności danej cechy dla ogólnej oceny produktu (ustalenie współczynników ważkości to określenie udziału każdej z cech w ocenie ogólnej produktu). W tym przypadku suma współczynników jest równa 1,0.
Przykład oceny punktowej dla opakowań wybranych produktów przedstawia poniższa tabela:
Cechy opakowania |
Ocena |
Współczynnik wagowy |
Iloczyn 2x3 |
Opakowania szamponów |
|||
Rodzaj tworzywa |
4,00 |
0,20 |
0,80 |
Estetyka |
4,00 |
0,20 |
0,80 |
Dogodność manipulacji |
5,00 |
0,25 |
1,25 |
Informacyjność |
5,00 |
0,25 |
1,25 |
Pojemność |
4,00 |
0,10 |
0,40 |
Ocena |
1,00 |
4,50 |
|
Opakowania proszków do prania |
|||
Kompozycja graficzna |
4,00 |
0,20 |
0,80 |
Informacyjność |
4,00 |
0,30 |
1,50 |
Staranność wykonania |
4,00 |
0,20 |
0,80 |
Dogodność manipulacji |
3,00 |
0,20 |
0,60 |
Dobór materiału |
4,00 |
0,10 |
0,40 |
Ocena |
1,00 |
4,10 |
Można przyjąć też inne kryterium ustalania współczynników ważkości np. od 1 do 3 gdzie:
1 - przeciętne,
2 - istotne;
3 - ważne.
Ocena opakowania |
Ocena 1-5 pkt |
Współczynnik wagowy |
Iloczyn 2x3 |
1 |
2 |
3 |
4 |
Forma konstrukcyjna |
4 |
3 |
12 |
Dogodność manipulacyjna |
5 |
3 |
15 |
Informacyjność |
5 |
2 |
10 |
Estetyka |
3 |
3 |
9 |
Jakość wykonania |
5 |
2 |
10 |
Suma |
13 |
56 |
|
Wskaźnik jakości (iloraz wartości z kolumny 4 i 3) X = 56/13 = 4,31 |
Metody skalowania
Skale oceny sensorycznej zaliczają się do skal szacunkowych, które dzielą się na dyskretne (skale kategorii) - skala ma wydzielone kategorie ( punkty, poziomy) i ciągłe (skale liniowe) - najczęściej pokazane tylko punkty krańcowe, oznaczające minimalne i maksymalne natężenie badanej cechy. Używane są także skale z zaznaczonymi punktami pośrednimi.
Skale ciągłe chętniej wykorzystywane są w badaniach laboratoryjnych natomiast skale z wydzielonymi wartościami pośrednimi - w badaniach konsumenckich.
Skale dyskretne
Zadaniem oceniającego pracującego na tych skalach jest zakwalifikowanie danej cechy do określonej kategorii intensywności wrażenia. Skale kategorii zwane są także skalami werbalnymi lub skalami numerycznymi, gdyż uporządkowanemu zbiorowi kategorii (określeń słownych) przypisuje się określone liczby. Inne spotykane określenia to skale liczbowe, używane na określenie skali z zaznaczonymi stopniami, np. od 0 do 8 lub od, 1 do 9, ale bez określeń słownych.
Spotykane jest jeszcze inne pojęcie: skale punktowe. Poszczególne kategorie tworzą skalę o kierunku, słaby - silny, podzieloną na równe części przez zaznaczenie stopni. Można także powiedzieć, interpretując wyniki, że produkt otrzymał punkty, odpowiadające danej kategorii.
Przykłady skal podane są w tabeli 1.
W kolumnie pierwszej znajduje się skala z punktami ujemnymi, zerem i punktami dodatnimi, w drugiej - skala zaczyna się od zera, w trzeciej i czwartej - skale zaczynają się od jedynki.
Częściej ze względu na późniejszą analizę danych, używa się skal zaczynających się od jedynki.
W kolumnie czwartej poszczególne stopnie zawarte są między 1 a 5. Ten typ skali jest wykorzystywany w ocenie pięciopunktowej.
Można używać skal liczbowych innych, niekoniecznie dziewięciostopniowych; np. trzech kategorii intensywności wrażenia podanych w kolumnie piątej (żadna, umiarkowana, skrajnie silna). Wtedy zarówno oceniana cecha, jak i pozostałe cechy tego samego produktu mają tylko trzy poziomy i można im przypisać wartości liczbowe 0,1,2 lub 1,2,3 lub -1, 0, 1.
Jeżeli oceniana cecha ma tylko trzy poziomy, a dla pozostałych cech można wyróżnić dziewięć poziomów, to poszczególnym kategoriom tej cechy należy przypisać wartości liczbowe 1,5,9 (kolumna trzecia) lub 1,3,5 (kolumna czwarta) a pozostałe cechy ocenić na pełnej 9- punktowej skali.
Tab.1. Przykłady liczbowych i werbalnych skal kategorii
Kategorie intensywności wrażenia |
|||||||
liczbowe |
werbalne |
||||||
-4 |
0 |
1 |
1,0 |
żadna |
żadna |
żadna |
żadna |
-3 |
1 |
2 |
1,5 |
|
|
b. słaba |
b. słaba |
-2 |
2 |
3 |
2,0 |
|
słaba |
słaba |
słaba |
-1 |
3 |
4 |
2,5 |
|
|
|
umiarkowanie słaba |
0 |
4 |
5 |
3,0 |
umiarkowana |
umiarkowana |
umiarkowana |
umiarkowana |
1 |
5 |
6 |
3,5 |
|
|
|
umiarkowanie silna |
2 |
6 |
7 |
4,0 |
|
silna |
silna |
silna |
3 |
7 |
8 |
4,5 |
|
|
b. silna |
b. silna |
4 |
8 |
9 |
5,0 |
skrajnie silna |
skrajnie silna |
skrajnie silna |
skrajnie silna |
Liczba używanych kategorii zależy od liczby wyróżnionych poziomów dla danej cechy. Najczęściej spotyka się ocenę przeprowadzoną na skalach 3-, 5-, 7-, i 9-punktowych.
Rozszerzenie skali powoduje zwykle wzrost mocy dyskryminacyjnej ( zdolności rozróżniania obiektów). Jednak rzadko spotyka się ocenę prowadzoną na liczbie poziomów większej od dziewięciu. Zasadniczo z dwóch powodów. Przede wszystkim bardzo trudno wyróżnić większą liczbę poziomów niż 9, a poza tym większa liczba kategorii prowadzi do większego rozrzutu, co obniża możliwość rozróżnienia ocenianych obiektów.
Liczba wyróżnionych kategorii powinna odpowiadać z jednej strony rzeczywistym poziomom ocenianej cechy, z drugiej zaś - możliwościom percepcji tych poziomów przez osoby wykonujące ocenę.
Oprócz tego bardzo łatwo rozszerzać skale liczbowa, o wiele trudniej skale werbalną, gdzie każdy stopień (punkt) skali musi mieć swoje własne, precyzyjne określenie, odrębne od sąsiednich.
Przyczyną znacznego rozrzutu wyników mogą być czynniki zakłócające ocenę np. efekt grupy, efekt kontrastu, błąd tendencji centralnej, wpływ sugestii, wpływ poziomu motywacji, błąd przyzwyczajenia, błąd oczekiwania, błąd dodatniej lub ujemnej łagodności.
Ocena z udziałem bardzo doświadczonych oceniających, ekspertów, nie gwarantuje wysokiej powtarzalności wyników. Osoba biorąca udział w ocenia, jakkolwiek starannie przygotowana, szkolona nie jest maszyną oceniającą. Oceniając cechę danego produktu, mimowolnie odnosi się ja do oceny ogólnej produktu. Jeżeli produkt oceniającemu odpowiada (np. jest smaczny), to i oceniana cecha produktu jest oceniana czasami wyżej niż na to w rzeczywistości zasługuje. Jeśli nie odpowiada, jest oceniana niżej. Ten błąd nosi nazwę błędu dodatniej lub ujemnej łagodności. Skutki błędu można ograniczyć przez stosowanie skal niezrównoważonych.
Podane w tabeli 1 skale werbalne są skalami zrównoważonymi: mają taką samą liczbę poziomów dodatnich i ujemnych, z rozdzielającym je centralnym punktem neutralnym - poziomem umiarkowanym. Skala niezrównoważona ma bardziej rozbudowaną część ujemną a mniej dodatnią lub odwrotnie.
Skale ciągłe
Skale liniowe (zwane też skalami graficznymi) są odcinkiem prostej, z nieoznaczonymi lub oznaczonymi krańcami skali oraz z odstępami od krańców po około 1,5 cm.
Jeżeli odcinek ma krańce oznaczone to może być podzielony na pewną liczbę równych części, jeśli nie - to może mieć zaznaczony tylko środek skali jako punkt równowagi lub umiarkowanej intensywności.
Ponadto skale liniowe mogą być jedno- lub dwubiegunowe, strukturowane lub niestrukturowane
Przyjmuje się, że długość linii nie powinna być mniejsza od 100 a większa od 200mm. Najczęściej używa się skal o długości 100 - 150 mm.
Skale zbyt krótkie nie zapewniają zróżnicowania próbek, natomiast skale zbyt długie także nie dają dobrego zróżnicowania. W pierwszym przypadku oceniający nie ma miejsca na wyrażenie swoich odczuć, w drugim - oceniający wykazują wyraźną tendencję do wykorzystywania tylko części skali.
Oceniający wyraża swoja ocenę o badanej próbce przez postawienie kreski na linii; wynikiem jest wyrażona w milimetrach długość powstałego odcinka od lewej strony skali do zaznaczonego punktu.
Przykłady skal przedstawiają poniższe rysunki:
Rys. 1. Skala niestrukturowana z nieoznaczonymi krańcami.
Rys. 2. Skala niestrukturowana z oznaczonymi: początkiem i końcem.
Rys. 3. Skala niestrukturowana z oznaczonymi krańcami.
Rys. 4. Skala z punktem środkowym i nieoznaczonymi krańcami.
Rys. 5. Skala strukturowana jednobiegunowa.
Rys. 6. Skala strukturowana dwubiegunowa z punktem środkowym.
Rys. 7. Skala strukturowana dwubiegunowa z punktem środkowym (który oznacza jakość
idealną).
Oprócz skal liniowych i skal kategorii można spotkać hybrydy w postaci przedstawionej na rys.8. Ocenę na tych skalach można traktować albo jako ocenę na skali kategorii (wtedy wynik podaje się w punktach), albo jako ocenę na skali liniowej (z wynikiem podanym w milimetrach).
Rys. 8. Hybryda powstała z połączenia skali liniowej ze skalą kategorii.
6