Artyku -pomiar, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY


Dane i ich pomiar

Wstęp

Niejednokrotnie można zauważyć w pracach badawczych pomyłki związane z niezrozumieniem charakteru dobranych zmiennych. W podręcznikach z zakresu badań ilościowych (np. statystyki, ekonometrii, badań operacyjnych) tego typu problematyka jest najczęściej pobieżnie omawiana we wstępie lub w pierwszym, ogólnym rozdziale.

Celem niniejszego opracowania jest zwrócenie uwagi na istnienie tych podstawowych zagadnień oraz próba uporządkowania problemów związanych z różnorodnością dostępnych danych. Poruszane tematy będą obrazowane prostymi przykładami.

Kierując się merytorycznymi kryteriami do modelu pobierane są następujące zmienne objaśniające (na podstawie monografii [1]):

  1. Pozostające w pewnym związku merytorycznym ze zmiennymi endogenicznymi modelu.

  2. Dobrze reprezentujące różne aspekty badanego odcinka rzeczywistości.

  3. Wyrażone przede wszystkim jednostkach naturalnych.

  4. Wykorzystywane poprzednio w podobnych badaniach.

  5. Których wartości są wiarygodne i łatwo dostępne.

Po dokonaniu wyboru zbioru zmiennych na podstawie przesłanek merytorycznych stosowane są kryteria formalno-statystyczne. Należy podkreślić, że przedmiotem zainteresowania nie będą konkretne procedury doboru zmiennych do modelu, ich weryfikacja merytoryczna i formalno-statystyczna.

Do wyżej wymienionych postulatów trzeba dodać wymaganie, by wszystkie wyróżnione zmienne można było ująć w modelu. Ten wymóg nie jest zwykle jawnie definiowany. Badacz bowiem często dobierając zestaw zmiennych „kandydatek”, zdając sobie sprawę z istniejących ograniczeń, pomija te aspekty rzeczywistości, których nie może ująć w modelu.

Przedmiotem zainteresowania w niniejszej pracy będą tego typu problem leżące bliżej samej natury badanych zjawisk, związane z występowaniem cech jakościowych. Celem pracy jest - powtórzmy - zwrócenie uwagi na często pomijaną problematykę związaną z pojawieniem się w badaniach zmiennych różnych typów, a w szczególności zmiennych jakościowych.

Transformacja cecha - zmienna

Pojęcia „cecha” oraz „zmienna” niejednokrotnie są traktowane jako synonimy i przez to używane zamiennie. Należy jednak pamiętać, że cecha jest pojęciem pierwotniejszym, dodajmy, że każdą cechę można opisać za pomocą wielu, różnego rodzaju zmiennych. Można stwierdzić, że „zmienna” jest liczbowym odzwierciedleniem „cechy”. Postępowanie prowadzące do przypisania wartości liczbowych cechom nosi nazwę kwantyfikacji i tyle różnych zmiennych można otrzymać ile można zaproponować procedur kwantyfikacji.

Przykład #1

Niech cechą będzie odległość między powierzchnią ziemi a dachem budynku mieszkalnego. W zależności od przyjętych jednostek otrzymuje się różne produkty kwantyfikacji cechy D. Jeśli odległość jest mierzona w metrach, to wtedy otrzymujemy wartość 0x01 graphic
tej zmiennej wynoszącą na przykład 0x01 graphic
, gdzie F jest daną funkcją pomiarową. Dla innych funkcji wartość zmiennej może wynosić:

0x01 graphic
jeśli odległość jest obliczana w jardach.

0x01 graphic
jeśli wysokość jest szacowana „na oko”.

0x01 graphic
jeśli odległość jest obliczana w liczbie pięter. #

Proces kwantyfikacja cechy D przebiega w następujący sposób [2]:

0x01 graphic
(1)
Jest to zbiór stanów cechy D rozróżnialnych przez metodę badawczą oznaczoną symbolem s. Metoda s rozróżnia r stanów.

0x01 graphic
(2)


taki, że

0x01 graphic
(3)

gdzie F jest funkcja pomiarową.

Należy mieć świadomość, że wyniki procesu kwantyfikacji nawet dla charakterystyk dobrze znanych mogą być powodem nieporozumień. Co więcej, zależności między wynikami mogą nie mieć charakteru liniowego.

Przykład #2

Ustalmy uwagę na cesze0x01 graphic
, którą tutaj będzie zużycie paliwa w samochodzie. W zależności od tradycji w danym regionie świata produktem kwantyfikacji cechy 0x01 graphic
(zużycie paliwa w samochodzie) jest na przykład:

Można sobie łatwo wyobrazić sytuację, gdy podczas rozmowy pomiędzy obywatelem Polski, Stanów Zjednoczonych, Holandii, Wielkiej Brytanii oraz Francji na pytanie ile pali twój samochód padają kolejno odpowiedzi: 10, 5, 15, 20 oraz stwierdzenie „średnio”. Chcąc sprowadzić te wypowiedzi do porównywalności musimy dokonać kilku przekształceń, przy czym zostawimy na boku odpowiedź 20, gdyż dodatkowo musielibyśmy znać cenę benzyny w Wielkiej Brytanii oraz przeciętną liczbę przejechanych kilometrów; zostawimy również na marginesie wypowiedź obywatela Francji, gdyż musielibyśmy zdefiniować co oznacza termin „średnio”.

Przekształcenie między zmiennymi 0x01 graphic
a 0x01 graphic
jest stosunkowo proste, gdyż znając zależności:

1 galon = 3,786 litrów oraz

1 mila = 1,609 kilometrów

można zapisać, że

0x01 graphic

Tak więc samochód, który spala 5 galonów na 100 mil, po przekształceniu jednostek, spala 11,76 litrów na 100 kilometrów.

Zamiana liczb uzyskanych za pomocą funkcji 0x01 graphic
oraz 0x01 graphic
nie jest już taka prosta, gdyż nie mamy tutaj do czynienia z funkcjami liniowymi lecz z funkcją hiperboliczną:

0x01 graphic

Samochód, który przejeżdża na jednym litrze 15 kilometrów spala „w rzeczywistości” 6,67 litrów na 100 kilometrów przejechanej drogi.#

Bezpośrednio z zagadnieniami transformacji cech do zmiennych wiąże się tematyka teorii pomiaru.

Elementy teorii pomiaru

U postaw stosowania wszelkiego typu metod ilościowych leży problematyka pomiaru. Pomiar jest to proces empiryczny polegający na przyporządkowaniu wartości liczbowych kategoriom jakościowym, za pomocą których opisuje się badany obiekt lub zjawisko. W procesie pomiaru występują dwa systemy relacyjne, a mianowicie:

Pomiarem jest tylko taki proces przyporządkowania wartości liczbowych obiektom, albo powtórzeniom zjawiska, który zapewnia izomorfizm obu systemów relacyjnych. Relacje między liczbami generowanymi w procesie pomiaru muszą odpowiadać relacjom między elementami obiektowego systemu relacyjnego. Oznacza to między innymi, że:

W teorii pomiaru wyróżnia się dodatkowo kilka rodzajów pomiaru. Mamy do czynienia z pomiarem bezpośrednim (podstawowym), pośrednim (pochodnym) bądź pomiarem umownym (wskaźnikowym).

  1. Pomiar podstawowy (bezpośredni). Jest to taki pomiar, w którym natężenie mierzonej cechy obiektu lub zjawiska określa się poprzez bezpośrednie porównanie ze wzorcem, czyli przedmiotem reprezentującym (posiadającym, zawierającym) określone natężenie cechy. Typowym przykładem takiego pomiaru jest pomiar długości.

  2. Pomiar pochodny (pośredni). Jest to pomiar, który wykorzystuje matematyczny (formalny, logiczny) model związków pomiędzy zjawiskami. Znając prawo dotyczące zależności między miarą podstawową, taką jak objętość cieczy (spirytusu lub rtęci) a temperaturą powszechnie stosuje się pomiar temperatury poprzez pomiar wysokości słupka rtęci (spirytusu).

  3. Pomiar umowny (wskaźnikowy). Jest to pomiar, który wykorzystuje przypuszczalne zależności między obserwacjami (doświadczeniem) a badanymi cechami. Pomimo „tylko” hipotetycznego związku między relacją między obiektami a relacją między liczbami pomiar umowny ma duże zastosowanie w praktyce. Przykładem takiego pomiaru może być ocena stanu gospodarki na podstawie wybranych wskaźników, czy też ocena w indeksie studenta na podstawie założenia zależności, że wiadomości, wiedza i umiejętności są ściśle związane z liczbą dobrych odpowiedzi podczas testu.

We współczesnej teorii pomiaru rozróżnia się cztery główne poziomy pomiary, co za tym idzie cztery typy skal pomiarowych, a mianowicie:

Skala nominalna

Jest to skala najbardziej elementarna. Jest stosowana wówczas, gdy zastosowana metoda badania pozwala jedynie rozpoznawać obiekty jednakowe i różne, bez wypowiadania się na temat preferencji w zbiorze kategorii jakościowych (bez wypowiadania, który z tych elementów jest lepszy). Otrzymuje się pomiary na tej skali poprzez przyporządkowanie obiektom (zjawiskom, przedmiotom) liczb oznaczających ich przynależność do rozłącznych kategorii. Kategorie te nie wyznaczają żadnych wielkości, nie mają naturalnego uporządkowania. Należy dodać, że zamiast liczb można używać określeń słownych.

Do korzystania ze skal nominalnych wystarczy rozróżnienie, czy badane obiekty są pod względem badanej cechy jednorodne i jeśli tak, to należy je zaliczyć do tej samej kategorii (grupy). Mamy bowiem:

0x01 graphic
(4)

0x01 graphic
(5)

gdzie:

F - funkcja pomiarowa, czyli funkcja która przyporządkowuje wartości liczbowe badanym obiektom,

D - cecha,

O - badany obiekt,

~ - funkcja nierozróżnialności,

0x01 graphic
- funkcja rozróżnialności.

Wzory (4) oraz (5) można interpretować w następujący sposób:

Po określeniu różnych kategorii ustala się liczebność każdej poprzez zliczania obiektów należących do każdej z klas. Liczenie to jest oparte na następujących aksjomatach:

  1. albo 0x01 graphic
    albo 0x01 graphic

  2. jeśli 0x01 graphic
    , to 0x01 graphic

  3. jeśli 0x01 graphic
    i 0x01 graphic
    , to 0x01 graphic

Pomiar na skali nominalnej jest tylko liczbowym etykietowaniem (nadawaniem symboli) badanych obiektów (powtórzeń zjawiska). Jest to bardzo słaba skala pomiarowa, gdyż liczba transformacji zbioru przyjętych wartości liczbowych (etykiet) jest praktycznie nieograniczona.

Dopuszczalnymi statystykami i testami istotności są [3]: liczebności, proporcje, procenty, modalna, współczynniki korelacji 0x01 graphic
, test 0x01 graphic
.

Przykładami skal nominalnych są klasyfikacje dwudzielne i wielodzielne. Podział zbiorowości ludzkiej ze względu na płeć, grupę krwi, pochodzenie społeczne. Dla cechy „kolor oczu” rezultatem pomiaru na skali nominalnej może być stwierdzenie: 0x01 graphic
osób ma oczy zielone, 0x01 graphic
osób ma oczy brązowe, 0x01 graphic
osób ma oczy niebieskie, natomiast 0x01 graphic
osób ma inny kolor oczu.

Skala porządkowa (rangowa)

Skala porządkowa, zwana również skalą rangową posiada wszystkie właściwości skali nominalnej, a dodatkowo wprowadza relację porządku (preferencji) w zbiorze kategorii, którym przyporządkowane są wartości liczbowe. W tej skali przyporządkowane liczby obiektom nie tylko wskazują na przynależność do zbioru (równość lub nierówność) ale także ich uporządkowanie ze względu na analizowaną cechę. Oprócz właściwości zapisanych we wzorach (4) i (5) mamy:

0x01 graphic
(6)

lub

0x01 graphic
(7)

gdzie D, F oraz O mają takie same znaczenie jak poprzednio.

Wzór (6) odpowiada sytuacji, gdy obiektowi 0x01 graphic
wyżej ocenianemu ze względu na cechę D odpowiada większa liczba 0x01 graphic
niż obiektowi 0x01 graphic
ocenianemu niżej. Z inną, odwrotną konwencja mamy do czynienia w przypadku wzoru (7) tam bowiem obiektowi wyżej ocenianemu przypisuje się mniejszą liczbę. Typowym przykładem zastosowania skali rangowej i implikacji (6) jest skala ocen szkolnych. Lepiej oceniany obiekt (uczeń) otrzymuje wyższy stopień szkolny, większą liczbę. Wielostopniowe odpowiedzi w kwestionariuszach również najczęściej są zbudowane w ten sposób, by najbardziej preferowanemu stanowi obiektu przypisuje się najwyższą liczbę. Odwrotna konwencja - opisana wzorem (7) - jest przyjęta w wielu sportach, na przykład w regatach żeglarskich zawodnik, który był pierwszy na mecie otrzymuje jeden punkt, zawodnik drugi - dwa punkty itd.

Ustalmy uwagę na sytuacji opisanej wzorem (6). Jeśli obiekt 0x01 graphic
jest oznaczony większą liczbą niż obiekt 0x01 graphic
, to wiadomo tyle, że obiekt 0x01 graphic
jest lepszy od drugiego obiektu pod względem badanej cechy D. Należy pamiętać jednak, że nie posługujemy się określoną jednostką miary i - w konsekwencji - nie wiemy o ile dany obiekt przewyższa drugi bowiem w operacjach pomiarowych na skali porządkowej nie ma niczego, co by pozwalało na takie stwierdzenie.

Do trzech aksjomatów zdefiniowanych dla skali nominalnej można teraz dołączyć następne:

  1. nieprawda, że 0x01 graphic

  2. jeśli 0x01 graphic
    , to bądź0x01 graphic
    , bądź 0x01 graphic

  3. jeżeli 0x01 graphic
    i 0x01 graphic
    , to 0x01 graphic

Skala porządkowa jest skalą mocniejszą niż skala nominalna. Przekazuje ona badaczowi więcej informacji, mówi bowiem ona o uszeregowaniu według nasilenia mierzonej cechy. Jej główną wadą jest niemożność określenia wielkości różnicy między poszczególnymi mierzonymi obiektami. Należy dodać, że liczba dozwolonych transformacji pierwotnie przyporządkowanych liczb jest tu mniejsza niż przy wykorzystaniu skali nominalnej, przekształcenia zbioru liczb nie mogą bowiem burzyć relacji (6) oraz (7), czyli izomorfizmu między obiektowym systemem relacyjnym i liczbowym systemem relacyjnym.

Dopuszczalnymi statystykami i testami obok wymienionych przy skali nominalnej są: mediana, centyle, decyle, kwadryle, współczynniki korelacji 0x01 graphic
 Spearmana i Kendalla oraz testy nieparametryczne takie jak Manna-Whitneya i Smirnowa-Kołmogorowa.

Dodajmy, że skala nominalna i skala przedziałowa są nazywane skalami słabymi.

Skala przedziałowa (interwałowa)

Skala przedziałowa zachowuje wszystkie właściwości skali porządkowej, a dodatkowo jest wyposażona w stałą jednostkę miary i umowne zero. Często nie wystarcza ustalenie, że obiekt 0x01 graphic
jest mniejszy, równy czy większy od obiektu 0x01 graphic
, lecz interesuje badacza wielkość różnicy pomiędzy tymi obiektami. Skala interwałowa ma taką własność, że równym różnicom w natężeniu występowania danej cechy odpowiadają równe różnice między przyporządkowanymi im liczbami. Jak zaznaczono wcześniej skale przedziałowe posiadają równe jednostki miary lecz są to jednostki dowolne; nie wiadomo jaka jest absolutna wartość poszczególnych punktów skali, gdyż nie jest znane absolutne zero. Jest to skala mocniejsza od skali rangowej, jest możliwy pomiar odległości na tej skali. Zakres dopuszczalnych transformacji liczb jest ograniczony do przekształceń liniowych.

0x01 graphic
(8)

gdzie x jest pierwotnym wynikiem pomiaru, natomiast x' jest wynikiem tego samego pomiaru po transformacji; dodajmy, że formuła ta nie burzy izomorfizmu przy założeniu b > 0.

Skale przedziałowe dodatkowo spełniają następujące aksjomaty:

  1. 0x01 graphic

  2. 0x01 graphic

  3. jeżeli 0x01 graphic
    i 0x01 graphic
    , to 0x01 graphic

  4. jeżeli 0x01 graphic
    i 0x01 graphic
    , to 0x01 graphic

Dopuszczalnymi statystykami i testami na tej skali są dodatkowo: średnia arytmetyczna, wariancja i odchylenie standardowe, współczynnik korelacji r Pearsona, test t oraz inne testy parametryczne.

Przykładem pomiarów na tej skali jest czas kalendarzowy, bilans handlowy firmy.

Wadą skali przedziałowej jest to, że nie można jej wykorzystać do badania stosunku dwóch obiektów ze względu na określoną cechę.

Skala ilorazowa (stosunkowa)

Skala ta zachowuje wszystkie właściwości skali przedziałowej a dodatkowo jest wyposażona w absolutne (bezwzględne) zero. Ten naturalny (nie umowny) punkt zerowy, ograniczający jednostronnie (lewostronnie) zakres skali oznacza stan zupełnego braku natężenia badanej cechy.

Skala ilorazowa jest skalą silniejszą od skali przedziałowej. Zakres dopuszczalnych transformacji jest ograniczony do przekształceń liniowych postaci

0x01 graphic
(9)

gdzie b > 0, bowiem tylko takie przekształcenia nie niszczą izomorfizmu między obiektowym i liczbowym systemem operacyjnym.

Skale przedziałowa i ilorazowa noszą ogólną nazwę skal silnych. Różnice między nimi przedstawia przykład 3.

Przykład #3

Czy można powiedzieć, że ciało 0x01 graphic
, które ma temperaturę 0x01 graphic
(stopni Celsjusza) jest dwa razy cieplejsze od ciała 0x01 graphic
, które ma temperaturę 0x01 graphic
?

Operując na skali przedziałowej, a na tej skali operuje skala termometryczna Celsjusza, bez absolutnego zera nie mamy podstaw do twierdzenia, że temperatura 0x01 graphic
jest dwa razy wyższa niż temperatura 0x01 graphic
. Przejście na skalę silniejszą, ilorazową, posiadającą bezwzględne zero pozwala na obliczenie ile razy ciało 0x01 graphic
jest cieplejsze od ciała 0x01 graphic
. Taką skalą termometryczną jest skala Kelvina. Wykorzystując znaną zależność

0x01 graphic

możemy obliczyć

0x01 graphic

Można odpowiedzieć, że ciało 0x01 graphic
o temperaturze 0x01 graphic
jest tylko 1,052 razy (czyli o 5,2%) cieplejsze od ciała 0x01 graphic
, którego temperatura wynosi 0x01 graphic
.#

Problemy związane z pomiarem

Przedstawione powyżej rozważania dotyczące skal pomiaru oraz kwantyfikacji cech wymagają komentarza.

Przede wszystkim należy stwierdzić, że przyjęty w punkcie 1.3 podział skal na cztery kategorie nie jest wszędzie akceptowany. Kontrowersje budzi przyjęcie pomiaru nominalnego i - w konsekwencji - wyodrębnienie specjalnej skali nominalnej. Niekiedy skala nominalna nie jest traktowana jako skala pomiarowa. Takie podejście powoduje jawny podział zmiennych (cech) na mierzalne (ilościowe) oraz niemierzalne (jakościowe). Do grupy zmiennych ilościowych zaliczane są pomiary dokonywane na skali porządkowej, przedziałowej i ilorazowej, natomiast wyniki uzyskane na „nieistniejącej” skali nominalnej nie są traktowane jako pomiar. Jak wspomniano powyżej, cechy jakościowe są to najczęściej cechy niewymierne, których nie można wyrazić liczbą, a tylko nazwą. W analizach ilościowych pojawienie się danych ze skali nominalnej powoduje „kłopoty” obliczeniowe ponieważ skala nominalna dyskryminuje zbiór obiektów na oddzielne, nieporównywalne kategorie. W przypadku występowania kilku cech mierzonych na skali nominalnej mamy do czynienie z iloczynem możliwych stanów każdej zmiennej.

Przykład #4

Prześledźmy na przykład wyniki masowego biegu ulicznego na dystansie 2000 metrów. Pierwsza, główna (open) klasyfikacja zawodników jest uszeregowaniem od osoby, która przybiegła do mety pierwsza do osoby, która była ostatnia. Uwzględniając jednak cechę płeć, gdyż trudno porównywać osiągnięcia sportowe kobiet i mężczyzn, otrzymujemy trzy klasyfikacje, a mianowicie:

0x01 graphic
- klasyfikacja ogólna (open),

0x01 graphic
- klasyfikacja kobiet,

0x01 graphic
- klasyfikacja mężczyzn,

przy czym często w rzeczywistości ta ostatnia klasyfikacja jest pomijana, gdyż osiągnięcia mężczyzn dominują nad wynikami kobiet.

Biorąc pod uwagę następną cechę jakościową, jaką jest wiek uczestników otrzymujemy dodatkowo kilka klasyfikacji, mamy bowiem zmienną wiek, o zastępujących realizacjach:

0x01 graphic

gdzie:

0x01 graphic
oznacza dzieci (do 13 roku życia),

0x01 graphic
oznacza juniorów (do 18 roku życia),

0x01 graphic
oznacza seniorów,

0x01 graphic
oznacza prawdziwych seniorów, czyli oldbojów powyżej 50 lat.

W takiej sytuacji otrzymujemy 9 kategorii, na przykład klasyfikacja 0x01 graphic
może oznaczać kolejność wśród kobiet juniorek. Jeśli dodatkowo zostanie wykorzystana zmienna miejsce pochodzenia o następującym zbiorze wartości:

0x01 graphic
- mieszkaniec miejscowości, w której odbyły się zawody,

0x01 graphic
- zawodnik pochodzący z Polski,

0x01 graphic
- zawodnik zagraniczny,

to liczba różnych klasyfikacji wzrasta do 25.

Należy dodać, że liczbę zmiennych rozdzielających można jeszcze zwiększyć poprzez na przykład dodanie kilku innych kategorii wiekowych czy też uwzględnienia zawodników sprawnych inaczej.#

Można się również spotkać z poglądem, że rozróżnienie między cechami ilościowymi i jakościowymi ma charakter względny i nie przesądza o mierzalności czy niemierzalności cech. Możliwości mierzenia zależą od tego, czy posiadamy odpowiednią metodę pomiaru. Kilkanaście lat temu pomiar inteligencji był niemożliwy, był podawany jako przykład cechy jakościowej, natomiast obecnie pomiar ten jest uznawany jako dokonywany na skali silnej.

Przy omawianiu różnych skal pomiaru należy również zwrócić uwagę, że niekiedy w publikacjach pojawia się dodatkowa skala pomiaru nosząca nazwę „absolutna”. Wyniki pomiarów na tej skali uzyskuje się przez zliczenie obiektów, albo powtórzeń zjawiska. Jest to skala o największej mocy, albowiem zbiór dopuszczalnych przekształceń jest zbiorem pustym. Każda transformacja uzyskanego wyniku pomiaru niszczy izomorfizm między obiektowym i liczbowym systemem relacyjnym.

Operując na rzeczywistych danych bardzo często można zauważyć nieświadome (albo świadome) zwiększanie mocy skali pomiaru; zjawisko to występuje najczęściej wtedy, gdy mamy do czynienia z pomiarami wykonywanymi na skalach słabych. Szczególnie często widać nadużywanie operacji arytmetycznych na wynikach pomiaru, dla których wyniki tych operacji nie mają interpretacji.

Przykład #5

Podczas przygotowania badań ankietowych określono możliwe stany badanej zmiennej jakościowej wykształcenie i przypisano odpowiednim kategoriom oznaczenie słowne i liczbowe (kategoria - liczbowe 1). Dane przedstawiono w tablicy 1.1.

Tablica 1. Wykształcenie

Oznaczenie liczbowe kategorii

Liczba

elementów

słownie

1

2

3

Niepełne podstawowe

1

-3

100

11

Podstawowe

2

-2

10

98

Niepełne średnie

3

-1

5

78

Średnie

4

1

3

77

Niepełne wyższe

5

2

2

34

Wyższe

6

3

1

23

W wyniku ankiety otrzymano podział populacji (321 obiekty) ze względu na wykształcenie przedstawiony w ostatniej kolumnie tablicy 1.1. Następnie obliczono sumę iloczynu kategorii liczbowej razy liczba elementów oraz wyznaczono wartości średnie.

Tablica 2

Kategoria

Suma

Średnia

liczbowe 1

1057

3,29

liczbowe 2

-93

-0,29

liczbowe 3

2792

8,70

Na podstawie badań stwierdzono, że społeczeństwo jest średnio wykształcone na poziomie 3,29.

Przypomnijmy, że liczby oznaczające kategorie w powyższej tablicy są tylko etykietami i nie mają sensu obliczenia średniej arytmetycznej. W powyższej tablicy obok kategorii liczbowe 1 pokazano etykiety nazwane liczbowe 2 oraz liczbowe 3. Dla nich również obliczono wartości średnie (tablica 1.2) i można równie dobrze powiedzieć, że społeczeństwo jest średnio wykształcone na poziomie -0,29, czy też 8,7. #

Należy pamiętać, że jeśli nawet zostaną przeprowadzone działania arytmetyczne niedopuszczalne dla danej skali, to z wyników tak osiągniętych nie wolno wyciągać wniosków wykraczających poza dopuszczalne dla danej skali interpretacje.

Przykład #6

W Polsce wartość średniej arytmetycznej z ocen jest powszechnie używaną miarą wykształcenia studenta. W zależności od wartości tej miary student otrzymuje odpowiednie świadczenie (stypendium), ma możliwość wyboru kierunku studiów, czy też wartość ta ma znaczący wpływ na końcową ocenę na dyplomie ukończenia studiów. Znaczenie tej miary - ze względu na różne możliwe korzyści - wzrasta z roku na rok i co gorsze mało kto zdaje sobie sprawę, że średnia z ocen w indeksie nie ma właściwie żadnej rozsądnej interpretacji. Przypomnijmy, że oceny szkolne są to pomiary wykonywane w skali porządkowej, a na tej skali obliczanie średniej arytmetycznej z rang nie ma większego sensu. Owszem, możemy obliczyć średnią rangę dla kilku obiektów, ale na podstawie możemy wnioskować co najwyżej, że jedna średnia ranga jest większa, mniejsza lub taka sama jak inna średnia ranga. Na tylko takie twierdzenia upoważnia nas skala porządkowa, w której dokonano pomiarów.

Wykorzystując „mechanicznie” wartość średniej arytmetycznej z ocen można dojść do wniosków niezgodnych ze zdrowym rozsądkiem. W tablicy 1.3 przedstawiono wyniki uzyskane przez trzech studentów w sesji składającej się z czterech egzaminów.

Tablica 3. Oceny uzyskane w trakcie sesji

Egzamin

Średnia

Student

A

B

C

D

Jan Kowalski

4,5

5

3,5

3,5

4,1

Ewa Kowalska

4

4

4

4

4,0

Marek Kowalski

5

5

5

2

2

5

3,8

Analizując oceny otrzymane przez studentów można wysnuć wnioski, że najlepszym studentem jest Marek, który każdy egzamin kończy oceną „bardzo dobry”. Miarą postępów nauki studentów jest jednak średnia arytmetyczna, a ta dla Marka wynosi 3,8, czyli najmniej wśród badanych studentów. W tym miejscu należałoby skorzystać z dodatkowych informacji by zidentyfikować przyczyny, przez które Marek musiał zdawać egzamin komisyjny z przedmiotu D.

Należy dodać, że w wielu krajach używa się ocen A, B, C, D oraz E. Takie podejście - w wypadku konieczności obliczenia średniej oceny - wymaga jawnego przyporządkowania symbolom liczb i postępowanie to przynajmniej ostrzega o „nadużyciach” formalnych. #

Innym problemem pojawiającym się podczas procesu pomiaru, czy też podczas analizy danych są trudności z zakwalifikowaniem uzyskanych danych do odpowiedniej skali pomiarowej. Niekiedy badacz otrzymuje liczby „etykiety” zamiast rzeczywistych, mierzalnych wyników pomiaru. Trudności pojawiają się często przy interpretacji czy dane są mierzone na skali porządkowej, czy też na skali przedziałowej. Typowym przykładem tutaj są testy w dydaktyce. Test w istocie jest pomiarem na skali porządkowej (nie ma podstaw do twierdzenia, że jednostki na tej skali są sobie równe), nie zmienia to jednak faktu, że wszędzie w praktyce jest traktowany jako pomiar na skali przedziałowej. Jeżeli jednak założymy w tym przypadku pomiar interwałowy, to przynajmniej powinniśmy bardzo ostrożnie interpretować wyniki uzyskane na podstawie przekształceń dozwolonych dla skali przedziałowej.

Osobnym problemem jest zagadnienie zmiany skali pomiarowej. Mamy tutaj dwa możliwe przypadki, a mianowicie:

Przejście ze skali silniejszej do skali słabszej jest najczęściej wykonywane wtedy, gdy chcemy uzyskać bardziej przejrzysty obraz analizowanych danych i godzimy się na utratę informacji o badanych obiektach. Innym powodem może być sytuacja polegająca na tym, że posiadamy aparat pomiarowy pozwalający mierzyć natężenie cechy na skali silnej, a charakter badania nie potrzebuje (wymaga) takiej skali. Przy tego typu działaniach często wykorzystywana jest dodatkowa zmienna „jakościowa” za pomocą której dokonuje się redukcji skali. Przykładem stosowania słabszej skali pomiaru tam, gdzie są dostępne informacje z silniejszej skali jest zapis w starym dowodzie osobistym dotyczący wzrostu. Mieliśmy mianowicie w dowodzie zapisy w skali rangowej „niski”, średni” oraz „wysoki”, a bez większych problemów (kosztów) można by wpisywać tam dane mierzone na skali silnej podane w centymetrach.

Należy dodać, że niekiedy powodem zmiany (redukcji) skali pomiaru jest pragnienie sprowadzenia danych do porównywalności.

Przejście w drugą stronę, ze skali słabszej na silniejszą jest przez wielu badaczy negowany. Nie zmienia to jednak faktu, że prace w tym kierunku są ciągle prowadzone i wielokrotnie w rzeczywistych, praktycznych badaniach można się spotkać z taką transformacją. Dobrze jeśli badacz, który dokonuje takiej zmiany przynajmniej zdaje sobie z tego sprawę, gdyż ciągle można spotkać prace, w których autorzy wykorzystują silny aparat formalno-statystyczny dla pomiarów na skalach słabych. Podczas prób zmiany skali pomiaru na silniejszą często wykorzystuje się dodatkową zmienną (referencyjną) i dzięki „pomocy” tej zmiennej przechodzi się do skali silniejszej. Należy wspomnieć, że wielokrotnie zmiana skali jest skutkiem (wynikiem) długofalowych badań na przykład preferencji konsumentów, czy też wymagań rynku.

Literatura

  1. Grabiński T., Wydymus S., Zeliaś A., Metody doboru zmiennych w modelach ekonometrycznych, Państwowe Wydawnictwo Naukowe, Warszawa, 1982.

  2. Iwasiewicz A., Zarządzanie jakością, Wydawnictwo Naukowe PWN, Warszawa-Kraków, 1999.

  3. Nowaczyk C., Podstawy metod statystycznych dla pedagogów, Państwowe Wydawnictwo Naukowe, Warszawa, 1985.

  4. Walesiak M., Pomiar w badaniach rynkowych i marketingowych, Wydawnictwo AE we Wrocławiu, Wrocław 2000.

Nie zmienia to faktu, że można znaleźć opracowania, w których wyróżnia się inną liczbę skal pomiaru.

1

15



Wyszukiwarka

Podobne podstrony:
Teoria konsumenta, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
17, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
pomoc publiczna, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
konsorcjum gospodarcze, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
Ś z integracji europejskiej, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
Logistyka, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
Egzaminu przedmiotu Normalizacja, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
Folie do tematow 1-2, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
44, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
Przykadowy egzamin, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
41, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
12, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY
modek9, Studia, STUDIA PRACE ŚCIĄGI SKRYPTY

więcej podobnych podstron