Dr hab. Marian Niezgoda
POMIAR W SOCJOLOGII
Definicje pomiaru
Definicje pomiaru:
Pomiar to przyporządkowanie natężeniu cech jakościowych wartości liczbowych. Oznacza to, że mierzenie polega na przypisywaniu liczb.
Pomiar polega na możliwości porównywania natężenia cech ze sobą, porównywaniu ze sobą obiektów.
Pomiarem jest każdy rodzaj badania, który pozwala na opis jakiejś zbiorowości ze względu na określone kryteria. W tym sensie pomiarem nazywa się np. wyniki sondażu przedwyborczego.
W jednym i drugim wypadku mamy do czynienia z sytuacją, w jakiej implicite lub explicite dokonujemy następujących czynności:
Określamy obiekty, a w zasadzie ich właściwości (cechy), jakie zamierzamy mierzyć, tj. porównywać ze sobą przy pomocy określonych zasad. Z reguły są to zmienne dyspozycyjne, postawy. To typ zmiennych ukrytych, do których możemy dotrzeć pośrednio. Warunkiem pomiaru jest istnienie continuum tzn. „rozciąganie się” zmiennej pomiędzy punktem maksymalnym i minimalnym. Zakłada to wiedzę o obiekcie pomiaru.
Określamy kryteria według których będziemy porównywać obiekty. Oznacza to w praktyce określenie co i jak będziemy ze sobą porównywać. Dodatkowo, oznacza to wybór (określenie) poziomu pomiaru, mocy skali - czy będzie to:
poziom nominalny, pozwalający nam jedynie określić to czy obiekty, ze względu na określone kryteria, są do siebie podobne, bądź różnią się;
poziom porządkowy pozwalający dodatkowo ustalić kolejność (relację wyższy - niższy, większy - mniejszy, pierwszy - kolejny itp.);
poziom interwałowy pozwalający ponadto określić odległości pomiędzy poszczególnymi pozycjami - o ile takich samych jednostek (interwałów)wyższy, większy, cieplejszy itp.;
poziom ilorazowy (stosunkowy) mający dodatkowo bezwzględne, a nie umowne zero. Pojawia się problem, z jakimi zmiennymi, mamy do czynienia w socjologii, jaki poziom pomiary zapewniają bez przyjmowania dodatkowych założeń.
Próbujemy zbudować narzędzie pomiaru, czyli skalę, uwzględniając zakładany (możliwy) poziom pomiaru.
Specyfika pomiaru w socjologii:
Staramy się mierzyć zmienne dyspozycyjne, najczęściej postawy, czyli zmienne ukryte. Dotrzeć do nich można jedynie w sposób pośredni, za pomocą wskaźników.
Specyfika zmiennych, które chcemy zmierzyć implikuje problemy trafności i rzetelności narzędzi pomiaru czyli skal.
Skala jest trafna wtedy gdy mierzy to co ma mierzyć czyli postawę „x”, a nie „y”.
Sprawdzić trafność można dokonując (a) analizy logicznej i teoretycznej badanych zjawisk, (b) zasięgając opinii sędziów, (c) stosując niezależne kryteria oceny trafności
Problem trafności to w istocie problem trafności doboru wskaźników. Ponieważ cechy, które chcemy mierzyć to zmienne ukryte, wskaźniki używane do określania pozycji na skali, to wskaźniki inferencyjne. To właśnie powoduje kłopoty - bowiem są one zjawiskami nie tożsamymi z indicatum. Gdyby były to wskaźniki definicyjne problemem byłaby jedynie poprawność definicji i relacje logiczne pomiędzy indicatum i wskaźnikiem. W wypadku wskaźników empirycznych rzeczywista siła związku empirycznego.
Skala jest rzetelna, gdy każdy kolejny pomiar w stosunku do tej samej zbiorowości (lub o identycznych cechach) daje te same rezultaty.
Sprawdzić to można (a) powtarzając pomiary, (b) stosując połówki skali w badaniach próbnych.
Powtarzanie pomiaru jest zawodne, ponieważ nasi badani w trakcie badania „uczą się” narzędzia.
Propozycje skal w socjologii
Skale szacunkowe: gdy staramy się nakłonić badanych do „oszacowania” natężenia zjawisk, cech itp. Mogą przybierać postać:
graficzną, gdy badany ma postawić znak w określonym miejscu,
słowną, gdy badany wybiera określenie typu „bardzo”, „wcale”
Skale rangowe, których istota polega na porównywaniu obiektów pomiędzy sobą, tak aby obiekty ustawić w kolejności - od najwyższych do najniższych lub odwrotnie. Można porównywać:
ustalając kolejność np. poprzez przypisanie rangi (wagi)
ustalając kolejność poprzez porównywanie obiektów ze sobą (lista obiektów musi być mała)
można także ustalać kolejność wtórnie.
Analiza skalogramowa: obowiązuje zasada kumulatywności - np. odpowiedź pozytywna na pytanie pierwsze powoduje pozytywne odpowiedzi na wszystkie pozostałe pytania.
Przykłady skal
„Skale” do oceniania pewnych faktów w kwestionariuszach typu: zdecydowanie tak, raczej tak, nie wiem, raczej nie, zdecydowanie nie. Postać werbalna, graficzna itp. Kształtowanie „profili” na zasadzie dysonansu poznawczego.
Skala Thurstone'a jako przykład skali rangowej
Lista kilkudziesięciu stwierdzeń oceniających obiekt postawy,
Sędziowie porządkujący stwierdzenia od A do K, od 1 do 11, od najmniej do najbardziej pozytywnych.
Obliczanie mediany i odchylenia kwartylowego pozwalających na wybranie stwierdzeń pokrywających całość continuum a zarazem tych, w stosunku do których sędziowie byli najbardziej zgodni.
Wybrane stwierdzenia tworzą ostateczną wersję skali. Badany ma wybrać jedno ze stwierdzeń i ono określa jego pozycję na skali.
Mediana jest operacyjną definicją ledwo dostrzegalnej różnicy, czyli najmniejszego interwału.
Rangowanie: porównywanie obiektów pomiędzy sobą, na zasadzie „każdy z każdym”.
Skala Likerta jako przykład skali zależnościowej
Lista kilkudziesięciu stwierdzeń ocenijaących obiekt postawy.
Każde stwierdzenie opatrzone jest skalą szacunkową - 5 -7 pozycyjną do „zdecydowanie się zgadzam” do „zdecydowanie się nie zgadzam”.
Krańce skali szacunkowej są odwracane w zależności od tego czy stwierdzenie ma charakter pozytywny czy negatywny.
Badani wypełniają kwestionariusze podkreślając odpowiedzi.
Wylicza się dla każdego badanego średnią ocenę dla całego kwestionariusza (suma punktów podzielona przez ilość stwierdzeń).
Oblicza się zależność pomiędzy sposobem oceniania (średnią oceną) a ocenianiem poszczególnych stwierdzeń.
Skala dystansu społecznego Bogardusa jako przykład niedoskonałego skalogramu.
Wybrano grupy etniczne, które mają być obiektem pomiaru.
Badanym zadaje się pytanie czy zgodziliby się:
aby ich dziecko (córka, syn) zawarło małżeństwo z przedstawicielem takiej grupy,
czy zgodziłby się, aby ktoś taki był jego sąsiadem
czy zgodziłby się z nim razem pracować
czy wpuściłby jako turystę do kraju
wyrzuciłby z kraju.
Oblicza się ważone odsetki odpowiedzi na te pytania dla każdej grypy etnicznej.
Różnice są wskaźnikiem dystansu społecznego.
Podstawą skalogramu jest zasada kumulatywności, która zakłada, że zgoda na małżeństwo jest także zgodą na sąsiedztwo, wspólną pracę czy pobyt turystyczny. Ostatnie pytanie u Bogardusa jest już niestety z innej skali.
Uwagi do problemu pomiaru oraz najważniejszych typów skal
Skala Thurstone'a
Liczba sędziów ok. 300. Im większa liczba sędziów tym dokładniejsze oszacowanie pozycji skali. To samo odnosi się do liczby stwierdzeń - [pwiinno ich by100.
sposób postępowania ze skala ostateczną:
podkreślenie tylko jednej odpowiedzi (właściwsze, bardzie klasyczne)
odpowiedzi na każde pytanie „zgadzam się”, „nie zgadzam się” - rozwiązanie dające możliwości dodatkowej interpretacji.
Problem co tak faktycznie oceniają sędziowie?
Czy tylko składnik emocjonalny?
Wiedzę o obiekcie postawy (składnik poznawczy)?
Czy mają taki sam system wartości, a zatem i ocen co badani? Towarzyszy ich udziałowi ukryte (przyjęte milcząco) założenie, że mamy do czynienia z:
względną homogenicznością kulturową badanych,
reprezentatywnością sędziów wobec badanych - „indeks podobieństw cech” jako sposób weryfikacji. Inny przyjęcie, że stanowią losową próbę badanych.
Czy jest to rzeczywiście skala interwałowa? Ledwo dostrzegalna różnica może być dobrą definicją operacyjną interwału. Brak tu nawet umownego zera. Stąd arbitralność decyzji o wartości poszczególnych pozycji na skali.
Stopień jednolitości skal typu Thurstone'a zależy od:
zasadności przyjmowanego założenia o reprezentatywności sędziów wobec badanej populacji,
zasadności przyjmowanego założenia o homogeniczności kulturowej badanej populacji,
spełnieniu wymogów niemonotoniczności bodźców.
Skala Likerta
Założenie, że odpowiedzi na poszczególne pytania korelują się z ogólnym wynikiem - sposobem odpowiadania na wszystkie pytania (zagregowanym, sumarycznym). Te o najwyższej korelacji wybiera się do skali ostatecznej
Założenie, że interkorelacja pytań spowodowana jest istnieniem jednego wspólnego czynnika. Pytania są wskaźnikiem tego czynnika.
Pytania odnoszą się do tego samego odczucia, ale inaczej zwerbalizowanego. Odnoszą się do jego „przyrostu”.
Pytania same są w sobie skalami.
Ograniczenia w stosowaniu pomiaru
możliwe najczęściej skale szacunkowe. Uwaga sztucznie przypisane wagi „punkty” nie są liczbowym odwzorowaniem pozycji na skali.
możliwe jest stosowanie skal typu rangowego.
poziom pomiaru w zasadzie nie przekracza poziomu porządkowego.
1
4