2.2.3,1. Przygotowanie danych empirycznych do obliczeń i obliczenia statystyczne
Czynności te przybliżymy na przykładzie badań ankietowych. Pierwszą czyn- I nością po zebraniu ankiet jest przejrzenie każdej z nich i ponumerowanie, po wylą- I ezeniu ankiet bezwartościowych. Należą do nich takie, w których respondenci nie | wypełnili tzw. metryczki (załącznik 2). Dlatego warto o tym przypomnieć przed | rozpoczęciem badań. Może się zdarzyć, że w którejś z ankiet nie wypełniono ja* | kiegoś pytania merytorycznego. Nie dyskwalifikuje to jednak tej ankiety, może ją I natomiast dyskwalifikować podejrzenie, że była wypełniana mechanicznie.
W wyniku przeprowadzonych badań terenowych, opierając się na przyjętych I metodach i technikach oraz opracowanych narzędziach badawczych, uzyskujemy I konkretne materiały empiryczne. Najogólniej biorąc zebrany w badaniach materia! I może mieć trojaką postać:
a) opisu;
b) cyfr;
c) połączenia cyfr i opisu.
Formę opisową mogą mieć na przykład materiały z wywiadów swobodnych I czy też z obserwacji, chociaż nierzadko się zdarza, że materiał z obserwacji posia* I da również konkretne dane liczbowe. Materiały w postaci opisu mogą być wyko* I rzystywane w dwojaki sposób:
a) do analiz jakościowych;
b) do analiz ilościowych.
W pierwszym przypadku, dotyczącym analiz jakościowych, zapoznajemy się I z wypowiedziami respondentów lub z innymi informacjami zapisanymi na papie- I rze, taśmie magnetofonowej czy magnetowidowej, dokonujemy ich analizy i syn- I tezy oraz wyciągamy odpowiednie wnioski.
W drugim przypadku, dotyczącym analiz ilościowych, materiały w formie opi- I su przekształcamy na odpowiedni zapis cyfrowy. Operacja ta jest nazywana kodo- i waniem. Wykorzystujemy do tego celu tzw. klucz kodowy32.
Z materiałem empirycznym w postaci cyfr mamy zazwyczaj do czynienia na I etapie wykonywania określonych operacji i obliczeń statystycznych. Obliczenia te i jeszcze stosunkowo niedawno wykonywane były metodą ręczną, za pomocą kal- I kulatora i odpowiednio skonstruowanych tabel. Zdarza się, że ten sposób pracy I z danymi empirycznymi spotykamy jeszcze dziś. Jednak coraz częściej wykony* I stujemy do tego celu komputer.
Warto dodać, że po wprowadzeniu wszystkich danych do pamięci komputera I wydajemy mu odpowiednie polecenia, nakazujące wykonanie odpowiednich obli* | czeń i przedstawienie wyników tych obliczeń na ekranie monitora bądź w postaci i
y~ Technika przygotowania i wykorzystania klucza kodowego zostanie przedstawiona w oddziel* nym opracowaniu.
wydruków. Z tego wynika, że z danymi liczbowymi mamy również do czynienia wtedy, kiedy otrzymujemy np. wydruki z komputera, zanim przystąpimy do ich opisania lub przetworzenia na wykresy czy inne formy wizualne, stanowiące doskonałą pomoc do analiz i wnioskowania. Zanim jednak komputer przetworzy dane liczbowe na wykresy, możemy je uzyskać w dwu najczęściej wykorzystywanych postaciach: tzw. frekwencji lub w tabelach krostabulacyjnych, zwanych też tabelami korelacyjnymi.
Dane w postaci frekwencji wykorzystujemy: po pierwsze, do wstępnych analiz, służących do opisania badanej rzeczywistości; Po drugie, na podstawie tych danych, zwanych również sumami marginesowymi, oraz przyjętych w koncepcji badań założeń, podejmujemy decyzję, jakie powinny być wykonane krostabulacje. Praktycznie oznacza to wybór tych zmiennych, miedzy którymi chcemy poznać łączące je relacje i zależności. Po wprowadzeniu do pamięci komputera polecenia wskazującego, które korelacje między zmiennymi nas interesują, uzyskamy wyniki -jakjuż wspomniano - w postaci tabel, zwanych korelacyjnymi czy też krostabu-lacyjnymi.
Warto zwrócić uwagę, że poza rozkładem odpowiedzi zawartych w tabelach korelacyjnych, arkusze te zawierają także wiele ciekawych informacji szczegółowych, umieszczonych pod tabelami. Są tam praktycznie przedstawione różne wskaźniki statystyczne. Jeden z nich spełnia rolę szczególną. Pozwala bowiem od razu określić, czy tabela zawiera dane, którymi warto się zajmować, czy też są to po prostu śmieci. Wskaźnikiem tym jest tzw. poziom istotności związku korelacyjnego, oznaczony symbolem „p”. Przedmiotem analiz stają się tabele krostabulacyjne, przy których wskaźnik poziomu istotności związku korelacyjnego wynosi p <0,05.
Współczynnikami korelacji, wykorzystywanym i w analizach są często: współczynnik korelacji Pearsona oznaczany symbolem „r”, lub współczynnik korelacji rangowej Spearmana - „rs”. Zainteresowanych tymi zagadnieniami odsyłamy do rozdziału 3 niniejszego opracowania oraz do innych pozycji literatury33.
Wróćmy jeszcze dp wymienionych na początku trzech form, albo inaczej -trzech postaci materiału empirycznego, tzn. opisu, cyfr oraz połączenia cyfr i opisu. Kombinacja tych trzech postaci materiału empirycznego, ujętych w formie tabel, zestawień, wykresów i rysunków stanowi podstawę do analiz i wnioskowania.
Stopień wykorzystania zebranego w badaniach materiału empirycznego zależy od kilku czynników, takich jak: jakość zebranego materiału, uwarunkowana z kolei zastosowanymi metodami, technikami i narzędziami badawczymi, a także wiedza
M G. A. Ferguson, Y. Tanake, Analiza statystyczna..., op. ciL; J. P. Guilford, Podstawowe metody statystyczne w psychologii i pedagogice, PWN, Warszawa 1964; Metody statystyczne w socjologii, red. K. Szaniawski. Warszawa 1968; A. Góralski, Metody opisu i wnioskowania statystycznego w psychologii i pedagogice. Warszawa 1987, s. 38.