POJCIE ORAZ ISTOTA REDUKCJI DANYCH laboratorium mgr inż. KATARZYNA SIERADZKA Katowice,7 kwietnia 2011 r. Redukcja jest procesem przystosowywania danych surowych do ich analizy. Redukcja danych, przeprowadzana ręcznie jest zajęciem rutynowym, zajmującym dużo czasu, ale niezbędnym. Dane surowe trzeba więc przygotować do dalszej analizy pod względem zarówno formalnym jak i technicznym. Dane surowe wypełnione kwestionariusze, dzienniki obserwacji, dzienniki panelowe, zapisane testy, zapisy z pomiaru wtórnego; często występują w nadmiarze; w procesie redukcji dane surowe są: " Kontrolowane; " Redagowane; " Wprowadzane; " Kodowane; " Klasyfikowane; " Zliczane; " Poddawane tabulacji i agregacji. Wynikiem czynności redukcyjnych jest uporządkowanie i wstępna prezentacja danych w postaci: " Opisowej; " Tabularycznej; " Graficznej. ETAPY REDUKCJI DANYCH Zgromadzone za pomocą narzędzi badawczych dane muszą być przetworzone w przydatne informacje. W tym celu dokonuje się: Kontrola pomiaru prowadzona jest przez prowadzących pomiar oraz kontrolerów. Odbywa się za pomocą kart pocztowych, listów, telefonów, a także w sposób bezpośredni dociera się do tych samych osób, wśród których był przeprowadzony pomiar. Instrument pomiarowy jest tak skonstruowany, aby możliwe było zidentyfikowanie: " osoby prowadzącej pomiar " daty " czasu trwania " przedmiotu " miejsca itd. Cel procesu kontroli: uzyskanie pewności, że cały proces badania, a zwłaszcza pomiar został przeprowadzony właściwie oraz całkowicie. Kontrola przeprowadzonych pomiarów powinna odpowiedzieć na następujące pytania: " Czy wszystkie osoby dobrane do próby były rzeczywiście pytane przez ankieterów? Jeżeli nie to ile osób zostało pominiętych, gdzie i dlaczego? " Czy wywiady były przeprowadzone we właściwy sposób i w wyznaczonym wcześniej miejscu (np. czy zamiast domu handlowego ankieter nie przeprowadził wywiadów w restauracji)? Sposób przeprowadzenia wywiadu powinien być zgodny ze wskazówkami przekazanymi na szkoleniu. Kontrola przeprowadzonych pomiarów powinna odpowiedzieć na następujące pytania: " Czy ankieterzy przeprowadzili pełne wywiady z każdym respondentem? (czasem się zdarza, że respondent się spieszy i odpowiada tylko na część pytań, a resztę wymyśla ankieter samodzielnie, ułatwiając sobie tym samym pracę). " Czy ankieter był uprzejmy, czy umiał nawiązać kontakt z respondentem? Czy nie naruszał osobistego dobra respondentów? Jakie negatywne opinie o ankieterach wypowiada respondent? Redakcja danych Redakcja (edycja) danych sprawdzenie otrzymanych narzędzi badawczych, ich czytelności, kompletności, spójności i prawdziwości odpowiedzi oraz uporządkowanie zebranych danych; można uzupełnić dane wynikowe, można wprowadzić dodatkową zmienną brak danych Powszechnie spotykane błędy i braki w sprawdzaniu czytelności i dokładności danych to:: " pomiary fikcyjne świadome oszustwa dokonane przez osoby prowadzące pomiar " błędne dane chociaż większość błędów jest niewidoczna, błędy dotyczące faktów można zwykle zidentyfikować; poprawki można robić wówczas gdy inne dane w kwestionariuszu są prawdziwe " sprzeczności i niezgodności np. respondent nie odpowiada na jedno pytanie, a odpowiada na drugie, które wyniki z poprzedniego poprawne wnioskowanie w tym zakresie może być ryzykowne " odpowiedzi niekompletne lub niejednoznaczne trudne do interpretacji i ewentualnej poprawy " odpowiedzi nieadekwatne nie związane z tematem pytania (respondent zle zrozumiał, albo kwestionariusz jest zle zaprojektowany) " brak odpowiedzi na jedno lub kilka pytań najczęściej występujący błąd w pomiarach ankietowych Metody nanoszenia poprawek i uzupełnień " Nie należy wymazywać danych oryginalnych (poprawki nanosi się za pomocą kolorowego ołówka) " Sprzeczne lub niezgodne dane należy zmienić lub odrzucić (po przestudiowaniu pozostałych odpowiedzi) " W niektórych przypadkach redaktor może określić odpowiedz " Tam, gdzie jest to konieczne redaktor może wstawić dane szacunkowe (zarówno w przypadku braków jak i błędów) Metody nanoszenia poprawek i uzupełnień " W przypadkach szczególnie ważnych podejmuje się próby ponownego kontaktu z respondentami " Dodatkowe uwagi lub komentarze zapisane lub wypowiedziane przez respondentów mogą świadczyć o innych ich oczekiwaniach względem danego pytania, instrumentu pomiarowego lub też pomiaru informacje te mogą być przydatne do tworzenia instrumentu w przyszłości " Jeżeli powyższe metody zawiodą, pytanie pozostawia się bez odpowiedzi. W przypadkach szczególnych (np. gdy oczywiste jest, że respondent nie ma ochoty do współpracy, lub zle zrozumiał cel pomiaru) odrzuca się cały instrument. Czasem wstawia się odpowiedzi neutrale: nie wiem, nie mam zdania, inne itd. Ogólne zasady redakcji danych " Upewnienie się, czy każdy przedmiot pomiaru był uwzględniony w dobranej uprzednio próbie " Wyniki pomiarów należy poddawać redukcji na świeżo natychmiast po zakończeniu pomiaru " Każdy redaktor opracowuje wyniki stale dostarczane przez te same osoby prowadzące pomiary (łatwiejsza identyfikacja rękopisu, wychwycenie specyficznych błędów, czy oszustw) " Jeżeli zatrudnia się więcej niż jednego redaktora to należy przygotować instrukcje redagowania danych ograniczenie subiektywności, ujednolicenie procesu redakcji. Kodowanie danych (jeśli ręcznie to: Klasyfikacja i zliczanie danych) przełożenie odpowiedzi respondentów na ciąg symboli celem poddania danych obróbce statystycznej (kodowanie pytań zamkniętych może się odbyć w każdej fazie badań; kodowanie pytań otwartych po zebraniu kompletu kwestionariuszy, polega na doprowadzeniu do tzw. zamknięcia tych pytań wg instrukcji, podział pytań na podobne klasy odpowiedzi) " Tabulacja komputerowa (jeśli ręcznie to: Tabulacja ręczna) zestawienie częstości występowania wartości poszczególnych zmiennych i zrelatywizowanie ich (np. formy procentowe). " Komputerowa transmisja danych (jeśli ręcznie to: brak tego etapu) " Wstępna analiza statystyczna " Opracowanie strategii dalszej analizy statystycznej. PRZEDSTAWIENIE WYNIKÓW Wnioski przedstawiane w formie raportu zawierającego konkluzje, zalecenia działań marketingowych i ich ewentualne skutki. Raport powinien być czytelny, zwięzły, dodatkowe informacje powinny być umieszczone w załącznikach. Dane wynikowe przestawione w formie diagramów i wykresów: " wykresy kołowe procenty, szczegóły dotyczące próby, udział w rynku; " wykresy liniowe dane odzwierciedlają przebieg zjawiska w czasie (dynamika); " wykresy słupkowe odzwierciedlają względne i bezwzględne wielkości, różnice struktury badanych zjawisk. Ważny jest prawidłowy dobór skali.