(gdy odpowiedzi „nie wiem na kogo zagłosuję”), czy z niej zrezygnować (gdy w przewadze będą odpowiedzi „nie idę na wybory”). Wprowadzając dane, oznaczamy:
• 1 - będę głosować na kandydata X,
• 2 - będę głosować na kandydata Y,
• 3 - będę głosować na kandydata Z,
• 8 nie wiem na kogo zagłosuję,
• 9 - nie idę na wybory.
Zazwyczaj te dodatkowe odpowiedzi umieszcza się na końcu skali, jako 8, 9, czy 98, 99. Teraz trzeba program poinformować, że przy robieniu analiz, np. wykonywaniu wykresów poparcia dla kandydatów, nie ma uwzględniać wartości 8 i 9 - są to zdefiniowane braki danych (w przeciwieństwie do systemowych braków danych, czyli po prostu pustych pól). Robimy to wypełniając pole Braki danych. Jak brak danych może występować cały przedział (np. błędy pomiarów).
Dla poprawnego wykonania analizy danych kluczowe jest ustawienie odpowiedniego poziomu pomiaru. Złe dobranie poziomu pomiaru może skutkować brakiem dostępu do odpowiedniego wykresu czy testu statystycznego. Zasadniczo wyróżnia się zmienne (cechy) jakościowe i ilościowe. Zmienne jakościowe mają wartości będące kategoriami, przy czym kategorie te mogą mieć jakiś naturalny porządek czy kolejność (poziom porządkowy) lub nie (poziom nominalny). Zmienne ilościowe są zmiennymi typowo liczbowymi jak wzrost, waga, czy wysokość zarobków. Poniżej cytujemy fragmenty rozdziału 6. podręcznika J. Koronackiego i J. Mielniczuka Statystyka dla studentów kierunków technicznych i przyrodniczych [3].
Zacząć wypada od zwrócenia uwagi na to, że dane jakościowe mogą być dwojakiego typu. Mogą mianowicie opisywać cechy nominalne lub uporządkowane [...]
Niech [...] interesującą nas cechą będzie wyznanie religijne, populacją zaś, w której chcemy poznać rozkład tej cechy, niech będą mieszkańcy Warszawy w zadanym roku. Cechę tę opisują następujące kategorie: katolik, prawosławny, ewangelik, żyd oraz kategoria „inne wyznania”, z której wymieniania rezygnujemy. [...] Wyznanie religijne jest cechą nominalną, nie ma bowiem żadnej relacji jakoś porządkującej kategorie wyznaniowe - są to po prostu różne kategorie i tyle. Tak samo rzecz ma się z takimi cechami jak kolor włosów, nazwa miejscowości, w której może być zameldowany mieszkaniec województwa pomorskiego, czy zawód.
11