• Skala nominalna nie ma porządku, używa różnych symboli, znaków, liczb do reprezentacji różnych stanów (wartości) mierzonej zmiennej.
• Przykład zmiennej nominalnej - typ klienta - z możliwymi wartościami: miejscowy, komercyjny, przemysłowy. Wartości te można zakodować alfabetycznie jako A, B, C, lub numerycznie jako 1, 2,3, ale nie mają one charakterystyk metrycznych jak inne dane numeryczne.
• Innym przykładem nominalnego atrybutu jest pole „kod pocztowy".
• Skala porządkowa składa się z uporządkowanych, dyskretnych gradacji, t. j. rankingów.
• Zmienna porządkowa to zmienna kategoryczna dla której zdefiniowano relację porządku, ale nie relację odległości.
• Przykłady atrybutów porządkowych: pozycja studenta w grupie; złoty, srebrny i brązowy medal.
• Skala porządkowa niekoniecznie musi być liniowa. Np. różnica między studentem 4 i 5 nie musi być taka sama jak między studentem 15 a 16.
Zmienne okresowe
• Specjalna klasa zmiennych dyskretnych.
• Zmienna dyskretna okresowa to cecha, dla której istnieje relacja odległości, ale nie istnieje relacja porządku.
• Przykłady: dni tygodnia, dni miesiąca, dni roku. Poniedziałek i wtorek, jako wartości cechy, są bliżej niż poniedziałek i czwartek, ale poniedziałek może być przed lub po piątku.
Dane statyczne i dynamiczne
• Wreszcie, dodatkowym wymiarem klasyfikacji danych jest ich zachowanie względem czasu.
• Niektóre dane nie zmieniają się w czasie i nazywamy je statycznymi.
• Są też wartości atrybutów, które zmieniają się w czasie i nazywamy je dynamicznymi lub temporalnymi.
• Większość metod drążenia danych nadaje się do danych statycznych, a dane dynamiczne wymagają specjalnego przygotowania.
Reprezentacja surowych danych
• Wszystkie zbiory surowych danych wstępnie przygotowane do drążenia są zazwyczaj duże.
• A priori, trzeba znaleźć we wstępnych zbiorach danych brakujące wartości, zniekształcenia, błędy, itd. Surowe dane, w których nie ma takich problemów powinny natychmiast stać się podejrzane.