Ewa Adamus
Politechnika Szczecińska, Wydział Informatyki
Abstract:
The problem of the incomplete data is guite common especially in the case of the actual measurement samples. In this connection, it has been vastly commented in the literaturę, especially in the rough set theory. The rough set theory was meant as a tool for imprecise and inconsistent information systems. The aim of this work is to supplement the incomplete data relying on the relations designed to this problem (similarity and tolerance relation). Basing on the opposite information to the incomplete object we know the area of permitted ualues for this object. The method proposed in the article works on the assumption that we possess with the opposite information to the supplemented sample in our information system.
Słowa kluczowe:
rough set theory, tolerance relation, similarity relation, opposite information, di-rectional classes of similarity
W rzeczywistych zbiorach danych bardzo często pojawia się problem niekompletności próbek pomiarowych. Przyczyny tego mogą być różnorakie, zupełnie przypadkowe, zamierzone (bardzo często spotykane w ankietach), techniczne (związane z możliwościami pomiarowymi aparatury) bądź inne.
Formalnie niekompletnością określamy brak wartości w pewnych atrybutach wektora wejściowego próbki. Zakładamy, że pojęcie to nie odnosi się do wektora z atrybutami wyjściowymi:
Definicja 1.1. Dla zbioru A atrybutów warunkowych, zdefiniowanego na uniwer-sum przykładów U, mówimy, że obiekt x E U jest niekompletny, jeżeli dla przynajmniej jednego atrybutu warunkowego a (a & A), obiekt ten nie ma zdefiniowanej wartości: f(a,x) = * 1, przy czym wartość atrybutu decyzyjnego d jest zawsze zdefiniowana (f(d,x) *).
Gdzie: f(a,x) - funkcja informacyjna, taka że Va £ A,x € U f(a,x) € Va, Va -dziedzina atrybutu a.
m.in. w pracy [6] przyjęto odpowiednio oznaczenia: „?” do istotnych oraz do nieistotnych brakujących wartości