Klasyfikacja kredytobiorców
Do zanalizowania 1000 klientów pewnego banku w Niemczech. Każdy klient charakteryzuje się 20 atrybutami (między innymi: wiek, wielkość zarobki, rodzaj umowy zatrudnienia, historia poprzedniego kredytu,…) Wśród atrybutów jest 6 numerycznych i 14 symbolicznych. Są dwie klasy klientów: kompetentny (dobry) i niekompetentny (zły).
Predyktory ryzyka w modelu German credit
A1 Stan istniejącego rachunku a vista
A11 < 0 DEM
A12 w przedziale (0,200> DEM
A13 ≥ 200 DEM / pensja na rachunek min 1 rok
A14 brak rachunku
A2 Czas trwania w miesiącach
A3 Historia kredytowa
A30 bez kredytów / wszystkie kredyty spłacone
A31 wszystkie kredyty w tym banku spłacone
A32 istniejące kredyty spłacane regularnie
A33 opóźnienie w spłatach w przeszłości
A34 rachunek krytyczny / są inne kredyty (poza)
A4 Cel kredytu
A40 samochód (nowy)
A41 samochód (używany)
A42 meble / wyposażenie
A43 radio / telewizor
A44 artykuły gospodarstwa domowego
A45 naprawy
A46 edukacja
A47 wakacje
A48 szkolenie
A49 biznes
A410 inny cel
A5 Kwota kredytu
A6 Rachunki oszczędnościowe / obligacje
A61 < 100 DEM
A62 w przedziale <100, 500) DEM
A63 w przedziale <500, 1000) DEM
A64 ≥ 1000 DEM
A65 brak danych / brak rach. oszczędnościowego
A7 Okres obecnego zatrudnienia
A71 bezrobotny
A72 < 1 rok
A73 w przedziale <1, 4) lata
A74 w przedziale <4, 7) lat
A75 ≥ 7 lat
A8 Rata kredytu jako procent dochodu
A9 Stan cywilny i płeć
A91 M: rozwiedziony / w separacji
A92 K: rozwiedziona / w separacji / zamężna
A93 M: samotny
A94 M: żonaty / wdowiec
A95 K: samotna
A10 Inni dłużnicy / żyranci
A101 brak
A102 współaplikant wniosku
A102 żyrant
A11 Okres obecnego zamieszkania w latach
A12 Własność
A121 nieruchomość
A122 (jeśli nie A121)
wkład do spółdzielni mieszk. / polisa na życie
A123 (jeśli nie A121 / A122)
samochód lub in.
A124 nie wiadomo / bez własności
A13 Wiek w latach
A14 Inne powinności ratalne
A141 bank
A142 sklepy
A143 brak
A15 Mieszkanie
A151 wynajmowane
A152 własne
A153 za darmo
A16 Liczba kredytów w tym banku
A17 Praca
A171 bezrobotny / bez kwalifikacji – nierezydent
A172 bez kwalifikacji – rezydent
A173 kwalifikowany / urzędnik
A174 zarządca / własna firma / pracownik wysoko kwalifikowany
A18 Liczba osób na utrzymaniu
A19 Telefon
A191 brak
A192 tak, zarejestrowany na nazwisko klienta
A20 Pracownik zagraniczny
A201 tak
A202 nie
Źródło: German credit data oraz opracowanie własne
Correctly Classified Instances 193 96.5 %
Incorrectly Classified Instances 7 3.5 %
Kappa statistic 0.4436
Mean absolute error 0.0524
Root mean squared error 0.1723
Relative absolute error 73.9056 %
Root relative squared error 93.7133 %
Total Number of Instances 200
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.984 0.571 0.979 0.984 0.982 0.662 A201
0.429 0.016 0.5 0.429 0.462 0.662 A202
Weighted Avg. 0.965 0.552 0.963 0.965 0.964 0.662
=== Confusion Matrix ===
a b <-- classified as
190 3 | a = A201
4 3 | b = A202
Number of Leaves : 61
Size of the tree : 77