Wykorzystanie funkcji typu CPL w problemie regresji przedziałowej zostało zaproponowane w pracy [7]. W podejściu tym, liniowy model regresyjny poszukiwany jest poprzez sprowadzenie problemu regresji do problemu liniowej separowalności. Główne różnice z klasycznym modelem regresji liniowej są następujące:
— funkcja kryterialna oparta jest o błąd bezwzględny, nie kwadratowy
— wartości yt nie są znane dokładnie, znane są przedziały do których należą [/*, ut]
— regularyzacja oparta jest o normę li, nie o normę /2
Funkcja kryterialna typu CPL w problemie regresji przedziałowej może zostać zapisana następująco:
x » » n
Qi(v) = -[y^cos*i(zj,fj) + y^cost0(zi,Ui)] + |z>»| (10)
COSti(Zi,li) =
COSt0(Zi,Ui) =
li - VTZi |
jeżeli vTZj < li |
0 |
w przeciwnym wypadku |
vTzi - yi |
jeżeli vTZj > Ui |
0 |
w przeciwnym wypadku |
(12)
gdzie v = [d0,vi, ...,ujv] jest wektorem parametrów modelu, natomiast z-t =
...,Xijv] poszerzonym wektorem zmiennych objaśniających. Jest to analogiczna postać funkcji kryterialnej typu CPL jaka występuje w problemie klasyfikacji. Przy czym dla jednego obiektu w problemie regresji klasycznej (xj,r/j) należy utworzyć dwa obiekty (l,Xj,/j,0) i (1, Xi, Ui, 1) w problemie klasyfikacji.
Celem przeprowadzonych w tej pracy eksperymentów jest pokazanie użyteczności technik eksploracji danych opartych na funkcjach kryterialnych typu CPL w prognozowaniu notowań giełdowych. Wykorzystane techniki to klasyfikator liniowy, regresja przedziałowa, oraz selekcja cech bazująca na relaksacji liniowej separowalności RLS. Wyniki tych metod zostały porównane z innymi popularnie stosowanymi klasyfikatorami np. maszyną wektorów wspierających SVM, modelami regresyjnymi np. regresją liniową.