Model regresyjny |
\err\ |
err2 |
R2 sdRatio |
Z/Sr0k |
mdd |
acc |
long | |
ZeroR |
0,76 |
1,13 |
- |
1,00 |
-9,66 |
30,50 |
46,60 |
0,00 |
Linear |
0,92 |
1,26 |
-0,244 |
1,11 |
4,67 |
32,44 |
48,00 |
43,80 |
M5P |
0,83 |
1,19 |
-0,125 |
1,06 |
20,57* |
24,79 |
51,20 |
43,40 |
Bagging(M5P) |
0,82 |
1,17 |
-0,073 |
1,03 |
12,48 |
27,72 |
50,00 |
40,20 |
CPL-REG |
1,12 |
1,41 |
-0,564 |
1,10 |
1,61 |
20,88 |
49,00 |
13,20 |
Tablica 8. Wyniki modeli regresyjnych z podziałem na zbiór uczący i testowy 1000/500. Przedstawione wyniki obliczono na zbiorze testowym, model budowany był na zbiorze treningowym. Źródło: opracowanie własne
przykładzie jednodniowych zmian indeksu giełdy amerykańskiej S&P500. Techniki te to: klasyfikator liniowy, regresja przedziałowa oraz selekcja cech oparta na relaksacji liniowej separowalności poprzez odpowiednie modyfikowanie parametru regularyzacyjnego. Aby zbadać jakość prognozy i móc porównać ją z innymi popularnymi klasyfikatorami i modelami regresyjnymi, w ramach pracy stworzona została aplikacja w języku programowania Java. Opracowano i zaimplementowano w niej oprócz standardowych miar jakości tych modeli, również miary finansowe zysku i ryzyka. Miary takie wprowadzono przy założeniu pewnej strategii inwestycyjnej, która dopuszcza krótką sprzedaż. Zaproponowano również sposób maksymalizacji tej miary w procesie budowy klasyfikatora.
Otrzymane wyniki potwierdziły popularną opinię, iż prognozowanie giełdy jest zadaniem trudnym. Otrzymane rezultaty eksperymentów skłaniają do następujących wniosków:
— podejście naiwne, prognozujące tylko wzrost często okazuje się najlepsze gdy jakość zmierzymy trafnością klasyfikacji, dzieje się tak jednak tylko w okresach utrzymującego się trendu, przy jego zmianie podejście to może być bardzo niebezpieczne,
— modele regresyjne poradziły sobie gorzej w prognozie danych giełdowych niż modele klasyfikacyjne. Z punktu widzenia inwestora ważne jest osiągnięcie zysku i uniknięcie straty, do tego celu wystarcza jedynie prognoza kierunku zmiany notowań i nie jest konieczna dokładna wielkość tej zmiany,
— jeden z lepszych wyników osiągnięto przy pomocy klasyfikatora liniowego typu CPL w połączeniu z doborem parametru regularyzacyjnego metodą RLS. Wynik ten to 27,15% zysku średniorocznego przy ryzyku mierzonym maksymalnym obsunięciem kapitału na poziomie 13,47%. Obie te wielkości są istotne statystycznie na poziomie istotności 95%.
19