ilość
zmiana
ilość
okres obiektów indeksu S&P500 dni wzrostowych
treningowy 1000
-15,41%
54,30%
testowy
500
+17,85%
55,60%
Tablica 5. Podstawowe statystyki okresu treningowego i testowego. Źródło: opracowanie własne.
następujących po nich. (tabela 5). Parametry klasyfikatora zostały dobrane na zbiorze treningowym w taki sposób aby maksymalizowały wybraną miarę jakości modelu. W tej pracy maksymalizowane są dwie miary jakości: trafność klasyfikacji acc oraz zysk finansowy z/sTOk-Natomiast pomiar dokonywany jest walidacją krzyżową z podziałem na 10 zbiorów. Przy czym podział ten nie jest losowy, a co dziesiąty element trafia do każdego podzbioru. Dzięki temu w każdym z nich znajdują się obiekty z różnych okresów. Miary jakości wyliczane były jedynie na zbiorze złożonym z 500 ostatnich obiektów, czyli 500 dni notowań od 2010-11-24 do 2012-10-23. Podstawowe statystyki dla tego okresu zawiera tabela 5. Przyjęte skróty w oznaczeniach modeli klasyfikacyjnych i regresyjnych zawiera tabela 10 natomiast skróty stosowanych miar jakości tabela 9.
Rysunek 4. Podział danych na okres treningowy i testowy. W okresie treningowym do estymacji jakości modeli zastosowano walidację krzyżową z podziałem na 10 zbiorów, przy czym każdy z nich zawierał co 10 obserwację. Źródło danych: finance.yahoo.com.
17