1636660523

1636660523



indywidualne koszty błędnej klasyfikacji dla każdego obiektu z osobna. W przypadku klasyfikatora CPL jest to możliwe poprzez podanie odpowiednich wartości parametrów a.i we wzorze (4) [24]. Wiele innych klasyfikatorów również posiada taką możliwość. Wszystkie sześć klasyfikatorów z pakietu do analizy danych Weka użyte w tej pracy również posiada taką możliwość (implementują interfejs WeightedlnstancesHandler). Przykładowo klasyfikator większościowy ZeroR będzie klasyfikował obiekty nie do klasy najbardziej licznej, a do klasy w której suma kosztów wszystkich jej obiektów będzie największa. Jest to sytuacja, która dokładnie odpowiada tej przy prognozowaniu wzrostów i spadków na giełdzie. Bardziej zależy nam na prawidłowej klasyfikacji (prognozie) wzrostu o 2% niż o 0,1%. Podobnie w przypadku spadków. Jednak zarówno wzrost o 2% jak i spadek o 2% są równoważne, jeżeli przyjmiemy możliwość dokonywania krótkiej sprzedaży. Dlatego też, z każdym z obiektów możemy związać wagę równą wartości bezwzględnej prognozowanej zmiany procentowej. Będziemy chcieli budować takie klasyfikatory, które będą prawidłowo klasyfikować większe zmiany indeksu S&P500 (zarówno wzrosty jak i spadki). Dzięki takiemu zdefiniowaniu kosztów na poziomie obiektów, klasyfikatory będą budowane tak, aby maksymalizowały zdefiniowany wcześniej (13) zysk finansowy. Jest to ciekawa właściwość klasyfikatorów, która nie została jeszcze spopularyzowana dla prognozy notowań giełdowych.

Statystyczna istotność wyników

Niewątpliwie najważniejsze z punktu widzenia badanych w tej pracy zastosowań technik eksploracji danych jest osiągnięcie zysku finansowego. Zarówno klasyfikacja jak i regresja zostały zastosowane do podjęcia decyzji o zajęciu odpowiedniej pozycji na giełdzie, czyli została zdefiniowana tzw. strategia inwestycyjna. Postawimy zatem hipotezę zerową HO, iż strategia działająca w oparciu o badane modele jest losowa, czyli zajmuje pozycję długą bądź krótką każdego dnia w sposób losowy (z prawdopodobieństwem 50%). Hipoteza alternatywna HI: użyty model daje wyniki lepsze niż strategia losowa. W celu weryfikacji tak postawionej hipotezy wykonano milion symulacji z użyciem strategii losowej [22]. Otrzymano dzięki temu milion różnych wyników miar jakości. Histogram dla miary z/srok przedstawiono na rysunku 3. Z histogramu możemy odczytać wartości krytyczne testu dla różnych poziomów istotności. Jeżeli model osiągnął zysk większy niż wartość krytyczna, wówczas odrzucamy hipotezę zerową iż jest to strategia losowa. Oznaczmy przez c wartość krytyczną, wówczas:

15



Wyszukiwarka

Podobne podstrony:
niezależnie rozwiązane dla każdego momentu z osobna. W zastosowaniu zbadano ewolucję momentów
Wątki w Javie *    Dla każdego obiektu Javy możemy wywołać funkcje typowe dla
Jak budujemy bazę danych? przyrostowy dla każdego elementu osobna baza, potem próba łączenia wada -
skanuj0192 (5) 204 PHP i MySQL dla każdego widoczny na rysunku 7.7. Formularz tworzony jest za pomoc
skanuj0221 (3) 234 PHP i MySQL dla każdegoKonfiguracja sesji W pliku php.ini zawarty jest zestaw opc
skanuj0351 (2) 366 PHP i MySQL dla każdegoZapytania typu SELECT W przypadku zapytań typu SELECT funk
skanuj0498 516 PHP i MySQL dla każdego Liczba wierszy generowanych w pętli while jest kontrolowana p
Równania kwadratowe są charakterystyczne dla każdego układu krystalograficznego w przypadku układu t
Nazwa w supozycji proste) - jest znakiem dla każdego swojego desygnatu. Nazwa w simozyrii formalnej
SPADKI Śmierć bliskiej osoby, to dla każdego bardzo trudna sytuacja. Smutek, żal, osamotnienie to gł
IMG88 56 W: Struktura modelu poznania. Dla naszej epoki czymś centralnym wydaje struktura. Jest to
zabawy dla maluchów0034 V. Ptyś poznaje światBIEDRONKI POD KORĄ Jest to zabawa ruchowa, w której dzi

więcej podobnych podstron