Podczas trzecich laboratoriów dokonujemy automatyzacji procesu uczenia oraz przeprowadzamy wstępną obróbkę danych. Pracujemy na 98 wzorcach danych pobranych ze strony internetowej Katedry Informatyki Stosowanej (9 ostatnich traktujemy jako dane testowe). Dane zawierają wiek (w latach), pleć (0 - kobieta, 1 - mężczyzna) oraz wynagrodzenie (miesięczne brutto w złotych). Opracowujemy model, w którym wynagrodzenie zależy od wieku oraz płci.
a b c
45,25066 85,6555 838,0937
42 |
0 |
2172 |
2738,621 |
321059,8 |
40 |
1 |
3223 |
2733,776 |
239340,5 |
47 |
0 |
2954 |
2964,875 |
118,2592 |
59 |
1 |
3711 |
3593,538 |
13797,3 |
59 |
0 |
2754 |
3507,883 |
568339 |
33 |
0 |
2344 |
2331,365 |
159,631 |
39 |
1 |
2361 |
2688,525 |
107272,6 |
52 |
0 |
2955 |
3191,128 |
55756,43 |
60 |
0 |
3732 |
3553,133 |
31993,31 |
50 |
1 |
3340 |
3186,282 |
23629,17 |
45 |
0 |
3206 |
2874,373 |
109976,2 |
19 |
1 |
1871 |
1783,512 |
7654,192 |
63 |
1 |
4416 |
3774,541 |
411470 |
43 |
0 |
2235 |
2783,872 |
301260,6 |
21 |
1 |
2064 |
1874,013 |
36095,03 |
66 |
1 |
3382 |
3910,293 |
279093,2 |
54 |
0 |
3030 |
3281,629 |
63317,31 |
SUMA: |
14067116 |
Można się domyśleć, że ręczne budowanie modelu nie daje satysfakcjonujących rezultatów. Budujemy zatem model sieci neuronowej z logistyczną funkcją aktywacji. Model ten automatyzuje proces uczenia neuronów. Jednak, jak widzimy na obrazku poniżej metoda również nie jest skuteczna, ponieważ suma kwadratów błędów osiągnęła bardzo wysoką wartość.