Wtedy pierwszym przybliżeniem wyniku może być np.:
Ui — 0
(3-14)
rtij = 0 (3.15)
Zauważmy, że mając ustalone wartości Uj, możemy łatwo znaleźć optymalne wartości my.
1
•- nr 'E r‘i ~ u‘ ~c
'A' ieUj
(3.16)
Podobnie mając ustalone wartości mj, możemy znaleźć optymalne wartości Uji
(3.17)
Zastosowany algorytm wykonuje na przemian obie fazy zbiegając do pewnego minimum lokalnego. Uruchomiony na danych konkursu Netflbc zbiega już po kilku fazach. Na zbiorze testowym osiąga wynik 0.9153, a na zbiorze treningowym 0.9862.
Na podstawie różnicy wyników dla zbioru treningowego i testowego łatwo zauważyć, że mamy do czynienia ze stosunkowo silnym przeliczeniem. Faktycznie, jeśli użytkownik ocenił przykładowo tylko jeden film, nie znaczy to od razu, że ta ocena odpowiada jego średniej. Z dużym prawdopodobieństwem będzie ona bliższa średniej globalnej.
Zastosowałem, więc, następującą metodę regularyzacji. Zamiast dążyć do zminimalizowania RM SE, czyli sumy:
ifij ~ rij)2| (3.18)
(ij)eA
próbowałem zminimalizować wartość:
J2 (rij-njf + aJ^iĄ + PY,™) (3.19)
(ij)eA iSl/ j&M
W tym przypadku można zastosować algorytm analogiczny do poprzedniego, przy czym drobnej modyfikacji ulegają wzory na optymalne wartości mj i
(3.20)
- V 7
jeMi
Y r*j ~Ui~C
i&Uj
(3.21)
Wykres 3.1 prezentuje wartość RM SE na zbiorze treningowym dla różnych parametrów a = (3. Próby doboru parametrów a ^ fi nie dały istotnie lepszych rezultatów.