Data mining w rekomendacji


Dlaczego internetowe systemy
rekomendacyjne?
Eksploracja danych
Kanały internetowe (serwisy, witryny) dla wielu firm są
w internetowych
głównym a dla bardzo wielu ważnym obszarem
działalności
systemach
Systemy internetowe a w szczególności sklepy powinny
rekomendujÄ…cych
być coraz bardziej adaptowane do potrzeb konkretnego
użytkownika - personalizacja
jak najlepsza prezentacja oferty handlowej
atrakcyjność i zadowolenie klienta
Przemysław KAZIENKO
dynamizm zawartości (zabezpieczenie przed
Instytut Informatyki Stosowanej znużeniem)
Politechnika Wrocławska
kazienko@pwr.wroc.pl Jedno z rozwiązań: systemy rekomendujące
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 2
Przykład rekomendacji
Reklama jako rekomendacja
Baner
Osoby które kupowały
"XML na poważnie"
często kupowały też:
Advertiser s web site
Publisher s page
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 3 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 4
Oceny
Åšrodowisko
Użytkownik serwisu internetowego
Obiekt rekomendowany (strona, produkt)
Połączenie użytkownik - obiekt
oceny (ratings)
zachowania (sesje, ścieżki nawigacyjne)
użytkowników
koszyki (dodane do koszyka)
zamówienia
zakupy
Połączenie strona internetowa - obiekt (jeżeli nie jest
on stroną), np. pomiędzy stroną a produktem w sklepie
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 5 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 6
Oceny
Połącznie strona - obiekt (produkt)
W eb Product
site database
Product 1 Product 2
Product 1
W eb page W eb page
m:n
Normal
rel
Product 2
web page
Product 3
W eb page
Product 3
Product page
Normal
set DP
web page
Product set P
W eb page set D
navigational steps corresponding to one user session
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 7 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 8
Rekomendowane obiekty Podpowiadanie odsyłaczy
Systemy rekomendujące proponują użytkownikowi:
inne elementy serwisu (strony, działy),
rekomendacja odsyłaczy hipertekstowych, (next
step recommendation, hyperlink recommendation)
produkty w sklepach internetowych
reklamy (Google AdSense, AdROSA)
inne obiekty charakterystyczne dla systemu, np.
kursy nauczania, artykuły prasowe, itd.
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 9 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 10
Sposób rekomendacji 1/2 Sposób rekomendacji 2/2
4. Korelacja obiektów (item-to-item correlation) -
1. Zwykłe wyszukiwanie (raw retrieval), bez
podobieństwo między obiektami, np. razem kupowane,
rekomendacji
razem oglÄ…dane, podobnie oceniane, strony podobne
treściowo
2. Ręczna selekcja (manually selected) dokonana przez
web content mining
jakieÅ› osoby (ekspert, zapaleniec),  ulubione linki ,
web usage mining
 zobacz także  inne związane
web structure mining
3. Globalne podsumowania statystyczne (statistical
association rules
summaries) np. opinii lub zakupów,  the best buy ,  the
5. Korelacja użytkowników (user-to-user correlation)
best rated
czyli filtrowanie kolaboratywne (collaborative filtering)
najbliższy sąsiad (nearest neighbour)
4. Korelacja atrybutów użytkownik-obiekt (attribute-
najbliższe sąsiedztwo (nearest neighbourhood)
based) preferencje użytkownika pasujące do obiektów,
np. interesują mnie:  słowniki w języku  angielskim potrzebny łącznik pomiędzy użytkownikami
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 11 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 12
Problemy systemów
Stopień personalizacji
kolaboratywnych
Nowe obiekty (strony, produkty) - nie mają połączenia Niespersonalizowana, każdy to samo na każdej stronie
z innymi użytkownikami (sąsiadami)
Ulotna (ephemeral), zależna od miejsca, tj. inna na
każdej stronie, ale wspólna dla wszystkich
Nowi użytkownicy - nie mają połączenia z obiektami.
Cold start problem
korelacja obiektów
Rzadkość danych - dużo obiektów i dużo
Bezustanna, ciągła (persistent) na danej stronie inna
użytkowników
dla każdego użytkownika a nawet inna dla każdego
użytkownika na każdej stronie
Zmienność obiektów i zainteresowań użytkowników
korelacja atrybutów
Pozyskiwanie połączeń
korelacja obiektów połączona z ciągłym
ręczne, niechęć do oceniania
monitorowaniem preferencji użytkownika (korelacja
atrybutów i obiektów razem)
automatyczne, np. sesje HTTP
korelacja użytkowników
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 13 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 14
Ta sama
Ta sama
strona, inna
osoba,
osoba
inna
strona
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 15 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 16
Ta sama osoba i strona, inny czas Inne elementy rekomendacji
Zmiennośćrekomendacji w czasie, każdy to samo na
każdej stronie
inna rekomendacja przy kolejnym wejściu na daną
stronÄ™ w czasie tej samej sesji
inna rekomendacja w różnych sesjach użytkownika
Identyfikacja użytkowników
Zmiennośćobiektów (stron, produktów)
Starzenie siÄ™ danych, np. wnioskowanie ze starych
zakupów
Integracja z innymi zródłami danych (wyszukiwarki,
katalogi), np. bazy danych o produktach z treścią
tekstowÄ… stron
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 17 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 18
Integracja bazy danych o
Eksploracja danych
produktach z treścią stron
Analiza związków, powiązań
reguły związków
wzorce sekwencji
podobne sekwencje czasowe
Grupowanie, segmentacja
hierarchiczne - płaskie
rozdzielne - zachodzÄ…ce grupy
Klasyfikacja, predykcja
drzewa decyzyjne
regresja liniowa i nieliniowa
sieci neuronowe
sieci Bayesa
wnioskowanie pamięciowe (najbliższy sąsiad/kilku
sąsiadów)
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 19 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 20
Reguły związków dla WWW Bezpośrednie reguły związków
d1 d2 [support, confidence]



Zwykle potwierdzają tylko istniejące odsyłacze
Może istnieć mało reguł
Efekt: czasami słabe rekomendacje (krótkie listy
rekomendacji)
d1 d2 [12%, 70%]



Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 21 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 22
Reguły bezpośrednie i pośrednie
Minimalne poparcie
1 000 000
direct association
rule: d1d3 d1
min. con=0.1%
(session 2)
100 000
min. con=2%
session 2
d1
10 000
No. of pages=4.242 partial indirect direct
No. of sessions=16.127
d3 session 1 d3 association association
rule: d1P#d2,d3
1 000 rule: d1d2
(session 1)
d2
session 3
100
direct association
0.0% 0.2% 0.4% 0.6% 0.8% 1.0%
d2
rule: d3d2
Min. support
(session 3)
direct partial indirect
Dane z polskiego sklepu internetowego handlujÄ…cego komputerami
association rule association rule
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 23 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 24
Number of direct rules
c
i
n
r
a
n
e
e
l
o
i
o
n
m
t
o
o
u
i
a
B
s
z
N
r
i
l
e
a
v
n
m
o
r
c
o
n
Cząstkowe reguły pośrednie
Cząstkowe reguły pośrednie
(partial indirect association rule)
Cząstkowe reguły pośrednie łączą dwie składowe:
d1 P# d2 , d3 [icon,minsup,mincon]



dwie reguły bezpośrednie
cząstkowa reguła pośrednia jest z każdej strony do
d1d3[sup,con] and d3d2[sup,con]



strony produktowej poprzez dowolnÄ… innÄ…
con°(di°dP ,dk) = cont(didk) * cont(dkdP )



j j
Obie bezpośrednie reguły składowe mogą być
uzależnione od czasu i obie przekraczają min.con.
i min.sup.
stare sesje mają mniejszy wpływ
d1d3[15%,55%] and d3d2[9%,70%]



Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 25 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 26
Liczba cząstkowych reguł
Liczba stron przechodnich
pośrednich
600 Max Tij
547 con=1%
con=0.1%
100 000 000
Average Tij
con=0.5%
400
400
con=1%
10 000 000
con=2%
250
252
200
1 000 000
38
8
20
11
0
100 000
0.00% 0.03% 0.06% 0.09% 0.12%
0.00 0.03 0.06 0.09 0.12
Min. support
% % % % %
Min. support Tij - zbiór stron przechodnich z di to dP
j
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 27 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 28
Kompletne reguły pośrednie
Bezpośrenie i pośrednie
(complete indirect association rules)
Id Pages Id Pages Id Pages Id Pages
1 d1,d2,d4 4 d1,d3 7 d4,d5,d6 10 d1,d3
Transitive pages
2 d1,d4 5 d2,d4,d5,d6 8 d2,d4,d5,d6
3 d1,d2,d4 6 d2,d4 9 d1,d6
d3
d6 d6
0.07
d3
d1
direct rule direct
d1
partial indirect
d4
d4
di dj
d5
d5
d2
d2
Direct confidences Indirect confidences
complete indirect association rule
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 29 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 30
0.40
pages card(Tij)
No. of transitive
rules
No. of partial indirect
7
0
1
0
.
.
1
0
5
7
.
2
0
4
0
.
0
.
.
1
4
0
0
3
3
4
4
.
2
0
.
1
0
0
5
.
.
5
0
7
0
.
0
.
0
0
0
7
1
0
.
.
0
2
0
0
3
1
.
4
7
7
.
0
0
0
.
4
.
2
3
0
0
0
0
0
7
4
.
.
3
1
.
.
1
0
0
0
5
7
6
.
0
0
3
.
5
0
.
0
.
5
0
0
0
4
.
0
4
.
2
0
Kompletne reguły pośrednie Kompletne reguły pośrednie
Aączą wszystkie reguły cząstkowe pomiędzy parą
80%
80%
stron
60%
60%
Konieczna jest normalizacja pewności
40%
40%
(confidence) dla zapewnienia przedziału [0;1]
20%
20%
supmin
Próg dla pewności do odfiltrowania zbyt  słabych
conmin
0%
reguł iconmin 0%
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 31 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 32
Normalizacja kompletnej pewności Próg
100.00%
card(Tij )
conP#(di P# d , dk )
j
"
without thresholds
k=1
con#(di#dj)=
u 10.00%
Global: u=max(card(Tij));
Tij - zbiór stron przechodnich z di do dj
with thresholds
1.00%
(supmin=0.008%,
conmin=2%)
Global: u=card (D); D - zbiór wszystkich stron
0.10%
Global: u=100,000
Local: u=card(Tij) - średnia arytm z reguł
iconmin
czÄ…stkowych
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 33 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 34
Reguły pośrednie w rekomendacji
Reguły złożone
Session
Reguły złożone łączą bezpośrednie i pośrednie
Historical user sessions
Pre-processor
Direct Association con*(di*dP ) = Ä…·con(didP ) + (1-Ä…) con#(di#dP )
j j j
Direct association rules
Rule Miner
Ä… - parameter of direct rules importance
Main,
Partial indirect
Indirect offline
association rules
RozszerzajÄ… listy rankingowe (w stosunku do list
Association recom m endation
bazujących wyłącznie na regułach bezpośredn.)
Complete indirect
Rule Miner process
association rules
Min No. of pages No. of pages No. of pages with
sup
with only 1 rule with 1 to 3 rules 1 to 5 rules
Complex
Complex association rules
[%]
direct complex complex complex
direct direct
Association
Ranking lists for pages
Rule Miner 0.01 69 2 257 3 502 (12%) 9 (0.2%)
0.02 94 2 386 2 775 (18%) 2 (0.05%)
Hyperlink
Personalized ranking list
Online
for requested page
Recommender
recom m endation 0.05 71 0 372 1 818 (19%) 2
process
W eb page content User Assistant
0.10 60 2 267 2 526 (12%) 2
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 35 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 36
0%
100
0.00%
0.04%
0.08%
0.12%
0.16%
0.20%
Percentage of all possible rules
20%
40%
60%
80%
Percentage of all possible rules
complete indirect rules
Percentage of all possible
0.0%
0.5%
1.0%
1.5%
2.0%
2.5%
3.0%
3.5%
4.0%
4.5%
Total 4,242 pages
Rozszerzenia rankingów Liczba reguł
100%
10 000 000
Direct
The
con=1%
80%
Indirect
field
Complex
for
60% 1 000 000
With no rules
exten-
Less than 2 rules
40%
sions
Less than 3 rules
ca. 20 times
100 000
Less than 4 rules
20%
more
Less than 6 rules
0%
10 000
0.00% 0.04% 0.08% 0.12% 0.16% 0.20%
0.00% 0.03% 0.06% 0.09% 0.12%
Min. support
Min. support
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 37 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 38
Wzmocnienia lub osłabienia reguł Rankingi bezpośrednie kontra
bezpośrednich przez pośrednie złożone - współczynnik Kendala
90%
10
no changes
75%
5
60%
3
45%
strenghtened
2
`
30%
weakened
1
15%
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1
0%
mediana
odchylenie standardowe
Współczynnik podobieństwa
średnia
www.pwr.wroc.pl
, conmin=1%,
iconmin
supmin=0.1%, indirconmin=0.01%, alfa=0.2
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 39 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 40
Wzorce sekwencji - popularne Ścieżki nawigacyjne
ścieżki nawigacyjne
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 41 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 42
No. of rules
Percentage of all pages
Liczba pozycji
percentage of rules
0.0%
0.2%
0.4%
0.6%
0.8%
1.0%
1.2%
1.4%
1.6%
1.8%
2.0%
2.2%
2.4%
2.6%
Strony poprzedzajÄ…ce rezygnacjÄ™
Grupowanie
z serwisu w danym miejscu
Służy do zmniejszenia liczby obiektów do porównania
i dotyczy np.
sesji użytkowników - grupy sesji to  wzorce
użytkowania (web usage mining)
treści tekstowej stron - grupy stron podobnych
tematycznie (web content mining)
Mając np. 20 grup szybko (online) można odnalezć
grupę najbliższą użytkownikowi - nearest
neighbourhood
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 43 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 44
Koncepcja podpowiadania
Web (ad) content mining
odsyłaczy
OFFLINE
Wydzielenie terminów ze Identyfikacja sesji
stron serwisu (logi)
Utworzenie
Utworzenie
wektorów terminów,
wektorów sesji.
Grupowanie
Grupowanie
Wzorce użycia - grupy,
Przestrzenie tematyczne
centroidy grup sesji
- centroidy tematów
PrzeglÄ…darka
Żądanie HTTP Odp. HTTP
Serwer WWW.
Najbliższa tematyka Najbliższa grupa sesji
Wektor aktual.sesji
wektor sesji Podpowiedzi (URL-e)
wektor centroidu
wektor centroidu
Integracja wektorów
Ranking stron
ONLINE
Web content mining Integracja Web usage mining
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 45 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 46
Web content clusters
Conceptual spaces - vectors
- conceptual spaces
Publisher s Advertisements Publisher s pages Advertiser s sites
url1 url2 url3 url4...urlM ad1,ad2,ad3...adN
Content Content
Clusters Clusters
term1 0, 1, 1, 0, ..., 1 term1 0, 0.8, 1, ..., 0
Conceptual
(pages) (sites) term2 0, 0, 1, 0, ..., 1
space
term3 0.1, 0, 0, 0, ..., 0
(cluster) 1
term1 term1 term4 1, 1, 1, 0.9,.., 1 term4 0, 0.1, 1, ..., 0
term2
Cluster 1 Cluster 1
term3
Conceptual
term5 0, 0, 0, 1, ..., 1
term4 term4
term6 1, 0, 0, 0.7,.., 1 term6 0, 0.1, 0, ..., 1 space
term7 1, 0, 0.1, 0.6,.., 1 term7 0, 0, 0, ..., 0
(cluster) 2
term5
term8 0, 0, 0.1, 0, ..., 0
term6 term6 Cluster 2
Cluster 2
term9 1, 1, 1, 0.9,.., 1
term7 term7
term10 1, 1, 0.1,.., 1
estimated derived
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 47 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 48
Conceptual spaces - centroids Web (ad) usage mining
W eb (ad) usage mining
Publ. term vectors
Publisher Advertisers
url1 url2 url3 url4...urlM
Historical,
Historical
Conceptual space (cluster) 1
visited ad
session vectors
term1 0, 1, 1, 0, ..., 1
vectors
url1 url2 url3 url4...urlM
term2 0, 0, 1, 0, ..., 1
centroid1 0, 0.5, 1, 0, ..., 1
Clustering
term3 0.1, 0, 0, 0, ..., 0
ad1 ad2 ad3 ...adN
1:1
Ad visiting
term4 1, 1, 1, 0.9,.., 1
Usage patterns,
centroid1 0, 0.3, 1, ..., 0
1:1 patterns,
usage centroids
centroids
offline
Conceptual space (cluster) 2
online
Active user page Closest usage Closest ad
term5 0, 0, 0, 1, ..., 1 url1 url2 url3 url4...urlM
session vector pattern visiting pattern
term6 1, 0, 0, 0.7,.., 1
centroid2 0.5, 0, 0, 0.9,..., 1
term7 1, 0, 0.1, 0.6,.., 1
ad1 ad2 ad3 ...adN
vector
Vector integration,
centroid2 0, 0.2, 0, ...,0.9
1:1
ad ranking
Personalization
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 49 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 50
Monitorowanie aktywn.użytkown.
Usage patterns - vectors
- page session vector
Visited publisher s
Session vectors
Clicked
url1 url2 url3 url4...urlM pages advertisements
Usage pattern (cluster) 1
session1 0, 1, 1, 0, ..., 1 url1 url2 url3 url4...urlM
session2 0, 0, 1, 0, ..., 1 centroid1 0, 0.5, 1, 0, ..., 1
ad1 ad2 ad3 ...adN
session3 1, 0, 0, 0, ..., 0
1:1
centroid1 1, 0, 0, ...,0.4
session4 0, 1, 0, 0, ..., 0
Usage patern (cluster) 2
session5 0, 0, 0, 1, ..., 1
url1 url2 url3 url4...urlM
Niezerowe wartości odpowiadają odwiedzonym
session6 1, 0, 0, 0, ..., 1 centroid2 0.5, 0, 0, 0.5,..., 1
stronom
ad1 ad2 ad3 ...adN
1:1
centroid2 0, 0.2, 0, ...,0.9 Po wyświetleniu strony zmniejszenie wartości
ekspotencjalnie
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 51 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 52
Przyporządkowanie treści
Przyporządkowanie użytkownika
- the closest conceptual space
the closest
Conceptual spaces
Conceptual spaces
Publisher s publisher s
Publisher s
Ad
Ad - centroid vectors
- centroid vectors
Publisher s
Publisher s pages
pages
Advertisers
Advertisers
Clicking
Clicking
Current
conceptual Current content
conceptual usage
usage
(conceptual space representatives)
conceptual (conceptual space representatives)
conceptual
pattern
pattern
user
space user
space pattern
pattern
space
space
(thematic goup)
(thematic goup) behavior
behavior 5
5
5
5
(visited pages)
(visited pages)
url1 url2 url3 url4...urlM
url1 url2 url3 url4...urlM
2 2
2 2
centroid1 0, 0, 1, 0, ...,1
centroid1 0, 0, 1, 0, ...,1
url1 url2 url3 url4& urlM
centroid2 0.1, 1, 1, 0.8,...,1
centroid2 0.1, 1, 1, 0.8,...,1
Publisher s
Publisher s
Publisher s
Publisher s Ad
Ad
Advertisers
Advertisers
pages
pages
conceptual
conceptual Clicking centroid3 0, 0, 0, 1, ...,1
ad1 ad2 ad3...adN 0, 1, 0, 0.9,..,0.81
Clicking centroid3 0, 0, 0, 1, ...,1
conceptual
conceptual
usage
usage
space
space pattern page session vector
pattern
space
space
pattern
(thematic goup) pattern
1, 0, 0, ..,0.4
(thematic goup) centroid4 1, 0, 0, 0.9,...,
centroid4 1, 0, 0, 0.9,...,
8
8
8 (active user behavior)
8
1 1
1 1
the closest
advertiser s content
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 53 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 54
Przyporządkowanie użytkowania
Inne wektory
- the closest usage pattern
Jedna przestrzeń wektorowa
Usage patterns
Usage patterns
the closest
Najbliższa grupa tematyczna (advertiser s portal
page usage - centroid vectors
- centroid vectors
content) - najbardziej odpowiednia treść
pattern
url1 url2 url3 url4...urlM
url1 url2 url3 url4...urlM
Najbliższy wzorzec klikowalności - reklamy
centroid1 0, 0, 1, 0, ...,1
centroid1 0, 0, 1, 0, ...,1
najbardziej prawdopodobne do kliknięcia
page session vector
centroid2 0.1, 1, 1, 0.8,...,1
centroid2 0.1, 1, 1, 0.8,...,1
(active user behavior)
Wyświetlone reklamy - zabezpieczenie przed
centroid3 0, 0, 0, 1, ...,1
centroid3 0, 0, 0, 1, ...,1
url1 url2 url3 url4& urlM centroid4 1, 0, 0, 0.9,...,
znużeniem
centroid4 1, 0, 0, 0.9,...,1
0, 1, 0, 0.9,..,0.81
ad1 ad2 ad3...adN
Reklamy już kliknięte nie wyświetlane
1, 0, 0, ..,0.4
the closest
Polityki reklamowe (liczba ekspozycji na klienta,
ad visiting pattern
priorytety, itd..)
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 55 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 56
Spersonalizowana integracja
Integracja wektorów
wektorów
Closest Personalization Closest ad
advertising visiting
rank = (cta+cv+²) " (1 as) " uea " (1 v) " p
conceptual space pattern
Active
vector
Ad Ad emission Visited
user
session acceptance ads
ad
Number of
vectors
Priority
The rank The closest ad exposition per
vectors
vector
vector
Vector integration, vector visiting pattern user monitoring
vector
ad ranking
Advertising
policy
Adv already
Filtering
The closest
visited by the
advertiser conceptual
Exposed
user
Advertisements Selected, personalized
space vector
set
advertisements advertisements
online
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 57 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 58
Ranking, Filtering Warsztaty na ISDA, Wrocław 2005
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 59 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 60
Bibliografia 1/2 Bibliografia 2/2
6. Kazienko P., Adamski M.: Personalized Web Advertising Method. Adaptive
1. Kazienko P., Kołodziejski P.: WindOwls - Adaptive System for the
Hypermedia 2004, August 24-26, 2004, Eindhoven, The Netherlands, LNCS
Integration of Recommendation Methods in E-commerce. 2005, to appear.
3137, Springer Verlag, pp. 146-155.
2. Kazienko P.: IDARM - Mining of Indirect Association Rules. New Trends in
7. Kazienko P., Matrejek M.: Parameters for Mining Indirect Associations in
Intelligent Information Processing and Web Mining IIS 2005, June 13-16, the Web Environment. MiSSI, Vol. II. 2004, pp. 201-211.
2005, Advances in Soft Computing, Springer Verlag 2005, pp. . 8. Kazienko P., Kiewra M.: Integration of Relational Databases and Web Site
Content for Product and Page Recommendation. 8th International
3. Kazienko P., Matrejek M.: Adjustment of Indirect Association Rules for the
Database Engineering & Applications Symposium. IDEAS 2004 Coimbra,
Web. SOFSEM 2005, Slovak Republic, 2005, Springer LNCS 3381, pp.
Portugal, IEEE Computer Society, pp. 111-116
211-220.
9. Kazienko P., Kiewra M.: ROSA - Multi-agent System for Web Services
Personalization. First Atlantic Web Intelligence Conference Proceedings,
4. Kazienko P.: Product Recommendation in E-Commerce Using Direct and
Madrid, Spain, May 5-6, 2003, LNAI 2663, Springer Verlag, 2003, 297-306
Indirect Confidence for Historical User Sessions. DS'04. 7th International
10. Kazienko P., Kiewra M.: Personalized Recommendation of Web Pages.
Conference on Discovery Science, Padova, Italy, 2004, Springer Verlag,
Chapter 10 in: Nguyen T. (ed.) Intelligent Technologies for Inconsistent
LNAI 3245, pp. 255-269
Knowledge Processing. Advanced Knowledge International, Adelaide,
South Australia, 2004, pp. 163-183.
5. Kazienko P.: Multi-agent Web Recommendation Method Based on Indirect
11. Kazienko P., Kiewra M.: Link Recommendation Method Based on Web
Association Rules. KES 2004, 8th International Conference on Knowledge-
Content and Usage Mining. New Trends in Intelligent Information
Based Intelligent Information & Engineering Systems, Wellington, New
Processing and Web Mining IIS 2003, Zakopane, June 2-5, 2003, Advances
Zealand, September 20-25, 2004, Part II, LNAI 3214, Springer Verlag,
in Soft Computing, Springer Verlag 2003, pp. 529-534.
1157-1164.
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 61 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 62
Dziękuję za uwagę!
Jest czas na pytania?
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 63


Wyszukiwarka