Dlaczego internetowe systemy rekomendacyjne? Eksploracja danych Kanały internetowe (serwisy, witryny) dla wielu firm są w internetowych głównym a dla bardzo wielu ważnym obszarem działalności systemach Systemy internetowe a w szczególności sklepy powinny rekomendujących być coraz bardziej adaptowane do potrzeb konkretnego użytkownika - personalizacja jak najlepsza prezentacja oferty handlowej atrakcyjność i zadowolenie klienta Przemysław KAZIENKO dynamizm zawartości (zabezpieczenie przed Instytut Informatyki Stosowanej znużeniem) Politechnika Wrocławska kazienko@pwr.wroc.pl Jedno z rozwiązań: systemy rekomendujące Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 2 Przykład rekomendacji Reklama jako rekomendacja Baner Osoby które kupowały "XML na poważnie" często kupowały też: Advertiser s web site Publisher s page Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 3 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 4 Oceny Środowisko Użytkownik serwisu internetowego Obiekt rekomendowany (strona, produkt) Połączenie użytkownik - obiekt oceny (ratings) zachowania (sesje, ścieżki nawigacyjne) użytkowników koszyki (dodane do koszyka) zamówienia zakupy Połączenie strona internetowa - obiekt (jeżeli nie jest on stroną), np. pomiędzy stroną a produktem w sklepie Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 5 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 6 Oceny Połącznie strona - obiekt (produkt) W eb Product site database Product 1 Product 2 Product 1 W eb page W eb page m:n Normal rel Product 2 web page Product 3 W eb page Product 3 Product page Normal set DP web page Product set P W eb page set D navigational steps corresponding to one user session Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 7 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 8 Rekomendowane obiekty Podpowiadanie odsyłaczy Systemy rekomendujące proponują użytkownikowi: inne elementy serwisu (strony, działy), rekomendacja odsyłaczy hipertekstowych, (next step recommendation, hyperlink recommendation) produkty w sklepach internetowych reklamy (Google AdSense, AdROSA) inne obiekty charakterystyczne dla systemu, np. kursy nauczania, artykuły prasowe, itd. Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 9 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 10 Sposób rekomendacji 1/2 Sposób rekomendacji 2/2 4. Korelacja obiektów (item-to-item correlation) - 1. Zwykłe wyszukiwanie (raw retrieval), bez podobieństwo między obiektami, np. razem kupowane, rekomendacji razem oglądane, podobnie oceniane, strony podobne treściowo 2. Ręczna selekcja (manually selected) dokonana przez web content mining jakieś osoby (ekspert, zapaleniec), ulubione linki , web usage mining zobacz także inne związane web structure mining 3. Globalne podsumowania statystyczne (statistical association rules summaries) np. opinii lub zakupów, the best buy , the 5. Korelacja użytkowników (user-to-user correlation) best rated czyli filtrowanie kolaboratywne (collaborative filtering) najbliższy sąsiad (nearest neighbour) 4. Korelacja atrybutów użytkownik-obiekt (attribute- najbliższe sąsiedztwo (nearest neighbourhood) based) preferencje użytkownika pasujące do obiektów, np. interesują mnie: słowniki w języku angielskim potrzebny łącznik pomiędzy użytkownikami Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 11 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 12 Problemy systemów Stopień personalizacji kolaboratywnych Nowe obiekty (strony, produkty) - nie mają połączenia Niespersonalizowana, każdy to samo na każdej stronie z innymi użytkownikami (sąsiadami) Ulotna (ephemeral), zależna od miejsca, tj. inna na każdej stronie, ale wspólna dla wszystkich Nowi użytkownicy - nie mają połączenia z obiektami. Cold start problem korelacja obiektów Rzadkość danych - dużo obiektów i dużo Bezustanna, ciągła (persistent) na danej stronie inna użytkowników dla każdego użytkownika a nawet inna dla każdego użytkownika na każdej stronie Zmienność obiektów i zainteresowań użytkowników korelacja atrybutów Pozyskiwanie połączeń korelacja obiektów połączona z ciągłym ręczne, niechęć do oceniania monitorowaniem preferencji użytkownika (korelacja atrybutów i obiektów razem) automatyczne, np. sesje HTTP korelacja użytkowników Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 13 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 14 Ta sama Ta sama strona, inna osoba, osoba inna strona Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 15 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 16 Ta sama osoba i strona, inny czas Inne elementy rekomendacji Zmiennośćrekomendacji w czasie, każdy to samo na każdej stronie inna rekomendacja przy kolejnym wejściu na daną stronę w czasie tej samej sesji inna rekomendacja w różnych sesjach użytkownika Identyfikacja użytkowników Zmiennośćobiektów (stron, produktów) Starzenie się danych, np. wnioskowanie ze starych zakupów Integracja z innymi zródłami danych (wyszukiwarki, katalogi), np. bazy danych o produktach z treścią tekstową stron Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 17 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 18 Integracja bazy danych o Eksploracja danych produktach z treścią stron Analiza związków, powiązań reguły związków wzorce sekwencji podobne sekwencje czasowe Grupowanie, segmentacja hierarchiczne - płaskie rozdzielne - zachodzące grupy Klasyfikacja, predykcja drzewa decyzyjne regresja liniowa i nieliniowa sieci neuronowe sieci Bayesa wnioskowanie pamięciowe (najbliższy sąsiad/kilku sąsiadów) Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 19 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 20 Reguły związków dla WWW Bezpośrednie reguły związków d1 d2 [support, confidence]
Zwykle potwierdzają tylko istniejące odsyłacze Może istnieć mało reguł Efekt: czasami słabe rekomendacje (krótkie listy rekomendacji) d1 d2 [12%, 70%]
Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 21 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 22 Reguły bezpośrednie i pośrednie Minimalne poparcie 1 000 000 direct association rule: d1d3 d1 min. con=0.1% (session 2) 100 000 min. con=2% session 2 d1 10 000 No. of pages=4.242 partial indirect direct No. of sessions=16.127 d3 session 1 d3 association association rule: d1P#d2,d3 1 000 rule: d1d2 (session 1) d2 session 3 100 direct association 0.0% 0.2% 0.4% 0.6% 0.8% 1.0% d2 rule: d3d2 Min. support (session 3) direct partial indirect Dane z polskiego sklepu internetowego handlującego komputerami association rule association rule Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 23 Przemysław Kazienko: Eksploracja danych w internetowych serwisach rekomendujących. 17.01.2005 24 Number of direct rules c i n r a n e e l o i o n m t o o u i a B s z N r i l e a v n m o r c o n Cząstkowe reguły pośrednie Cząstkowe reguły pośrednie (partial indirect association rule) Cząstkowe reguły pośrednie łączą dwie składowe: d1 P# d2 , d3 [icon,minsup,mincon]
dwie reguły bezpośrednie cząstkowa reguła pośrednia jest z każdej strony do d1d3[sup,con] and d3d2[sup,con]
strony produktowej poprzez dowolnÄ… innÄ… con°(di°dP ,dk) = cont(didk) * cont(dkdP )
j j Obie bezpośrednie reguły składowe mogą być uzależnione od czasu i obie przekraczają min.con. i min.sup. stare sesje mają mniejszy wpływ d1d3[15%,55%] and d3d2[9%,70%]
PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 25 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 26 Liczba czÄ…stkowych reguÅ‚ Liczba stron przechodnich poÅ›rednich 600 Max Tij 547 con=1% con=0.1% 100 000 000 Average Tij con=0.5% 400 400 con=1% 10 000 000 con=2% 250 252 200 1 000 000 38 8 20 11 0 100 000 0.00% 0.03% 0.06% 0.09% 0.12% 0.00 0.03 0.06 0.09 0.12 Min. support % % % % % Min. support Tij - zbiór stron przechodnich z di to dP j PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 27 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 28 Kompletne reguÅ‚y poÅ›rednie BezpoÅ›renie i poÅ›rednie (complete indirect association rules) Id Pages Id Pages Id Pages Id Pages 1 d1,d2,d4 4 d1,d3 7 d4,d5,d6 10 d1,d3 Transitive pages 2 d1,d4 5 d2,d4,d5,d6 8 d2,d4,d5,d6 3 d1,d2,d4 6 d2,d4 9 d1,d6 d3 d6 d6 0.07 d3 d1 direct rule direct d1 partial indirect d4 d4 di dj d5 d5 d2 d2 Direct confidences Indirect confidences complete indirect association rule PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 29 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 30 0.40 pages card(Tij) No. of transitive rules No. of partial indirect 7 0 1 0 . . 1 0 5 7 . 2 0 4 0 . 0 . . 1 4 0 0 3 3 4 4 . 2 0 . 1 0 0 5 . . 5 0 7 0 . 0 . 0 0 0 7 1 0 . . 0 2 0 0 3 1 . 4 7 7 . 0 0 0 . 4 . 2 3 0 0 0 0 0 7 4 . . 3 1 . . 1 0 0 0 5 7 6 . 0 0 3 . 5 0 . 0 . 5 0 0 0 4 . 0 4 . 2 0 Kompletne reguÅ‚y poÅ›rednie Kompletne reguÅ‚y poÅ›rednie AÄ…czÄ… wszystkie reguÅ‚y czÄ…stkowe pomiÄ™dzy parÄ… 80% 80% stron 60% 60% Konieczna jest normalizacja pewnoÅ›ci 40% 40% (confidence) dla zapewnienia przedziaÅ‚u [0;1] 20% 20% supmin Próg dla pewnoÅ›ci do odfiltrowania zbyt sÅ‚abych conmin 0% reguÅ‚ iconmin 0% PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 31 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 32 Normalizacja kompletnej pewnoÅ›ci Próg 100.00% card(Tij ) conP#(di P# d , dk ) j " without thresholds k=1 con#(di#dj)= u 10.00% Global: u=max(card(Tij)); Tij - zbiór stron przechodnich z di do dj with thresholds 1.00% (supmin=0.008%, conmin=2%) Global: u=card (D); D - zbiór wszystkich stron 0.10% Global: u=100,000 Local: u=card(Tij) - Å›rednia arytm z reguÅ‚ iconmin czÄ…stkowych PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 33 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 34 ReguÅ‚y poÅ›rednie w rekomendacji ReguÅ‚y zÅ‚ożone Session ReguÅ‚y zÅ‚ożone Å‚Ä…czÄ… bezpoÅ›rednie i poÅ›rednie Historical user sessions Pre-processor Direct Association con*(di*dP ) = Ä…·con(didP ) + (1-Ä…) con#(di#dP ) j j j Direct association rules Rule Miner Ä… - parameter of direct rules importance Main, Partial indirect Indirect offline association rules RozszerzajÄ… listy rankingowe (w stosunku do list Association recom m endation bazujÄ…cych wyÅ‚Ä…cznie na reguÅ‚ach bezpoÅ›redn.) Complete indirect Rule Miner process association rules Min No. of pages No. of pages No. of pages with sup with only 1 rule with 1 to 3 rules 1 to 5 rules Complex Complex association rules [%] direct complex complex complex direct direct Association Ranking lists for pages Rule Miner 0.01 69 2 257 3 502 (12%) 9 (0.2%) 0.02 94 2 386 2 775 (18%) 2 (0.05%) Hyperlink Personalized ranking list Online for requested page Recommender recom m endation 0.05 71 0 372 1 818 (19%) 2 process W eb page content User Assistant 0.10 60 2 267 2 526 (12%) 2 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 35 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 36 0% 100 0.00% 0.04% 0.08% 0.12% 0.16% 0.20% Percentage of all possible rules 20% 40% 60% 80% Percentage of all possible rules complete indirect rules Percentage of all possible 0.0% 0.5% 1.0% 1.5% 2.0% 2.5% 3.0% 3.5% 4.0% 4.5% Total 4,242 pages Rozszerzenia rankingów Liczba reguÅ‚ 100% 10 000 000 Direct The con=1% 80% Indirect field Complex for 60% 1 000 000 With no rules exten- Less than 2 rules 40% sions Less than 3 rules ca. 20 times 100 000 Less than 4 rules 20% more Less than 6 rules 0% 10 000 0.00% 0.04% 0.08% 0.12% 0.16% 0.20% 0.00% 0.03% 0.06% 0.09% 0.12% Min. support Min. support PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 37 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 38 Wzmocnienia lub osÅ‚abienia reguÅ‚ Rankingi bezpoÅ›rednie kontra bezpoÅ›rednich przez poÅ›rednie zÅ‚ożone - współczynnik Kendala 90% 10 no changes 75% 5 60% 3 45% strenghtened 2 ` 30% weakened 1 15% 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 0% mediana odchylenie standardowe Współczynnik podobieÅ„stwa Å›rednia www.pwr.wroc.pl , conmin=1%, iconmin supmin=0.1%, indirconmin=0.01%, alfa=0.2 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 39 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 40 Wzorce sekwencji - popularne Åšcieżki nawigacyjne Å›cieżki nawigacyjne PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 41 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 42 No. of rules Percentage of all pages Liczba pozycji percentage of rules 0.0% 0.2% 0.4% 0.6% 0.8% 1.0% 1.2% 1.4% 1.6% 1.8% 2.0% 2.2% 2.4% 2.6% Strony poprzedzajÄ…ce rezygnacjÄ™ Grupowanie z serwisu w danym miejscu SÅ‚uży do zmniejszenia liczby obiektów do porównania i dotyczy np. sesji użytkowników - grupy sesji to wzorce użytkowania (web usage mining) treÅ›ci tekstowej stron - grupy stron podobnych tematycznie (web content mining) MajÄ…c np. 20 grup szybko (online) można odnalezć grupÄ™ najbliższÄ… użytkownikowi - nearest neighbourhood PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 43 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 44 Koncepcja podpowiadania Web (ad) content mining odsyÅ‚aczy OFFLINE Wydzielenie terminów ze Identyfikacja sesji stron serwisu (logi) Utworzenie Utworzenie wektorów terminów, wektorów sesji. Grupowanie Grupowanie Wzorce użycia - grupy, Przestrzenie tematyczne centroidy grup sesji - centroidy tematów PrzeglÄ…darka Żądanie HTTP Odp. HTTP Serwer WWW. Najbliższa tematyka Najbliższa grupa sesji Wektor aktual.sesji wektor sesji Podpowiedzi (URL-e) wektor centroidu wektor centroidu Integracja wektorów Ranking stron ONLINE Web content mining Integracja Web usage mining PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 45 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 46 Web content clusters Conceptual spaces - vectors - conceptual spaces Publisher s Advertisements Publisher s pages Advertiser s sites url1 url2 url3 url4...urlM ad1,ad2,ad3...adN Content Content Clusters Clusters term1 0, 1, 1, 0, ..., 1 term1 0, 0.8, 1, ..., 0 Conceptual (pages) (sites) term2 0, 0, 1, 0, ..., 1 space term3 0.1, 0, 0, 0, ..., 0 (cluster) 1 term1 term1 term4 1, 1, 1, 0.9,.., 1 term4 0, 0.1, 1, ..., 0 term2 Cluster 1 Cluster 1 term3 Conceptual term5 0, 0, 0, 1, ..., 1 term4 term4 term6 1, 0, 0, 0.7,.., 1 term6 0, 0.1, 0, ..., 1 space term7 1, 0, 0.1, 0.6,.., 1 term7 0, 0, 0, ..., 0 (cluster) 2 term5 term8 0, 0, 0.1, 0, ..., 0 term6 term6 Cluster 2 Cluster 2 term9 1, 1, 1, 0.9,.., 1 term7 term7 term10 1, 1, 0.1,.., 1 estimated derived PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 47 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 48 Conceptual spaces - centroids Web (ad) usage mining W eb (ad) usage mining Publ. term vectors Publisher Advertisers url1 url2 url3 url4...urlM Historical, Historical Conceptual space (cluster) 1 visited ad session vectors term1 0, 1, 1, 0, ..., 1 vectors url1 url2 url3 url4...urlM term2 0, 0, 1, 0, ..., 1 centroid1 0, 0.5, 1, 0, ..., 1 Clustering term3 0.1, 0, 0, 0, ..., 0 ad1 ad2 ad3 ...adN 1:1 Ad visiting term4 1, 1, 1, 0.9,.., 1 Usage patterns, centroid1 0, 0.3, 1, ..., 0 1:1 patterns, usage centroids centroids offline Conceptual space (cluster) 2 online Active user page Closest usage Closest ad term5 0, 0, 0, 1, ..., 1 url1 url2 url3 url4...urlM session vector pattern visiting pattern term6 1, 0, 0, 0.7,.., 1 centroid2 0.5, 0, 0, 0.9,..., 1 term7 1, 0, 0.1, 0.6,.., 1 ad1 ad2 ad3 ...adN vector Vector integration, centroid2 0, 0.2, 0, ...,0.9 1:1 ad ranking Personalization PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 49 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 50 Monitorowanie aktywn.użytkown. Usage patterns - vectors - page session vector Visited publisher s Session vectors Clicked url1 url2 url3 url4...urlM pages advertisements Usage pattern (cluster) 1 session1 0, 1, 1, 0, ..., 1 url1 url2 url3 url4...urlM session2 0, 0, 1, 0, ..., 1 centroid1 0, 0.5, 1, 0, ..., 1 ad1 ad2 ad3 ...adN session3 1, 0, 0, 0, ..., 0 1:1 centroid1 1, 0, 0, ...,0.4 session4 0, 1, 0, 0, ..., 0 Usage patern (cluster) 2 session5 0, 0, 0, 1, ..., 1 url1 url2 url3 url4...urlM Niezerowe wartoÅ›ci odpowiadajÄ… odwiedzonym session6 1, 0, 0, 0, ..., 1 centroid2 0.5, 0, 0, 0.5,..., 1 stronom ad1 ad2 ad3 ...adN 1:1 centroid2 0, 0.2, 0, ...,0.9 Po wyÅ›wietleniu strony zmniejszenie wartoÅ›ci ekspotencjalnie PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 51 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 52 PrzyporzÄ…dkowanie treÅ›ci PrzyporzÄ…dkowanie użytkownika - the closest conceptual space the closest Conceptual spaces Conceptual spaces Publisher s publisher s Publisher s Ad Ad - centroid vectors - centroid vectors Publisher s Publisher s pages pages Advertisers Advertisers Clicking Clicking Current conceptual Current content conceptual usage usage (conceptual space representatives) conceptual (conceptual space representatives) conceptual pattern pattern user space user space pattern pattern space space (thematic goup) (thematic goup) behavior behavior 5 5 5 5 (visited pages) (visited pages) url1 url2 url3 url4...urlM url1 url2 url3 url4...urlM 2 2 2 2 centroid1 0, 0, 1, 0, ...,1 centroid1 0, 0, 1, 0, ...,1 url1 url2 url3 url4& urlM centroid2 0.1, 1, 1, 0.8,...,1 centroid2 0.1, 1, 1, 0.8,...,1 Publisher s Publisher s Publisher s Publisher s Ad Ad Advertisers Advertisers pages pages conceptual conceptual Clicking centroid3 0, 0, 0, 1, ...,1 ad1 ad2 ad3...adN 0, 1, 0, 0.9,..,0.81 Clicking centroid3 0, 0, 0, 1, ...,1 conceptual conceptual usage usage space space pattern page session vector pattern space space pattern (thematic goup) pattern 1, 0, 0, ..,0.4 (thematic goup) centroid4 1, 0, 0, 0.9,..., centroid4 1, 0, 0, 0.9,..., 8 8 8 (active user behavior) 8 1 1 1 1 the closest advertiser s content PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 53 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 54 PrzyporzÄ…dkowanie użytkowania Inne wektory - the closest usage pattern Jedna przestrzeÅ„ wektorowa Usage patterns Usage patterns the closest Najbliższa grupa tematyczna (advertiser s portal page usage - centroid vectors - centroid vectors content) - najbardziej odpowiednia treść pattern url1 url2 url3 url4...urlM url1 url2 url3 url4...urlM Najbliższy wzorzec klikowalnoÅ›ci - reklamy centroid1 0, 0, 1, 0, ...,1 centroid1 0, 0, 1, 0, ...,1 najbardziej prawdopodobne do klikniÄ™cia page session vector centroid2 0.1, 1, 1, 0.8,...,1 centroid2 0.1, 1, 1, 0.8,...,1 (active user behavior) WyÅ›wietlone reklamy - zabezpieczenie przed centroid3 0, 0, 0, 1, ...,1 centroid3 0, 0, 0, 1, ...,1 url1 url2 url3 url4& urlM centroid4 1, 0, 0, 0.9,..., znużeniem centroid4 1, 0, 0, 0.9,...,1 0, 1, 0, 0.9,..,0.81 ad1 ad2 ad3...adN Reklamy już klikniÄ™te nie wyÅ›wietlane 1, 0, 0, ..,0.4 the closest Polityki reklamowe (liczba ekspozycji na klienta, ad visiting pattern priorytety, itd..) PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 55 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 56 Spersonalizowana integracja Integracja wektorów wektorów Closest Personalization Closest ad advertising visiting rank = (cta+cv+²) " (1 as) " uea " (1 v) " p conceptual space pattern Active vector Ad Ad emission Visited user session acceptance ads ad Number of vectors Priority The rank The closest ad exposition per vectors vector vector Vector integration, vector visiting pattern user monitoring vector ad ranking Advertising policy Adv already Filtering The closest visited by the advertiser conceptual Exposed user Advertisements Selected, personalized space vector set advertisements advertisements online PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 57 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 58 Ranking, Filtering Warsztaty na ISDA, WrocÅ‚aw 2005 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 59 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 60 Bibliografia 1/2 Bibliografia 2/2 6. Kazienko P., Adamski M.: Personalized Web Advertising Method. Adaptive 1. Kazienko P., KoÅ‚odziejski P.: WindOwls - Adaptive System for the Hypermedia 2004, August 24-26, 2004, Eindhoven, The Netherlands, LNCS Integration of Recommendation Methods in E-commerce. 2005, to appear. 3137, Springer Verlag, pp. 146-155. 2. Kazienko P.: IDARM - Mining of Indirect Association Rules. New Trends in 7. Kazienko P., Matrejek M.: Parameters for Mining Indirect Associations in Intelligent Information Processing and Web Mining IIS 2005, June 13-16, the Web Environment. MiSSI, Vol. II. 2004, pp. 201-211. 2005, Advances in Soft Computing, Springer Verlag 2005, pp. . 8. Kazienko P., Kiewra M.: Integration of Relational Databases and Web Site Content for Product and Page Recommendation. 8th International 3. Kazienko P., Matrejek M.: Adjustment of Indirect Association Rules for the Database Engineering & Applications Symposium. IDEAS 2004 Coimbra, Web. SOFSEM 2005, Slovak Republic, 2005, Springer LNCS 3381, pp. Portugal, IEEE Computer Society, pp. 111-116 211-220. 9. Kazienko P., Kiewra M.: ROSA - Multi-agent System for Web Services Personalization. First Atlantic Web Intelligence Conference Proceedings, 4. Kazienko P.: Product Recommendation in E-Commerce Using Direct and Madrid, Spain, May 5-6, 2003, LNAI 2663, Springer Verlag, 2003, 297-306 Indirect Confidence for Historical User Sessions. DS'04. 7th International 10. Kazienko P., Kiewra M.: Personalized Recommendation of Web Pages. Conference on Discovery Science, Padova, Italy, 2004, Springer Verlag, Chapter 10 in: Nguyen T. (ed.) Intelligent Technologies for Inconsistent LNAI 3245, pp. 255-269 Knowledge Processing. Advanced Knowledge International, Adelaide, South Australia, 2004, pp. 163-183. 5. Kazienko P.: Multi-agent Web Recommendation Method Based on Indirect 11. Kazienko P., Kiewra M.: Link Recommendation Method Based on Web Association Rules. KES 2004, 8th International Conference on Knowledge- Content and Usage Mining. New Trends in Intelligent Information Based Intelligent Information & Engineering Systems, Wellington, New Processing and Web Mining IIS 2003, Zakopane, June 2-5, 2003, Advances Zealand, September 20-25, 2004, Part II, LNAI 3214, Springer Verlag, in Soft Computing, Springer Verlag 2003, pp. 529-534. 1157-1164. PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 61 PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 62 DziÄ™kujÄ™ za uwagÄ™! Jest czas na pytania? PrzemysÅ‚aw Kazienko: Eksploracja danych w internetowych serwisach rekomendujÄ…cych. 17.01.2005 63