Ajánló rendszerek áttekintés

Hasonló dokumentumok
Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Szomszédság alapú ajánló rendszerek

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

Közösség detektálás gráfokban

Gépi tanulás a gyakorlatban. Lineáris regresszió

Gépi tanulás a gyakorlatban. Bevezetés

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Adatok statisztikai értékelésének főbb lehetőségei

1. gyakorlat. Mesterséges Intelligencia 2.

JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Intelligens adatelemzés

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Teljesen elosztott adatbányászat alprojekt

Hash-alapú keresések

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Mátrix-alapú projektkockázatmenedzsment

Adatszerkezetek 2. Dr. Iványi Péter

(Independence, dependence, random variables)

IBM SPSS Modeler 18.2 Újdonságok

Markov-láncok stacionárius eloszlása

Szalai Péter. April 17, Szalai Péter April 17, / 36

Adatbányászati szemelvények MapReduce környezetben

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz

Felügyelt önálló tanulás - Analízis III.

7. Régió alapú szegmentálás

Mesterséges Intelligencia I.

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa:

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Az optimális megoldást adó algoritmusok

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Társadalmi és gazdasági hálózatok modellezése

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

Közösségek keresése nagy gráfokban

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Struktúra nélküli adatszerkezetek

Online ajánlórendszerek az elektronikus kereskedelemben. Dr. Révész Balázs

Társadalmi és gazdasági hálózatok modellezése

Sergyán Szabolcs szeptember 21.

Online migrációs ütemezési modellek

Neurális hálózatok bemutató

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

IBNR számítási módszerek áttekintése

22. GRÁFOK ÁBRÁZOLÁSA

2. Visszalépéses keresés

Principal Component Analysis

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése

[Biomatematika 2] Orvosi biometria

Totális Unimodularitás és LP dualitás. Tapolcai János

Random Forests - Véletlen erdők

Nagyméretű adathalmazok kezelése Ajánló rendszerek

Bonyolultságelmélet. Monday 26 th September, 2016, 18:50

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

Kódverifikáció gépi tanulással

10: Peer-To-Peer Hálózatok I. HálózatokII, 2007

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Konjugált gradiens módszer

10. Előadás P[M E ] = H

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

Visszacsatolt (mély) neurális hálózatok

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Statisztikai módszerek a skálafüggetlen hálózatok

Történet John Little (1970) (Management Science cikk)

2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év).

Számítógép hálózatok, osztott rendszerek 2009

Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2.

Páros összehasonlítás mátrixok empirikus vizsgálata. Bozóki Sándor

Lineáris regressziós modellek 1

Adott: VPN topológia tervezés. Költségmodell: fix szakaszköltség VPN végpontok

Saj at ert ek-probl em ak febru ar 26.

Gyakorló feladatok adatbányászati technikák tantárgyhoz

Megkülönböztetett kiszolgáló routerek az

Számítógépes döntéstámogatás. Genetikus algoritmusok

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Kettőnél több csoport vizsgálata. Makara B. Gábor

Dr. habil. Maróti György

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar

Diszkrét matematika 2.C szakirány

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Modellkiválasztás és struktúrák tanulása

Gráfelméleti feladatok. c f

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hipotézis vizsgálatok

Klaszterezés, 2. rész

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Speciális adatszerkezetek. Programozás alapjai II. (8. ea) C++ Tömbök. Tömbök/2. N dimenziós tömb. Nagyméretű ritka tömbök

Általános algoritmustervezési módszerek

Programozás alapjai II. (7. ea) C++ Speciális adatszerkezetek. Tömbök. Kiegészítő anyag: speciális adatszerkezetek

Tartalomjegyzék. Köszönetnyilvánítás. 1. Az alapok 1

Amortizációs költségelemzés

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Átírás:

Ajánló rendszerek áttekintés Hegedűs István, Ormándi Róbert Ajánló rendszerek áttekintés p. 1/50

Ajánlási feladat definíciója Adott: Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és Ajánló rendszerek áttekintés p. 2/50

Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és teljesen definiált a teljes U I téren. Ajánló rendszerek áttekintés p. 2/50

Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszerek áttekintés p. 3/50

Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: Ajánló rendszerek áttekintés p. 3/50

Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre Ajánló rendszerek áttekintés p. 3/50

Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Ajánló rendszerek áttekintés p. 3/50

Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Az f-ből ismert értékelések aránya, a teljes U I tér méretéhez képest nagyon kicsi. Ajánló rendszerek áttekintés p. 3/50

Algoritmusok osztályozása Felhasznált információ alapján: Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció hybrid methods: az előző két módszer ötvözete Ajánló rendszerek áttekintés p. 4/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, gráf alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: Ajánló rendszerek áttekintés p. 6/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; Ajánló rendszerek áttekintés p. 6/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; Ajánló rendszerek áttekintés p. 6/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); Ajánló rendszerek áttekintés p. 6/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. Ajánló rendszerek áttekintés p. 6/50

Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. A feladat definíciója és az algoritmusok csoportosítása [Adomavicius-2005] alapján lett kimondva. Ajánló rendszerek áttekintés p. 6/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, illetve az, hogy U i mekkora részét vesszük figyelembe. Ajánló rendszerek áttekintés p. 7/50

Memory-based user-user CF algoritmusok Klasszikus változatok: Ajánló rendszerek áttekintés p. 8/50

Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. Ajánló rendszerek áttekintés p. 8/50

Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. [Adomavicius-2005], [Zhou-2008]: P k topns,n(u ˆf(u,i) = i ) s i,kf(k,j) Pk topns,n(u i ) s, ahol s i,k i,k az i. és k. user koszinusz hasonlósága. Ajánló rendszerek áttekintés p. 8/50

Központosított eljárások Ajánló rendszerek áttekintés p. 9/50

[Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, 122 176 értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: Ajánló rendszerek áttekintés p. 10/50

[Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, 122 176 értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) Ajánló rendszerek áttekintés p. 10/50

[Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, 122 176 értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) Ajánló rendszerek áttekintés p. 10/50

[Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, 122 176 értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) alacsony "együttértékelésű" hasonlóságok leértékelése: van, nincs; ( sokat segít ha van) Ajánló rendszerek áttekintés p. 10/50

[Konstan-1999] memory-based user-user CF A változtatások (folyt.): Ajánló rendszerek áttekintés p. 11/50

[Konstan-1999] memory-based user-user CF A változtatások (folyt.): szomszédség mértéke. Ajánló rendszerek áttekintés p. 11/50

Memory-based user-user CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 12/50

Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 12/50

Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Ajánló rendszerek áttekintés p. 12/50

Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Ajánló rendszerek áttekintés p. 12/50

Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Érzékeny az "new user" és "new item" problémákra [Yu-2004] Ajánló rendszerek áttekintés p. 12/50

Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ajánló rendszerek áttekintés p. 13/50

Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Ajánló rendszerek áttekintés p. 13/50

Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: Ajánló rendszerek áttekintés p. 13/50

Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], Ajánló rendszerek áttekintés p. 13/50

Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], egy egyszerű ötlettel kezelhető(bb)ek a nagyon ritka adatbázisok is [Sarwar-2001]. Ajánló rendszerek áttekintés p. 13/50

[Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i. Ajánló rendszerek áttekintés p. 14/50

[Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba.. Ajánló rendszerek áttekintés p. 14/50

[Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái:. Ajánló rendszerek áttekintés p. 14/50

[Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j),. Ajánló rendszerek áttekintés p. 14/50

[Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j), Pearson korreláció: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui ( f(u,i) avg q Ui (f(q,i)) ) 2 r P u Uj ( f(u,j) avg q Uj (f(q,j)) ) 2,. Ajánló rendszerek áttekintés p. 14/50

[Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Ajánló rendszerek áttekintés p. 15/50

[Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. Ajánló rendszerek áttekintés p. 15/50

[Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. A cikkben tárgyalt 6 módszert (2 predikciós eljárás, 3 hasonlósági mértékkel) MovieLens adatbázis legkisebb változatán értékelték ki. Ajánló rendszerek áttekintés p. 15/50

[Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

[Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

[Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

[Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

Memory-based item-item CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 18/50

Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 18/50

Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Ajánló rendszerek áttekintés p. 18/50

Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Ajánló rendszerek áttekintés p. 18/50

Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Érzékeny az "new user" és "new item" problémákra, azonban ezen is segítenek (valamennyit) a smoothing technikák [Yu-2004], [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Ajánló rendszerek áttekintés p. 19/50

Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Ajánló rendszerek áttekintés p. 19/50

Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. Ajánló rendszerek áttekintés p. 19/50

Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. User-user gráf: a csomópontok halmaza U, élek hasonlóság vagy egyéb heurisztika alapján képződnek (amik az hasonló preferenciát, vagy az egymás alapján történő predikálhatóságot modellezik) [Aggarwal-1999]. Ajánló rendszerek áttekintés p. 19/50

[Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: Ajánló rendszerek áttekintés p. 20/50

[Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; Ajánló rendszerek áttekintés p. 20/50

[Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; predictable(u 1,u2) = hortes(u2, u1) ÉS j I u1 I u2 f(u 1,j) T s,t (f (u 2,j)) T s,t : I u1 I u2 < H, H konst. Ajánló rendszerek áttekintés p. 20/50

[Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: Ajánló rendszerek áttekintés p. 21/50

[Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, Ajánló rendszerek áttekintés p. 21/50

[Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Ajánló rendszerek áttekintés p. 21/50

[Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. Ajánló rendszerek áttekintés p. 21/50

[Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. A predictalble reláció alapján user-user gráf megépítése. Ajánló rendszerek áttekintés p. 21/50

[Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: Ajánló rendszerek áttekintés p. 22/50

[Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, Ajánló rendszerek áttekintés p. 22/50

[Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Ajánló rendszerek áttekintés p. 22/50

[Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Kiértékelés base-line nélkül 3 különböző (számomra ismeretlen) adtbázison... Ajánló rendszerek áttekintés p. 22/50

[Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Ajánló rendszerek áttekintés p. 23/50

[Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: Ajánló rendszerek áttekintés p. 23/50

[Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, Ajánló rendszerek áttekintés p. 23/50

[Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, u U : cr (u 0,u) - felhasználó reprezentativitás: megmondja, hogy u 0 felhasználóhoz mennyire hasonlít az u user. Ajánló rendszerek áttekintés p. 23/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Amennyiben h(cr) = CR T A T és g(pr) = A T PR, akkor a HITS algoritmust kapjuk vissza a PR és CR megfelelő sor- illetve oszlopvektoraira. Ajánló rendszerek áttekintés p. 24/50

[Huang-2004] páros gráf alapú megközelítés Amennyiben: Ajánló rendszerek áttekintés p. 25/50

[Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k és Ajánló rendszerek áttekintés p. 25/50

[Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j, és Ajánló rendszerek áttekintés p. 25/50

[Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j akkor a PageRank-ben implementált random walk modellt kapjuk., és Ajánló rendszerek áttekintés p. 25/50

[Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, 18 771 link. Ajánló rendszerek áttekintés p. 26/50

[Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, 18 771 link. Ajánló rendszerek áttekintés p. 26/50

Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Ajánló rendszerek áttekintés p. 27/50

Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, Ajánló rendszerek áttekintés p. 27/50

Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, Ajánló rendszerek áttekintés p. 27/50

Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), Ajánló rendszerek áttekintés p. 27/50

Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), ezekből képzett hibrid módszerrel. Ajánló rendszerek áttekintés p. 27/50

[Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, Ajánló rendszerek áttekintés p. 28/50

[Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Ajánló rendszerek áttekintés p. 28/50

[Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

[Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

[Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

[Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

[Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Ajánló rendszerek áttekintés p. 30/50

[Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

[Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Ajánló rendszerek áttekintés p. 31/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: Ajánló rendszerek áttekintés p. 31/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], Ajánló rendszerek áttekintés p. 31/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Ajánló rendszerek áttekintés p. 31/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

Néhány összehasonlító eredmény Ajánló rendszerek áttekintés p. 32/50

Elosztott módszerek Ajánló rendszerek áttekintés p. 33/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak ha nem, akkor a kapott vektort továbbítja a szomszédainak. Ajánló rendszerek áttekintés p. 34/50

[Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ajánló rendszerek áttekintés p. 35/50

[Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást Ajánló rendszerek áttekintés p. 35/50

[Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást A hálózat dinamikája: ha egy peer két szomszédjától nagyon hasonló vektorokat kap, akkor megkérdezi őket, hogy akarnak-e közvetlen kapcsolatot egymás között Ajánló rendszerek áttekintés p. 35/50

[Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Ajánló rendszerek áttekintés p. 36/50

[Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Ajánló rendszerek áttekintés p. 36/50

[Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Az ajánlást pedig a Consensus Propagation algoritmus [Moallemi-2006] segítségével számolták, amely a hálózat átlagát számolta, hogy minimalizálja a fent definiált hibát Ajánló rendszerek áttekintés p. 36/50

[Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy Ajánló rendszerek áttekintés p. 37/50

[Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra Ajánló rendszerek áttekintés p. 37/50

[Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) Ajánló rendszerek áttekintés p. 37/50

[Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Ajánló rendszerek áttekintés p. 37/50

[Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Az algoritmus kiterjeszthető a személyre szabott PageRank és az Information Centrality módszerekre a megfelelő input paraméterekkel Ajánló rendszerek áttekintés p. 37/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak Ajánló rendszerek áttekintés p. 38/50

[Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak A beérkező listák bizalmi szintjét hasonlósági mértékké konvertálja, majd kiszámítja a legjobb ajánlást Ajánló rendszerek áttekintés p. 38/50

[Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Ajánló rendszerek áttekintés p. 39/50

[Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Minden egyes item minden egyes előforduló rate-jéhez fel van véve egy bucket, amely tartalmazza azon userek azonosítóit, akik legalább ezzel az értékkel szavaztak az aktuális itemre Ajánló rendszerek áttekintés p. 39/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Ajánló rendszerek áttekintés p. 40/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: Ajánló rendszerek áttekintés p. 40/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására Ajánló rendszerek áttekintés p. 40/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére Ajánló rendszerek áttekintés p. 40/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Ajánló rendszerek áttekintés p. 40/50

[Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Eachmovie adatbázis 0.83 MAE Ajánló rendszerek áttekintés p. 40/50

[Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ Ajánló rendszerek áttekintés p. 41/50

[Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája Ajánló rendszerek áttekintés p. 41/50

[Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

[Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

[Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma a µ pedig simító paraméter Ajánló rendszerek áttekintés p. 41/50