Ajánló rendszerek áttekintés

Átírás

1 Ajánló rendszerek áttekintés Hegedűs István, Ormándi Róbert Ajánló rendszerek áttekintés p. 1/50

2 Ajánlási feladat definíciója Adott: Ajánló rendszerek áttekintés p. 2/50

3 Ajánlási feladat definíciója Adott: U - felhasználók (users), Ajánló rendszerek áttekintés p. 2/50

4 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), Ajánló rendszerek áttekintés p. 2/50

5 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, Ajánló rendszerek áttekintés p. 2/50

6 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, Ajánló rendszerek áttekintés p. 2/50

7 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Ajánló rendszerek áttekintés p. 2/50

8 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Ajánló rendszerek áttekintés p. 2/50

9 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely Ajánló rendszerek áttekintés p. 2/50

10 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és Ajánló rendszerek áttekintés p. 2/50

11 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és teljesen definiált a teljes U I téren. Ajánló rendszerek áttekintés p. 2/50

12 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszerek áttekintés p. 3/50

13 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: Ajánló rendszerek áttekintés p. 3/50

14 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre Ajánló rendszerek áttekintés p. 3/50

15 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Ajánló rendszerek áttekintés p. 3/50

16 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Az f-ből ismert értékelések aránya, a teljes U I tér méretéhez képest nagyon kicsi. Ajánló rendszerek áttekintés p. 3/50

17 Algoritmusok osztályozása Felhasznált információ alapján: Ajánló rendszerek áttekintés p. 4/50

18 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció Ajánló rendszerek áttekintés p. 4/50

19 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során Ajánló rendszerek áttekintés p. 4/50

20 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció Ajánló rendszerek áttekintés p. 4/50

21 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció Ajánló rendszerek áttekintés p. 4/50

22 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció hybrid methods: az előző két módszer ötvözete Ajánló rendszerek áttekintés p. 4/50

23 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: Ajánló rendszerek áttekintés p. 5/50

24 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, Ajánló rendszerek áttekintés p. 5/50

25 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, Ajánló rendszerek áttekintés p. 5/50

26 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, Ajánló rendszerek áttekintés p. 5/50

27 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, Ajánló rendszerek áttekintés p. 5/50

28 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

29 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, gráf alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

30 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: Ajánló rendszerek áttekintés p. 6/50

31 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; Ajánló rendszerek áttekintés p. 6/50

32 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; Ajánló rendszerek áttekintés p. 6/50

33 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); Ajánló rendszerek áttekintés p. 6/50

34 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. Ajánló rendszerek áttekintés p. 6/50

35 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. A feladat definíciója és az algoritmusok csoportosítása [Adomavicius-2005] alapján lett kimondva. Ajánló rendszerek áttekintés p. 6/50

36 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Ajánló rendszerek áttekintés p. 7/50

37 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Ajánló rendszerek áttekintés p. 7/50

38 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: Ajánló rendszerek áttekintés p. 7/50

39 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, Ajánló rendszerek áttekintés p. 7/50

40 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, Ajánló rendszerek áttekintés p. 7/50

41 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, illetve az, hogy U i mekkora részét vesszük figyelembe. Ajánló rendszerek áttekintés p. 7/50

42 Memory-based user-user CF algoritmusok Klasszikus változatok: Ajánló rendszerek áttekintés p. 8/50

43 Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. Ajánló rendszerek áttekintés p. 8/50

44 Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. [Adomavicius-2005], [Zhou-2008]: P k topns,n(u ˆf(u,i) = i ) s i,kf(k,j) Pk topns,n(u i ) s, ahol s i,k i,k az i. és k. user koszinusz hasonlósága. Ajánló rendszerek áttekintés p. 8/50

45 Központosított eljárások Ajánló rendszerek áttekintés p. 9/50

46 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: Ajánló rendszerek áttekintés p. 10/50

47 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) Ajánló rendszerek áttekintés p. 10/50

48 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) Ajánló rendszerek áttekintés p. 10/50

49 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) alacsony "együttértékelésű" hasonlóságok leértékelése: van, nincs; ( sokat segít ha van) Ajánló rendszerek áttekintés p. 10/50

50 [Konstan-1999] memory-based user-user CF A változtatások (folyt.): Ajánló rendszerek áttekintés p. 11/50

51 [Konstan-1999] memory-based user-user CF A változtatások (folyt.): szomszédség mértéke. Ajánló rendszerek áttekintés p. 11/50

52 Memory-based user-user CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 12/50

53 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 12/50

54 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Ajánló rendszerek áttekintés p. 12/50

55 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Ajánló rendszerek áttekintés p. 12/50

56 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Érzékeny az "new user" és "new item" problémákra [Yu-2004] Ajánló rendszerek áttekintés p. 12/50

57 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ajánló rendszerek áttekintés p. 13/50

58 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Ajánló rendszerek áttekintés p. 13/50

59 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: Ajánló rendszerek áttekintés p. 13/50

60 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], Ajánló rendszerek áttekintés p. 13/50

61 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], egy egyszerű ötlettel kezelhető(bb)ek a nagyon ritka adatbázisok is [Sarwar-2001]. Ajánló rendszerek áttekintés p. 13/50

62 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i. Ajánló rendszerek áttekintés p. 14/50

63 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba.. Ajánló rendszerek áttekintés p. 14/50

64 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái:. Ajánló rendszerek áttekintés p. 14/50

65 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j),. Ajánló rendszerek áttekintés p. 14/50

66 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j), Pearson korreláció: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui ( f(u,i) avg q Ui (f(q,i)) ) 2 r P u Uj ( f(u,j) avg q Uj (f(q,j)) ) 2,. Ajánló rendszerek áttekintés p. 14/50

67 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Ajánló rendszerek áttekintés p. 15/50

68 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. Ajánló rendszerek áttekintés p. 15/50

69 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. A cikkben tárgyalt 6 módszert (2 predikciós eljárás, 3 hasonlósági mértékkel) MovieLens adatbázis legkisebb változatán értékelték ki. Ajánló rendszerek áttekintés p. 15/50

70 [Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

71 [Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

72 [Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

73 [Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

74 Memory-based item-item CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 18/50

75 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 18/50

76 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Ajánló rendszerek áttekintés p. 18/50

77 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Ajánló rendszerek áttekintés p. 18/50

78 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

79 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Érzékeny az "new user" és "new item" problémákra, azonban ezen is segítenek (valamennyit) a smoothing technikák [Yu-2004], [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

80 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Ajánló rendszerek áttekintés p. 19/50

81 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Ajánló rendszerek áttekintés p. 19/50

82 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. Ajánló rendszerek áttekintés p. 19/50

83 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. User-user gráf: a csomópontok halmaza U, élek hasonlóság vagy egyéb heurisztika alapján képződnek (amik az hasonló preferenciát, vagy az egymás alapján történő predikálhatóságot modellezik) [Aggarwal-1999]. Ajánló rendszerek áttekintés p. 19/50

84 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: Ajánló rendszerek áttekintés p. 20/50

85 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; Ajánló rendszerek áttekintés p. 20/50

86 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; predictable(u 1,u2) = hortes(u2, u1) ÉS j I u1 I u2 f(u 1,j) T s,t (f (u 2,j)) T s,t : I u1 I u2 < H, H konst. Ajánló rendszerek áttekintés p. 20/50

87 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: Ajánló rendszerek áttekintés p. 21/50

88 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, Ajánló rendszerek áttekintés p. 21/50

89 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Ajánló rendszerek áttekintés p. 21/50

90 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. Ajánló rendszerek áttekintés p. 21/50

91 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. A predictalble reláció alapján user-user gráf megépítése. Ajánló rendszerek áttekintés p. 21/50

92 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: Ajánló rendszerek áttekintés p. 22/50

93 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, Ajánló rendszerek áttekintés p. 22/50

94 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Ajánló rendszerek áttekintés p. 22/50

95 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Kiértékelés base-line nélkül 3 különböző (számomra ismeretlen) adtbázison... Ajánló rendszerek áttekintés p. 22/50

96 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Ajánló rendszerek áttekintés p. 23/50

97 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: Ajánló rendszerek áttekintés p. 23/50

98 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, Ajánló rendszerek áttekintés p. 23/50

99 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, u U : cr (u 0,u) - felhasználó reprezentativitás: megmondja, hogy u 0 felhasználóhoz mennyire hasonlít az u user. Ajánló rendszerek áttekintés p. 23/50

100 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: Ajánló rendszerek áttekintés p. 24/50

101 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I Ajánló rendszerek áttekintés p. 24/50

102 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U Ajánló rendszerek áttekintés p. 24/50

103 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: Ajánló rendszerek áttekintés p. 24/50

104 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) Ajánló rendszerek áttekintés p. 24/50

105 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Ajánló rendszerek áttekintés p. 24/50

106 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Amennyiben h(cr) = CR T A T és g(pr) = A T PR, akkor a HITS algoritmust kapjuk vissza a PR és CR megfelelő sor- illetve oszlopvektoraira. Ajánló rendszerek áttekintés p. 24/50

107 [Huang-2004] páros gráf alapú megközelítés Amennyiben: Ajánló rendszerek áttekintés p. 25/50

108 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k és Ajánló rendszerek áttekintés p. 25/50

109 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j, és Ajánló rendszerek áttekintés p. 25/50

110 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j akkor a PageRank-ben implementált random walk modellt kapjuk., és Ajánló rendszerek áttekintés p. 25/50

111 [Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, link. Ajánló rendszerek áttekintés p. 26/50

112 [Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, link. Ajánló rendszerek áttekintés p. 26/50

113 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Ajánló rendszerek áttekintés p. 27/50

114 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, Ajánló rendszerek áttekintés p. 27/50

115 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, Ajánló rendszerek áttekintés p. 27/50

116 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), Ajánló rendszerek áttekintés p. 27/50

117 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), ezekből képzett hibrid módszerrel. Ajánló rendszerek áttekintés p. 27/50

118 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, Ajánló rendszerek áttekintés p. 28/50

119 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Ajánló rendszerek áttekintés p. 28/50

120 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

121 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

122 [Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

123 [Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

124 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Ajánló rendszerek áttekintés p. 30/50

125 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

126 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

127 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Ajánló rendszerek áttekintés p. 31/50

128 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: Ajánló rendszerek áttekintés p. 31/50

129 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], Ajánló rendszerek áttekintés p. 31/50

130 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Ajánló rendszerek áttekintés p. 31/50

131 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

132 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

133 Néhány összehasonlító eredmény Ajánló rendszerek áttekintés p. 32/50

134 Elosztott módszerek Ajánló rendszerek áttekintés p. 33/50

135 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok Ajánló rendszerek áttekintés p. 34/50

136 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében Ajánló rendszerek áttekintés p. 34/50

137 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre Ajánló rendszerek áttekintés p. 34/50

138 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ajánló rendszerek áttekintés p. 34/50

139 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) Ajánló rendszerek áttekintés p. 34/50

140 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak Ajánló rendszerek áttekintés p. 34/50

141 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak ha nem, akkor a kapott vektort továbbítja a szomszédainak. Ajánló rendszerek áttekintés p. 34/50

142 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ajánló rendszerek áttekintés p. 35/50

143 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást Ajánló rendszerek áttekintés p. 35/50

144 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást A hálózat dinamikája: ha egy peer két szomszédjától nagyon hasonló vektorokat kap, akkor megkérdezi őket, hogy akarnak-e közvetlen kapcsolatot egymás között Ajánló rendszerek áttekintés p. 35/50

145 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Ajánló rendszerek áttekintés p. 36/50

146 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Ajánló rendszerek áttekintés p. 36/50

147 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Az ajánlást pedig a Consensus Propagation algoritmus [Moallemi-2006] segítségével számolták, amely a hálózat átlagát számolta, hogy minimalizálja a fent definiált hibát Ajánló rendszerek áttekintés p. 36/50

148 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy Ajánló rendszerek áttekintés p. 37/50

149 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra Ajánló rendszerek áttekintés p. 37/50

150 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) Ajánló rendszerek áttekintés p. 37/50

151 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Ajánló rendszerek áttekintés p. 37/50

152 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Az algoritmus kiterjeszthető a személyre szabott PageRank és az Information Centrality módszerekre a megfelelő input paraméterekkel Ajánló rendszerek áttekintés p. 37/50

153 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Ajánló rendszerek áttekintés p. 38/50

154 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja Ajánló rendszerek áttekintés p. 38/50

155 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: Ajánló rendszerek áttekintés p. 38/50

156 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé Ajánló rendszerek áttekintés p. 38/50

157 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak Ajánló rendszerek áttekintés p. 38/50

158 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak Ajánló rendszerek áttekintés p. 38/50

159 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak A beérkező listák bizalmi szintjét hasonlósági mértékké konvertálja, majd kiszámítja a legjobb ajánlást Ajánló rendszerek áttekintés p. 38/50

160 [Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Ajánló rendszerek áttekintés p. 39/50

161 [Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Minden egyes item minden egyes előforduló rate-jéhez fel van véve egy bucket, amely tartalmazza azon userek azonosítóit, akik legalább ezzel az értékkel szavaztak az aktuális itemre Ajánló rendszerek áttekintés p. 39/50

162 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Ajánló rendszerek áttekintés p. 40/50

163 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: Ajánló rendszerek áttekintés p. 40/50

164 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására Ajánló rendszerek áttekintés p. 40/50

165 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére Ajánló rendszerek áttekintés p. 40/50

166 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Ajánló rendszerek áttekintés p. 40/50

167 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Eachmovie adatbázis 0.83 MAE Ajánló rendszerek áttekintés p. 40/50

168 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ Ajánló rendszerek áttekintés p. 41/50

169 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája Ajánló rendszerek áttekintés p. 41/50

170 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

171 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

172 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma a µ pedig simító paraméter Ajánló rendszerek áttekintés p. 41/50

Több megjelenítése