Ajánló rendszerek áttekintés

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Ajánló rendszerek áttekintés"

Átírás

1 Ajánló rendszerek áttekintés Hegedűs István, Ormándi Róbert Ajánló rendszerek áttekintés p. 1/50

2 Ajánlási feladat definíciója Adott: Ajánló rendszerek áttekintés p. 2/50

3 Ajánlási feladat definíciója Adott: U - felhasználók (users), Ajánló rendszerek áttekintés p. 2/50

4 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), Ajánló rendszerek áttekintés p. 2/50

5 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, Ajánló rendszerek áttekintés p. 2/50

6 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, Ajánló rendszerek áttekintés p. 2/50

7 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Ajánló rendszerek áttekintés p. 2/50

8 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Ajánló rendszerek áttekintés p. 2/50

9 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely Ajánló rendszerek áttekintés p. 2/50

10 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és Ajánló rendszerek áttekintés p. 2/50

11 Ajánlási feladat definíciója Adott: U - felhasználók (users), I - termékek (items), p : U profilespace - felhasználói profilolok, c : I characteristicspace - termék leírások, egy f : U I R leképezésből néhány példa (R halmaz, teljes rendezéssel). Feladat: Határozzuk meg azt az ˆf : U I R leképezést, amely a lehető legjobban közelíti f-et, és teljesen definiált a teljes U I téren. Ajánló rendszerek áttekintés p. 2/50

12 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszerek áttekintés p. 3/50

13 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: Ajánló rendszerek áttekintés p. 3/50

14 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre Ajánló rendszerek áttekintés p. 3/50

15 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Ajánló rendszerek áttekintés p. 3/50

16 Megjegyzések Ajánlási feladat megoldása: algoritmus, amely meghatározza ˆf-et. Ajánló rendszer: rendszer, ami használja ˆf-et, pl.: u felhasználónak megvételjre ajánlja az i u terméket, melyre i u = argmax i I,f(i,u)definiálatlan ˆf(u,i). Az f-ből ismert értékelések aránya, a teljes U I tér méretéhez képest nagyon kicsi. Ajánló rendszerek áttekintés p. 3/50

17 Algoritmusok osztályozása Felhasznált információ alapján: Ajánló rendszerek áttekintés p. 4/50

18 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció Ajánló rendszerek áttekintés p. 4/50

19 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során Ajánló rendszerek áttekintés p. 4/50

20 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció Ajánló rendszerek áttekintés p. 4/50

21 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció Ajánló rendszerek áttekintés p. 4/50

22 Algoritmusok osztályozása Felhasznált információ alapján: content based methods: a cél felhasználó korábbi értékelései alapján történik a predikció collaborative filtering: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló izlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció hybrid methods: az előző két módszer ötvözete Ajánló rendszerek áttekintés p. 4/50

23 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: Ajánló rendszerek áttekintés p. 5/50

24 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, Ajánló rendszerek áttekintés p. 5/50

25 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, Ajánló rendszerek áttekintés p. 5/50

26 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, Ajánló rendszerek áttekintés p. 5/50

27 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, Ajánló rendszerek áttekintés p. 5/50

28 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

29 Algoritmusok osztályozása Az algoritmusban használt megközelítés alapján: hasonlóság alapú megközelítések, mátrix faktorizáción alapuló módszerek, klaszterezést hasznláló módszerek, gépi tanulási modellt használó eljárások, valószínűségi modell alapú módszerek, gráf alapú módszerek, Ajánló rendszerek áttekintés p. 5/50

30 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: Ajánló rendszerek áttekintés p. 6/50

31 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; Ajánló rendszerek áttekintés p. 6/50

32 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; Ajánló rendszerek áttekintés p. 6/50

33 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); Ajánló rendszerek áttekintés p. 6/50

34 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. Ajánló rendszerek áttekintés p. 6/50

35 Algoritmusok osztályozása Ezek megközelítések tovább csoportosíthatóak: memória alalpú módszerek: hasonlóság alapú; dimenzió redukciós módszerek: mátrix faktorizácó, klaszterezés; hiba minimalizációs módszerek: gépi tanulás, klaszterezés(néha), mátrix faktorizáció(néha); modell alapú megközelítések: mátrix faktorizáció, klaszterezés, gépi tanulás, valószínűségi modellek. A feladat definíciója és az algoritmusok csoportosítása [Adomavicius-2005] alapján lett kimondva. Ajánló rendszerek áttekintés p. 6/50

36 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Ajánló rendszerek áttekintés p. 7/50

37 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Ajánló rendszerek áttekintés p. 7/50

38 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: Ajánló rendszerek áttekintés p. 7/50

39 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, Ajánló rendszerek áttekintés p. 7/50

40 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, Ajánló rendszerek áttekintés p. 7/50

41 Memory-based user-user CF algoritmusok Alapötlet: ˆf(u,i) = aggregate u U i (f(u,i)), ahol U i azoknak a felhasználóknak a halmaza, akik szavaztak az i termékre. Tulajdonképpen a módszer a többi felhasználó (szofisztikálabb esetekben a hasonló preferenciával rendelkező felhasználók) adott termékre tett értékeléseit ragadja meg. Az egyes módszerek esetén eltér: az aggregáció, az aggregációban használt súlyozás, amennyiben van ilyen, illetve az, hogy U i mekkora részét vesszük figyelembe. Ajánló rendszerek áttekintés p. 7/50

42 Memory-based user-user CF algoritmusok Klasszikus változatok: Ajánló rendszerek áttekintés p. 8/50

43 Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. Ajánló rendszerek áttekintés p. 8/50

44 Memory-based user-user CF algoritmusok Klasszikus változatok: [Resnick-1994]: ˆf(u,i) = P k topns,n(u i ) s i,k(f(k,j) avg q Ik (f(k,q))) Pk topns,n(u i ) s i,k + avg q Ii (f (i,q)), ahol s i,k az i. és k. user Pearson korrelációja, topn s,n (U) megadja az U halmaz elemeinek s szerinti rendezésben az első n elemből képzett részhalmazát. [Adomavicius-2005], [Zhou-2008]: P k topns,n(u ˆf(u,i) = i ) s i,kf(k,j) Pk topns,n(u i ) s, ahol s i,k i,k az i. és k. user koszinusz hasonlósága. Ajánló rendszerek áttekintés p. 8/50

45 Központosított eljárások Ajánló rendszerek áttekintés p. 9/50

46 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: Ajánló rendszerek áttekintés p. 10/50

47 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) Ajánló rendszerek áttekintés p. 10/50

48 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) Ajánló rendszerek áttekintés p. 10/50

49 [Konstan-1999] memory-based user-user CF A cikkben különböző user-user alapú CF algoritmus változatokat hasonlítottak össze a GroupLens adatbázison (1173 user, értékelés, 10% test user MovieLens kis adatbázisa). A változtatások: aggregáció: korábban bemutatott kettő + z-score-average ([Resnick-1994] egy változata); ( [Resnick-1994] nyer sokkal) hasonlóság: Pearson-, Spearman-korreláció, vektor hasonlóság, entropia, négyzetes különbség; ( Pearson nyer kicsivel) alacsony "együttértékelésű" hasonlóságok leértékelése: van, nincs; ( sokat segít ha van) Ajánló rendszerek áttekintés p. 10/50

50 [Konstan-1999] memory-based user-user CF A változtatások (folyt.): Ajánló rendszerek áttekintés p. 11/50

51 [Konstan-1999] memory-based user-user CF A változtatások (folyt.): szomszédség mértéke. Ajánló rendszerek áttekintés p. 11/50

52 Memory-based user-user CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 12/50

53 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 12/50

54 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Ajánló rendszerek áttekintés p. 12/50

55 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Ajánló rendszerek áttekintés p. 12/50

56 Memory-based user-user CF algoritmusok Pozitívumok: Intuitív, könnyen értelmezhető és interpretálható Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára: nagy valószínűséggel kapunk 0 hasonlóságot [Billsus-1998]. Érzékeny az "new user" és "new item" problémákra [Yu-2004] Ajánló rendszerek áttekintés p. 12/50

57 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ajánló rendszerek áttekintés p. 13/50

58 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Ajánló rendszerek áttekintés p. 13/50

59 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: Ajánló rendszerek áttekintés p. 13/50

60 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], Ajánló rendszerek áttekintés p. 13/50

61 Memory-based item-item CF algoritmusok Alapötlet: ˆf(u,i) = aggregate i I u (f(u,i )), ahol I u az u user által értékelt termékek halmaza. Ebben a megközelítésben módszer az adott felhasználó többi (szofisztikálabb esetben a hasonló karakterisztikával rendelkező termékekre) termékekre tett értékelések alapján predikál. Tulajdonképpen a user-user alapú megközelítés transzpontáltja, mégis: jobban skálázódik mint az [Sarwar-2001], egy egyszerű ötlettel kezelhető(bb)ek a nagyon ritka adatbázisok is [Sarwar-2001]. Ajánló rendszerek áttekintés p. 13/50

62 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i. Ajánló rendszerek áttekintés p. 14/50

63 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba.. Ajánló rendszerek áttekintés p. 14/50

64 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái:. Ajánló rendszerek áttekintés p. 14/50

65 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j),. Ajánló rendszerek áttekintés p. 14/50

66 [Sarwar-2001] memory-based item-item CF Alap aggregáció: ˆf(u,i) = P i topns,n(iu) s i,i f(u,i ) P i topns,n(iu) s i,i Regression based aggregáció: f (u,i ) helyett f (u,i ) = αf (u,i ) + β + ɛ, ahol α és β az i item u szerinti lineáris regressziójának paraméterei, ɛ pedig az ehhez tartozó regressziós hiba. Az s alternatívái: koszinusz hasonlóság: s i,j = f(.,i) f(.,j) f(.,i) f(.,j), Pearson korreláció: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui ( f(u,i) avg q Ui (f(q,i)) ) 2 r P u Uj ( f(u,j) avg q Uj (f(q,j)) ) 2,. Ajánló rendszerek áttekintés p. 14/50

67 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Ajánló rendszerek áttekintés p. 15/50

68 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. Ajánló rendszerek áttekintés p. 15/50

69 [Sarwar-2001] memory-based item-item CF Az s alternatívái (folyt.): Módosított koszinusz hasonlóság: s i,j = P u U i U j (f(u,i) avg q Ui (f(q,i)))(f(u,j) avg q Uj (f(q,j))) q P u Ui (f(u,i) avg q Iu(f(u,q))) 2q Pu Uj (f(u,j) avg q I u(f(u,q))) 2. A cikkben tárgyalt 6 módszert (2 predikciós eljárás, 3 hasonlósági mértékkel) MovieLens adatbázis legkisebb változatán értékelték ki. Ajánló rendszerek áttekintés p. 15/50

70 [Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

71 [Sarwar-2001] memory-based item-item CF Hasonlósági mértékek hatása (alap aggregáció esetén): Ajánló rendszerek áttekintés p. 16/50

72 [Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

73 [Sarwar-2001] memory-based item-item CF Szomszédság méretének és a train/test hányados hatásai: Ajánló rendszerek áttekintés p. 17/50

74 Memory-based item-item CF algoritmusok Pozitívumok: Ajánló rendszerek áttekintés p. 18/50

75 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Ajánló rendszerek áttekintés p. 18/50

76 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Ajánló rendszerek áttekintés p. 18/50

77 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Ajánló rendszerek áttekintés p. 18/50

78 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

79 Memory-based item-item CF algoritmusok Pozitívumok: Szintén intuitív, könnyen értelmezhető és interpretálható Empirikus elemzésekkel kimutatták, hogy szignifikánsan jobb, mint a hasonló user-user alapú megközelítések [Sarwar-2001]. Negatívumok: Érzékeny az adathalmaz (túl) ritka voltára, habár különböző technikákkal (smoothing) javítottak ezen [Hu-2006]. Érzékeny az "new user" és "new item" problémákra, azonban ezen is segítenek (valamennyit) a smoothing technikák [Yu-2004], [Hu-2006]. Ajánló rendszerek áttekintés p. 18/50

80 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Ajánló rendszerek áttekintés p. 19/50

81 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Ajánló rendszerek áttekintés p. 19/50

82 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. Ajánló rendszerek áttekintés p. 19/50

83 Gráf alapú megközelítések Alapötlet: a rendelkezésre álló f(u, i) adatokból képezzünk gráfot és a gráfelmélet technikáit segítségül hívva. Megközelítések: Páros gráf: az csomópontok halmaza U I, élek csak u U és i I csomópontok között mennek (páros gráf), pontosan azon u és i csomópontok között megy él, ahol f(u, i) ismert [Huang-2004], [Zhou-2008]. User-user gráf: a csomópontok halmaza U, élek hasonlóság vagy egyéb heurisztika alapján képződnek (amik az hasonló preferenciát, vagy az egymás alapján történő predikálhatóságot modellezik) [Aggarwal-1999]. Ajánló rendszerek áttekintés p. 19/50

84 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: Ajánló rendszerek áttekintés p. 20/50

85 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; Ajánló rendszerek áttekintés p. 20/50

86 [Aggarwal-1999] Horting hatches an egg... A cikkben használt megközelítés irányított user-user gráfot épít, amely két relációt ír le: hortes(u 1,u 2 ) = I u1 I u2 I u1 F, ahol F előre adott küszöb, VAGY I u1 I u2 G, ahol g előre adott küszöb; predictable(u 1,u2) = hortes(u2, u1) ÉS j I u1 I u2 f(u 1,j) T s,t (f (u 2,j)) T s,t : I u1 I u2 < H, H konst. Ajánló rendszerek áttekintés p. 20/50

87 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: Ajánló rendszerek áttekintés p. 21/50

88 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, Ajánló rendszerek áttekintés p. 21/50

89 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Ajánló rendszerek áttekintés p. 21/50

90 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. Ajánló rendszerek áttekintés p. 21/50

91 [Aggarwal-1999] Horting hatches an egg... A predictable relációban szereplő T s,t (f(u 2,j)) = sf(u 2,j) + t lineáris leképezés a bemenet értékeléshez tartozó felhasználó "viselkedési modelljét" határozza meg, egy másik (u 1 ) felhasználóhoz képest, azaz: s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése azonos, s = 1 és t = 0 esetén az u 1 és u 2 felhasználók viselekedése ellentétes... Az s {+1, 1} és t {2, 2v, 1 v,v 1} értékek egy szűk halmazból kerülnek kiválasztásra, így a megfelelő T s,t meghatározása kimerítő kereséssel is hatékony. A predictalble reláció alapján user-user gráf megépítése. Ajánló rendszerek áttekintés p. 21/50

92 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: Ajánló rendszerek áttekintés p. 22/50

93 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, Ajánló rendszerek áttekintés p. 22/50

94 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Ajánló rendszerek áttekintés p. 22/50

95 [Aggarwal-1999] Horting hatches an egg... ˆf (u, j) meghatározása: legrövidebb u u 1... u l, úgy hogy f (u l,j) létezzen, ˆf(u,j) = T s 1,t 1... T s l,t l (f (u l,j)). Kiértékelés base-line nélkül 3 különböző (számomra ismeretlen) adtbázison... Ajánló rendszerek áttekintés p. 22/50

96 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Ajánló rendszerek áttekintés p. 23/50

97 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: Ajánló rendszerek áttekintés p. 23/50

98 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, Ajánló rendszerek áttekintés p. 23/50

99 [Huang-2004] páros gráf alapú megközelítés A cikkben kidolgozott módszert Kleinberg HITS algoritmusa inspirálta. Adott u 0 felhasználó esetén definiáljuk a következő score-okat: i I : pr (u 0,i) - termék reprezentativitás: megmondja, hogy u 0 felhasználót mennyire érdekli az i termék, u U : cr (u 0,u) - felhasználó reprezentativitás: megmondja, hogy u 0 felhasználóhoz mennyire hasonlít az u user. Ajánló rendszerek áttekintés p. 23/50

100 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: Ajánló rendszerek áttekintés p. 24/50

101 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I Ajánló rendszerek áttekintés p. 24/50

102 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U Ajánló rendszerek áttekintés p. 24/50

103 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: Ajánló rendszerek áttekintés p. 24/50

104 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) Ajánló rendszerek áttekintés p. 24/50

105 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Ajánló rendszerek áttekintés p. 24/50

106 [Huang-2004] páros gráf alapú megközelítés A reprezentativitások segítségével felírhatóak a következő mágrixok: PR = {pr(u,i)} i,j R U I CR = {cr(u 1,u 2 )} i,j R U U A reprezentativitások definíciója rekurziv (Kleinber szerű értelemben), azaz: PR = h (CR) CR = g (PR) Amennyiben h(cr) = CR T A T és g(pr) = A T PR, akkor a HITS algoritmust kapjuk vissza a PR és CR megfelelő sor- illetve oszlopvektoraira. Ajánló rendszerek áttekintés p. 24/50

107 [Huang-2004] páros gráf alapú megközelítés Amennyiben: Ajánló rendszerek áttekintés p. 25/50

108 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k és Ajánló rendszerek áttekintés p. 25/50

109 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j, és Ajánló rendszerek áttekintés p. 25/50

110 [Huang-2004] páros gráf alapú megközelítés Amennyiben: h(cr) i,k = g(pr) i,t = P P j és a j,k null a j,kcr(i,j) P j és a j,k null a j,k j és a j,k null a t,jpr(i,j) P j és a t,j null a t,j akkor a PageRank-ben implementált random walk modellt kapjuk., és Ajánló rendszerek áttekintés p. 25/50

111 [Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, link. Ajánló rendszerek áttekintés p. 26/50

112 [Huang-2004] páros gráf alapú megközelítés Eredmények: F-measure-ben, Chinese online book database, 9695 item, 2000 user, link. Ajánló rendszerek áttekintés p. 26/50

113 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Ajánló rendszerek áttekintés p. 27/50

114 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, Ajánló rendszerek áttekintés p. 27/50

115 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, Ajánló rendszerek áttekintés p. 27/50

116 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), Ajánló rendszerek áttekintés p. 27/50

117 Machine Learning Model based methods Alapötlet: a rendelkezésre álló f (u, i) adathalmazból, a felhasználó profilokból valamint a termék karakterisztikákból készítsünk jellemzővektorokat, az predikciót osztálycímkének tekintve tanítsuk felügyelt gépi tanuló modellt. Jellemző vektorokat lehet, minden felhasznlóra és item-re külön kinyerni, felhasználonként itemek egy csoportjához (klaszteréhez), ezekből képzett hibrid módszerrel. Ajánló rendszerek áttekintés p. 27/50

118 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, Ajánló rendszerek áttekintés p. 28/50

119 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Ajánló rendszerek áttekintés p. 28/50

120 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

121 [Park-2008] ML model A cikkben azt vizsgálták, hogy a különböző gépi tanulási modellekre hogyan hat az item értékelési gyakoriság, illetve arra kerestek választ, hogy a gépi tanulási modelek három felhasználása közül melyik a legjobb. Észrevétel: az item értékelési gyakoriság long-tail eloszlású Ajánló rendszerek áttekintés p. 28/50

122 [Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

123 [Park-2008] ML model Következmény: Ha minden egyes item-re külön készítünk modellt, akkor a modellek hatékonysága az item értékelések számának csökkenésével arányosan romlik. Ajánló rendszerek áttekintés p. 29/50

124 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Ajánló rendszerek áttekintés p. 30/50

125 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

126 [Park-2008] ML model Ha az itemeket klaszterezzük az segít, de így a gyakran értékelt itemek is klasztereződnek így veszítnek informáltságukból. Megoldás hibrid mószer, head-ben minden item-hez külön modell, tail-ben klaszterezés és klaszterenkénti modell. Ajánló rendszerek áttekintés p. 30/50

127 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Ajánló rendszerek áttekintés p. 31/50

128 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: Ajánló rendszerek áttekintés p. 31/50

129 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], Ajánló rendszerek áttekintés p. 31/50

130 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Ajánló rendszerek áttekintés p. 31/50

131 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

132 Dimensionality reduction based approches Alapötlet: a rendelkezésünkre álló ajánlásokból képzett mátrix dimenzióját csökkentsük, ezzel tömörítve azt hatékonyabban tudunk távolságot számolni, a számolt távolságértékek megbízhatóbbak lesznek. Leggyakrabban használt eljárások: LSI [Billsus-1998], PCA [Goldberg-2001]. Vélemények megoszlanak a hasznukról [Sarwar-2000]: Ajánló rendszerek áttekintés p. 31/50

133 Néhány összehasonlító eredmény Ajánló rendszerek áttekintés p. 32/50

134 Elosztott módszerek Ajánló rendszerek áttekintés p. 33/50

135 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok Ajánló rendszerek áttekintés p. 34/50

136 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében Ajánló rendszerek áttekintés p. 34/50

137 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre Ajánló rendszerek áttekintés p. 34/50

138 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ajánló rendszerek áttekintés p. 34/50

139 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) Ajánló rendszerek áttekintés p. 34/50

140 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak Ajánló rendszerek áttekintés p. 34/50

141 [Tveit-2001] Szavazati lista terjesztés A peer-ek egymásnak küldött üzeneteik a szavazatvektorok A hatékonyság növelése érdekében A vektorok ritka reprezentációban kerülnek átküldésre A ritka reprezentációt tömörítik (binary interpolative compression [Moffat-1996]) Ezen vektor alapján hasonlóság számolása (Pearson correlation vagy Cosine measure) ha ez meghalad egy τ korlátot, akkor visszaküldi a saját vektorát a feladónak ha nem, akkor a kapott vektort továbbítja a szomszédainak. Ajánló rendszerek áttekintés p. 34/50

142 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ajánló rendszerek áttekintés p. 35/50

143 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást Ajánló rendszerek áttekintés p. 35/50

144 [Tveit-2001] Szavazati lista terjesztés (2) Pl.: [10 : 0, 22 : 2, 37 : 8] és [10 : 0, 22 : 2, 24 : 9, 37 : 8], akkor az ajánlás a 24 : 9 súlyozva Ha elég sok vektor érkezett vissza, akkor a peer rangsorolja azokat és megteszi az ajánlást A hálózat dinamikája: ha egy peer két szomszédjától nagyon hasonló vektorokat kap, akkor megkérdezi őket, hogy akarnak-e közvetlen kapcsolatot egymás között Ajánló rendszerek áttekintés p. 35/50

145 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Ajánló rendszerek áttekintés p. 36/50

146 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Ajánló rendszerek áttekintés p. 36/50

147 [Bickson-2007] Ráták szétterjesztése Az általuk definált veszteség fgv.: min x ( i V (x i y i ) 2 + β w ij E w ij(x i x j ) 2 ) Minden egyes peer-hez megadták a többi peer fontossági sorrendjét a Gaussian Belief Propagation algoritmus [Johnson-2006] peer-enkénti párhuzamos futtatásával a szociális háló topológiája alapján Az ajánlást pedig a Consensus Propagation algoritmus [Moallemi-2006] segítségével számolták, amely a hálózat átlagát számolta, hogy minimalizálja a fent definiált hibát Ajánló rendszerek áttekintés p. 36/50

148 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy Ajánló rendszerek áttekintés p. 37/50

149 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra Ajánló rendszerek áttekintés p. 37/50

150 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) Ajánló rendszerek áttekintés p. 37/50

151 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Ajánló rendszerek áttekintés p. 37/50

152 [Bickson-2007] Ráták szétterjesztése (2) Ezen algoritmust (CPA) módosították, hogy a β paraméterrel hangolható legyen, hogy a peerek mennyire legyenek érzékenyek szomszédokra az algoritmus kezelje a hiányzó értékeket (még szavazat nélküli itemek) valamint ne kelljen az élsúlyoknak egyenletes eloszlást követniük Az algoritmus kiterjeszthető a személyre szabott PageRank és az Information Centrality módszerekre a megfelelő input paraméterekkel Ajánló rendszerek áttekintés p. 37/50

153 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Ajánló rendszerek áttekintés p. 38/50

154 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja Ajánló rendszerek áttekintés p. 38/50

155 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: Ajánló rendszerek áttekintés p. 38/50

156 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé Ajánló rendszerek áttekintés p. 38/50

157 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak Ajánló rendszerek áttekintés p. 38/50

158 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak Ajánló rendszerek áttekintés p. 38/50

159 [Georgios-2006] Kérés szétterjesztése Bizalmi overlay háló építése a [Pitsilis-2004] cikk alapján Abban a cikkben gyakorlatilag a bizalmi szintet a felhasználók Pearson coefficient értéke adja A megépített bizalmi háló nem fontos (limit alatti) éleinek elhagyása, majd ajánlat keresése: ajánlatkérés elindítása a szomszédok felé a peer hozzáfűzi a listához a bizalmi szintjét és továbbküldi a szomszédoknak ha a peer rendelkezik szavazattal az adott itemre, akkor visszaküldi a lekérdezést a feladónak A beérkező listák bizalmi szintjét hasonlósági mértékké konvertálja, majd kiszámítja a legjobb ajánlást Ajánló rendszerek áttekintés p. 38/50

160 [Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Ajánló rendszerek áttekintés p. 39/50

161 [Han-2004] DHT Az itemek és a hozzá tartozó információk szét vannak osztva a peerek között (DHT - Distributed Hash Table) - bucketek Minden egyes item minden egyes előforduló rate-jéhez fel van véve egy bucket, amely tartalmazza azon userek azonosítóit, akik legalább ezzel az értékkel szavaztak az aktuális itemre Ajánló rendszerek áttekintés p. 39/50

162 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Ajánló rendszerek áttekintés p. 40/50

163 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: Ajánló rendszerek áttekintés p. 40/50

164 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására Ajánló rendszerek áttekintés p. 40/50

165 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére Ajánló rendszerek áttekintés p. 40/50

166 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Ajánló rendszerek áttekintés p. 40/50

167 [Han-2004] DHT (2) Az ötlet, hogy azon a felhasználóknak hasonló az érdeklődése, akik egy itemre hasonlóan szavaznak Az algoritmus két fontos műveletet valósít meg: put(key) A DHT overlay konstrukciójára és az itemek elosztására lookup(key) A hasonló szavazatokkal rendelkező userek megkeresésére A lookup segítségével kialakítható egy lokális train set, ami alapján meg lehet tenni az ajánlást Eachmovie adatbázis 0.83 MAE Ajánló rendszerek áttekintés p. 40/50

168 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ Ajánló rendszerek áttekintés p. 41/50

169 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája Ajánló rendszerek áttekintés p. 41/50

170 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

171 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma Ajánló rendszerek áttekintés p. 41/50

172 [Yang-2007] Buddycast User based Item rangsoroló módszer: o u (i) u :u L i log c(u,u) + µ P c(u ) u c(u ) c(u) + µ L i az i itemre szavazó felhasználók listája c(u) az u felhasználó által szavazott itemek száma c(u,u) az u és u felhasználók által közösen szavazott itemek száma a µ pedig simító paraméter Ajánló rendszerek áttekintés p. 41/50

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

Szomszédság alapú ajánló rendszerek

Szomszédság alapú ajánló rendszerek Nagyméretű adathalmazok kezelése Szomszédság alapú ajánló rendszerek Készítette: Szabó Máté A rendelkezésre álló adatmennyiség növelésével egyre nehezebb kiválogatni a hasznos információkat Megoldás: ajánló

Részletesebben

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján Hegedűs István Ajánló rendszerek Napjainkban egyre népszerűbb az ajánló rendszerek alkalmazása A cégeket is hasznos információval

Részletesebben

Közösség detektálás gráfokban

Közösség detektálás gráfokban Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a

Részletesebben

Gépi tanulás a gyakorlatban. Lineáris regresszió

Gépi tanulás a gyakorlatban. Lineáris regresszió Gépi tanulás a gyakorlatban Lineáris regresszió Lineáris Regresszió Legyen adott egy tanuló adatbázis: Rendelkezésünkre áll egy olyan előfeldolgozott adathalmaz, aminek sorai az egyes ingatlanokat írják

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

1. gyakorlat. Mesterséges Intelligencia 2.

1. gyakorlat. Mesterséges Intelligencia 2. 1. gyakorlat Mesterséges Intelligencia. Elérhetőségek web: www.inf.u-szeged.hu/~gulyasg mail: gulyasg@inf.u-szeged.hu Követelmények (nem teljes) gyakorlat látogatása kötelező ZH írása a gyakorlaton elhangzott

Részletesebben

JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN

JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN Supporting Top-k item exchange recommendations in large online communities Barabás Gábor Nagy Dávid Nemes Tamás Probléma Cserekereskedelem

Részletesebben

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)

Részletesebben

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István Teljesen elosztott adatbányászat pletyka algoritmusokkal Jelasity Márk Ormándi Róbert, Hegedűs István Motiváció Nagyméretű hálózatos elosztott alkalmazások az Interneten egyre fontosabbak Fájlcserélő rendszerek

Részletesebben

Intelligens adatelemzés

Intelligens adatelemzés Antal Péter, Antos András, Horváth Gábor, Hullám Gábor, Kocsis Imre, Marx Péter, Millinghoffer András, Pataricza András, Salánki Ágnes Intelligens adatelemzés Szerkesztette: Antal Péter A jegyzetben az

Részletesebben

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló

Részletesebben

Teljesen elosztott adatbányászat alprojekt

Teljesen elosztott adatbányászat alprojekt Teljesen elosztott adatbányászat alprojekt Hegedűs István, Ormándi Róbert, Jelasity Márk Big Data jelenség Big Data jelenség Exponenciális növekedés a(z): okos eszközök használatában, és a szenzor- és

Részletesebben

Hash-alapú keresések

Hash-alapú keresések 1/16 az információ-visszakeresésben Babeş Bolyai Tudományegyetem Magyar Matematika és Informatika Intézet A Magyar Tudomány Napja Erdélyben Kolozsvár, 2012 2/16 Tartalom Információ-visszakeresés Információ-visszakeresés

Részletesebben

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet / Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet / Tartalom 3/ kernelek segítségével Felügyelt és félig-felügyelt tanulás felügyelt: D =

Részletesebben

Mátrix-alapú projektkockázatmenedzsment

Mátrix-alapú projektkockázatmenedzsment Mátrix-alapú projektkockázatmenedzsment Hegedűs Csaba, Kosztyán Zsolt Tibor Pannon Egyetem, Kvantitatív Módszerek Intézeti Tanszék XXXII. Magyar Operációkutatási Konferencia Cegléd, 2017.06.14-16. Informatikai

Részletesebben

Adatszerkezetek 2. Dr. Iványi Péter

Adatszerkezetek 2. Dr. Iványi Péter Adatszerkezetek 2. Dr. Iványi Péter 1 Fák Fákat akkor használunk, ha az adatok között valamilyen alá- és fölérendeltség van. Pl. könyvtárszerkezet gyökér (root) Nincsennek hurkok!!! 2 Bináris fák Azokat

Részletesebben

(Independence, dependence, random variables)

(Independence, dependence, random variables) Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,

Részletesebben

IBM SPSS Modeler 18.2 Újdonságok

IBM SPSS Modeler 18.2 Újdonságok IBM SPSS Modeler 18.2 Újdonságok 1 2 Új, modern megjelenés Vizualizáció fejlesztése Újabb algoritmusok (Python, Spark alapú) View Data, t-sne, e-plot GMM, HDBSCAN, KDE, Isotonic-Regression 3 Új, modern

Részletesebben

Markov-láncok stacionárius eloszlása

Markov-láncok stacionárius eloszlása Markov-láncok stacionárius eloszlása Adatbányászat és Keresés Csoport, MTA SZTAKI dms.sztaki.hu Kiss Tamás 2013. április 11. Tartalom Markov láncok definíciója, jellemzése Visszatérési idők Stacionárius

Részletesebben

Szalai Péter. April 17, Szalai Péter April 17, / 36

Szalai Péter. April 17, Szalai Péter April 17, / 36 Szociális hálók Szalai Péter April 17, 2015 Szalai Péter April 17, 2015 1 / 36 Miről lesz szó? 1 Megfigyelések Kis világ Power-law Klaszterezhetőség 2 Modellek Célok Erdős-Rényi Watts-Strogatz Barabási

Részletesebben

Adatbányászati szemelvények MapReduce környezetben

Adatbányászati szemelvények MapReduce környezetben Adatbányászati szemelvények MapReduce környezetben Salánki Ágnes salanki@mit.bme.hu 2014.11.10. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Felügyelt

Részletesebben

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz

Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz Kontrollcsoport-generálási lehetőségek retrospektív egészségügyi vizsgálatokhoz Szekér Szabolcs 1, Dr. Fogarassyné dr. Vathy Ágnes 2 1 Pannon Egyetem Rendszer- és Számítástudományi Tanszék, szekersz@gmail.com

Részletesebben

Felügyelt önálló tanulás - Analízis III.

Felügyelt önálló tanulás - Analízis III. Felügyelt önálló tanulás - Analízis III Kormos Máté Differenciálható sokaságok Sokaságok Röviden, sokaságoknak nevezzük azokat az objektumokat, amelyek egy n dimenziós térben lokálisan k dimenziósak Definíció:

Részletesebben

7. Régió alapú szegmentálás

7. Régió alapú szegmentálás Digitális képek szegmentálása 7. Régió alapú szegmentálás Kató Zoltán http://www.cab.u-szeged.hu/~kato/segmentation/ Szegmentálási kritériumok Particionáljuk a képet az alábbi kritériumokat kielégítő régiókba

Részletesebben

Mesterséges Intelligencia I.

Mesterséges Intelligencia I. Mesterséges Intelligencia I. 10. elıadás (2008. november 10.) Készítette: Romhányi Anita (ROANAAT.SZE) - 1 - Statisztikai tanulás (Megfigyelések alapján történı bizonytalan következetésnek tekintjük a

Részletesebben

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007 Hálózatok II 2007 1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok 1 Az előadáshoz Előadás: Szerda 17:00 18:30 Gyakorlat: nincs Vizsga írásbeli Honlap: http://people.inf.elte.hu/lukovszki/courses/g/07nwii

Részletesebben

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján Schrádi Tamás schraditamas@aut.bme.hu Automatizálási és Alkalmazott Informatikai Tanszék BME A feladat A webszerverek naplóállományainak

Részletesebben

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa:

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa: Gráfok, definíciók Irányítatlan gráf: G = (V,E), ahol E rendezetlen (a,b),a,b V párok halmaza. Irányított gráf: G = (V,E) E rendezett (a,b) párok halmaza; E V V. Címkézett (súlyozott) gráf: G = (V,E,C)

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket

Részletesebben

Az optimális megoldást adó algoritmusok

Az optimális megoldást adó algoritmusok Az optimális megoldást adó algoritmusok shop ütemezés esetén Ebben a fejezetben olyan modellekkel foglalkozunk, amelyekben a munkák több műveletből állnak. Speciálisan shop ütemezési problémákat vizsgálunk.

Részletesebben

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő

Részletesebben

Társadalmi és gazdasági hálózatok modellezése

Társadalmi és gazdasági hálózatok modellezése Társadalmi és gazdasági hálózatok modellezése 2. el adás A hálózatkutatás néhány fontos fogalma El adó: London András 2015. szeptember 15. Átmér l ij a legrövidebb út a hálózatban i és j pont között =

Részletesebben

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Adaptív dinamikus szegmentálás idősorok indexeléséhez Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november

Részletesebben

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet   takach november 30. 1 Diszkrét matematika I, 12 előadás Dr Takách Géza NyME FMK Informatikai Intézet takach@infnymehu http://infnymehu/ takach 2005 november 30 Vektorok Definíció Egy tetszőleges n pozitív egész számra n-komponensű

Részletesebben

Közösségek keresése nagy gráfokban

Közösségek keresése nagy gráfokban Közösségek keresése nagy gráfokban Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem 2011. április 14. Katona Gyula Y. (BME SZIT) Közösségek

Részletesebben

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat Klaszterezés Szegedi Tudományegyetem Élei lehetnek címkézettek (pl. ellenség, barát), továbbá súlyozottak (pl. telefonbeszélgetés) Megjelenési formái Ismeretségi, társszerzőségi gráf (Erdős-Bacon szám)

Részletesebben

Struktúra nélküli adatszerkezetek

Struktúra nélküli adatszerkezetek Struktúra nélküli adatszerkezetek Homogén adatszerkezetek (minden adatelem azonos típusú) osztályozása Struktúra nélküli (Nincs kapcsolat az adatelemek között.) Halmaz Multihalmaz Asszociatív 20:24 1 A

Részletesebben

Online ajánlórendszerek az elektronikus kereskedelemben. Dr. Révész Balázs

Online ajánlórendszerek az elektronikus kereskedelemben. Dr. Révész Balázs Online ajánlórendszerek az elektronikus kereskedelemben Dr Révész Balázs Bevezetés Az internet használat tovább terjed mind a lakossági, mind az üzleti szegmensben A B2C és a C2C piac szerepének fokozatos

Részletesebben

Társadalmi és gazdasági hálózatok modellezése

Társadalmi és gazdasági hálózatok modellezése Társadalmi és gazdasági hálózatok modellezése 5. el adás Közösségszerkezet El adó: London András 2017. október 16. Közösségek hálózatban Homofília, asszortatívitás Newman modularitás Közösségek hálózatban

Részletesebben

Sergyán Szabolcs szeptember 21.

Sergyán Szabolcs szeptember 21. Éldetektálás Sergyán Szabolcs Budapesti Műszaki Főiskola Neumann János Informatikai Kar 2009. szeptember 21. Sergyán Sz. (BMF NIK) Éldetektálás 2009. szeptember 21. 1 / 28 Mit nevezünk élnek? Intuitív

Részletesebben

Online migrációs ütemezési modellek

Online migrációs ütemezési modellek Online migrációs ütemezési modellek Az online migrációs modellekben a régebben ütemezett munkák is átütemezhetőek valamilyen korlátozott mértékben az új munka ütemezése mellett. Ez csökkentheti a versenyképességi

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Funkcionális konnektivitás vizsgálata fmri adatok alapján Funkcionális konnektivitás vizsgálata fmri adatok alapján Képalkotási technikák 4 Log Resolution (mm) 3 Brain EEG & MEG fmri TMS PET Lesions 2 Column 1 0 Lamina -1 Neuron -2 Dendrite -3 Synapse -4 Mikrolesions

Részletesebben

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Dombi József Szegedi Tudományegyetem Bevezetés - ID3 (Iterative Dichotomiser 3) Az ID algoritmusok egy elemhalmaz felhasználásával

Részletesebben

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban Intelligens Rendszerek Elmélete : dr. Kutor László Versengéses és önszervező tanulás neurális hálózatokban http://mobil.nik.bmf.hu/tantargyak/ire.html Login név: ire jelszó: IRE07 IRE 9/1 Processzor Versengéses

Részletesebben

IBNR számítási módszerek áttekintése

IBNR számítási módszerek áttekintése 1/13 IBNR számítási módszerek áttekintése Prokaj Vilmos email: Prokaj.Vilmos@pszaf.hu 1. Kifutási háromszög Év 1 2 3 4 5 2/13 1 X 1,1 X 1,2 X 1,3 X 1,4 X 1,5 2 X 2,1 X 2,2 X 2,3 X 2,4 X 2,5 3 X 3,1 X 3,2

Részletesebben

22. GRÁFOK ÁBRÁZOLÁSA

22. GRÁFOK ÁBRÁZOLÁSA 22. GRÁFOK ÁBRÁZOLÁSA A megoldandó feladatok, problémák modellezése során sokszor gráfokat alkalmazunk. A gráf fogalmát a matematikából ismertnek vehetjük. A modellezés során a gráfok több változata is

Részletesebben

2. Visszalépéses keresés

2. Visszalépéses keresés 2. Visszalépéses keresés Visszalépéses keresés A visszalépéses keresés egy olyan KR, amely globális munkaterülete: egy út a startcsúcsból az aktuális csúcsba (az útról leágazó még ki nem próbált élekkel

Részletesebben

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Principal Component Analysis Principal Component Analysis Definíció Ortogonális transzformáció, amely az adatokat egy új koordinátarendszerbe transzformálja úgy, hogy a koordináták

Részletesebben

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Gépi tanulás Gregorics Tibor Mesterséges intelligencia Gépi tanulás Tanulás fogalma Egy algoritmus akkor tanul, ha egy feladat megoldása során olyan változások következnek be a működésében, hogy később ugyanazt a feladatot vagy ahhoz hasonló más feladatokat

Részletesebben

Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése

Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése Dr. Kallós Gábor 2014 2015 1 Az Ordó jelölés Azt mondjuk, hogy az f(n) függvény eleme az Ordó(g(n)) halmaznak, ha van olyan c konstans (c

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs

Részletesebben

Totális Unimodularitás és LP dualitás. Tapolcai János

Totális Unimodularitás és LP dualitás. Tapolcai János Totális Unimodularitás és LP dualitás Tapolcai János tapolcai@tmit.bme.hu 1 Optimalizálási feladat kezelése NP-nehéz Hatékony megoldás vélhetően nem létezik Jó esetben hatékony algoritmussal közelíteni

Részletesebben

Random Forests - Véletlen erdők

Random Forests - Véletlen erdők Random Forests - Véletlen erdők Szabó Adrienn Adatbányászat és Webes Keresés Kutatócsoport 2010 Tartalom Fő forrás: Leo Breiman: Random Forests Machine Learning, 45, 5-32, 2001 Alapok Döntési fa Véletlen

Részletesebben

Nagyméretű adathalmazok kezelése Ajánló rendszerek

Nagyméretű adathalmazok kezelése Ajánló rendszerek Nagyméretű adathalmazok kezelése Gubek Andrea BME SZIT 1 Tartalom alapú ajánló rendszerek Együttműködés alapú ajánló rendszerek 2 The Movie Genome és a Jinni Movie Genome Gubek Andrea (BME SZIT) Elosztott

Részletesebben

Bonyolultságelmélet. Monday 26 th September, 2016, 18:50

Bonyolultságelmélet. Monday 26 th September, 2016, 18:50 Bonyolultságelmélet Monday 26 th September, 2016, 18:50 A kiszámítás modelljei 2 De milyen architektúrán polinom? A kiszámításnak számos (matematikai) modellje létezik: Általános rekurzív függvények λ-kalkulus

Részletesebben

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma Készítette: Laczik Sándor János Gráfelmélet I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma Definíció: a G=(V,E) párt egyszerű gráfnak nevezzük, (V elemeit a gráf csúcsainak/pontjainak,e elemeit

Részletesebben

Kódverifikáció gépi tanulással

Kódverifikáció gépi tanulással Kódverifikáció gépi tanulással Szoftver verifikáció és validáció kiselőadás Hidasi Balázs 2013. 12. 12. Áttekintés Gépi tanuló módszerek áttekintése Kódverifikáció Motiváció Néhány megközelítés Fault Invariant

Részletesebben

10: Peer-To-Peer Hálózatok I. HálózatokII, 2007

10: Peer-To-Peer Hálózatok I. HálózatokII, 2007 Hálózatok II 2007 10: Peer-To-Peer Hálózatok I 1 Definíció Egy Peer-to-Peer hálózat egy kommunikációs hálózat számítógépek között, melyben minden résztvevő mind client, mind server feladatokat végrehajt.

Részletesebben

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris

Részletesebben

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március

Részletesebben

Konjugált gradiens módszer

Konjugált gradiens módszer Közelítő és szimbolikus számítások 12. gyakorlat Konjugált gradiens módszer Készítette: Gelle Kitti Csendes Tibor Vinkó Tamás Faragó István Horváth Róbert jegyzetei alapján 1 LINEÁRIS EGYENLETRENDSZEREK

Részletesebben

10. Előadás P[M E ] = H

10. Előadás P[M E ] = H HALMAZRENDSZEREK 10. Előadás Matematika MSc hallgatók számára Előadó: Hajnal Péter Jegyzetelő: Hajnal Péter 2010. április 20. Halmazrendszerek színezése Egy halmazrendszer csúcshalmazának színezése jó

Részletesebben

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD

Flynn féle osztályozás Single Isntruction Multiple Instruction Single Data SISD SIMD Multiple Data MISD MIMD M5-. A lineáris algebra párhuzamos algoritmusai. Ismertesse a párhuzamos gépi architektúrák Flynn-féle osztályozását. A párhuzamos lineáris algebrai algoritmusok között mi a BLAS csomag célja, melyek annak

Részletesebben

Visszacsatolt (mély) neurális hálózatok

Visszacsatolt (mély) neurális hálózatok Visszacsatolt (mély) neurális hálózatok Visszacsatolt hálózatok kimenet rejtett rétegek bemenet Sima előrecsatolt neurális hálózat Visszacsatolt hálózatok kimenet rejtett rétegek bemenet Pl.: kép feliratozás,

Részletesebben

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( ) Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:

Részletesebben

Statisztikai módszerek a skálafüggetlen hálózatok

Statisztikai módszerek a skálafüggetlen hálózatok Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti

Részletesebben

Történet John Little (1970) (Management Science cikk)

Történet John Little (1970) (Management Science cikk) Információ menedzsment Szendrői Etelka Rendszer- és Szoftvertechnológia Tanszék szendroi@witch.pmmf.hu Vezetői információs rendszerek Döntéstámogató rendszerek (Decision Support Systems) Döntések információn

Részletesebben

2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év).

2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év). 1. fejezet AWK 1.1. Szűrési feladatok 1. Készítsen awk szkriptet, ami kiírja egy állomány leghosszabb szavát. 2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét,

Részletesebben

Számítógép hálózatok, osztott rendszerek 2009

Számítógép hálózatok, osztott rendszerek 2009 Számítógép hálózatok, osztott rendszerek 2009 1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok 1 Az előadáshoz Előadás: Hétfő 10:00 12:00 óra Gyakorlat: Hétfő 14:00-16:00 óra Honlap: http://people.inf.elte.hu/lukovszki/courses/0910nwmsc

Részletesebben

Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2.

Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2. Mesterséges Intelligencia II. kötelező feladat (3. forduló) - Ajánló rendszer 2. 1. Feladat kiírása A második forduló feladata hasonlóan az előző fordulóhoz egy ajánló rendszer modelljének elkészítése.

Részletesebben

Páros összehasonlítás mátrixok empirikus vizsgálata. Bozóki Sándor

Páros összehasonlítás mátrixok empirikus vizsgálata. Bozóki Sándor Páros összehasonlítás mátrixok empirikus vizsgálata Bozóki Sándor MTA SZTAKI Operációkutatás és Döntési Rendszerek Kutatócsoport Budapesti Corvinus Egyetem Operációkutatás és Aktuáriustudományok Tanszék

Részletesebben

Lineáris regressziós modellek 1

Lineáris regressziós modellek 1 Lineáris regressziós modellek 1 Ispány Márton és Jeszenszky Péter 2016. szeptember 19. 1 Az ábrák C.M. Bishop: Pattern Recognition and Machine Learning c. könyvéből származnak. Tartalom Bevezető példák

Részletesebben

Adott: VPN topológia tervezés. Költségmodell: fix szakaszköltség VPN végpontok

Adott: VPN topológia tervezés. Költségmodell: fix szakaszköltség VPN végpontok Hálózatok tervezése VITMM215 Maliosz Markosz 2012 12.10..10.27 27. Adott: VPN topológia tervezés fizikai hálózat topológiája Költségmodell: fix szakaszköltség VPN végpontok 2 VPN topológia tervezés VPN

Részletesebben

Saj at ert ek-probl em ak febru ar 26.

Saj at ert ek-probl em ak febru ar 26. Sajátérték-problémák 2018. február 26. Az alapfeladat Adott a következő egyenlet: Av = λv, (1) ahol A egy ismert mátrix v ismeretlen, nem zérus vektor λ ismeretlen szám Azok a v, λ kombinációk, amikre

Részletesebben

Gyakorló feladatok adatbányászati technikák tantárgyhoz

Gyakorló feladatok adatbányászati technikák tantárgyhoz Gyakorló feladatok adatbányászati technikák tantárgyhoz Buza Krisztián Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Klaszterezés kiértékelése Feladat:

Részletesebben

Megkülönböztetett kiszolgáló routerek az

Megkülönböztetett kiszolgáló routerek az Megkülönböztetett kiszolgáló routerek az Interneten Megkülönböztetett kiszolgálás A kiszolgáló architektúrák minősége az Interneten: Integrált kiszolgálás (IntServ) Megkülönböztetett kiszolgálás (DiffServ)

Részletesebben

Számítógépes döntéstámogatás. Genetikus algoritmusok

Számítógépes döntéstámogatás. Genetikus algoritmusok BLSZM-10 p. 1/18 Számítógépes döntéstámogatás Genetikus algoritmusok Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu BLSZM-10 p. 2/18 Bevezetés 1950-60-as

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

Kettőnél több csoport vizsgálata. Makara B. Gábor

Kettőnél több csoport vizsgálata. Makara B. Gábor Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10

Részletesebben

Dr. habil. Maróti György

Dr. habil. Maróti György infokommunikációs technológiák III.8. MÓDSZER KIDOLGOZÁSA ALGORITMUSOK ÁTÜLTETÉSÉRE KIS SZÁMÍTÁSI TELJESÍTMÉNYŰ ESZKÖZÖKBŐL ÁLLÓ NÉPES HETEROGÉN INFRASTRUKTÚRA Dr. habil. Maróti György maroti@dcs.uni-pannon.hu

Részletesebben

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar A Jövő Internet elméleti alapjai Vaszil György Debreceni Egyetem, Informatikai Kar Kutatási témák Bizalmas adatok védelme, kriptográfiai protokollok DE IK Számítógéptudományi Tsz., MTA Atomki Informatikai

Részletesebben

Diszkrét matematika 2.C szakirány

Diszkrét matematika 2.C szakirány Diszkrét matematika 2.C szakirány 2017. tavasz 1. Diszkrét matematika 2.C szakirány 11. előadás Nagy Gábor nagygabr@gmail.com nagy@compalg.inf.elte.hu compalg.inf.elte.hu/ nagy Komputeralgebra Tanszék

Részletesebben

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel! függvények RE 1 Relációk Függvények függvények RE 2 Definíció Ha A, B és ρ A B, akkor azt mondjuk, hogy ρ reláció A és B között, vagy azt, hogy ρ leképezés A-ból B-be. Ha speciálisan A=B, azaz ρ A A, akkor

Részletesebben

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Strukturált Generátorrendszerek Online Tanulása és Alk-ai Strukturált Generátorrendszerek Online Tanulása és Alkalmazásai Problémamegoldó Szeminárium 2010. nov. 5 Tartalomjegyzék Motiváció, példák Regressziós feladatok (generátorrendszer fix) Legkisebb négyzetes

Részletesebben

Modellkiválasztás és struktúrák tanulása

Modellkiválasztás és struktúrák tanulása Modellkiválasztás és struktúrák tanulása Szervezőelvek keresése Az unsupervised learning egyik fő célja Optimális reprezentációk Magyarázatok Predikciók Az emberi tanulás alapja Általános strukturális

Részletesebben

Gráfelméleti feladatok. c f

Gráfelméleti feladatok. c f Gráfelméleti feladatok d e c f a b gráf, csúcsok, élek séta: a, b, c, d, e, c, a, b, f vonal: c, d, e, c, b, a út: f, b, a, e, d (walk, lanţ) (trail, lanţ simplu) (path, lanţ elementar) 1 irányított gráf,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Hipotézis vizsgálatok

Hipotézis vizsgálatok Hipotézis vizsgálatok Hipotézisvizsgálat Hipotézis: az alapsokaság paramétereire vagy az alapsokaság eloszlására vonatkozó feltevés. Hipotézis ellenőrzés: az a statisztikai módszer, amelynek segítségével

Részletesebben

Klaszterezés, 2. rész

Klaszterezés, 2. rész Klaszterezés, 2. rész Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 208. április 6. Csima Judit Klaszterezés, 2. rész / 29 Hierarchikus klaszterezés egymásba ágyazott klasztereket

Részletesebben

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Kollektív tanulás milliós hálózatokban. Jelasity Márk Kollektív tanulás milliós hálózatokban Jelasity Márk 2 3 Motiváció Okostelefon platform robbanásszerű terjedése és Szenzorok és gazdag kontextus jelenléte, ami Kollaboratív adatbányászati alkalmazások

Részletesebben

Speciális adatszerkezetek. Programozás alapjai II. (8. ea) C++ Tömbök. Tömbök/2. N dimenziós tömb. Nagyméretű ritka tömbök

Speciális adatszerkezetek. Programozás alapjai II. (8. ea) C++ Tömbök. Tömbök/2. N dimenziós tömb. Nagyméretű ritka tömbök Programozás alapjai II. (8. ea) C++ Kiegészítő anyag: speciális adatszerkezetek Szeberényi Imre BME IIT Speciális adatszerkezetek A helyes adatábrázolás választása, a helyes adatszerkezet

Részletesebben

Általános algoritmustervezési módszerek

Általános algoritmustervezési módszerek Általános algoritmustervezési módszerek Ebben a részben arra mutatunk példát, hogy miként használhatóak olyan általános algoritmustervezési módszerek mint a dinamikus programozás és a korlátozás és szétválasztás

Részletesebben

Programozás alapjai II. (7. ea) C++ Speciális adatszerkezetek. Tömbök. Kiegészítő anyag: speciális adatszerkezetek

Programozás alapjai II. (7. ea) C++ Speciális adatszerkezetek. Tömbök. Kiegészítő anyag: speciális adatszerkezetek Programozás alapjai II. (7. ea) C++ Kiegészítő anyag: speciális adatszerkezetek Szeberényi Imre BME IIT M Ű E G Y E T E M 1 7 8 2 C++ programozási nyelv BME-IIT Sz.I. 2016.04.05. - 1

Részletesebben

Tartalomjegyzék. Köszönetnyilvánítás. 1. Az alapok 1

Tartalomjegyzék. Köszönetnyilvánítás. 1. Az alapok 1 Köszönetnyilvánítás Bevezetés Kinek szól a könyv? Elvárt előismeretek A könyv témája A könyv használata A megközelítés alapelvei Törekedjünk az egyszerűségre! Ne optimalizáljunk előre! Felhasználói interfészek

Részletesebben

Amortizációs költségelemzés

Amortizációs költségelemzés Amortizációs költségelemzés Amennyiben műveleteknek egy M 1,...,M m sorozatának a futási idejét akarjuk meghatározni, akkor egy lehetőség, hogy külön-külön minden egyes művelet futási idejét kifejezzük

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben