Engedy Balázs. Nagy adathalmazok kezelése

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Engedy Balázs. Nagy adathalmazok kezelése"

Átírás

1 Ajánlórendszerek Engedy Balázs Budapesti Műszaki és Gazdaságtudományi Egyetem Számítástudomány szakirány Nagy adathalmazok kezelése című tárgy előadása április 21. Engedy Balázs Ajánlórendszerek 1/ 37

2 Tartalom Bevezetés 1 Bevezetés Történelem Gazdasági előnyök Formális leírás Csoportosítás 2 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés 3 Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása 4 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Engedy Balázs Ajánlórendszerek 2/ 37

3 Dehomogenizálódó piacok Történelem Gazdasági előnyök Formális leírás Csoportosítás Joseph Pine: Mass Customization (1993) A 90-es években végbemenő piaci változásokat tárgyalja, miszerint: a szabványos, egyenvásárlóra tervezett tömegtermékek ideje lejárt, többféle vásárló többféle igényét kielégítő heterogén (sokféle) termékek gyártásának irányába kell elmozdulni. Engedy Balázs Ajánlórendszerek 3/ 37

4 Ajánlórendszerek Bevezetés Történelem Gazdasági előnyök Formális leírás Csoportosítás Jeff Bezos (CEO, Amazon) Ha 2 millió vásárlóm van a Weben, akkor 2 millió boltom kell hogy legyen a Weben! A heterogenitás dilemmája Megvan a sokféle termék, változatos kínálat De így a vásárlónak rengeteg lehetőségből kell választani Információs túlterhelés A kínálatot meg kell szűrni! Egy lehetséges megoldás: ajánlórendszerek A vásárlónak csak releváns termékeket mutatunk Egyénre- avagy testreszabott vásárlás Engedy Balázs Ajánlórendszerek 4/ 37

5 Ajánlórendszerek Bevezetés Történelem Gazdasági előnyök Formális leírás Csoportosítás Jeff Bezos (CEO, Amazon) Ha 2 millió vásárlóm van a Weben, akkor 2 millió boltom kell hogy legyen a Weben! A heterogenitás dilemmája Megvan a sokféle termék, változatos kínálat De így a vásárlónak rengeteg lehetőségből kell választani Információs túlterhelés A kínálatot meg kell szűrni! Egy lehetséges megoldás: ajánlórendszerek A vásárlónak csak releváns termékeket mutatunk Egyénre- avagy testreszabott vásárlás Engedy Balázs Ajánlórendszerek 4/ 37

6 Történelem Gazdasági előnyök Formális leírás Csoportosítás Gazdasági előnyök az eladók számára 1 Böngészőkből vásárlók Vásárlói kosár létrejön Ha a webshop böngészése közben érdekes termékekkel találkozik a vásárló, talán vásárolni is fog! 2 Járulékos eladások Kosár-átlagméret növekszik Ha vásárlás közben további érdekes termékekkel találkozik a vásárló, talán azokból is vásárolni fog! 3 Hűséges vásárlók Vásárlások száma növekszik Ha a konkurenciához képest nálunk érdekesebb termékekkel találkozik a vásárló mert a régebbi ténykedéseiből épített vásárlói profil szerint ajánlunk kedvére valót, talán emiatt már legközelebb is inkább hozzánk tér be vásárolni! Engedy Balázs Ajánlórendszerek 5/ 37

7 Történelem Gazdasági előnyök Formális leírás Csoportosítás Gazdasági előnyök az eladók számára 1 Böngészőkből vásárlók Vásárlói kosár létrejön Ha a webshop böngészése közben érdekes termékekkel találkozik a vásárló, talán vásárolni is fog! 2 Járulékos eladások Kosár-átlagméret növekszik Ha vásárlás közben további érdekes termékekkel találkozik a vásárló, talán azokból is vásárolni fog! 3 Hűséges vásárlók Vásárlások száma növekszik Ha a konkurenciához képest nálunk érdekesebb termékekkel találkozik a vásárló mert a régebbi ténykedéseiből épített vásárlói profil szerint ajánlunk kedvére valót, talán emiatt már legközelebb is inkább hozzánk tér be vásárolni! Engedy Balázs Ajánlórendszerek 5/ 37

8 Történelem Gazdasági előnyök Formális leírás Csoportosítás Gazdasági előnyök az eladók számára 1 Böngészőkből vásárlók Vásárlói kosár létrejön Ha a webshop böngészése közben érdekes termékekkel találkozik a vásárló, talán vásárolni is fog! 2 Járulékos eladások Kosár-átlagméret növekszik Ha vásárlás közben további érdekes termékekkel találkozik a vásárló, talán azokból is vásárolni fog! 3 Hűséges vásárlók Vásárlások száma növekszik Ha a konkurenciához képest nálunk érdekesebb termékekkel találkozik a vásárló mert a régebbi ténykedéseiből épített vásárlói profil szerint ajánlunk kedvére valót, talán emiatt már legközelebb is inkább hozzánk tér be vásárolni! Engedy Balázs Ajánlórendszerek 5/ 37

9 Történelem Gazdasági előnyök Formális leírás Csoportosítás Gazdasági előnyök az eladók számára 1 Böngészőkből vásárlók Vásárlói kosár létrejön Ha a webshop böngészése közben érdekes termékekkel találkozik a vásárló, talán vásárolni is fog! 2 Járulékos eladások Kosár-átlagméret növekszik Ha vásárlás közben további érdekes termékekkel találkozik a vásárló, talán azokból is vásárolni fog! 3 Hűséges vásárlók Vásárlások száma növekszik Ha a konkurenciához képest nálunk érdekesebb termékekkel találkozik a vásárló mert a régebbi ténykedéseiből épített vásárlói profil szerint ajánlunk kedvére valót, talán emiatt már legközelebb is inkább hozzánk tér be vásárolni! Engedy Balázs Ajánlórendszerek 5/ 37

10 Az ajánlási feladat formális leírása Történelem Gazdasági előnyök Formális leírás Csoportosítás Input Output C vásárlóhalmaz, C = m S termékhalmaz, S = n u : C S R hasznosságfüggvény (pl. rating 1 10-ig) Kevés függvényérték ismert (pl. amely filmeket értékelte) Az m és n pedig nagyon nagy (milliók) c C vásárló számára a legérdekesebb/leghasznosabb új termék(ek) megadása, azaz: s c S, hogy u (c, s c ) maximális Engedy Balázs Ajánlórendszerek 6/ 37

11 Ajánlórendszerek csoportosítsa Történelem Gazdasági előnyök Formális leírás Csoportosítás Az ajánlandó termékekhez eljuthatunk a kérdéses felhasználó által kedvelt termékeken keresztül, azokhoz hasonlót keresve; vagy a kérdéses felhasználóhoz hasonló ízlésű felhasználókon keresztül, azok által közösen kedvelt terméket keresve. Így tehát: Tartalomalapú ajánlás A felhasználónak olyan termékeket ajánlunk, melyek tartalmukban hasonlók azokhoz, amelyeket a múltban magasra értékelt. Kollaboratív ajánlás A felhasználónak olyan termékeket ajánlunk, melyeket más, hasonló ízlésű felhasználók magasra értékeltek. Hibrid módszerek A fenti két módszert együttesen alkalmazzuk, vagy nem is különítjük el kategorikusan a két irányt. Engedy Balázs Ajánlórendszerek 7/ 37

12 Tartalomalapú ajánlórendszerek Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Engedy Balázs Ajánlórendszerek 8/ 37

13 Tartalomalapú ajánlórendszerek Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Egy adott felhasználó számára egy termék hasznosságát a hasonló termékek ugyanazon felhasználó által megadott hasznosságaiból becsüljük 1 : û (c, s) u (c, s i ) alapján, ahol: s s i Klasszikusan szöveges dokumentumokra alkalmazzuk A dokumentumokat tartalmilag pl. kulcsszavak gyakoriságával, fontosságával jellemezhetjük, a továbbiakban e skalárjellemzőkből álló ennes képviseli a dokumentumot Két dokumentum hasonló, ha tartalmuk, így jellemző kulcsszavaik hasonlóak Feltételezzük, hogy tartalmában a már olvasott (és kedvelt) dokumentumokhoz hasonlóra vágyik a felhasználó 1és a legnagyobb becsültet ajánljuk Engedy Balázs Ajánlórendszerek 9/ 37

14 Az ajánlás menete Bevezetés Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés 1 Az egyes dokumentumokhoz tartalmi profilt készítünk: s S : s Content (s) 2 Az értékelt dokumentumok alapján felhasználói profil készül: c C : {(Content (s), u (c, s)) s S c } ContentBasedProf (c) 3 Ezek alapján az ismeretlen hasznosságokat becsüljük: û (c, s) = score (Content (s), ContentBasedProfile (c)) Engedy Balázs Ajánlórendszerek 10/ 37

15 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Dokumentumprofil készítése (egy lehetséges heurisztika) Legyenek a rendszerben nyilvántartott kulcsszavak: σ 1, σ 2,... σ k Az s i dokumentumban σ j kulcsszó gyakorisága: f i,j Egy dokumentum profilja legyen az a vektor, mely az összes kulcsszavak w i,j fontosságait tartalmazza erre a dokumentumra: Content (s i ) = w si = ( w i,1, w i,2,... w i,k ) Engedy Balázs Ajánlórendszerek 11/ 37

16 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Dokumentumprofil készítése (egy lehetséges heurisztika) Egy kulcsszó fontossága sokféleképp definiálható, de pl. mondhatjuk, hogy arányos a normalizált előfordulási gyakoriságával: f i,j TF i,j = max z f i,z A túl sok dokumentumban szereplő kulcsszavak viszont nem túl informatívak, ezek súlyát hivatott csökkenteni az inverse document-frequency tényező: IDF j = log n, ahol n j = { i fi,j > 0 } n j Így a fontosság: w i,j = TF i,j IDF j Engedy Balázs Ajánlórendszerek 12/ 37

17 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Felhasználói profil készítése (egy lehetséges heurisztika) A felhasználó profilja lehet pl. szintén egy vektor, mely a múltban elolvasott dokumentumok alapján az adott felhasználó egyes kulcsszavakra vonatkozó v i,j preferenciáit tartalmazza: ContentBasedProfile (c i ) = v ci = ( v i,1, v i,2,... v i,k ) A preferenciák meghatározására történhet a már értékelt dokumentumok w si vektorainak valamilyen átlagolásával. Így a v preferenciavektor szintén tekinthető egy TF-IDF vektornak Engedy Balázs Ajánlórendszerek 13/ 37

18 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Hasznosságbecslés (egy lehetséges heurisztika) A hasznosságot pedig definiálhatjuk pl. a v és w vektorok által bezárt szög koszinuszaként: û (c i, s l ) = score (Content (s l ), ContBasedProfile (c i )) = = cos ( ) v ci w sl v ci, w sl = wsl = v ci kj =1 v i,j w l,j kj =1 vi,j 2 kj =1 w 2 l,j Engedy Balázs Ajánlórendszerek 14/ 37

19 Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Hasznosságbecslés (modellalapú módszerek) Az imént bemutatott vektoros becslés a heurisztikus módszerek családjába tartozik, és természetesen csak egy a sok lehetséges algoritmus közül Vannak még ún. modell-alapú módszerek Content (s) itt is valamilyen statisztika a dokumentumokról ContentBasedProfile (c) viszont valamilyen bonyolultabb modell A hasznosságbecslés a modell kimenetén jelenik meg, az adott dokumentum profilját a bemenetére adva: û (c i, s l ) = Model ci (Content (s l )) Pl. Naiv bayesi osztályozó felépítése a kulcsszógyakoriságokból Pl. Rosta (winnow) algoritmus, neurális hálózatok Engedy Balázs Ajánlórendszerek 15/ 37

20 Előnyök Bevezetés Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Függetlenség a többi felhasználótól Egyáltalán nem használjuk a becsléshez a többi felhasználóról tárolt információkat, csak a kérdéses felhasználó preferenciáit Így akár egyetlen felhasználó esetén is életképes a rendszer A hasznosságfüggvény opcionális A felhasználói profil akár egy u hasznosságfüggvény nélkül létrehozható A rendszer ekkor is életképes, olyan értelemben, hogy a már megtekintett termékekhez hasonlókat akkor is tud ajánlani Engedy Balázs Ajánlórendszerek 16/ 37

21 Hátrányok Bevezetés Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Termékjellemzők előálĺıtásának problémája Szöveges dokumentumok esetén jól automatizálható Más termékek (pl. filmek, képek) esetén viszont manuálisan kéne megadni (műfaj, szereplők... ) sok munka Megint más termékeknél esetleg egyáltalán nem tudunk olyan (skalár) jellemzőket megadni, melyen keresztül értelmesen összehasonĺıthatnánk őket Megkülönböztethetetlenség problémája Ha két termék jellemzői azonosak (a két ennes megegyezik), a rendszer számára megkülönböztethetetlenek Pl. Egy jól és egy rosszul megírt cikk ugyanabban a témában Pl. Egy jó és egy rossz 22 collos, TN-paneles, felbontású LCD-monitor Engedy Balázs Ajánlórendszerek 17/ 37

22 Hátrányok Bevezetés Dokumentumprofil készítése Felhasználói profil készítése Hasznosságbecslés Túlspecializáció Elképzelhető, hogy nem mindig a már (magasan) értékeltekhez leginkább hasonló termékek ajánlása lenne az ideális Megoldás: mesterségesen zajt kell az eredményhez keverni Pl. Étteremajánló-rendszer: amennyiben a felhasználó még csak kínai és magyar ízeket kóstolt, soha nem fogunk neki görög éttermet ajánlani (még ha az is a legjobb a városban), hiszen túlságosan különböző az eddig értékelt termékektől Új felhasználó problémája Egy új felhasználónak egy darabig nem tudunk értelmesen ajánlani, hiszen túlságosan kevés értékelt termékből kéne a profilját felépítenünk Engedy Balázs Ajánlórendszerek 18/ 37

23 Kollaboratív ajánlórendszerek Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Engedy Balázs Ajánlórendszerek 19/ 37

24 Kollaboratív ajánlórendszerek Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása A továbbiakban egy termék (pl. film) hasznosságán mindig egy adott skálán mozgó értékelést (rating) értünk, azaz, hogy egy felhasználó milyen magasra pontozta, értékelte (volna) az adott terméket. Ennek megfelelően a következő jelölést vezetjük be: r c,s u (c, s) Egy adott felhasználó számára egy adott (még nem értékelt) termék értékelését most a hasonló ízlésű felhasználók által a termékre adott értékelések összesítéséből becsüljük 2 : ˆr c,s r ci,s alapján, ahol: c c i 2és itt is a legnagyobb becsültet ajánljuk Engedy Balázs Ajánlórendszerek 20/ 37

25 Az ajánlás menete Bevezetés Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása 1 Felhasználópárok hasonlósági faktorának megállapítása: x, y C : sim (x, y) meghatározása 2 Adott felhasználóhoz hasonló ízlésű felhasználók megkeresése: c C : c Ĉ = {c c C, sim(c, c ) nagy} 3 A hasonló ízlésű felhasználók által adott értékek aggregálásával az ismeretlen értékelés becslése: ˆr c,s = aggr c Ĉ ( rc,s) Engedy Balázs Ajánlórendszerek 21/ 37

26 Felhasználópárok hasonlósága Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Általában a felhasználók által közösen értékelt S xy termékhalmaz alapján dolgozunk: S xy = { s S r x,s, r y,s } A mindkettejük által értékelt termékek pontszámait egy-egy x és y vektorként tekintve itt is definiálhatjuk a hasonlóságot az ezek által bezárt szög koszinuszaként: x y sim(x, y) = cos ( x, y) = x y = s S xy r x,s r y,s r 2 s Sxy x,s r 2 s Sxy y,s Engedy Balázs Ajánlórendszerek 22/ 37

27 Felhasználópárok hasonlósága Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Egyes felhasználók szigorúbban pontozhatnak, mint mások, ezt hivatott orvosolni a Pearson-féle korrelációs együttható: sim(x, y) = cos ( x n, y n ) = s Sxy (r x,s r x ) (r y,s r y ) s Sxy (r x,s r x ) 2 s Sxy (r y,s r y ) 2 ahol x n, y n az x, y vektorok nulla-átlagúra normálva, azaz: x n = x (r x,... r x ) y n = y ( r y,... r y ) ahol r x, r y az x, y felhasználók értékeléseinek átlagai Engedy Balázs Ajánlórendszerek 23/ 37

28 Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Hasonló ízlésű felhasználók megkeresése Adott egy c felhasználó, a hozzá leginkább hasonló ízlésű néhány másikat szeretnénk megtalálni Kiszámíthatjuk minden x, y felhasználópárra sim (x, y)-t, majd rendezzük lassú lehet nagy adathalmazok esetén, mivel az adatok nem férnek el a operatív memóriában Gráfot építhetünk a felhasználókból, ahol a hasonló ízlésűek valamilyen szempontból közel helyezkednek el egymáshoz A következő fejezetben látni fogunk egy módszert, mellyel a sim (x, y) értékeket csak közeĺıtjük, de így legalább elférünk a memóriában Engedy Balázs Ajánlórendszerek 24/ 37

29 Értékelések aggregálása Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Valamilyen átlag, például: (a) Egyszerű átlag ˆr c,s = 1 N c Ĉ r c,s, ahol N = Ĉ (b) Felhasználók hasonlóságával súlyozott átlag ˆr c,s = k c Ĉ sim(c, c 1 ) r c,s, ahol k = c Ĉ sim(c, c ) (c) Súlyozott átlag, normalizált értékelésekkel ˆr c,s = r c + k sim(c, c ) (r ) c,s r c c Ĉ Engedy Balázs Ajánlórendszerek 25/ 37

30 Modellalapú módszerek Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Az imént bemutatott becslés szintén a heurisztikus módszerek családjába tartozik Kollaboratív esetben is vannak modell-alapú módszerek Az értékelésekből egy bonyolultabb modellt építünk A modell kimenetén becsli r c,s nem ismert értékeit Pl. Klaszterezésen alapuló módszerek: a hasonló ízlésű felhasználókat egy-egy osztályba soroljuk, ezen belül naiv bayesi osztályozót használunk a becslésre Pl. Bayes-hálók: a csomópontok a termékek, lehetséges állapotaik az egyes értékelések (pl ig) Pl. Egyéb gépi tanulási módszerek Engedy Balázs Ajánlórendszerek 26/ 37

31 Előnyök Bevezetés Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Tetszőleges típusú termékek A felhasználóink értékrendjük szerint lényegében bármilyen típusú terméket képesek pontozni, így mindenféle termékhez rendelhető egy skalár (a hasznosság) A termékeknek klasszikus értelemben nem is kell összehasonĺıthatónak lenniük Minden megkülönböztethető A felhasználók értékeléskor a teljes tartalmat nézik, így nem lehet olyan probléma, mint a tartalomalapú esetben, hogy a kivont jellemzők megegyeznek, így egy jó és egy rossz filmet ne tudnánk megkülönböztetni Engedy Balázs Ajánlórendszerek 27/ 37

32 Hátrányok Bevezetés Felhasználók hasonlósága Hasonló ízlésű felhasználók Értékelések aggregálása Új felhasználó problémája (mint előbb) Új termék problémája Amíg egy termékre nem érkezik elég sok értékelés, nem fogjuk tudni ajánlani (sokáig nem lesz olyan felhasználó lesz, aki hasonló ízlésű a kérdéses felhasználóhoz és értékelte) Megoldás: hibrid módszerek Ritkaság Általában csak kevés r c,s érték ismert, ezek alapján kell jól ajánlanunk A megfelelő működéshez még így is kell egy kritikus tömeg (felhasználókból), hogy: (1) minden felhasználóhoz legyen elég sok hasonló ízlésű, (2) akik ráadásul értékelték is a kérdéses terméket Engedy Balázs Ajánlórendszerek 28/ 37

33 Hibrid ajánlórendszerek Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Engedy Balázs Ajánlórendszerek 29/ 37

34 Hibrid ajánlórendszerek Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! A becslés javítható, ha az egyes megközeĺıtéseket kombináljuk: 1 A külön alkalmazott tartalomalapú, illetve kollaboratív ajánlók eredményeit kombináljuk 2 Tartalomalapú ajánlót kollaboratív elemekkel egészítjük ki 3 Kollaboratív ajánlót tartalomalapú elemekkel egészítjük ki 4 Egységes modellt dolgozunk ki, mely egyszerre dolgozik a két megközeĺıtés szerint, nem választja szét a két irányt Engedy Balázs Ajánlórendszerek 30/ 37

35 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Hasonlóságbecslés gradiensmódszerrel Alapötlet: Az előző fejezetben a felhasználók hasonlóságának kiszámítására manuálisan adtunk képletet (koszinusz, Pearson) Bízzuk ezt is az ajánlórendszerre: tanuljon alkalmas hasonlóságértékeket úgy, hogy a végeredmény jó legyen Az egyes felhasználók hasonlóságát leíró sim (i, j ) függvényt rendezzük egy H mátrixba: H = [ h i,j = sim (i, j ) ] Ekkor az alábbi módon becsült hasznosságok összes (négyzetes) hibáját akarjuk minimalizálni: c ˆr c,s = C s h c,c r c,s, ahol C s = { c c C, r c,s } c C s hc,c Engedy Balázs Ajánlórendszerek 31/ 37

36 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Hasonlóságbecslés gradiensmódszerrel A minimalizálandó hibafüggvény tehát : E (H, L) = 1 2 r c,s L ) (ˆrc,s (H) r 2 c,s + γ h i,j, ahol L a tanítóhalmaz, γ a regularizációs konstans Az ún. sztochasztikus gradiensmódszert használva az egyes tanítópontokkal egyenként javítjuk egy adott r c,s példában érintett h c,i paramétereket: ( ) húj c,i = ) ˆr c,s hrégi c,i η sign (ˆrc,s r c,s ηγh régi h c,i, c,i ahol η a bátorsági tényező i<j Engedy Balázs Ajánlórendszerek 32/ 37

37 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Faktormátrixok (a gradiensmódszerhez) A gradiensmódszer problémája, hogy kis számú tanítópontból akarunk rengeteg h i,j hasonlóságértéket meghatározni, így hajlamos a túltanulásra (és a memóriában sem fér el!) Csökkentsük a szabadsági fokot, a paraméterek számát! Erre egy lehetséges megoldás, hogy a H mátrixot két ún. faktormátrix szorzataként írjuk fel: n n H = n k P k n Q Így az eredeti mátrix egy k-rangú approximációját kaptuk A becsült ˆr c,s értékek az így kapott p i,j, q i,j paraméterek szerint továbbra is deriválhatók, így ezek betanulására a gradiensmódszer hasonlóan alkalmazható Engedy Balázs Ajánlórendszerek 33/ 37

38 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! A faktormátrixok szemléletes jelentése A P Q mátrixszorzásra úgy is tekinthetünk, hogy a H i-edik sorát Q egyes sorainak p i,1,... p i,k -együtthatós lineáris kombinációjával közeĺıtjük: h i = k p i,j q j j =1 Engedy Balázs Ajánlórendszerek 34/ 37

39 Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! A faktormátrixok szemléletes jelentése Ez szemléletesen azt jelenti, hogy Q soraiban az egyes felhasználó-sztereotípiákat leíró vektorok jelennek meg, P soraiban pedig az, hogy az adott felhasználó mennyire tartozik bele az adott sztereotípiába Engedy Balázs Ajánlórendszerek 35/ 37

40 Források Bevezetés Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Gediminas Adomavicius and Alexander Tuzhilin. Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions. IEEE Trans. on Knowl. and Data Eng., 17(6): , J. Ben Schafer, Joseph Konstan, and John Riedi. Recommender systems in e-commerce. In EC 99: Proceedings of the 1st ACM conference on E. commerce, pages , New York, USA, ACM. Andreas Töscher, Michael Jahrer, and Robert Legenstein. Improved neighborhood-based algorithms for large-scale recommender systems. In NETFLIX 08: Proceedings of the 2nd KDD Workshop, pages 1 6, New York, NY, USA, ACM. Engedy Balázs Ajánlórendszerek 36/ 37

41 Vége! Bevezetés Hibrid rendszerek Gradiensmódszer Faktormátrixok Források, vége! Engedy Balázs Ajánlórendszerek 37/ 37

Szomszédság alapú ajánló rendszerek

Szomszédság alapú ajánló rendszerek Nagyméretű adathalmazok kezelése Szomszédság alapú ajánló rendszerek Készítette: Szabó Máté A rendelkezésre álló adatmennyiség növelésével egyre nehezebb kiválogatni a hasznos információkat Megoldás: ajánló

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)

Részletesebben

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján Hegedűs István Ajánló rendszerek Napjainkban egyre népszerűbb az ajánló rendszerek alkalmazása A cégeket is hasznos információval

Részletesebben

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5. Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat

Részletesebben

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló

Részletesebben

1 2 3 4 5 Meta adat: bármilyen adat, ami a tartalomhoz kapcsolódik. Pl. filmek esetén a rendező, a főszereplő, a műfaj. Tranzakciós adat: felhasználó és az elemek közötti interakció során keletkező adat.

Részletesebben

Mátrixok 2017 Mátrixok

Mátrixok 2017 Mátrixok 2017 számtáblázatok" : számok rendezett halmaza, melyben a számok helye két paraméterrel van meghatározva. Például lineáris egyenletrendszer együtthatómátrixa 2 x 1 + 4 x 2 = 8 1 x 1 + 3 x 2 = 1 ( 2 4

Részletesebben

Soros felépítésű folytonos PID szabályozó

Soros felépítésű folytonos PID szabályozó Soros felépítésű folytonos PID szabályozó Főbb funkciók: A program egy PID szabályozót és egy ez által szabályozott folyamatot szimulál, a kimeneti és a beavatkozó jel grafikonon való ábrázolásával. A

Részletesebben

Least Squares becslés

Least Squares becslés Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás

Részletesebben

Konjugált gradiens módszer

Konjugált gradiens módszer Közelítő és szimbolikus számítások 12. gyakorlat Konjugált gradiens módszer Készítette: Gelle Kitti Csendes Tibor Vinkó Tamás Faragó István Horváth Róbert jegyzetei alapján 1 LINEÁRIS EGYENLETRENDSZEREK

Részletesebben

Algoritmusok bonyolultsága

Algoritmusok bonyolultsága Algoritmusok bonyolultsága 5. előadás http://www.ms.sapientia.ro/~kasa/komplex.htm 1 / 27 Gazdaságos faváz Kruskal-algoritmus Joseph Kruskal (1928 2010) Legyen V = {v 1, v 2,..., v n }, E = {e 1, e 2,...,

Részletesebben

Számítási feladatok a Számítógépi geometria órához

Számítási feladatok a Számítógépi geometria órához Számítási feladatok a Számítógépi geometria órához Kovács Zoltán Copyright c 2012 Last Revision Date: 2012. október 15. kovacsz@nyf.hu Technikai útmutató a jegyzet használatához A jegyzet képernyőbarát

Részletesebben

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Khi-négyzet eloszlás. Statisztika II., 3. alkalom Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként

Részletesebben

A PiFast program használata. Nagy Lajos

A PiFast program használata. Nagy Lajos A PiFast program használata Nagy Lajos Tartalomjegyzék 1. Bevezetés 3 2. Bináris kimenet létrehozása. 3 2.1. Beépített konstans esete.............................. 3 2.2. Felhasználói konstans esete............................

Részletesebben

A Markowitz modell: kvadratikus programozás

A Markowitz modell: kvadratikus programozás A Markowitz modell: kvadratikus programozás Harry Markowitz 1990-ben kapott Közgazdasági Nobel díjat a portfolió optimalizálási modelljéért. Ld. http://en.wikipedia.org/wiki/harry_markowitz Ennek a legegyszer

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Függetlenségvizsgálat, Illeszkedésvizsgálat Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata

Részletesebben

A maximum likelihood becslésről

A maximum likelihood becslésről A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának

Részletesebben

Lineáris egyenletrendszerek

Lineáris egyenletrendszerek Lineáris egyenletrendszerek Lineáris egyenletrendszernek nevezzük az a 11 x 1 + a 12 x 2 +... +a 1n x n = b 1 a 21 x 1 + a 22 x 2 +... +a 2n x n = b 2.. a k1 x 1 + a k2 x 2 +... +a kn x n = b k n ismeretlenes,

Részletesebben

Irányításelmélet és technika II.

Irányításelmélet és technika II. Irányításelmélet és technika II. Legkisebb négyzetek módszere Magyar Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék amagyar@almos.vein.hu 200 november

Részletesebben

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei A Gauss-Jordan elimináció, mátrixinvertálás Gauss-Jordan módszer Ugyanazzal a technikával, mint ahogy a k-adik oszlopban az a kk alatti elemeket kinulláztuk, a fölötte lévő elemeket is zérussá lehet tenni.

Részletesebben

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István Teljesen elosztott adatbányászat pletyka algoritmusokkal Jelasity Márk Ormándi Róbert, Hegedűs István Motiváció Nagyméretű hálózatos elosztott alkalmazások az Interneten egyre fontosabbak Fájlcserélő rendszerek

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

Matematikai geodéziai számítások 5.

Matematikai geodéziai számítások 5. Matematikai geodéziai számítások 5 Hibaterjedési feladatok Dr Bácsatyai László Matematikai geodéziai számítások 5: Hibaterjedési feladatok Dr Bácsatyai László Lektor: Dr Benedek Judit Ez a modul a TÁMOP

Részletesebben

Determinánsok. A determináns fogalma olyan algebrai segédeszköz, amellyel. szolgáltat az előbbi kérdésekre, bár ez nem mindig hatékony.

Determinánsok. A determináns fogalma olyan algebrai segédeszköz, amellyel. szolgáltat az előbbi kérdésekre, bár ez nem mindig hatékony. Determinánsok A determináns fogalma olyan algebrai segédeszköz, amellyel jól jellemezhető a mátrixok invertálhatósága, a mátrix rangja. Segítségével lineáris egyenletrendszerek megoldhatósága dönthető

Részletesebben

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó

Részletesebben

Random Forests - Véletlen erdők

Random Forests - Véletlen erdők Random Forests - Véletlen erdők Szabó Adrienn Adatbányászat és Webes Keresés Kutatócsoport 2010 Tartalom Fő forrás: Leo Breiman: Random Forests Machine Learning, 45, 5-32, 2001 Alapok Döntési fa Véletlen

Részletesebben

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett

Részletesebben

Shoprenter Webinárium. Változatkezelés

Shoprenter Webinárium. Változatkezelés Shoprenter Webinárium Változatkezelés www.shoprenter.hu WebShop-Experts Kft. Miről lesz szó? Hogyan lehet kezelni azt, ha egy termékből több féle változatunk van? Hogyan tároljuk ezeket az adatokat? (Egy

Részletesebben

Gépi tanulás Gregorics Tibor Mesterséges intelligencia

Gépi tanulás Gregorics Tibor Mesterséges intelligencia Gépi tanulás Tanulás fogalma Egy algoritmus akkor tanul, ha egy feladat megoldása során olyan változások következnek be a működésében, hogy később ugyanazt a feladatot vagy ahhoz hasonló más feladatokat

Részletesebben

Irányításelmélet és technika II.

Irányításelmélet és technika II. Irányításelmélet és technika II. Modell-prediktív szabályozás Magyar Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék amagyar@almos.vein.hu 2010 november

Részletesebben

Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk?

Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk? Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk? Nem szükséges informatikusnak lennünk, vagy mélységében átlátnunk az

Részletesebben

Szalai Péter. April 17, Szalai Péter April 17, / 36

Szalai Péter. April 17, Szalai Péter April 17, / 36 Szociális hálók Szalai Péter April 17, 2015 Szalai Péter April 17, 2015 1 / 36 Miről lesz szó? 1 Megfigyelések Kis világ Power-law Klaszterezhetőség 2 Modellek Célok Erdős-Rényi Watts-Strogatz Barabási

Részletesebben

A leíró statisztikák

A leíró statisztikák A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az

Részletesebben

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Algoritmusok Tervezése 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Mi az algoritmus? Lépések sorozata egy feladat elvégzéséhez (legáltalánosabban) Informálisan algoritmusnak nevezünk bármilyen jól definiált

Részletesebben

Norma Determináns, inverz Kondíciószám Direkt és inverz hibák Lin. egyenletrendszerek A Gauss-módszer. Lineáris algebra numerikus módszerei

Norma Determináns, inverz Kondíciószám Direkt és inverz hibák Lin. egyenletrendszerek A Gauss-módszer. Lineáris algebra numerikus módszerei Indukált mátrixnorma Definíció A. M : R n n R mátrixnormát a. V : R n R vektornorma által indukált mátrixnormának nevezzük, ha A M = max { Ax V : x V = 1}. Az indukált mátrixnorma geometriai jelentése:

Részletesebben

A Markowitz modell: kvadratikus programozás

A Markowitz modell: kvadratikus programozás A Markowitz modell: kvadratikus programozás Losonczi László Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar Debrecen, 2011/12 tanév, II. félév Losonczi László (DE) A Markowitz modell 2011/12 tanév,

Részletesebben

Súlyozott automaták alkalmazása

Súlyozott automaták alkalmazása Súlyozott automaták alkalmazása képek reprezentációjára Gazdag Zsolt Szegedi Tudományegyetem Számítástudomány Alapjai Tanszék Tartalom Motiváció Fraktáltömörítés Súlyozott véges automaták Képek reprezentációja

Részletesebben

Dinamikus programozás vagy Oszd meg, és uralkodj!

Dinamikus programozás vagy Oszd meg, és uralkodj! Dinamikus programozás Oszd meg, és uralkodj! Mohó stratégia Melyiket válasszuk? Dinamikus programozás vagy Oszd meg, és uralkodj! Háromszögfeladat rekurzívan: c nj := a nj ha 1 j n c ij := a ij + max{c

Részletesebben

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

11. Előadás. 11. előadás Bevezetés a lineáris programozásba 11. Előadás Gondolkodnivalók Sajátérték, Kvadratikus alak 1. Gondolkodnivaló Adjuk meg, hogy az alábbi A mátrixnak mely α értékekre lesz sajátértéke a 5. Ezen α-ák esetén határozzuk meg a 5 sajátértékhez

Részletesebben

Gauss-Seidel iteráció

Gauss-Seidel iteráció Közelítő és szimbolikus számítások 5. gyakorlat Iterációs módszerek: Jacobi és Gauss-Seidel iteráció Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 ITERÁCIÓS

Részletesebben

Dinamikus modellek szerkezete, SDG modellek

Dinamikus modellek szerkezete, SDG modellek Diagnosztika - 3. p. 1/2 Modell Alapú Diagnosztika Diszkrét Módszerekkel Dinamikus modellek szerkezete, SDG modellek Hangos Katalin PE Villamosmérnöki és Információs Rendszerek Tanszék Diagnosztika - 3.

Részletesebben

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

BIOMATEMATIKA ELŐADÁS

BIOMATEMATIKA ELŐADÁS BIOMATEMATIKA ELŐADÁS 6. Differenciálegyenletekről röviden Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés 2 Elsőrendű differenciálegyenletek Definíciók Kezdetiérték-probléma

Részletesebben

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Funkcionális konnektivitás vizsgálata fmri adatok alapján Funkcionális konnektivitás vizsgálata fmri adatok alapján Képalkotási technikák 4 Log Resolution (mm) 3 Brain EEG & MEG fmri TMS PET Lesions 2 Column 1 0 Lamina -1 Neuron -2 Dendrite -3 Synapse -4 Mikrolesions

Részletesebben

REGULARIZÁLT INVERZ KARAKTERISZTIKÁKKAL

REGULARIZÁLT INVERZ KARAKTERISZTIKÁKKAL NEMLINEÁRISAN TORZULT OPTIKAI HANGFELVÉTELEK HELYREÁLLÍTÁSA REGULARIZÁLT INVERZ KARAKTERISZTIKÁKKAL Ph.D. értekezés tézisei Bakó Tamás Béla okleveles villamosmérnök Témavezető: dr. Dabóczi Tamás aműszaki

Részletesebben

R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský

R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský R ++ -tree: an efficient spatial access method for highly redundant point data - Martin Šumák, Peter Gurský Recenzió: Németh Boldizsár Térbeli indexelés Az adatszerkezetek alapvetően fontos feladata, hogy

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak

1. Generátorrendszer. Házi feladat (fizikából tudjuk) Ha v és w nem párhuzamos síkvektorok, akkor generátorrendszert alkotnak a sík vektorainak 1. Generátorrendszer Generátorrendszer. Tétel (Freud, 4.3.4. Tétel) Legyen V vektortér a T test fölött és v 1,v 2,...,v m V. Ekkor a λ 1 v 1 + λ 2 v 2 +... + λ m v m alakú vektorok, ahol λ 1,λ 2,...,λ

Részletesebben

Régebbi Matek M1 zh-k. sztochasztikus folyamatokkal kapcsolatos feladatai.

Régebbi Matek M1 zh-k. sztochasztikus folyamatokkal kapcsolatos feladatai. Régebbi Matek M1 zh-k Folyamfeladatokkal, többszörös összef ggőséggel, párosításokkal, Nagy szḿok törvényével, Centrális Határeloszlás tétellel, sztochasztikus folyamatokkal kapcsolatos feladatai. Gráfok

Részletesebben

6. Előadás. Megyesi László: Lineáris algebra, oldal. 6. előadás Bázis, dimenzió

6. Előadás. Megyesi László: Lineáris algebra, oldal. 6. előadás Bázis, dimenzió 6. Előadás Megyesi László: Lineáris algebra, 37. 41. oldal. Gondolkodnivalók Lineáris függetlenség 1. Gondolkodnivaló Legyen V valós számtest feletti vektortér. Igazolja, hogy ha a v 1, v 2,..., v n V

Részletesebben

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1. Nagyságrendek Kiegészítő anyag az Algoritmuselmélet tárgyhoz (a Rónyai Ivanyos Szabó: Algoritmusok könyv mellé) Friedl Katalin BME SZIT friedl@cs.bme.hu 018. február 1. Az O, Ω, Θ jelölések Az algoritmusok

Részletesebben

15. LINEÁRIS EGYENLETRENDSZEREK

15. LINEÁRIS EGYENLETRENDSZEREK 15 LINEÁRIS EGYENLETRENDSZEREK 151 Lineáris egyenletrendszer, Gauss elimináció 1 Definíció Lineáris egyenletrendszernek nevezzük az (1) a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a

Részletesebben

Kódverifikáció gépi tanulással

Kódverifikáció gépi tanulással Kódverifikáció gépi tanulással Szoftver verifikáció és validáció kiselőadás Hidasi Balázs 2013. 12. 12. Áttekintés Gépi tanuló módszerek áttekintése Kódverifikáció Motiváció Néhány megközelítés Fault Invariant

Részletesebben

Osztott jáva programok automatikus tesztelése. Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január

Osztott jáva programok automatikus tesztelése. Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január Osztott jáva programok automatikus tesztelése Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január Osztott alkalmazások Automatikus tesztelés Tesztelés heurisztikus zaj keltés Tesztelés genetikus

Részletesebben

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I. : Intelligens Rendszerek Gyakorlata Neurális hálózatok I. dr. Kutor László http://mobil.nik.bmf.hu/tantargyak/ir2.html IRG 3/1 Trend osztályozás Pnndemo.exe IRG 3/2 Hangulat azonosítás Happy.exe IRG 3/3

Részletesebben

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1 Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában

Részletesebben

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

III. Kvantitatív változók kapcsolata (korreláció, regresszió) III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással

Részletesebben

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t Ellenőrző kérdések 2. Kis dolgozat kérdései 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t 37. Ha t szintű indexet használunk,

Részletesebben

Társadalmi és gazdasági hálózatok modellezése

Társadalmi és gazdasági hálózatok modellezése Társadalmi és gazdasági hálózatok modellezése 2. el adás A hálózatkutatás néhány fontos fogalma El adó: London András 2015. szeptember 15. Átmér l ij a legrövidebb út a hálózatban i és j pont között =

Részletesebben

Adatbányászati szemelvények MapReduce környezetben

Adatbányászati szemelvények MapReduce környezetben Adatbányászati szemelvények MapReduce környezetben Salánki Ágnes salanki@mit.bme.hu 2014.11.10. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Felügyelt

Részletesebben

5. előadás - Regressziószámítás

5. előadás - Regressziószámítás 5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat

Részletesebben

KOOPERÁCIÓ ÉS GÉPI TANULÁS LABORATÓRIUM

KOOPERÁCIÓ ÉS GÉPI TANULÁS LABORATÓRIUM KOOPERÁCIÓ ÉS GÉPI TANULÁS LABORATÓRIUM Kernel módszerek idősor előrejelzés Mérési útmutató Készítette: Engedy István (engedy@mit.bme.hu) Méréstechnika és Információs Rendszerek Tanszék Budapesti Műszaki

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

Gráfelméleti feladatok. c f

Gráfelméleti feladatok. c f Gráfelméleti feladatok d e c f a b gráf, csúcsok, élek séta: a, b, c, d, e, c, a, b, f vonal: c, d, e, c, b, a út: f, b, a, e, d (walk, lanţ) (trail, lanţ simplu) (path, lanţ elementar) 1 irányított gráf,

Részletesebben

Gyakori elemhalmazok kinyerése

Gyakori elemhalmazok kinyerése Gyakori elemhalmazok kinyerése Balambér Dávid Budapesti M szaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudomány szakirány 2011 március 11. Balambér Dávid (BME) Gyakori

Részletesebben

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton Osztályozás, regresszió Nagyméretű adathalmazok kezelése Tatai Márton Osztályozási algoritmusok Osztályozás Diszkrét értékkészletű, ismeretlen attribútumok értékének meghatározása ismert attribútumok értéke

Részletesebben

Éldetektálás, szegmentálás (folytatás) Orvosi képdiagnosztika 11_2 ea

Éldetektálás, szegmentálás (folytatás) Orvosi képdiagnosztika 11_2 ea Éldetektálás, szegmentálás (folytatás) Orvosi képdiagnosztika 11_2 ea Geometrikus deformálható modellek Görbe evolúció Level set módszer A görbe evolúció parametrizálástól független mindössze geometriai

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet / Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet / Tartalom 3/ kernelek segítségével Felügyelt és félig-felügyelt tanulás felügyelt: D =

Részletesebben

User explorer riport a Google Analyticsben. "Tartsd magadhoz közel a barátaidat, de még közelebb a potenciális vásárlóidat"

User explorer riport a Google Analyticsben. Tartsd magadhoz közel a barátaidat, de még közelebb a potenciális vásárlóidat 1 User explorer riport a Google Analyticsben "Tartsd magadhoz közel a barátaidat, de még közelebb a potenciális vásárlóidat" 2 In God we A Google Analytics használata elsőre összetett, de könnyen megtanulható.

Részletesebben

Mesterséges Intelligencia MI

Mesterséges Intelligencia MI Mesterséges Intelligencia MI Valószínűségi hálók - következtetés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade Következtetés

Részletesebben

Hash-alapú keresések

Hash-alapú keresések 1/16 az információ-visszakeresésben Babeş Bolyai Tudományegyetem Magyar Matematika és Informatika Intézet A Magyar Tudomány Napja Erdélyben Kolozsvár, 2012 2/16 Tartalom Információ-visszakeresés Információ-visszakeresés

Részletesebben

Példák jellemzőkre: - minden pixelérték egy jellemző pl. neurális hálózat esetében csak kis képekre, nem invariáns sem a megvilágításra, sem a geom.

Példák jellemzőkre: - minden pixelérték egy jellemző pl. neurális hálózat esetében csak kis képekre, nem invariáns sem a megvilágításra, sem a geom. Lépések 1. tanító és teszt halmaz összeállítása / megszerzése 2. jellemzők kinyerése 3. tanító eljárás választása Sok vagy kevés adat áll-e rendelkezésünkre? Mennyi tanítási idő/memória áll rendelkezésre?

Részletesebben

Numerikus matematika vizsga

Numerikus matematika vizsga 1. Az a = 2, t = 4, k = 3, k + = 2 számábrázolási jellemzők mellett hány pozitív, normalizált lebegőpontos szám ábrázolható? Adja meg a legnagyobb ábrázolható számot! Mi lesz a 0.8-hoz rendelt lebegőpontos

Részletesebben

Számítógépes Grafika mintafeladatok

Számítógépes Grafika mintafeladatok Számítógépes Grafika mintafeladatok Feladat: Forgassunk a 3D-s pontokat 45 fokkal a X tengely körül, majd nyújtsuk az eredményt minden koordinátájában kétszeresére az origóhoz képest, utána forgassunk

Részletesebben

Matematikai geodéziai számítások 9.

Matematikai geodéziai számítások 9. Matematikai geodéziai számítások 9 Szabad álláspont kiegyenlítése Dr Bácsatyai, László Created by XMLmind XSL-FO Converter Matematikai geodéziai számítások 9: Szabad álláspont kiegyenlítése Dr Bácsatyai,

Részletesebben

Adatbányászati feladatgyűjtemény tehetséges hallgatók számára

Adatbányászati feladatgyűjtemény tehetséges hallgatók számára Adatbányászati feladatgyűjtemény tehetséges hallgatók számára Buza Krisztián Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Tartalomjegyék Modellek kiértékelése...

Részletesebben

Közönséges differenciálegyenletek megoldása Mapleben

Közönséges differenciálegyenletek megoldása Mapleben Közönséges differenciálegyenletek megoldása Mapleben Differenciálegyenlet alatt egy olyan egyenletet értünk, amelyben a meghatározandó ismeretlen egy függvény, és az egyenlet tartalmazza az ismeretlen

Részletesebben

2. Logika gyakorlat Függvények és a teljes indukció

2. Logika gyakorlat Függvények és a teljes indukció 2. Logika gyakorlat Függvények és a teljes indukció Folláth János Debreceni Egyetem - Informatika Kar 2012/13. I. félév Áttekintés 1 Függvények Relációk Halmazok 2 Természetes számok Formulák Definíció

Részletesebben

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő

Részletesebben

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel! függvények RE 1 Relációk Függvények függvények RE 2 Definíció Ha A, B és ρ A B, akkor azt mondjuk, hogy ρ reláció A és B között, vagy azt, hogy ρ leképezés A-ból B-be. Ha speciálisan A=B, azaz ρ A A, akkor

Részletesebben

Vektorok, mátrixok, lineáris egyenletrendszerek

Vektorok, mátrixok, lineáris egyenletrendszerek a Matematika mérnököknek I. című tárgyhoz Vektorok, mátrixok, lineáris egyenletrendszerek Vektorok A rendezett valós számpárokat kétdimenziós valós vektoroknak nevezzük. Jelölésükre latin kisbetűket használunk.

Részletesebben

Termelés- és szolgáltatásmenedzsment

Termelés- és szolgáltatásmenedzsment Termelés- és szolgáltatásmenedzsment egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék Termelés- és szolgáltatásmenedzsment 13. Előrejelzési módszerek 14. Az előrejelzési modellek felépítése

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel! RE 1 Relációk Függvények RE 2 Definíció: Ha A, B és ρ A B, akkor azt mondjuk, hogy ρ reláció A és B között, vagy azt, hogy ρ leképezés A-ból B-be. Ha speciálisan A=B, azaz ρ A A, akkor azt mondjuk, hogy

Részletesebben

Mesterséges Intelligencia MI

Mesterséges Intelligencia MI Mesterséges Intelligencia MI Racionalitás: a hasznosság és a döntés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade

Részletesebben

Mesterséges Intelligencia I.

Mesterséges Intelligencia I. Mesterséges Intelligencia I. 10. elıadás (2008. november 10.) Készítette: Romhányi Anita (ROANAAT.SZE) - 1 - Statisztikai tanulás (Megfigyelések alapján történı bizonytalan következetésnek tekintjük a

Részletesebben

Egyszerű programozási tételek

Egyszerű programozási tételek Egyszerű programozási tételek 2. előadás Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2011. szeptember 15. Sergyán (OE NIK) AAO 02 2011. szeptember 15.

Részletesebben

Mátrixok, mátrixműveletek

Mátrixok, mátrixműveletek Mátrixok, mátrixműveletek 1 előadás Farkas István DE ATC Gazdaságelemzési és Statisztikai Tanszék Mátrixok, mátrixműveletek p 1/1 Mátrixok definíciója Definíció Helyezzünk el n m elemet egy olyan téglalap

Részletesebben

2014/2015. tavaszi félév

2014/2015. tavaszi félév Hajder L. és Valasek G. hajder.levente@sztaki.mta.hu Eötvös Loránd Tudományegyetem Informatikai Kar 2014/2015. tavaszi félév Tartalom Geometria modellezés 1 Geometria modellezés 2 Geometria modellezés

Részletesebben

Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok

Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok A feszítőfákból számolt súlyvektorok mértani közepének optimalitása a logaritmikus legkisebb négyzetes célfüggvényre nézve Bozóki Sándor MTA SZTAKI, Budapesti Corvinus Egyetem Vitaliy Tsyganok Laboratory

Részletesebben

Valasek Gábor valasek@inf.elte.hu

Valasek Gábor valasek@inf.elte.hu Számítógépes Grafika Valasek Gábor valasek@inf.elte.hu Eötvös Loránd Tudományegyetem Informatikai Kar 2013/2014. őszi félév ( Eötvös LorándSzámítógépes TudományegyetemInformatikai Grafika Kar) 2013/2014.

Részletesebben

Panorámakép készítése

Panorámakép készítése Panorámakép készítése Képregisztráció, 2009. Hantos Norbert Blaskovics Viktor Összefoglalás Panoráma (image stitching, planar mosaicing): átfedő képek összeillesztése Lépések: Előfeldolgozás (pl. intenzitáskorrekciók)

Részletesebben

Strukturált Generátorrendszerek Online Tanulása és Alk-ai

Strukturált Generátorrendszerek Online Tanulása és Alk-ai Strukturált Generátorrendszerek Online Tanulása és Alkalmazásai Problémamegoldó Szeminárium 2010. nov. 5 Tartalomjegyzék Motiváció, példák Regressziós feladatok (generátorrendszer fix) Legkisebb négyzetes

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Nagyméretű adathalmazok kezelése Ajánló rendszerek

Nagyméretű adathalmazok kezelése Ajánló rendszerek Nagyméretű adathalmazok kezelése Gubek Andrea BME SZIT 1 Tartalom alapú ajánló rendszerek Együttműködés alapú ajánló rendszerek 2 The Movie Genome és a Jinni Movie Genome Gubek Andrea (BME SZIT) Elosztott

Részletesebben

Lin.Alg.Zh.1 feladatok

Lin.Alg.Zh.1 feladatok LinAlgZh1 feladatok 01 3d vektorok Adott három vektor ā = (0 2 4) b = (1 1 4) c = (0 2 4) az R 3 Euklideszi vektortérben egy ortonormált bázisban 1 Mennyi az ā b skalárszorzat? 2 Mennyi az n = ā b vektoriális

Részletesebben

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban Intelligens Rendszerek Elmélete : dr. Kutor László Versengéses és önszervező tanulás neurális hálózatokban http://mobil.nik.bmf.hu/tantargyak/ire.html Login név: ire jelszó: IRE07 IRE 9/1 Processzor Versengéses

Részletesebben