A Szinguláris felbontás adatbányászati alkalmazásai

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "A Szinguláris felbontás adatbányászati alkalmazásai"

Átírás

1 A Szinguláris felbontás adatbányászati alkalmazásai Kurucz Miklós Témavezető: Benczúr A. András Ph.D. Eötvös Loránd Tudomány Egyetem Informatikai Kar Informatikai Tanszék Informatikai Doktori Iskola Benczúr András D.Sc. Az Informatika Alapjai és Módszertana Doktori Program Demetrovics János D.Sc. Budapest, 2011

2 1 Bevezetés Az elmúlt időszakban a szinguláris felbontás (SVD) az egyik leggyakrabban használt eszköz volt statisztikai, jelfeldolgozási és modellezési problémák megoldására. A zajszűrés, Látens Szemantikus Allokáció és a statisztikus faktormodellezés csak néhány a számos különböző megközelítés közül, amely SVD-t használ gyakorlati feladatok megoldására. A szinguláris felbontás alkalmazási területei között egy régóta népszerű kutatási terület, a szociális hálózatok elemzését is megtaláljuk. A különböző csoportok azonosítása, a hasonló emberek keresése, és a szociális dinamikák megfigyelése mind széles körben kutatott témák. Az ezek által kinyert információk nagyon hasznosak marketing célokra, például egy új szolgáltatás célcsoportjának meghatározására, vagy olyan ügyfelek azonosítására, akik fel akarják mondani az előfizetésüket. Az elmúlt években a rendelkezésre álló adatmennyiség megnőtt, amelynek következtében teret hódítottak az információ kinyerésre használt újabb módszerek. Az egyik ilyen módszer a spektrál klaszterezés, amelyet pár évtizednyi érdektelenség után kezdtek újra felfedezni. A spektrál klaszterezés SVD-t használ arra, hogy minimális vágásokat találjon egy hálózatban. Az emberek érdeklődésének előrejelzése egy másik olyan kutatási terület, ahol az SVD-t elterjedten használják. Egyre fontosabb az olyan terméket megtalálása, amelyek érdekesek a vevők számára. Amennyiben a termékekhez szöveges leírás áll rendelkezésre, ajánlást tudunk adni úgy, hogy olyan termékleírásokat keresünk, amelyek a vevő számára általában fontos szavakat tartalmaznak. Azonban az új tartalom szolgáltatók a televízió az internet és a mobil eszközök egybeolvadása miatt a nem szöveges tartalmakra összpontosítanak. Az ajánló technikák új értékeket adnak az új generációs szolgáltatásokhoz. A tézisünkben az SVD-vel folytatott kísérleteinket és eredményeinket mutatjuk be. Elsőként összehasonlítjuk a létező spektrál klaszterező algoritmusokat nagyméretű adathalmazokon. A spektál klaszterező algoritmusok közül vizsgáljuk a csupán a második (Fridler) szinguláris vektort, és az ennél több vektort alkalmazó módszereket is. Kísérletezünk továbbá mind a Laplace, mind a súlyozott Laplace mátrixokkal. Ezután mutatunk két előfeldolgozó és egy utófeldolgozó heurisztikát, amelyek javítanak a spektrál klaszterezés eredményein. Előfeldolgozásként egyrészt összehúzzuk az úgynevezett csápokat, a hálózat hosszú, ritka részeit, amelyek zavarják a módszereket; illetve azonosítjuk a sűrű területeket, amelyek túl sok sajátvektort érintenek. Az utófeldolgozás során a sűrű részeket újraosztjuk a létrejött klaszterek közt, a nem összefüggő részeket megszüntetjük, és kiegyensúlyozzuk a klaszterméreteket. Adunk továbbá egy olyan hálózat modellt, amely megmagyarázza a spektrál klaszterezés nehézségeit. Mostanában hívták fel arra a figyelmet, hogy a spektrál klaszterezés nem talál kiegyensúlyozott vágást szociális hálózatokban, mert csak a csápokat vágja le a gráfról. A jelenlegi Barabási és 1

3 Kleinberg-féle modellek nem magyarázzák meg ezt a jelenséget: még ha a modell által generált gráf tartalmaz is csápokat, az algoritmus értelmes vágásokat ad. A modellek viselkedése tehát eltér a valódi hálózatokban megfigyelt eredményektől. Az általunk adott modell tulajdonságai gráf klaszterezési szempontból megegyeznek a valódi hálózatokéval. Végül pedig bemutatjuk az SVD alkalmazását hiányosan kitöltött mátrixokon. Kiszámoljuk az SVD-t egy Expectation-Maximization algoritmus és a Lánczos algoritmus segítségével is. A kezdeti szinguláris vektorokat úgy számítjuk, hogy a mátrix hiányzó elemeit valamely előre meghatározott értékekkel töltjük ki. A kezdőértékek lehetnek a globális átlagok, vagy más, kifinomultabb módszerek eredményei. A későbbi lépésekben a korábbi lépések eredményeként kapott alacsony rangú mátrixokat használjuk bemenetnek. A számolás gyorsításának érdekében két konvergencia gyorsító eljárást alkalmazunk. A módszereket a Netflix adathalmazon teszteljük. 2 Új eredmények Az eredmények öt tézis köré vannak rendezve. Az első három a szociális hálózatok elemzésével foglalkozik, az utolsó kettő pedig a Lánczos algoritmus ajánló rendszerekben való alkalmazását tárgyalja. Spektrál Klaszterezés Nagy szociális hálózatok klaszterezése során a spektrál módszer a sűrű részékhez gyengén csatolt csápokat vágja le, amely nem összefüggő részeket és egy nagy sűrű komponenst eredményez. Elméletileg lehet ilyen az optimális vágás szerkezete, azonban a nem összefüggő klaszter kicsi részgráfokból áll, amelyek az értelmezés szempontjából a sűrű komponens egyértelműen meghatározható területeihez tartoznak. Ezen kívül a nem összefüggő gráfokat a további particionálás céljából komponensekre kell bontanunk, például azért, mert többszörös legnagyobb sajátértékük van, azaz az összefüggő részgráfokra külön kell sajátvektort számolni. Azonban ha külön klaszterként kezeljük a részgráfokat, a klaszterméretek eloszlása nagyon kiegyensúlyozatlan lesz. Adunk egy hierarchikus spektrál klaszterező algoritmust klaszter méret kiegyensúlyozó heurisztikákkal, amelyet összehasonlítunk a Divide-and-Merge algoritmussal [R 1] is. Telefonhívás-hálózatok klaszterezésekor a mi algoritmusunk jobban teljesít, mint a Divide-and-Merge. Megmérjük a különböző SVD bemenetek hatását: a súlyozott Laplace mátrix sokkal jobban teljesít, mint a súlyozatlan. Továbbá bevezetünk egy nagyon jó eredményre vezető Jaccard-féle súlyozási módszert is. 1. Tézis Előfeldolgozó heurisztikák [Spec 1, Spec 2, Spec 3] Demonstráljuk, hogy a spektrál gráf particionálás végrehajtható nagyméretű skála-mentes há- 2

4 lózatokon a megfelelő előfeldolgozás után. A mi előfeldolgozásunk lényege az olyan erősen összekapcsolt közösségek eltávolítása, amelyek a teljes hálózat csupán kis részét képviselik; valamint a hosszú csápok, azaz lazán kapcsolódó tagok láncainak összehúzása. A gráfok spektrál klaszterezését leginkább áramkörök particionálásán kutatták, Lang viszonylag új eredményének [R 2] kivételével. Lang egy szemidefinit programozási módszert (SDP) javasol, hogy elkerüljük a kiegyensúlyozatlan vágásokat, azonban csupán egyetlen vágás számolási ideje ideje több óra egy 10 millió élű gráfnál. A szemidefinit módszerek skálázhatóságának megoldása nyitott probléma. 2. Tézis Összehasonlítás a Szemidefinit módszerrel [Spec 3, Spec 4] A főbb megállapításaink a gráf particionálási problémának az SVD, illetve a SDP általi relaxációinak összehasonlításához kapcsolódik. Megmutatjuk, hogy az SVD alapú módszer legalább olyan jó eredményt adhat, mint az SDP, azonban annál jóval gyorsabb, különösen mivel a Lánczos algoritmus mátrixszorzás műveletét lehet párhuzamosítani. Az SVD-nek továbbá jó közelítő megoldásai vannak [R3, R4]. Jövőbeli tervünk között szerepel elosztott közelítő SVD algoritmusok alkalmazása olyan nagy gráfokon, mint például a UK2007- WEBSPAM, amely 3 milliárd élt tartalmaz. Független téma a LiveJournal baráti hálózat elemzése, amely hárommillió felhasználót tartalmaz, 80%-ban az USA-ból, 6%-ban Nyugat-Európából és 5%- ban Oroszországból illetve Kelet-Európából. Az elemzésünk felfedi a földrajzi elhelyezkedés, életkor, illetve vallási meggyőződés hatásait. További célom a hatások bővebb vizsgálata, és az általunk mutatott módszereket alkalmazása más nagy szociális hálózatokra. Szociális Hálózat modellek A spektrál klaszterezés nagy közösségi hálózatokon történő alkalmazásáról az elmúlt időben negatív eredményeket publikáltak. Míg Lang [R 2] részben azt állítja, hogy ez a kiterjedtség és a fokszámok hatvány eloszlása miatt van, azonban az ismert hálózat modellek, mint például a preferált illesztés modell [R 5] vagy Kumar fejlődő másoló modellje [R 6] illetve Kleinberg kis-világ modellje [R 7] könnyen és kiegyensúlyozottan particionálható a spektrál módszerrel. Következő eredményünk egy hálózatmodell, amely a spektrál módszerrel nehezen particionálható gráfokat generál, és a megfigyelt sűrű részhalmaz és csáp méreteloszlást mutatja. Kleinberg kis-világ modelljéből indulunk ki, egy két dimenziós rácsból, amelyen azonban bizonyos pontokat kicsi teljes részgráfokkal helyettesítünk. Ezután a megfelelő hatvány-eloszlás szerint éleket generálunk, úgy hogy az élek valószínűsége a végpontok távolságának négyzetével fordítottan arányos. A generált sűrű 3

5 részek számának és csápok méretének eloszlása nagyon hasonló a nehezen particionálható hálózatokéhoz. 3. Tézis Nehezen Particionálható Gráfok Generatív Modelljei [Spec 4] Megmutattuk, hogy a létező modellek által generált gráfokat nem olyan nehéz klaszterezni, mint a valódi hálózatokat. Ezért olyan összetett modellt készítettünk, amelyben a szomszédsági mátrix szinguláris értékei nagyon lassan csökkennek és a gráf nehezen particionálható. Ebben az új modellben a spektrál klaszterezés csak azután ad kiegyensúlyozott vágást, miután eltávolítjuk a sűrű részgráfokat és a csápokat is. SVD nagy méretű hiányos mátrixokra Az alacsony rangú közelítő mátrixok számolásának központi nehézségét az értékelési mátrixból hiányzó rengeteg érték okozza: a Netflix mátrix értékeinek 99%-a nem ismert. Bár több szerző Expectation Maximization alapú SVD algoritmusokat adott már a 70-es években [R 8], mások pedig ajánló rendszerekben alkalmazható módszereket is mutattak, a vizsgált feladatok mérete messze elmaradt a Netflix problémáétól. Ezek az eredmények kicsi, néhány ezerszer néhány ezres mátrixokon készültek az EachMovie vagy a Jester adathalmazokon, amelyek több nagyságrenddel kisebbek, mint amelyeket a mi algoritmusaink kezelnek. 4. Tézis A Lánczos algoritmus alkalmazása egy EM rendszerben [Rec 1] Több módosítást implementáltunk az svdpack csomagban, ami lehetővé teszi a hiányzó adatok kezelését nagyon nagy bemenetekre. Összehasonlítjuk a Lánczos, blokk-lánczos és hatvány iterációs algoritmusokat. Az eredményeink szerint a legjobb módszer a Lánczos algoritmus 10 dimenzióban. Sajnos a számolás lassú, és a konvergencia gyorsítás csak kicsit javít ezen. A hatvány iterációs módszerek túltanulnak. Úgy gondoljuk, hogy az algoritmusaink részletes elemzése még javíthat az eredményeken, azonban a fő célunk a hiányzó értékekből adódó problémák megértése volt, a különböző kapcsolódó algoritmusok vizsgálata által. 5. Tézis KDD Cup 2007 nyertes megoldás [Rec 2] Bemutatjuk a Who Rated What in 2006 feladaton első helyezést elért módszerünket. A feladat az volt, hogy megjósoljuk a valószínűségét annak, hogy egy felhasználó értékelt egy filmet ban. Ehhez adott volt 100,000 felhasználó-film pár a Netflix adathalmazból. A megoldásunk a naiv függetlenség, az SVD, a korreláció és a szabály alapú megközelítések kombinációja volt. 4

6 A mi eredményünk os hibája tel jobb volt, mint a második helyezetté, illetve mal a csupa nulla jóslaténál. 5

7 Publikációk [Spec 1] Miklós Kurucz, András A. Benczúr, Károly Csalogány, László Lukács. Spectral Clustering in Telephone Call Graphs. In Proceedings of the WebKDD/SNAKDD Workshop 2007 in conjunction with KDD Lecture Notes in Computer Science, 2009, Volume 5439/2009, 1-20, [Spec 2] Miklós Kurucz, László Lukács, Dávid Siklósi, András A. Benczúr, Károly Csalogány, András Lukács. Telephone Call Network Data Mining: A Survey with Experiments. Chapter 12, Handbook of Large-Scale Random Networks, Bolyai Society Mathematical Studies, Vol. 18, Springer, [Spec 3] Miklós Kurucz, András A. Benczúr, Attila Pereszlényi. Large-Scale Principal Component Analysis on LiveJournal Friends Network. In Proceedings of the Workshop on Social Network Mining and Analysis Held in conjunction with KDD [Spec 4] Miklós Kurucz and András A. Benczúr. Geographically Organized Small Communities and the Hardness of Clustering Social Networks. Annals of Information Systems, 2010, Volume 12, [Rec 1] Miklós Kurucz, András A. Benczúr, Károly Csalogány. Methods for large scale SVD with missing values. In Proceedings of the KDD Cup and Workshop 2007 in conjunction with KDD [Rec 2] Miklós Kurucz, András A. Benczúr, Tamás Kiss, István Nagy, Adrienn Szabó and Balázs Torma. Who Rated What: a combination of SVD, correlation and frequent sequence mining. In Proceedings of the KDD Cup and Workshop 2007 in conjunction with KDD SIGKDD Explorations Volume 9, Issue 2,

8 Egyéb kapcsolódó publikációk [MT] [FP] [Spam 1] [Spam 2] Miklós Kurucz, László Lukács, Dávid Siklósi, András A. Benczúr, Károly Csalogány, András Lukács. Kapcsolatok és Távolságok a Hazai Vezetékes Hívás-szokások Elemzése. Magyar tudomány, Issue 6, Miklós Kurucz, Dávid Siklósi, István Bíró, Péter Csizsek, Zsolt Fekete, Róbert Iwatt, Tamás Kiss, Adrienn Szabó. KDD Cup Budapest: feature partitioning and boosting. In Proceedings of the KDD Cup Workshop 2009 in conjunction with KDD Journal of Machine Learning Research: Workshop and Conference Proceedings 7, 65-75, 2009 Dávid Siklósi, András A. Benczúr, Zsolt Fekete, Miklós Kurucz, István Bíró, Attila Pereszlényi, Simon Rácz, Adrienn Szabó, Jácint Szabó. Web Spam Budapest. In Proceedings of Airweb 2008 in conjunction with WWW 2008 András A. Benczúr, Dávid Siklósi, István Bíró, Zsolt Fekete, Miklós Kurucz, Attila Pereszlényi, Simon Rácz, Adrienn Szabó, Jácint Szabó. Web Spam: a Survey with Vision for the Archivist. In Proceedings of IWAW

9 Hivatkozások [R 1] David Cheng and Santosh Vempala and Ravi Kannan and Grant Wang. A divide-and-merge methodology for clustering. PODS 05: Proceedings of the twenty-fourth ACM SIGMOD- SIGACT-SIGART symposium on Principles of database systems [R 2] Kevin Lang. Fixing two weaknesses of the Spectral Method. NIPS 05: Advances in Neural Information Processing Systems, Vol 18, 2005 [R 3] Tamás Sarlós. Improved Approximation Algorithms for Large Matrices via Random Projections. IEEE Symposium on Foundations of Computer Science, 2006 [R 4] Petros Drineas and Ravi Kannan and Michael W. Mahoney. Fast Monte Carlo Algorithms for Matrices I: Approximating Matrix Multiplication. SIAM Journal on Computing, Vol 36, , 2006 [R 5] Albert-László Barabási and Réka Albert and Hawoong Jeong. Scale-free characteristics of random networks: the topology of the word-wide web. Physica A, Vol 281, 69-77, 2000 [R 6] Ravi Kumar and Prabhakar Raghavan and Sridhar Rajagopalan and D. Sivakumar and Andrew Tomkins and Eli Upfal. Stochastic Models for the Web Graph. IEEE Symposium on Foundations of Computer Science, 2000 [R 7] Jon Kleinberg. The Small-World Phenomenon: An Algorithmic Perspective. Proceedings of the 32nd ACM Symposium on Theory of Computing, 2000 [R 8] K. R. Gabriel and S. Zamir. Lower Rank Approximation of Matrices by Least Squares with Any Choice of Weights. Technometrics, Vol 21, ,

Közösség detektálás gráfokban

Közösség detektálás gráfokban Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a

Részletesebben

Szalai Péter. April 17, Szalai Péter April 17, / 36

Szalai Péter. April 17, Szalai Péter April 17, / 36 Szociális hálók Szalai Péter April 17, 2015 Szalai Péter April 17, 2015 1 / 36 Miről lesz szó? 1 Megfigyelések Kis világ Power-law Klaszterezhetőség 2 Modellek Célok Erdős-Rényi Watts-Strogatz Barabási

Részletesebben

Web spam szűrési módszerek

Web spam szűrési módszerek Web spam szűrési módszerek Doktori értekezés tézisek Csalogány Károly Témavezető: Benczúr A. András Ph.D. Eötvös Loránd Tudományegyetem Informatikai Kar Információtudományi Tanszék Informatika Doktori

Részletesebben

A Barabási-Albert-féle gráfmodell

A Barabási-Albert-féle gráfmodell A Barabási-Albert-féle gráfmodell és egyéb véletlen gráfok Papp Pál András Gráfok, hálózatok modelljei Rengeteg gráfokkal modellezhető terület: Pl: Internet, kapcsolati hálók, elektromos hálózatok, stb.

Részletesebben

Előrenéző és paraméter tanuló algoritmusok on-line klaszterezési problémákra

Előrenéző és paraméter tanuló algoritmusok on-line klaszterezési problémákra Szegedi Tudományegyetem Számítógépes Algoritmusok és Mesterséges Intelligencia Tanszék Dr. Németh Tamás Előrenéző és paraméter tanuló algoritmusok on-line klaszterezési problémákra SZTE TTIK, Móra Kollégium,

Részletesebben

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján Hegedűs István Ajánló rendszerek Napjainkban egyre népszerűbb az ajánló rendszerek alkalmazása A cégeket is hasznos információval

Részletesebben

Pletykaalapú gépi tanulás teljesen elosztott környezetben

Pletykaalapú gépi tanulás teljesen elosztott környezetben Pletykaalapú gépi tanulás teljesen elosztott környezetben Hegedűs István Jelasity Márk témavezető Szegedi Tudományegyetem MTA-SZTE Mesterséges Intelligencia Kutatócsopot Motiváció Az adat adatközpontokban

Részletesebben

Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok

Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok A feszítőfákból számolt súlyvektorok mértani közepének optimalitása a logaritmikus legkisebb négyzetes célfüggvényre nézve Bozóki Sándor MTA SZTAKI, Budapesti Corvinus Egyetem Vitaliy Tsyganok Laboratory

Részletesebben

Hogy keres a Google?

Hogy keres a Google? Hogy keres a Google? Kevei Péter SZTE Bolyai Intézet Kutatók Éjszakája 208. szeptember 28. WWW Könyvtár 25 milliárd (25 0 9 ) dokumentummal, és nincs könyvtáros (a Somogyi Könyvtárban 900 000, a Bolyai

Részletesebben

7. Régió alapú szegmentálás

7. Régió alapú szegmentálás Digitális képek szegmentálása 7. Régió alapú szegmentálás Kató Zoltán http://www.cab.u-szeged.hu/~kato/segmentation/ Szegmentálási kritériumok Particionáljuk a képet az alábbi kritériumokat kielégítő régiókba

Részletesebben

Teljesen elosztott adatbányászat alprojekt

Teljesen elosztott adatbányászat alprojekt Teljesen elosztott adatbányászat alprojekt Hegedűs István, Ormándi Róbert, Jelasity Márk Big Data jelenség Big Data jelenség Exponenciális növekedés a(z): okos eszközök használatában, és a szenzor- és

Részletesebben

Szinguláris érték felbontás Singular Value Decomposition

Szinguláris érték felbontás Singular Value Decomposition Szinguláris érték felbontás Singular Value Decomposition Borbély Gábor 7. április... Tétel (teljes SVD. Legyen A C m n mátrix (valósra is jó, ekkor léteznek U C m m és V C n n unitér mátrixok (valósban

Részletesebben

Komplex hálózatok moduláris szerkezete

Komplex hálózatok moduláris szerkezete Az OTKA K68669 azonosítójú, Komplex hálózatok moduláris szerkezete című pályázat szakmai beszámolója 1. Bevezetés Az utóbbi évtizedben a hálózati megközelítés több fontos sikert hozott biológiai, technológiai,

Részletesebben

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007 Hálózatok II 2007 1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok 1 Az előadáshoz Előadás: Szerda 17:00 18:30 Gyakorlat: nincs Vizsga írásbeli Honlap: http://people.inf.elte.hu/lukovszki/courses/g/07nwii

Részletesebben

Klaszterezés, 2. rész

Klaszterezés, 2. rész Klaszterezés, 2. rész Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 208. április 6. Csima Judit Klaszterezés, 2. rész / 29 Hierarchikus klaszterezés egymásba ágyazott klasztereket

Részletesebben

Számítógép hálózatok, osztott rendszerek 2009

Számítógép hálózatok, osztott rendszerek 2009 Számítógép hálózatok, osztott rendszerek 2009 1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok 1 Az előadáshoz Előadás: Hétfő 10:00 12:00 óra Gyakorlat: Hétfő 14:00-16:00 óra Honlap: http://people.inf.elte.hu/lukovszki/courses/0910nwmsc

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

IBM SPSS Modeler 18.2 Újdonságok

IBM SPSS Modeler 18.2 Újdonságok IBM SPSS Modeler 18.2 Újdonságok 1 2 Új, modern megjelenés Vizualizáció fejlesztése Újabb algoritmusok (Python, Spark alapú) View Data, t-sne, e-plot GMM, HDBSCAN, KDE, Isotonic-Regression 3 Új, modern

Részletesebben

Hash-alapú keresések

Hash-alapú keresések 1/16 az információ-visszakeresésben Babeş Bolyai Tudományegyetem Magyar Matematika és Informatika Intézet A Magyar Tudomány Napja Erdélyben Kolozsvár, 2012 2/16 Tartalom Információ-visszakeresés Információ-visszakeresés

Részletesebben

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék Adatelemzés intelligens módszerekkel Hullám Gábor Adatelemzés hagyományos megközelítésben I. Megválaszolandó

Részletesebben

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat Klaszterezés Szegedi Tudományegyetem Élei lehetnek címkézettek (pl. ellenség, barát), továbbá súlyozottak (pl. telefonbeszélgetés) Megjelenési formái Ismeretségi, társszerzőségi gráf (Erdős-Bacon szám)

Részletesebben

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások Pannon Egyetem Informatikai Tudományok Doktori Iskola Tézisfüzet Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások Kovács Levente Képfeldolgozás és Neuroszámítógépek Tanszék Témavezet

Részletesebben

Nem teljesen kitöltött páros összehasonlítás mátrixok sajátérték optimalizálása Newton-módszerrel p. 1/29. Ábele-Nagy Kristóf BCE, ELTE

Nem teljesen kitöltött páros összehasonlítás mátrixok sajátérték optimalizálása Newton-módszerrel p. 1/29. Ábele-Nagy Kristóf BCE, ELTE Nem teljesen kitöltött páros összehasonlítás mátrixok sajátérték optimalizálása Newton-módszerrel Ábele-Nagy Kristóf BCE, ELTE Bozóki Sándor BCE, MTA SZTAKI 2010. november 4. Nem teljesen kitöltött páros

Részletesebben

Matematika MSc záróvizsgák (2015. június )

Matematika MSc záróvizsgák (2015. június ) Június 23. (kedd) H45a 12.00 13.00 Bizottság: Simonovits András (elnök), Simon András, Katona Gyula Y., Pap Gyula (külső tag) 12.00 Bácsi Marcell Közelítő algoritmusok és bonyolultságuk tv.: Friedl Katalin

Részletesebben

Doktori disszertáció. szerkezete

Doktori disszertáció. szerkezete Doktori disszertáció tézisfüzet Komplex hálózatok szerkezete Szabó Gábor Témavezető Dr. Kertész János Elméleti Fizika Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem 2005 Bevezetés A tudományos

Részletesebben

Elosztott Hash Táblák. Jelasity Márk

Elosztott Hash Táblák. Jelasity Márk Elosztott Hash Táblák Jelasity Márk Motiváció Nagyméretű hálózatos elosztott rendszerek az Interneten egyre fontosabbak Fájlcserélő rendszerek (BitTorrent, stb), Grid, Felhő, Gigantikus adatközpontok,

Részletesebben

Principal Component Analysis

Principal Component Analysis Principal Component Analysis Principal Component Analysis Principal Component Analysis Definíció Ortogonális transzformáció, amely az adatokat egy új koordinátarendszerbe transzformálja úgy, hogy a koordináták

Részletesebben

Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok

Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok 9. fejezet Tan, Steinbach, Kumar Bevezetés az adatbányászatba előadás-fóliák fordította Ispány Márton Logók és támogatás A tananyag a TÁMOP-4.1.2-08/1/A-2009-0046

Részletesebben

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK

Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK Sapientia-EMTE 2017-18 http://www.cs.cornell.edu/home/kleinber/networks-book/ A gyenge kapcsolatok ereje The strength of weak ties (legidézettebb cikk) 1969 (American

Részletesebben

XSLT XML. DEIM Forum 2013 B2-1 XML XML XML XML XSLT XSLT XSLT XML XSLT XSLT

XSLT XML.    DEIM Forum 2013 B2-1 XML XML XML XML XSLT XSLT XSLT XML XSLT XSLT DEIM Forum 2013 B2-1 XML XSLT 305 8550 1-2 E-mail: s0911654@u.tsukuba.ac.jp, nszuki@slis.tsukuba.ac.jp XML XML XML XPath XSLT XML XSLT XSLT XML 1. XMLXSLT XML(Extensible Markup Language) Web XML ( XML

Részletesebben

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș-Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika 1.3 Intézet Magyar Matematika és Informatika 1.4 Szakterület

Részletesebben

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time) (specializáció választás a 4. félévben, specializációra lépés feltétele: az egyik szigorlat

Részletesebben

Publikációs lista. Gódor Győző. 2008. július 14. Cikk szerkesztett könyvben... 2. Külföldön megjelent idegen nyelvű folyóiratcikk...

Publikációs lista. Gódor Győző. 2008. július 14. Cikk szerkesztett könyvben... 2. Külföldön megjelent idegen nyelvű folyóiratcikk... Publikációs lista Gódor Győző 2008. július 14. Cikk szerkesztett könyvben... 2 Külföldön megjelent idegen nyelvű folyóiratcikk... 2 Nemzetközi konferencia-kiadványban megjelent idegen nyelvű előadások...

Részletesebben

Statisztikai módszerek a skálafüggetlen hálózatok

Statisztikai módszerek a skálafüggetlen hálózatok Statisztikai módszerek a skálafüggetlen hálózatok vizsgálatára Gyenge Ádám1 1 Budapesti Műszaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudományi és Információelméleti

Részletesebben

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése Kovács Péter ChemAxon Kft., ELTE IK kpeter@inf.elte.hu Budapest, 2018.11.06. Bevezetés Feladat: két molekulagráf legnagyobb közös

Részletesebben

Betekintés a komplex hálózatok világába

Betekintés a komplex hálózatok világába Betekintés a komplex hálózatok világába Dr. Varga Imre Debreceni Egyetem Informatikai Kar EFOP-3.6.1-16-2016-00022 Egyszerű hálózatok Grafit kristály Árpád házi uralkodók családfája LAN hálózat Komplex

Részletesebben

Szomszédság alapú ajánló rendszerek

Szomszédság alapú ajánló rendszerek Nagyméretű adathalmazok kezelése Szomszédság alapú ajánló rendszerek Készítette: Szabó Máté A rendelkezésre álló adatmennyiség növelésével egyre nehezebb kiválogatni a hasznos információkat Megoldás: ajánló

Részletesebben

Társadalmi és gazdasági hálózatok modellezése

Társadalmi és gazdasági hálózatok modellezése Társadalmi és gazdasági hálózatok modellezése 5. el adás Közösségszerkezet El adó: London András 2017. október 16. Közösségek hálózatban Homofília, asszortatívitás Newman modularitás Közösségek hálózatban

Részletesebben

Kódverifikáció gépi tanulással

Kódverifikáció gépi tanulással Kódverifikáció gépi tanulással Szoftver verifikáció és validáció kiselőadás Hidasi Balázs 2013. 12. 12. Áttekintés Gépi tanuló módszerek áttekintése Kódverifikáció Motiváció Néhány megközelítés Fault Invariant

Részletesebben

2008 IV. 22. Internetes alkalmazások forgalmának mérése és osztályozása. Április 22.

2008 IV. 22. Internetes alkalmazások forgalmának mérése és osztályozása. Április 22. 2008 IV. 22. Internetes alkalmazások forgalmának mérése és osztályozása Az óra rövid vázlata Nemzetközi együttműködések áttekintése A CAIDA céljai A CAIDA főbb kutatási irányai 2007-2010 között Internet

Részletesebben

Csima Judit BME, SZIT február 17.

Csima Judit BME, SZIT február 17. 1 Véletlen gráfok és valós hálózatok Csima Judit BME, SZIT 2010. február 17. Tartalom 2 1. Motiváció: miért pont véletlen gráfok? 2. A klasszikus modell: Erdős-Rényi véletlen-gráf modell definíció jellemzői

Részletesebben

A megerosítéses tanulás és a szimulált hutés kombinált használata: algoritmusok és alkalmazások

A megerosítéses tanulás és a szimulált hutés kombinált használata: algoritmusok és alkalmazások MISKOLCI EGYETEM DOKTORI (PH.D.) TÉZISFÜZETEI HATVANY JÓZSEF INFORMATIKAI TUDOMÁNYOK DOKTORI ISKOLA A megerosítéses tanulás és a szimulált hutés kombinált használata: algoritmusok és alkalmazások Készítette:

Részletesebben

Összefoglalás és gyakorlás

Összefoglalás és gyakorlás Összefoglalás és gyakorlás High Speed Networks Laboratory 1 / 28 Hálózatok jellemző paraméterei High Speed Networks Laboratory 2 / 28 Evolúció alkotta adatbázis Önszerveződő adatbázis = (struktúra, lekérdezés)

Részletesebben

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

BIG DATA ELEMZÉSEK LEHETŐSÉGEI BIG DATA ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN Dr. Torma A. 2015.11.13. 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 2 Tartalom 1. A Big Data fogalma 2. Pár érdekes adat a Big Data

Részletesebben

Gyakorló feladatok adatbányászati technikák tantárgyhoz

Gyakorló feladatok adatbányászati technikák tantárgyhoz Gyakorló feladatok adatbányászati technikák tantárgyhoz Buza Krisztián Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Klaszterezés kiértékelése Feladat:

Részletesebben

Gépi tanulás a gyakorlatban. Lineáris regresszió

Gépi tanulás a gyakorlatban. Lineáris regresszió Gépi tanulás a gyakorlatban Lineáris regresszió Lineáris Regresszió Legyen adott egy tanuló adatbázis: Rendelkezésünkre áll egy olyan előfeldolgozott adathalmaz, aminek sorai az egyes ingatlanokat írják

Részletesebben

Szepesvári Csaba. 2005 ápr. 11

Szepesvári Csaba. 2005 ápr. 11 Gépi tanulás III. Szepesvári Csaba MTA SZTAKI 2005 ápr. 11 Szepesvári Csaba (SZTAKI) Gépi tanulás III. 2005 ápr. 11 1 / 37 1 Döntési fák 2 Felügyelet nélküli tanulás Klaszter-anaĺızis EM algoritmus Gauss

Részletesebben

Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar. Doktori Disszertáció Tézisei. Recski Gábor. Számítógépes módszerek a szemantikában

Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar. Doktori Disszertáció Tézisei. Recski Gábor. Számítógépes módszerek a szemantikában Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar Doktori Disszertáció Tézisei Recski Gábor Számítógépes módszerek a szemantikában Nyelvtudományi Doktori Iskola Tolcsvai Nagy Gábor MHAS Elméleti Nyelvészet

Részletesebben

Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola Doktori (Ph.D.) értekezés tézisei Számítási intelligencia alapú regressziós technikák és Készítette Kenesei Tamás Péter Témavezető: Dr. habil.

Részletesebben

Big Data az adattárházban

Big Data az adattárházban Big Data az adattárházban A párbaj folytatódik? Néhány fontos Big Data projekt Cég Téma Adat Újfajta Mennyiség Saját adat? Típus Google Influenza Google I big I Előjelzés előjelzés Farecast Xoom Chicagoi

Részletesebben

Információ-visszakeresı módszerek egységes keretrendszere és alkalmazásai. Kiezer Tamás

Információ-visszakeresı módszerek egységes keretrendszere és alkalmazásai. Kiezer Tamás Információ-visszakeresı módszerek egységes keretrendszere és alkalmazásai Doktori (PhD) értekezés tézise Kiezer Tamás Témavezetı: Dr. Dominich Sándor (1954-2008) Pannon Egyetem Mőszaki Informatikai Kar

Részletesebben

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA Kovács Ernő 1, Füvesi Viktor 2 1 Egyetemi docens, PhD; 2 tudományos segédmunkatárs 1 Eletrotechnikai és Elektronikai Tanszék, Miskolci Egyetem

Részletesebben

Gauss-Seidel iteráció

Gauss-Seidel iteráció Közelítő és szimbolikus számítások 5. gyakorlat Iterációs módszerek: Jacobi és Gauss-Seidel iteráció Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 ITERÁCIÓS

Részletesebben

Ambiens szabályozás problémája Kontroll és tanulás-1

Ambiens szabályozás problémája Kontroll és tanulás-1 Ambiens szabályozás problémája Kontroll és tanulás-1 Ambiens (fizikai) tér Ambiens Intelligencia szenzorok beavatkozók Ágens szervezet AmI - megfigyelés, elemzés - tervezés, megtanulás AmI - statikus -

Részletesebben

Gráfok spektruma. Szakdolgozat. Dudás-Marx László. Témavezet : Benczúr A. András Ph.D. Operációkutatás tanszék

Gráfok spektruma. Szakdolgozat. Dudás-Marx László. Témavezet : Benczúr A. András Ph.D. Operációkutatás tanszék Gráfok spektruma Szakdolgozat Dudás-Marx László Témavezet : Benczúr A. András Ph.D. Operációkutatás tanszék Eötvös Loránd Tudományegyetem Természettudományi Kar Tartalomjegyzék 1. Bevezetés 4 2. Szinguláris

Részletesebben

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján

Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján Tipikus időbeli internetezői profilok nagyméretű webes naplóállományok alapján Schrádi Tamás schraditamas@aut.bme.hu Automatizálási és Alkalmazott Informatikai Tanszék BME A feladat A webszerverek naplóállományainak

Részletesebben

Panorámakép készítése

Panorámakép készítése Panorámakép készítése Képregisztráció, 2009. Hantos Norbert Blaskovics Viktor Összefoglalás Panoráma (image stitching, planar mosaicing): átfedő képek összeillesztése Lépések: Előfeldolgozás (pl. intenzitáskorrekciók)

Részletesebben

Véletlen gráfok, hálózatok

Véletlen gráfok, hálózatok Véletlen gráfok, hálózatok Véletlen gráfok, hálózatok Csirik András 2018.04.25 Erdős-Rényi modell Watts-Strogatz modell Barabási-Albert modell Hálózatok a mindennapokban Hálózatok a világ minden területén

Részletesebben

Klasztervizsgálat, keresés hálózatokban

Klasztervizsgálat, keresés hálózatokban Hálózatok dinamikája Klasztervizsgálat, keresés hálózatokban 3.3. projekt Lukács András alukacs@sztaki.hu Eötvös Loránd Tudományegyetem econet.hu Informatikai Nyrt. Számítógéptudományi Tanszék nagy és

Részletesebben

A preferencia térképezés kritikus pontjai az élelmiszeripari termékfejlesztésben

A preferencia térképezés kritikus pontjai az élelmiszeripari termékfejlesztésben A preferencia térképezés kritikus pontjai az élelmiszeripari termékfejlesztésben Gere A., Losó, V., Györey, A., Szabó, D., Sipos, L., Kókai, Z. Budapesti Corvinus Egyetem, Élelmiszertudományi Kar Érzékszervi

Részletesebben

Searching in an Unsorted Database

Searching in an Unsorted Database Searching in an Unsorted Database "Man - a being in search of meaning." Plato History of data base searching v1 2018.04.20. 2 History of data base searching v2 2018.04.20. 3 History of data base searching

Részletesebben

KÖZELÍTŐ INFERENCIA II.

KÖZELÍTŐ INFERENCIA II. STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.

Részletesebben

Modellkiválasztás és struktúrák tanulása

Modellkiválasztás és struktúrák tanulása Modellkiválasztás és struktúrák tanulása Szervezőelvek keresése Az unsupervised learning egyik fő célja Optimális reprezentációk Magyarázatok Predikciók Az emberi tanulás alapja Általános strukturális

Részletesebben

PONTFELHŐ REGISZTRÁCIÓ

PONTFELHŐ REGISZTRÁCIÓ PONTFELHŐ REGISZTRÁCIÓ ITERATIVE CLOSEST POINT Cserteg Tamás, URLGNI, 2018.11.22. TARTALOM Röviden Alakzatrekonstrukció áttekintés ICP algoritmusok Projektfeladat Demó FORRÁSOK Cikkek Efficient Variants

Részletesebben

műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó Munkahelyek: Nokia -Hungary kft Veszprémi Egyetem

műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó Munkahelyek: Nokia -Hungary kft Veszprémi Egyetem Név: Tarnay Katalin Születési adatok: Nyiregyháza, 1933. május 8 Legmagasabb tudományos fokozat, és elnyerésének éve: műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó

Részletesebben

Közösségek keresése nagy gráfokban

Közösségek keresése nagy gráfokban Közösségek keresése nagy gráfokban Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem 2011. április 14. Katona Gyula Y. (BME SZIT) Közösségek

Részletesebben

Körkép a lakossági felhasználók fogyasztásának készülékszintű becsléséről (NILM)

Körkép a lakossági felhasználók fogyasztásának készülékszintű becsléséről (NILM) Körkép a lakossági felhasználók fogyasztásának készülékszintű becsléséről (NILM) MEE Vándorgyűlés, Siófok, 2015. szeptember 17. Dr. Raisz Dávid, docens, csoportvezető Dr. Divényi Dániel, adjunktus Villamos

Részletesebben

AZ A PRIORI ISMERETEK ALKALMAZÁSA

AZ A PRIORI ISMERETEK ALKALMAZÁSA Doktori (PhD) értekezés tézisei AZ A PRIORI ISMERETEK ALKALMAZÁSA A VEGYIPARI FOLYAMATMÉRNÖKSÉGBEN MADÁR JÁNOS Veszprémi Egyetem Vegyészmérnöki Tudományok Doktori Iskolája Témavezető: dr. Abonyi János

Részletesebben

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely Készítette: Trosztel Mátyás Konzulens: Hajós Gergely Monte Carlo Markov Chain MCMC során egy megfelelően konstruált Markov-lánc segítségével mintákat generálunk. Ezek eloszlása követi a céleloszlást. A

Részletesebben

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás: szakmai önéletrajz Személyes információk: Név: Bánhalmi András Pozíció: Tudományos segédmunkatárs Munkahely: MTA-SZTE Mesterséges Intelligencia Kutatócsoport Cím: 6720 Szeged, Aradi vértanúk tere 1. Telefon:

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus

Részletesebben

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Kollektív tanulás milliós hálózatokban. Jelasity Márk Kollektív tanulás milliós hálózatokban Jelasity Márk 2 3 Motiváció Okostelefon platform robbanásszerű terjedése és Szenzorok és gazdag kontextus jelenléte, ami Kollaboratív adatbányászati alkalmazások

Részletesebben

Társadalmi és gazdasági hálózatok modellezése

Társadalmi és gazdasági hálózatok modellezése Társadalmi és gazdasági hálózatok modellezése 2. el adás A hálózatkutatás néhány fontos fogalma El adó: London András 2015. szeptember 15. Átmér l ij a legrövidebb út a hálózatban i és j pont között =

Részletesebben

Pletykaalapú gépi tanulás teljesen elosztott környezetben

Pletykaalapú gépi tanulás teljesen elosztott környezetben Pletykaalapú gépi tanulás teljesen elosztott környezetben Hegedűs István Témavezető Dr. Jelasity Márk MTA-SZTE Mesterséges Intelligencia Kutatócsoport Informatika Doktori Iskola Szegedi Tudományegyetem

Részletesebben

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Tartalom Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben. Előszó 1. Az adatbányászatról általában 19 1.1. Miért adatbányászat? 21 1.2. Technológia a rejtett információk

Részletesebben

8. Pontmegfeleltetések

8. Pontmegfeleltetések 8. Pontmegfeleltetések Kató Zoltán Képfeldolgozás és Számítógépes Grafika tanszék SZTE (http://www.inf.u-szeged.hu/~kato/teaching/) 2 Példa: panoráma kép készítés 1. Jellemzőpontok detektálása mindkét

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján Közelítő és szimbolikus számítások 6. gyakorlat Sajátérték, Gersgorin körök Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor Vinkó Tamás London András Deák Gábor jegyzetei alapján . Mátrixok sajátértékei

Részletesebben

Csima Judit BME, SZIT február 18.

Csima Judit BME, SZIT február 18. 1 Véletlen gráfok és valós hálózatok Csima Judit BME, SZIT 2011. február 18. Tartalom 2 1. Motiváció: miért pont véletlen gráfok? Tartalom 2 1. Motiváció: miért pont véletlen gráfok? 2. A klasszikus modell:

Részletesebben

MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR

MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR Korszerű információs technológiák Klaszteranalízis Tompa Tamás tanársegéd Általános Informatikai Intézeti Tanszék Miskolc, 2018. október 20. Tartalom

Részletesebben

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet Hálózattudomány SZTE Informatikai Intézet Számítógépes Optimalizálás Tanszék Előadó: London András 4. Előadás Hogyan nőnek a hálózatok? Statikus hálózatos modellek: a pontok száma (n) fix, az éleket valamilyen

Részletesebben

Módszerek valós hálózatokon játszódó folyamatok leírására és elemzésére

Módszerek valós hálózatokon játszódó folyamatok leírására és elemzésére Szegedi Tudományegyetem Természettudományi és Informatikai Kar Számítógépes Optimalizálás Tanszék Informatika Doktori Iskola Módszerek valós hálózatokon játszódó folyamatok leírására és elemzésére Doktori

Részletesebben

OTKA nyilvántartási szám: T047198 ZÁRÓJELENTÉS

OTKA nyilvántartási szám: T047198 ZÁRÓJELENTÉS MESTERSÉGES INTELLIGENCIA MÓDSZEREK ALKALMAZÁSA A FOLYAMATMODELLEZÉSBEN című OTKA pályázatról 2004. jan. 01 2007. dec. 31. (Vezető kutató: Piglerné dr. Lakner Rozália) A mesterséges intelligencia eszközök

Részletesebben

ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ

ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ 1 TARTALOM 1.1 A MODELLEZÉS ÉS SZIMULÁCIÓ META-SZINTŰ HATÉKONYSÁGÁNAK JAVÍTÁSA A. Az SMM definiálása, a Jackson Keys módszer kiterjesztése

Részletesebben

Honlap szerkesztés Google Tudós alkalmazásával

Honlap szerkesztés Google Tudós alkalmazásával Dr. Mester Gyula Honlap szerkesztés Google Tudós alkalmazásával Összefoglaló: A közlemény tematikája honlap szerkesztés Google Tudós alkalmazásával. A bevezetés után a tudományos teljesítmény mérésének

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeș Bolyai Tudományegyetem 1.2 Kar Matematika és Informatika Kar 1.3 Intézet Magyar Matematika és Informatika Intézet 1.4

Részletesebben

Algoritmus vizualizáció a tanítási gyakorlatban. Törley Gábor

Algoritmus vizualizáció a tanítási gyakorlatban. Törley Gábor Algoritmus vizualizáció a tanítási gyakorlatban Törley Gábor pezsgo@inf.elte.hu Mi is ez? Algoritmus működésének illusztrálása, abból a célból, hogy jobban megértsék azt a tanulók Tapasztalat: nehéz tanulni

Részletesebben

Telefonszám(ok) +36-93-502-916 Mobil +36-30-396-8675 Fax(ok) +36-93-502-900. Egyetem u. 10., 8200 Veszprém. Tehetséggondozás (matematika)

Telefonszám(ok) +36-93-502-916 Mobil +36-30-396-8675 Fax(ok) +36-93-502-900. Egyetem u. 10., 8200 Veszprém. Tehetséggondozás (matematika) Europass Önéletrajz Személyi adatok Vezetéknév(ek) / Utónév(ek) Bujtás Csilla Telefonszám(ok) +36-93-502-916 Mobil +36-30-396-8675 Fax(ok) +36-93-502-900 E-mail(ek) Szakmai tapasztalat bujtas@dcs.vein.hu

Részletesebben

Kvantitatív módszerek

Kvantitatív módszerek Kvantitatív módszerek szimuláció Kovács Zoltán Szervezési és Vezetési Tanszék E-mail: kovacsz@gtk.uni-pannon.hu URL: http://almos/~kovacsz Mennyiségi problémák megoldása analitikus numerikus szimuláció

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Gyakori elemhalmazok kinyerése

Gyakori elemhalmazok kinyerése Gyakori elemhalmazok kinyerése Balambér Dávid Budapesti M szaki és Gazdaságtudományi Egyetem Villamosmérnöki és Informatikai Kar Számítástudomány szakirány 2011 március 11. Balambér Dávid (BME) Gyakori

Részletesebben

Dokumentum osztályozás rejtett Dirichlet-allokációval

Dokumentum osztályozás rejtett Dirichlet-allokációval Dokumentum osztályozás rejtett Dirichlet-allokációval Doktori értekezés tézisek Bíró István Témavezető: Lukács András Ph.D. Eötvös Loránd Tudományegyetem Informatikai Kar Információtudományi Tanszék Informatika

Részletesebben

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Varga Domonkos (I.évf. PhD hallgató) 2014 május A prezentáció felépítése 1) Alapfogalmak 2) A gépi tanulás, mintafelismerés alkalmazási

Részletesebben

Entity Resolution azonosságfeloldás

Entity Resolution azonosságfeloldás 1 Entity Resolution azonosságfeloldás Entity Resolution (ER) is the process of identifying groups of records that refer to the same real-world entity. rejtett, való világbeli entitásokhoz köthető megfigyelések

Részletesebben

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére Bányai Mihály! MTA Wigner FK! Computational Systems Neuroscience Lab!! KOKI-VIK szeminárium! 2014. február 11. Struktúra és funkció

Részletesebben

Az fmri alapjai Statisztikai analízis II. Dr. Kincses Tamás Szegedi Tudományegyetem Neurológiai Klinika

Az fmri alapjai Statisztikai analízis II. Dr. Kincses Tamás Szegedi Tudományegyetem Neurológiai Klinika Az fmri alapjai Statisztikai analízis II. Dr. Kincses Tamás Szegedi Tudományegyetem Neurológiai Klinika Autokorreláció white noise Autokorreláció: a függvény önnmagával számított korrelációja különböző

Részletesebben

A TDM-modellt támogató informatikai lehetőségek

A TDM-modellt támogató informatikai lehetőségek A TDM-modellt támogató informatikai lehetőségek Előadó: Semsei Sándor, Chrome Kreatív Munkák Kft. eturizmus - a technológia és a turizmus a két leggyorsabban fejlődő szektor a globális gazdaságban (Dr.Dimitros

Részletesebben

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI A távoktatási forma bevezetése és eredményességének vizsgálata az igazgatásszervezők informatikai képzésében DOKTORI ÉRTEKEZÉS TÉZISEI dr. Horváth

Részletesebben