Klasztervizsgálat, keresés hálózatokban



Hasonló dokumentumok
Komplex hálózatok moduláris szerkezete

Pál Judit - Vörös András. Budapesti Corvinus Egyetem. Kapcsolatháló- és Oktatáskutató Központ március 1.

Az IBM WebSphere Multichannel Bank Transformation Toolkit V7.1 felgyorsítja a többcsatornás alkalmazásfejlesztést

Módszerek valós hálózatokon játszódó folyamatok leírására és elemzésére

Közösségek keresése nagy gráfokban

KÉPZÉS NEVE: Informatikai statisztikus és gazdasági tervezı TANTÁRGY CÍME: Számítógép hálózatok. Készítette:

Emberi erőforrás menedzsment Exact megoldásokkal

Entity Resolution azonosságfeloldás

Nyilvántartási Rendszer

GAZDASÁGINFORMATIKA ALAPJAI...

A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS

Új tehetséggondozó programok és kutatások

Számítógépes Hálózatok ősz 2006

Organizáció. Számítógépes Hálózatok ősz Tartalom. Vizsga. Web-oldal

A Debreceni Egyetem és a Nagyváradi Egyetem WiFi alapú helymeghatározó rendszere

Andrew S.Tanenbaum. Számítógéphálózatok. Második, bővített, átdolgozott kiadás. Panem

MFB Zrt évi Közbeszerzési Terv. Uniós értékhatárt elérő értékű közbeszerzés

Szakmai CD-ROM és online adatbázisok

Anatómiai régiók automatikus felismerése

Alkalmazások teljesítmény problémáinak megszűntetése

Óravázlat. az ECDL oktatócsomaghoz. 5. modul. Adatbáziskezelés. Krea Kft Budapest, Szőlő u 21. Tel/fax: / krea@krea.

Intézményi interface technikai dokumentáció

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

A TÉRINFORMATIKA OKTATÁSA ÉS ALKALMAZÁSI LEHETÕSÉGEI

A Szekszárdi I. Béla Gimnázium Helyi Tanterve

A licensztől a megoldásig

Ismeretanyag Záróvizsgára való felkészüléshez

Jövő Internet - kutatások az elmélettől az alkalmazásig. Eredménykommunikációs kiadvány

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Szoftveripar és üzleti modellek

Teszt generálás webes alkalmazásokhoz

Tantárgyi programok 1. Informatikai projektmenedzsment A projektmenedzsment alapjai (a projektek típusai, életciklus, szervezet, ütemezés,

Közlekedéshez kifejlesztett szenzorhálózat kiépítése, tesztelése és elônyei a forgalomirányításban

Big Data technológiai megoldások fejlesztése közvetlen mezőgazdasági tevékenységekhez

FELHŐ ALAPÚ HELYMEGHATÁROZÓ SZOLGÁLTATÁS KIFEJLESZTÉSE MOBIL ESZKÖZÖK SZÁMÁRA

Teljesen elosztott adatfeldogozás és adatbányászat

(70) BUSZNYÁK J., SISÁK I. A Georgikon Térképszerver helye és szerepe a térinformatikai adatbázisok hálózatában

DEnzero 2013/10. Debrecen január december 31.

XVI. sz. melléklet KOMPLEX INTÉZMÉNYI ÉS IKT HELYZETELEMZÉS ELKÉSZÍTÉSÉNEK EGYSÉGES SZEMPONTRENDSZERE

Többtermékes folyamatos technológi

PANNON EGYETEM Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék

Cégismerteto. Ez így kicsit tömören hangzik, nézzük meg részletesebben, mivel is foglalkozunk!

Organizáció. Számítógépes Hálózatok Gyakorlati jegy. Vizsga. Web-oldal

Ingrid Signo Felhasználói kézikönyv. Pénztári használatra

IT biztonság és szerepe az információbiztonság területén

LOGISZTIKA A TUDOMÁNYBAN ÉS A GAZDASÁGBAN

Hallgatói motivációs vizsgálat

I. sz. 220 körül Origenész összeállítja Hexapla címen az Ószövetség hat különbözı fordítását

Elektronikus közhiteles nyilvántartások Megvalósítási tanulmány

Adat és információvédelem Informatikai biztonság. Dr. Beinschróth József CISA

Osztott alkalmazások fejlesztési technológiái Áttekintés

WWW Kliens-szerver Alapfogalmak Technológiák Terv. Web programozás 1 / 31

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék tavasz

TUDOMÁNYOS ÖNÉLETRAJZ

SARM. Veszteségek minimalizálása visszaélés-felderítéssel. Csizmadia Attila CISA

Logisztikai mérnök záróvizsga tételsor Módosítva június 3.

A számítógép-hálózatok használata

TÁVOKTATÁSI TANANYAGOK FEJLESZTÉSÉNEK MÓDSZERTANI KÉRDÉSEI

Dél dunántúli Régió innovációs potenciálja és a kistérségek lehetőségei

KEYSERVE. Pulttól a kasszáig Szolgáltatások értéknövelése automatizálással 2010

Forgalmi grafikák és statisztika MRTG-vel

Exact Synergy Enterprise Időtervezés & Számlázás

Budai Attila. Webalapú multimédiás interaktív oktatóprogramok

Élpont osztályozáson alapuló robusztus tekintetkövetés

International Conference on Emergency Management Technology ICEMT 2011 TERVEZETT PROGRAM május 23.

Adatbázisok I Adatmodellek komponensei. Adatbázis modellek típusai. Adatbázisrendszer-specifikus tervezés

E L T E I K I N F O R M A T I K A T A N Á R I S Z A K N A P P A L I T A G O Z A T B U D A P E S T, 2003.

Helyi tanterv Német nyelvű matematika érettségi előkészítő. 11. évfolyam

Geoinformatikai szakember szakirányú továbbképzési szak

Széchenyi István Szakképző Iskola

Big Data tömeges adatelemzés gyorsan

Informatika. Magyar-angol két tanítási nyelvű osztály tanterve. 9. évfolyam

CSOPORTOSULÁSOK SZOCIOLÓGIAI, TECHNOLÓGIAI ÉS BIOLÓGIAI HÁLÓZATOKBAN

Farkas Illés Az MTMT által csatolt publikációs lista

Oklevél kiadásához szükséges nyelvvizsgák táblázata a DF szakjainál

GÉPI ÉS EMBERI POZICIONÁLÁSI, ÉRINTÉSI MŰVELETEK DINAMIKÁJA

Az elektronikus információs rendszerek védelmére alkalmazható módszerek az Információbiztonsági törvény szemszögéből Május

Stratégiai Fttx hálózat tervező. Smart Strategic Planner

SLA Suite. Új generációs informatikai és kommunikációs megoldások

Intézményi repozitórium - intézményi tartalomfelhő az Eötvös Loránd Tudományegyetemen

KÖZHASZNÚSÁGÚ JELENTÉSÉHEZ

Pázmány Péter Katolikus Egyetem Információs Technológiai Kar Interdiszciplináris Műszaki Tudományok Doktori Iskola Képzési Terve

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

AZ ADATBÁZIS-BIZTONSÁG ALAPJAI

Közhasznúsági jelentés 2010.

Matematikai alapú lokalizációs keretrendszer

Adatmodellek komponensei

A GOP

Kognitív Infokommunikáció: egy ébredő interdiszciplína. Baranyi Péter DSc

Java és web programozás

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

8. osztály. Felhasznált tankönyv: Pedellus Tankönyvkiadó, Debrecen, 2009; 2009

Az ökoturisztikai létesítmények fejlesztési lehetőségei. Budapest, június 12. Bozzay Andrásné szakmai főtanácsadó

A tananyag. Témakörök. Optimum. Tudja meghatározni a numerikus, és karakteres adtok tárolt alakját.

Elosztott rendszerek

Multicast és forgalomkötegelés többrétegû hálózatokban

Ipari hálózatok biztonságának speciális szempontjai és szabványai

MINISZTERELNÖKI HIVATAL. Szóbeli vizsgatevékenység

2016. március IT és Irodatechnika finanszírozás Merkantil Bank Zrt.

Verziószám: 1.0. Kiadás időpontja: MÁSOLATKÉSZÍTÉSI REND

Átírás:

Hálózatok dinamikája Klasztervizsgálat, keresés hálózatokban 3.3. projekt Lukács András alukacs@sztaki.hu Eötvös Loránd Tudományegyetem econet.hu Informatikai Nyrt. Számítógéptudományi Tanszék

nagy és heterogén hálózatok = komplex információ

Témák és s vezető kutatók Hálózati kódolás Információáramlás és fogyasztás vizsgálata Lovász László Szociális hálózatok Nagyméretű hálózatokat leíró és klaszterező algoritmusok kutatása és fejlesztése Lukács András Kapcsolati adattárházak Benczúr A. András Keresés nagyméretű hálózatokban

Hálózati kódolk dolás Lehet-e és hogyan növelni egy hálózat áteresztőképességét, ha az információtovábbításnál a köztes csomópontok kódolást is végezhetünk - változik az információ/adatformátum? A lehetséges üzeneteket, információcsomagokat számokkal, vektorokkal kódoljuk. Lineáris műveletek: a 1 a 2 a k Σλ i a i

Hálózati kódolk dolás Lehet-e és hogyan növelni egy hálózat áteresztőképességét, ha az információtovábbításnál a köztes csomópontok kódolást is végezhetünk - változik az információ/adatformátum? Li Li sejtés: irányítatlan hálózatokon, több forrás több cél esetében hálózati kódolás nem tud javítani a maximálisan elérhető információáramláson. Mennyiben általánosítható az elmélet matroid címkézésű folyamok esetén? Milyen matroid-osztályok esetén segít a hálózati kódolás?

Szociális hálózatokh Alapok humán közösségek típusai: család/kreatív (5-8),, szociális (25-150), politikai (1000-) a p2p telekommunikációs eszközök használata a szociálisnál nem nagyobb közösségek kurkászásához járul hozzá Módszer több mint 2 millió felhasználó 8 hónapnyi telefonálási naplóadatából hálózatot/gráfot építünk a kialakított hálózatból klikkperkolációs módszerrel (Palla at al. 2005) kinyerjük a közösségeket

100000 Humán n közössk sségek méreteim 10000 gyakoriság 1000 100 10 1 0.5 1 1.5 2 2.5 3 3.5 4 Dunbar-határ, szociális közösségek maximális mérete (Dunbar 1993): ~150 klaszterméret logaritmusa

Szociális hálózatokh Alapok humán közösségek típusai: család/kreatív (5-8),, szociális (25-150), politikai (1000-) a p2p telekommunikációs eszközök használata a szociálisnál nem nagyobb közösségek kurkászásához járul hozzá Itt veszthetjük/veszítjük a legtöbb információt!! Módszer több mint 2 millió felhasználó 8 hónapnyi telefonálási naplóadatából hálózatot/gráfot építünk a kialakított hálózatból klikkperkolációs módszerrel (Palla at al. 2005) kinyerjük a közösségeket Hogyan kell kapcsolati naplókból valódi szociális információkat tartalmazó hálózatot építeni?

Közösségek kinyerése Három különböző hálózaton, de ugyanazon módszerrel (klikkperkoláció) végzett klaszterezés minőségén keresztül mutatom be a nyers hálózat átsúlyozásának fontosságát. A kapcsolatok új súlyaihoz a nyers környezetek kölcsönös viszonyait mérjük, majd a gyenge kapcsolatokat elvetjük. klikk méret: 5 felhasználók: 2,1 millió irányítatlan alapgráf átsúlyozott, küszöb: 0,03 átsúlyozott, küszöb: 0,05 átsúlyozott, küszöb: 0,1 kapcsolatok száma (millió) 30 26,4 18,3 10,5 klaszterezett felh. aránya 33% 75% 66% 47% maximális klaszter méret 6721 13482 486 164 átlagos klaszterszám @felh. 1,7 2,4 1,9 1,4 + hatékonyabb algoritmus a klikkperkolációs feladatra

100000 Humán n közössk sségek méreteim Eredeti hálózat 10000 Átsúlyozással, küszöb: 0.03 Átsúlyozással, küszöb: 0.05 gyakoriság 1000 100 Átsúlyozással, küszöb: 0.10 10 1 0.5 1 1.5 2 2.5 3 3.5 4 Dunbar-határ, szociális közösségek maximális mérete (Dunbar 1993): ~150 klaszterméret logaritmusa

Kapcsolati adattárh rházak Célok céges/intézményes adatvagyon újszerű felhasználása: az üzleti logika hű leképezése egy kapcsolati hálózatba a kapcsolati adattárház akár heterogén adattáblákból történő (közel) automatikus felépítése felhasználóbarát keresés és böngészés a hálózatban hasonló entitások, ill. hálózati mintázatok felismerése Előképek World Wide Web közösségi webportálok (iwiw, Orkut, Flickr stb.) Analyst s Notebook (bűnüldözési szoftver) Kapcsolodó projektek ASTOR (Működési kockázatok csökkentése) i-tracs (Counter-Terrorism identification and tracking system)

Kliens-szerver szerver architektúra ra GUI kliensoldali absztrakt adatelérési inteface DataProvider.java Java RMI / távoli metódus hívás ssh tunnel / port forwarding java - C++ konverter JNI szerver oldali adatelérési inteface kapcsolati adatbázis és motor NativeServer.java dataprovider.c++

Kapcsolati adatbázis és s motor kereséseket kiszolgáló motor adatbázis (csv fájlok és indexek) entitás kinyerés id kiosztás tábla gyártás gráf gyártás indexelés kialakítása (Berkeley DB) üzleti logika/ konfigurációs adatok (XML) heterogén adattáblák Adatmodell, adatleképezés rekord feszítő fa

Irodalom R. Ahlswede, N. Cai, S. R. Li, and R. W. Yeung (2000) Network information flow, IEEE Transactions on Information Theory 46, 1204-1216. Z. Li and B. Li. (2004) Network coding in undirected networks, in Proc. CISS 2004. R.I.M. Dunbar (1993) Coevolution of Neocortical Size, Group Size and Language in Humans, Behavioural and Brain Sciences 16, 681 735. G. Palla, I. Derényi, I. Farkas, and T. Vicsek (2005) Uncovering the overlapping community structure of complex networks in nature and society, Nature 435, 814-818.

Hasznosítás, s, termékes kesítés