Közösség detektálás gráfokban

Hasonló dokumentumok
Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

7. Régió alapú szegmentálás

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Társadalmi és gazdasági hálózatok modellezése

Szalai Péter. April 17, Szalai Péter April 17, / 36

Gépi tanulás. Féligellenőrzött tanulás. Pataki Béla (Bolgár Bence)

Gyakorló feladatok adatbányászati technikák tantárgyhoz

Klaszterezés. Kovács Máté március 22. BME. Kovács Máté (BME) Klaszterezés március / 37

Közösségek keresése nagy gráfokban

Klaszterezés, 2. rész

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Adatbányászati szemelvények MapReduce környezetben

Képrekonstrukció 9. előadás

Szociális hálók klaszterezése

Izgalmas újdonságok a klaszteranalízisben

Komplex hálózatok átfedő csoportosulásainak vizsgálata

Adatelemzés és adatbányászat MSc

Babeş Bolyai Tudományegyetem, Kolozsvár Matematika és Informatika Kar Magyar Matematika és Informatika Intézet

Számítógép és programozás 2

Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Adatszerkezetek 2. Dr. Iványi Péter

Gráfelmélet/Diszkrét Matematika MSc hallgatók számára. 13. Előadás

SZENZOROKRA ÉPÜLŐ ADAPTÍV RENDSZERMODELL

Gráfelméleti alapfogalmak

Adatbányászat. Klaszterezés Szociális hálózatok Szegedi Tudományegyetem

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján

PONTFELHŐ REGISZTRÁCIÓ

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

Markov-láncok stacionárius eloszlása

GRÁFELMÉLET. 7. előadás. Javító utak, javító utak keresése, Edmonds-algoritmus

RSA algoritmus. P(M) = M e mod n. S(C) = C d mod n. A helyesség igazoláshoz szükséges számelméleti háttér. a φ(n) = 1 mod n, a (a 1,a 2,...

A segédletben található esetleges hibákkal kapcsolatos visszajelzéseket szívesen veszem.

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Szomszédság alapú ajánló rendszerek

Programozási módszertan. Mohó algoritmusok

Felvételi tematika INFORMATIKA

Diszkrét matematika 2.C szakirány

Kémiai reakciók mechanizmusa számítógépes szimulációval

Gráfelméleti feladatok. c f

Diszkrét matematika 2. estis képzés

Diszkrét matematika 2 (C) vizsgaanyag, 2012 tavasz

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

Szimmetrikus kombinatorikus struktúrák MSc hallgatók számára. Ramsey-gráfok

KOMBINATORIKA ElŐADÁS Matematika BSc hallgatók számára. Klikkek gráfokban-1. Definíció. Egy G gráfban egy K V(G) csúcshalmazt klikknek nevezünk, ha K

Mesterséges Intelligencia MI

Operációkutatás vizsga

Készítette: Trosztel Mátyás Konzulens: Hajós Gergely

Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok

A hazai elszámolásforgalom hálózati elemzése

Diszkrét matematika 2.

Gráfalgoritmusok ismétlés ősz

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Genetikus algoritmusok

Exact inference in general Bayesian networks

Véletlen gráfok, hálózatok

1. tétel - Gráfok alapfogalmai

INFORMATIKA javítókulcs 2016

Diszkrét matematika 2.

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

AliROOT szimulációk GPU alapokon

értékel függvény: rátermettségi függvény (tness function)

Hálózati elemzések az üzleti életben. Kovács Gyula Sixtep Kft.

Sapientia - Erdélyi Magyar TudományEgyetem (EMTE) Csíkszereda IRT- 4. kurzus. 3. Előadás: A mohó algoritmus

(Independence, dependence, random variables)

[Biomatematika 2] Orvosi biometria

CSOPORTOSULÁSOK SZOCIOLÓGIAI, TECHNOLÓGIAI ÉS BIOLÓGIAI HÁLÓZATOKBAN

Diszkrét Matematika MSc hallgatók számára 7. Előadás Párosítási tételek Előadó: Hajnal Péter Jegyzetelő: Kovácsházi Anna

Csima Judit BME, SZIT február 18.

Keresések Gregorics Tibor Mesterséges intelligencia

Numerikus matematika vizsga

Saj at ert ek-probl em ak febru ar 26.

Biomatematika 2 Orvosi biometria

Algoritmuselmélet. Legrövidebb utak, Bellmann-Ford, Dijkstra. Katona Gyula Y.

Király Zoltán, Kondé Zoltán, Kovács Antal, Lévai Annamária 2006

Problémás regressziók

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

3D számítógépes geometria és alakzatrekonstrukció

Számítógép és programozás 2

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

HAMILTON ÚT: minden csúcson PONTOSAN egyszer áthaladó út

Minimális feszítőfák Legyen G = (V,E,c), c : E R + egy súlyozott irányítatlan gráf. Terjesszük ki a súlyfüggvényt a T E élhalmazokra:

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Társadalmi és gazdasági hálózatok modellezése

Párhuzamos programozási feladatok

Mesterséges Intelligencia MI

HAMILTON KÖR: minden csúcson PONTOSAN egyszer áthaladó kör. Forrás: (

Komplex hálózatok: alapfogalmak, modellek, módszerek

ACM Snake. Orvosi képdiagnosztika 11. előadás első fele

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa:

Klaszterelemzés az SPSS-ben

Konjugált gradiens módszer

22. GRÁFOK ÁBRÁZOLÁSA

Diszkrét matematika 1. estis képzés

A Barabási-Albert-féle gráfmodell

Diszkrét matematika 2.C szakirány

RHadoop. Kocsis Imre Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Átírás:

Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István

Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a felhasználásával, valamint esetleges hierarchikus szerveződések feltárása

Közösség detekció Csoportosulások keresése gráfokban Jellemzők: Csoportokon belül sok, kívül kevés él Erdős-Rényi gráf modellben esélytelen Közösségek: Klaszterek Modulok Csoportok Felhasználási területek: biológia, bioinformatika, számítás tudomány, politika,

Zachary-gráf Szociális kapcsolatok

Közös publikációk Santa Fe Institute

Asszociációs kísérlet Példa a csoportok átfedésére Egy pont nem feltétlenül egy csoporthoz tartozik

A közösség detekció alapelemi közösségen beül várhatóan több az él Gráfok csúcshalmazának jellemzése Klaszteren belüli eloszlás Klaszterek közötti eloszlás

Közösségek definíciói Lokális definíció (jellemző) Mindenki mindenkinek a barátja Klikk, n-klikk, n-klán, n-klub, k-plex, k-core Élkapcsolat, lambda halmaz, relatív fokszám eloszlás Globális definíció Random gráftól való eltérés (modularitás) Csúcs hasonlóság alapú definíció Euklideszi távolság, koszinusz hasonlóság, átfedés, Pearson korreláció, élkapcsolat

Módszerek: gráf partícionálás Csúcsok 2 halmazba osztása minimális klaszterek közötti élszám mellett + kiegyenlített Kernighan-Lin algoritmus Két részre osztás majd cserélgetés Spektrális algoritmus Laplace mátrix Legkisebb nem 0 sajátértékhez tartozó sajátvektor

Spektrális algoritmus: L = 1 0-1 0 0 0 0 1-1 0 0 0-1 -1 3-1 0 0 0 0-1 3-1 -1 0 0 0-1 1 0 0 0 0-1 0 1 V = -0.1845 0.2887-0.2780 0.6502 0.4647-0.4082-0.1845 0.2887 0.2780-0.6502 0.4647-0.4082 0.6572-0.5774-0.0000 0.0000 0.2610-0.4082-0.6572-0.5774-0.0000-0.0000-0.2610-0.4082 0.1845 0.2887 0.6502 0.2780-0.4647-0.4082 0.1845 0.2887-0.6502-0.2780-0.4647-0.4082 D = 4.5616 0 0 0 0 0 0 3.0000 0 0 0 0 0 0 1.0000 0 0 0 0 0 0 1.0000 0 0 0 0 0 0 0.4384 0 0 0 0 0 0-0.0000 1 2 3 4 5 6

Módszerek: gráf partícionálás 2 Maximális folyam minimális vágás conductance c vágás költsége k halmaz fokszáma vágási arány n csúcsok száma

Módszerek: hierarchikus klaszterezés Nem tudjuk előre a klaszterek számát, nem is kell Agglomeratív algoritmusok Single linkage Complate linkage Avarage linkage Divizív algoritmusok

Módszerek: partíciós klaszterezés Előre definiált klaszterszám (k) Minimum k-clustering (átmérő min) k-clustering sum (átlagos átmérő min) k-center (centertől való max távolság min) k-median (centertől való átlagos táv. min) k-means (centertől való négyzetes távolságösszegek min.) Fuzzy k-means

Divizív algoritmusok Hierarchikus: hasonlóság alapján vág Girvan Newman algoritmus él központiság számítása bármely két pont pár között a legrövidebb utak hányszor érintik ugyan azt az élet a legközpontibb él mentén kell vágni a gráfot

Girvan-Newman algoritmus 2 Random-walk alapú él-központiság Még ritka gráfok esetén is 10 000 csúcs a felső határa az algoritmusnak Könnyen adaptálható súlyozott élek esetén Tyler et al. gyorsítás Monte Carlo módszerrel mintavételezett pontok közt mért csak központiságot A közösséghatáron fekvő pontok bizonytalan kalszterezése ebből adódik, hogy mely közösségek fednek át

Modularitás Random gráftól való különbözőség A: szomszédsági mátrix P: szomszédsági valószínűség m: élek száma Közelítése: k: fokszám súlyozott élekkel

Modularitás alapú algoritmusok Mohó módszer (Newman): Kezdetben minden csúcs külön klaszter Nincs egy él sem behúzva Adjuk hozzá azt az élet amely növeli a modularitást Modularitás mindig az eredeti gráf alapján vannak számolva Ha egy klaszteren belül húzunk be egy élet, az nem változtat a modularitáson csúcshalmazok egyesítése A módszernek sok javítása született, mind sebesség, mind az optimum közelítése szempontokból

Blondel et al. 2008 Minden csúcs külön közösség Majd sorban a csúcsokhoz hozzáveszi a szomszédait, amíg a modularitás nem csökken (iteratívan) hierarchia

Modularitás alapú algoritmusok Szimulált hűtés Lokális mozgatás: véletlen módon egy csúcs átkerül egy másik csoportba Globális mozgatás: csoportok vágása és egyesítése Jó közelítést ad a globális optimumra, de lassú Genetikus algoritmusok Modularitást használva fitness értékként

Modularitás alapú algoritmusok Spektrális módszer: modularitás: legyen: Vegyük a Laplace mátrix helyett a B mátrixot Vágjuk ketté a gráfot rekurzívan, amíg nő a modularitás (legkisebb nem 0 sajátértékhez tartozó sajátvektor alapján) Vegyük a k legkisebb (nem 0) sajátértékhez tarozó sajátvektorból álló nxk méretű mátrixot. Ennek a sorai reprezentálnak egy k dimenziós pontot. Klaszterezzük ezeket k klaszterbe.

Spektrális módszerek Laplace mátrix sajátvektorok + klaszterezés (bal) Jobb-sztochasztikus szomszédsági mátrix (jobb) + sajátvektorok lépcsősek

Címke terjesztés Legyen minden csúcsnak egyedi címkéje Iteratívan (minden csúcsra): legyen a csúcs címkéje a leggyakoribb a szomszédos címkék közül ha több leggyakoribb van, akkor véletlenszerűen közülük folytassuk, amíg már csak kevés csúcs címkéje változik az iterációk során

Klikk perkoláció Vegyük a k méretű klikkeket a gráfban Két k méretű klikk szomszédos ha k-1 csúcsuk megegyezik Egy k-klikk lánc a szomszédos klikkek sorozata A közösségek pedig a leghosszabb láncok uniója