Közösségek keresése nagy gráfokban

Hasonló dokumentumok
A számítástudomány alapjai

Algoritmuselmélet. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 13.

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa:

Algoritmuselmélet. Bonyolultságelmélet. Katona Gyula Y.

Közösség detektálás gráfokban

Algoritmuselmélet. Gráfok megadása, szélességi bejárás, összefüggőség, párosítás. Katona Gyula Y.

Algoritmuselmélet. Legrövidebb utak, Bellmann-Ford, Dijkstra. Katona Gyula Y.

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

Diszkrét matematika 2.

Algoritmuselmélet. Mélységi keresés és alkalmazásai. Katona Gyula Y.

Algoritmuselmélet. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 12.

Gráfalgoritmusok ismétlés ősz

Algoritmuselmélet 1. előadás

Diszkrét matematika 2. estis képzés

Diszkrét matematika 2.C szakirány

Algoritmuselmélet. Függvények nagyságrendje, elágazás és korlátozás, dinamikus programozás. Katona Gyula Y.

Diszkrét matematika 2.C szakirány

Klasztervizsgálat, keresés hálózatokban

Kiegészítő részelőadás 1. Az algoritmusok hatékonyságának mérése

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t

Melykeres(G) for(u in V) {szin(u):=feher Apa(u):=0} for(u in V) {if szin(u)=feher then MBejar(u)}

SzA II. gyakorlat, szeptember 18.

KOVÁCS BÉLA, MATEMATIKA I.

KOMBINATORIKA ElŐADÁS Matematika BSc hallgatók számára. Klikkek gráfokban-1. Definíció. Egy G gráfban egy K V(G) csúcshalmazt klikknek nevezünk, ha K

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

Diszkrét matematika 2.C szakirány

Sali Attila Budapest Műszaki és Gazdaságtudományi Egyetem. I. B. 137/b március 16.

Diszkrét matematika 2. estis képzés

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

Algoritmuselmélet. Függvények nagyságrendje, elágazás és korlátozás, dinamikus programozás. Katona Gyula Y.

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Érdemes egy n*n-es táblázatban (sorok-lányok, oszlopok-fiúk) ábrázolni a két színnel, mely éleket húztuk be (pirossal, kékkel)

Szalai Péter. April 17, Szalai Péter April 17, / 36

Gráfok 2. Legrövidebb utak, feszítőfák. Szoftvertervezés és -fejlesztés II. előadás. Szénási Sándor

Számítógépes döntéstámogatás. Genetikus algoritmusok

Algoritmuselmélet 1. előadás

Melykeres(G) for(u in V) {szin(u):=feher Apa(u):=0} for(u in V) {if szin(u)=feher then MBejar(u)}

Logika és számításelmélet. 11. előadás

Számítógép hálózatok, osztott rendszerek 2009

Diszkrét matematika 1. estis képzés

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Melykeres(G) for(u in V) {szin(u):=feher Apa(u):=0} for(u in V) {if szin(u)=feher then MBejar(u)}

Diszkrét matematika I.

Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK

A számítástudomány alapjai. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem

22. GRÁFOK ÁBRÁZOLÁSA

bármely másikra el lehessen jutni. A vállalat tudja, hogy tetszőlegesen adott

1. tétel - Gráfok alapfogalmai

Diszkrét matematika 2.C szakirány

út hosszát. Ha a két várost nem köti össze út, akkor legyen c ij = W, ahol W már az előzőekben is alkalmazott megfelelően nagy szám.

Diszkrét matematika 2. estis képzés

Szimmetrikus kombinatorikus struktúrák MSc hallgatók számára. Ramsey-gráfok

Bonyolultságelmélet gyakorlat 06 Gráfos visszavezetések II.

Társadalmi és gazdasági hálózatok modellezése

30. ERŐSEN ÜSSZEFÜGGŐ KOMPONENSEK

Algoritmuselmélet 18. előadás

7. Régió alapú szegmentálás

4. Fuzzy relációk. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI

Gráfelmélet/Diszkrét Matematika MSc hallgatók számára. 13. Előadás

Diszkrét matematika 2.C szakirány

Bonyolultságelmélet. Monday 10 th October, 2016, 17:44

Adatszerkezetek 2. Dr. Iványi Péter

Hálózati folyamok. A használt fogalmak definiálása

A Barabási-Albert-féle gráfmodell

Csima Judit október 24.

Diszkrét matematika 1. estis képzés

ELTE IK Esti képzés tavaszi félév. Tartalom

Euler tétel következménye 1:ha G összefüggő síkgráf és legalább 3 pontja van, akkor: e 3

Sapientia - Erdélyi Magyar TudományEgyetem (EMTE) Csíkszereda IRT- 4. kurzus. 3. Előadás: A mohó algoritmus

Optimalizálási eljárások MSc hallgatók számára. 11. Előadás

Analízis I. Vizsgatételsor

Ramsey-féle problémák

Diszkrét matematika 2.

Diszkrét Matematika MSc hallgatók számára 7. Előadás Párosítási tételek Előadó: Hajnal Péter Jegyzetelő: Kovácsházi Anna

Adatbázisok elmélete 12. előadás

Komplex hálózatok: alapfogalmak, modellek, módszerek

Diszkrét Matematika MSc hallgatók számára. 11. Előadás. Előadó: Hajnal Péter Jegyzetelő: Szarvák Gábor november 29.

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

Gráfelméleti feladatok. c f

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

Algoritmuselmélet. Hashelés. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem

GRÁFELMÉLET. 7. előadás. Javító utak, javító utak keresése, Edmonds-algoritmus

Diszkrét matematika 2. estis képzés

Komplex hálózatok moduláris szerkezete

Diszkrét matematika 2.C szakirány

Csima Judit november 15.

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

Korlátozás és szétválasztás elve. ADAGOLO adattípus

1. ábra ábra

Formális nyelvek - 9.

Nagy Gábor compalg.inf.elte.hu/ nagy

Rendezések. A rendezési probléma: Bemenet: Kimenet: n számot tartalmazó (a 1,a 2,,a n ) sorozat

HAMILTON ÚT: minden csúcson PONTOSAN egyszer áthaladó út

Online migrációs ütemezési modellek

Diszkrét matematika 2.

Az optimális megoldást adó algoritmusok

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Diszkrét matematika 2. estis képzés

Adatszerkezetek II. 2. előadás

Átírás:

Közösségek keresése nagy gráfokban Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem 2011. április 14. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 1 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 2 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 3 / 66

Alapkérdés Kérdés Adott egy irányítatlan (súlyozott vagy súlyozatlan) G gráf. Keressünk benne összetartozó ponthalmazokat! Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 4 / 66

Triviális ötletek Vegyük az összefüggő komponenseket. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 5 / 66

Triviális ötletek Vegyük az összefüggő komponenseket. Vegyük a 2-szeresen összefüggő blokkokat. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 5 / 66

Triviális ötletek Vegyük az összefüggő komponenseket. Vegyük a 2-szeresen összefüggő blokkokat. Ezek legtöbbször nem sokat mutatnak. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 5 / 66

Triviális ötletek Vegyük az összefüggő komponenseket. Vegyük a 2-szeresen összefüggő blokkokat. Ezek legtöbbször nem sokat mutatnak. Néhány példa nagy gráfokra: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 5 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 6 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 7 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 8 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 9 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 10 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 11 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 12 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 13 / 66

Definíciók teljes részgráf: K k Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 14 / 66

Definíciók teljes részgráf: K k Klikk: teljes részgráf (ugyanaz, mint az előző) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 14 / 66

Definíciók teljes részgráf: K k Klikk: teljes részgráf (ugyanaz, mint az előző) k-klikk: ha ez épp k méretű Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 14 / 66

Definíciók teljes részgráf: K k Klikk: teljes részgráf (ugyanaz, mint az előző) k-klikk: ha ez épp k méretű Maximális klikk (maximal clique): nem bővíthető teljes részgráf Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 14 / 66

Definíciók teljes részgráf: K k Klikk: teljes részgráf (ugyanaz, mint az előző) k-klikk: ha ez épp k méretű Maximális klikk (maximal clique): nem bővíthető teljes részgráf Maximális méretű klikk: (maximum size clique) a legnagyobb méretű klikk (ezt ugyse használjuk) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 14 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 15 / 66

Alapötlet A gráfot úgy tekintsük, mintha az éleken keresztül infomáció jutna el az egyik pontból a másikba. De az információ csak akkor terjed el, ha elég meggyőző. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 16 / 66

Alapötlet A gráfot úgy tekintsük, mintha az éleken keresztül infomáció jutna el az egyik pontból a másikba. De az információ csak akkor terjed el, ha elég meggyőző. Egy új ember csak akkor hiszi el, ha már k ismerősétől hallotta. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 16 / 66

Alapötlet A gráfot úgy tekintsük, mintha az éleken keresztül infomáció jutna el az egyik pontból a másikba. De az információ csak akkor terjed el, ha elég meggyőző. Egy új ember csak akkor hiszi el, ha már k ismerősétől hallotta. Palla G., Derényi I., Farkas I., Vicsek T.: Uncovering the Overlapping Community Structure of Complex Networks in Nature and Society. Nature. 435, 814-818. (2005) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 16 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = az ekvivalencia osztályok a k-klikk közösségek. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = az ekvivalencia osztályok a k-klikk közösségek. Ez megad egy klaszterezést a pontok között is. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = az ekvivalencia osztályok a k-klikk közösségek. Ez megad egy klaszterezést a pontok között is. (Egy pont több halmazban is benne lehet.) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = az ekvivalencia osztályok a k-klikk közösségek. Ez megad egy klaszterezést a pontok között is. (Egy pont több halmazban is benne lehet.) Azaz: Legyen a H gráf pontjai a G gráf k-klikkjei. H két pontja szomszédos, ha a két klikknek k 1 közös pontja van. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Klikk görgetés Definíció Két k-klikk szomszédos, ha k 1 közös pontjuk van. Egy c 1 klikkből elérhető egy c m klikk, ha van olyan c 1, c 2,..., c m klikksorozat, hogy bármely c i és c i+1 szomszédos. Definíció k-klikk közösség: Két klikk akkor van egy k-klikk közösségben, ha az egyik elérhető a másikból. Mivel ez ekvivalencia reláció = az ekvivalencia osztályok a k-klikk közösségek. Ez megad egy klaszterezést a pontok között is. (Egy pont több halmazban is benne lehet.) Azaz: Legyen a H gráf pontjai a G gráf k-klikkjei. H két pontja szomszédos, ha a két klikknek k 1 közös pontja van. A k-klikk közösségek a H összefüggő komponensei. university-logo Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 17 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 3: Nem ugyanaz, mint a 2-összefüggő komponensek. university-logo Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 18 / 66

Példa k = 4: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 19 / 66

Példa k = 4: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 19 / 66

Példa k = 4: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 19 / 66

Példa k = 4: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 19 / 66

Példa k = 4: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 19 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 20 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 21 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 22 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 23 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Output: A közösségek. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Output: A közösségek. Algoritmus: k-klikkek felsorolása Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Output: A közösségek. Algoritmus: k-klikkek felsorolása Segédgráf generálása Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Output: A közösségek. Algoritmus: k-klikkek felsorolása Segédgráf generálása Komponensek megkeresése Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Algoritmikus kérdések Input: n pontú, e élű G gráf (esetleg eredetileg súlyozott), k szám Output: A közösségek. Algoritmus: k-klikkek felsorolása Segédgráf generálása Komponensek megkeresése Ez k = 3-ra még egész gyors, de már 10-re lassú lehet. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 24 / 66

Klikkek felsorolása Klikk nagyon sok lehet, és még egy szokásos gráfban is tényleg elég sok van. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 25 / 66

Klikkek felsorolása Klikk nagyon sok lehet, és még egy szokásos gráfban is tényleg elég sok van. Helyette keressük meg a maximális klikkeket. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 25 / 66

Klikkek felsorolása Klikk nagyon sok lehet, és még egy szokásos gráfban is tényleg elég sok van. Helyette keressük meg a maximális klikkeket. Ebből is lehet sok: 3 n 3 = T n 3,3 Turán gráf ( n 3 osztály, mindegyikben 3 pont.) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 25 / 66

Klikkek felsorolása Klikk nagyon sok lehet, és még egy szokásos gráfban is tényleg elég sok van. Helyette keressük meg a maximális klikkeket. Ebből is lehet sok: 3 n 3 = T n 3,3 Turán gráf ( n 3 osztály, mindegyikben 3 pont.) De a szóbajövő, gyakorlati alkalmazásokban ebből már rendszerint nincs sok. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 25 / 66

Klikkek felsorolása Klikk nagyon sok lehet, és még egy szokásos gráfban is tényleg elég sok van. Helyette keressük meg a maximális klikkeket. Ebből is lehet sok: 3 n 3 = T n 3,3 Turán gráf ( n 3 osztály, mindegyikben 3 pont.) De a szóbajövő, gyakorlati alkalmazásokban ebből már rendszerint nincs sok. Megfigyelés Egy maximális klikk megkeresése gyors: mohó algoritmus Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 25 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Bizonyítás vázlat: Definíció Legyen V = {v 1,..., v n }. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Bizonyítás vázlat: Definíció Legyen V = {v 1,..., v n }. Ha S V, akkor S i = S {v 1,..., v i }. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Bizonyítás vázlat: Definíció Legyen V = {v 1,..., v n }. Ha S V, akkor S i = S {v 1,..., v i }. Ha X, Y V és az (X Y ) (Y X)-ben levő legkisebb sorszámú pont X-ben van, akkor X lexikografikusan nagyobb, mint Y. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Bizonyítás vázlat: Definíció Legyen V = {v 1,..., v n }. Ha S V, akkor S i = S {v 1,..., v i }. Ha X, Y V és az (X Y ) (Y X)-ben levő legkisebb sorszámú pont X-ben van, akkor X lexikografikusan nagyobb, mint Y. Ha K egy klikk, akkor legyen C(K ) a K -t tartalmazó maximális klikkek közül a lexikografikusan legnagyobb. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

Algorimus maximális klikkek felsorolására Tétel (Makino, Uno (2004)) Van olyan algorimus, ami felsorolja az összes maximális klikket O(n 2.376 µ) időben, ahol µ a maximális klikkek száma. Bizonyítás vázlat: Definíció Legyen V = {v 1,..., v n }. Ha S V, akkor S i = S {v 1,..., v i }. Ha X, Y V és az (X Y ) (Y X)-ben levő legkisebb sorszámú pont X-ben van, akkor X lexikografikusan nagyobb, mint Y. Ha K egy klikk, akkor legyen C(K ) a K -t tartalmazó maximális klikkek közül a lexikografikusan legnagyobb. Világos, hogy C(K ) lex K. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 26 / 66

A maximális klikkek fája Legyen K 0 a lexikografikusan legnagyobb maximális klikk. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 27 / 66

A maximális klikkek fája Legyen K 0 a lexikografikusan legnagyobb maximális klikk. Definíció Egy K K 0 maximális klikk P(K ) szülője legyen C(K i 1 ), ahol i a legnagyobb olyan index, amire C(K i 1 ) K. Az ilyen i legyen a K szülő indexe: i(k ). Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 27 / 66

A maximális klikkek fája Legyen K 0 a lexikografikusan legnagyobb maximális klikk. Definíció Egy K K 0 maximális klikk P(K ) szülője legyen C(K i 1 ), ahol i a legnagyobb olyan index, amire C(K i 1 ) K. Az ilyen i legyen a K szülő indexe: i(k ). Ez K 0 -t kivéve mindenre definiál egyértelműen egy szülőt (K C(K 0 )). Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 27 / 66

A maximális klikkek fája Legyen K 0 a lexikografikusan legnagyobb maximális klikk. Definíció Egy K K 0 maximális klikk P(K ) szülője legyen C(K i 1 ), ahol i a legnagyobb olyan index, amire C(K i 1 ) K. Az ilyen i legyen a K szülő indexe: i(k ). Ez K 0 -t kivéve mindenre definiál egyértelműen egy szülőt (K C(K 0 )). Mivel a szülő lexikografikusan nagyobb, mint a gyerek, ezért ez egy gyökeres fa lesz. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 27 / 66

A maximális klikkek fája Legyen K 0 a lexikografikusan legnagyobb maximális klikk. Definíció Egy K K 0 maximális klikk P(K ) szülője legyen C(K i 1 ), ahol i a legnagyobb olyan index, amire C(K i 1 ) K. Az ilyen i legyen a K szülő indexe: i(k ). Ez K 0 -t kivéve mindenre definiál egyértelműen egy szülőt (K C(K 0 )). Mivel a szülő lexikografikusan nagyobb, mint a gyerek, ezért ez egy gyökeres fa lesz. Az összes algoritmus ezt a fát járja be valamilyen sorrendben. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 27 / 66

Példa 10 9 3 1 6 2 4 7 5 8 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 28 / 66

Példa 10 3 9 1,2,3,4 2,3,4,5 1,3,10 1 6 3,4,5,6 2,5,8 2 4 7 5,6,7 3,6,9 5 8 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 28 / 66

Szülő-gyerek meghatározása Adott K -ra könnyű megkeresni a szülőt: Vegyük csökkenő sorrendben az i-ket. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 29 / 66

Szülő-gyerek meghatározása Adott K -ra könnyű megkeresni a szülőt: Vegyük csökkenő sorrendben az i-ket. Egy i-re megnézzük, hogy a K i 1 -et milyen maximális klikk tartalmazza. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 29 / 66

Szülő-gyerek meghatározása Adott K -ra könnyű megkeresni a szülőt: Vegyük csökkenő sorrendben az i-ket. Egy i-re megnézzük, hogy a K i 1 -et milyen maximális klikk tartalmazza. Sorra nézzük, hogy v 1, v 2,... össze van-e kötve mindegyikkel. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 29 / 66

Szülő-gyerek meghatározása Adott K -ra könnyű megkeresni a szülőt: Vegyük csökkenő sorrendben az i-ket. Egy i-re megnézzük, hogy a K i 1 -et milyen maximális klikk tartalmazza. Sorra nézzük, hogy v 1, v 2,... össze van-e kötve mindegyikkel. Az összes gyerek előállítása: Definíció K [i] = C ((K i Γ(v i )) {v i }) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 29 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). c) K [i] i 1 = K i Γ(v i ) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). c) K [i] i 1 = K i Γ(v i ) d) K i = C(K i Γ(v i )) i Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). c) K [i] i 1 = K i Γ(v i ) d) K i = C(K i Γ(v i )) i a) és b) lineáris időben ellenőrizhető. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). c) K [i] i 1 = K i Γ(v i ) d) K i = C(K i Γ(v i )) i a) és b) lineáris időben ellenőrizhető. c) és d) még egy trükkel, gyors mátrix-szorzást alkalmazva, O(n 2.376 ) időben. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Lemma Legyenek K és K maximális klikkek. K akkor és csak akkor gyereke K -nak, ha valamilyen i-re K = K [i], hogy a) v i / K. b) i > i(k ). c) K [i] i 1 = K i Γ(v i ) d) K i = C(K i Γ(v i )) i a) és b) lineáris időben ellenőrizhető. c) és d) még egy trükkel, gyors mátrix-szorzást alkalmazva, O(n 2.376 ) időben. Ebből kijön az O(n 2.376 µ) futásidő. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 30 / 66

Közösségek megkeresése A maximális klikkekből készítünk egy fát, amiben két klikk szomszédos, ha a metszetük k 1. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 31 / 66

Közösségek megkeresése A maximális klikkekből készítünk egy fát, amiben két klikk szomszédos, ha a metszetük k 1. Ez elég a k-klikkek gráfja helyett. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 31 / 66

Közösségek megkeresése A maximális klikkekből készítünk egy fát, amiben két klikk szomszédos, ha a metszetük k 1. Ez elég a k-klikkek gráfja helyett. Megkeressük a komponenseket mondjuk szélességi kereséssel. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 31 / 66

Közösségek megkeresése A maximális klikkekből készítünk egy fát, amiben két klikk szomszédos, ha a metszetük k 1. Ez elég a k-klikkek gráfja helyett. Megkeressük a komponenseket mondjuk szélességi kereséssel. Ha két klikk egy közösségben van, akkor pontjaik is egy közösségben vannak. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 31 / 66

Közösségek megkeresése A maximális klikkekből készítünk egy fát, amiben két klikk szomszédos, ha a metszetük k 1. Ez elég a k-klikkek gráfja helyett. Megkeressük a komponenseket mondjuk szélességi kereséssel. Ha két klikk egy közösségben van, akkor pontjaik is egy közösségben vannak. Ez persze már nem ekvivalencia reláció. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 31 / 66

Mire tudjuk ezt használni? Lefuttatjuk k = 3, 4,...-ra, lerajzoljuk és nézegetjük, hogy látszik-e valami érdekes. Tudunk-e valamit mondani az egy közösségen belül levő pontokról? Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 32 / 66

Mire tudjuk ezt használni? Lefuttatjuk k = 3, 4,...-ra, lerajzoljuk és nézegetjük, hogy látszik-e valami érdekes. Tudunk-e valamit mondani az egy közösségen belül levő pontokról? Ez alapján kiválasztunk egy szimpatikus k-t és arról írnunk cikket. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 32 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 33 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 34 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 35 / 66

Hogyan rajzoljuk le a gráfot? Minden él legyen egy rugó, ami f (d(u, v) d 0 ) erővel húzza össze a csúcsokat. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 36 / 66

Hogyan rajzoljuk le a gráfot? Minden él legyen egy rugó, ami f (d(u, v) d 0 ) erővel húzza össze a csúcsokat. (A d 0 azért kell, hogy pl. teljes gráfra ne egy pontba menjen minden.) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 36 / 66

Hogyan rajzoljuk le a gráfot? Minden él legyen egy rugó, ami f (d(u, v) d 0 ) erővel húzza össze a csúcsokat. (A d 0 azért kell, hogy pl. teljes gráfra ne egy pontba menjen minden.) Minden nem-élhez pedig egy olyan rugót, ami f (d(u, v)) erővel taszítja a két csúcsot. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 36 / 66

Hogyan rajzoljuk le a gráfot? Minden él legyen egy rugó, ami f (d(u, v) d 0 ) erővel húzza össze a csúcsokat. (A d 0 azért kell, hogy pl. teljes gráfra ne egy pontba menjen minden.) Minden nem-élhez pedig egy olyan rugót, ami f (d(u, v)) erővel taszítja a két csúcsot. Van sok egyéb variáció: http://en.wikipedia.org/wiki/force-based_algorithms Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 36 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 37 / 66

Biológia Adott egy csomó protein, melyek között kísérletileg igazolt kölcsönhatások vannak = súlyozott gráf Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 38 / 66

Biológia Adott egy csomó protein, melyek között kísérletileg igazolt kölcsönhatások vannak = súlyozott gráf Ebből készítünk egy súlyozatlan gráfot, abban megkeressük a közösségeket. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 38 / 66

Biológia Adott egy csomó protein, melyek között kísérletileg igazolt kölcsönhatások vannak = súlyozott gráf Ebből készítünk egy súlyozatlan gráfot, abban megkeressük a közösségeket. A közösségekről észrevesszük, hogy az egy közösségen belül levőknek hasonló a biológiai funkciója. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 38 / 66

Biológia Adott egy csomó protein, melyek között kísérletileg igazolt kölcsönhatások vannak = súlyozott gráf Ebből készítünk egy súlyozatlan gráfot, abban megkeressük a közösségeket. A közösségekről észrevesszük, hogy az egy közösségen belül levőknek hasonló a biológiai funkciója. Ebből következtetni tudunk, hogy az ugyanott levőknek is valószínűleg hasonló, akkor is, ha eddig nem tudtunk róla. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 38 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 39 / 66

Súlyozottból súlyozatlan Kérdés Hogyan csinálunk súlyozatlan gráfot? Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 40 / 66

Súlyozottból súlyozatlan Kérdés Hogyan csinálunk súlyozatlan gráfot? Egy ügyesen meghatározott korlát alatti éleket elhagyjuk. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 40 / 66

Súlyozottból súlyozatlan Kérdés Hogyan csinálunk súlyozatlan gráfot? Egy ügyesen meghatározott korlát alatti éleket elhagyjuk. Kérdés Mi legyen a korlát? Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 40 / 66

Súlyozottból súlyozatlan Kérdés Hogyan csinálunk súlyozatlan gráfot? Egy ügyesen meghatározott korlát alatti éleket elhagyjuk. Kérdés Mi legyen a korlát? Úgy érdemes választani, hogy a közösségek ne legyenek se túl nagyok, se túl kicsik. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 40 / 66

Fázisátmenet Tétel Ha egy N pontú gráf éleit p c (k) valószínűséggel vesszük be egy véletlen gráfba, ahol p c (k) 1 [(k 1)N] 1 k 1 akkor nagy valószínűséggel egy nagy közösség lesz. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 41 / 66

Fázisátmenet Tétel Ha egy N pontú gráf éleit p c (k) valószínűséggel vesszük be egy véletlen gráfba, ahol p c (k) 1 [(k 1)N] 1 k 1 akkor nagy valószínűséggel egy nagy közösség lesz. Válasszuk a korlátot úgy, hogy kicsivel ez alatt legyen. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 41 / 66

Szociális hálók M. C. Gonzalez, H. J. Herrmann, J. Kertész and T. Vicsek Community structure and ethnic preferences in school friendship networks Physica A 379, (2007) 307-316. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 42 / 66

Szociális hálók M. C. Gonzalez, H. J. Herrmann, J. Kertész and T. Vicsek Community structure and ethnic preferences in school friendship networks Physica A 379, (2007) 307-316. Egy iskola diákjai között kiosztott kérdőíven bejelölik, hogy kik a barátaik. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 42 / 66

Szociális hálók M. C. Gonzalez, H. J. Herrmann, J. Kertész and T. Vicsek Community structure and ethnic preferences in school friendship networks Physica A 379, (2007) 307-316. Egy iskola diákjai között kiosztott kérdőíven bejelölik, hogy kik a barátaik. Ezen a gráfon megkeressük a közösségeket, és érdekeseket mondunk. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 42 / 66

Szociális hálók M. C. Gonzalez, H. J. Herrmann, J. Kertész and T. Vicsek Community structure and ethnic preferences in school friendship networks Physica A 379, (2007) 307-316. Egy iskola diákjai között kiosztott kérdőíven bejelölik, hogy kik a barátaik. Ezen a gráfon megkeressük a közösségeket, és érdekeseket mondunk. Fel lehet rajzolni a közösségek szomszédossági gráfját is. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 42 / 66

Szociális hálók M. C. Gonzalez, H. J. Herrmann, J. Kertész and T. Vicsek Community structure and ethnic preferences in school friendship networks Physica A 379, (2007) 307-316. Egy iskola diákjai között kiosztott kérdőíven bejelölik, hogy kik a barátaik. Ezen a gráfon megkeressük a közösségeket, és érdekeseket mondunk. Fel lehet rajzolni a közösségek szomszédossági gráfját is. IWIW is hasonló. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 42 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 43 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 44 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Tétel Adott egy N 0 méretű kezdeti gráf. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Tétel Adott egy N 0 méretű kezdeti gráf. Egy új pontot veszek hozzá. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Tétel Adott egy N 0 méretű kezdeti gráf. Egy új pontot veszek hozzá. Ezt összekötöm m r N véletlenül kiválasztott ponttal. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Tétel Adott egy N 0 méretű kezdeti gráf. Egy új pontot veszek hozzá. Ezt összekötöm m r N véletlenül kiválasztott ponttal. Az eddigi szomszédok szomszédaiból is még összekötöm m s N darabbal. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Új véletlen gráf modell szociális hálókra R. Toivonen, J.-P. Onnela, J. Saramäki, J. Hyvönen, and K. Kaski A Model for Social Networks Physica A, 371(2), 851-860, (2006) A szociális hálók véletlen gráfok, de a paraméterei különböznek az Erdős-Rényi modell által kapottaktól. = Új véletlen gráf modell kell. Tétel Adott egy N 0 méretű kezdeti gráf. Egy új pontot veszek hozzá. Ezt összekötöm m r N véletlenül kiválasztott ponttal. Az eddigi szomszédok szomszédaiból is még összekötöm m s N darabbal. Ha egy ilyen gráfra megnézem a közösségeket, akkor olyanok lesznek, mint az igazi szociális hálóknál. university-logo Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 45 / 66

Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 46 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 47 / 66

Súlyozott klikkek Definíció Egy súlyozott gráfban egy klikk intenzitása legyen a súlyok mértani közepe. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 48 / 66

Súlyozott klikkek Definíció Egy súlyozott gráfban egy klikk intenzitása legyen a súlyok mértani közepe. Két klikk akkor van egy közösségben, ha mindkettő intenzitása legalább I és elérhetők egymásból > I intenzitású klikkek sorozatán. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 48 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 49 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Az így kapott v k pont és v i közé felveszünk egy új élet 1 súllyal ha nem volt él, Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Az így kapott v k pont és v i közé felveszünk egy új élet 1 súllyal ha nem volt él, különben a meglévő él súlyát növeljük δ-val. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Az így kapott v k pont és v i közé felveszünk egy új élet 1 súllyal ha nem volt él, különben a meglévő él súlyát növeljük δ-val. Közben a 2 hosszú út éleinek súlyát is növeljük δ-val. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Az így kapott v k pont és v i közé felveszünk egy új élet 1 súllyal ha nem volt él, különben a meglévő él súlyát növeljük δ-val. Közben a 2 hosszú út éleinek súlyát is növeljük δ-val. p r valószínűséggel behúzunk egy új élet. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

Új modell a szociális háló változásaira Definíció Adott egy szociális háló, élei súlyozottak. Minden lépésben három dolog közül választunk: Egy véletlenül kiválasztott v i pontból véletlenül elindulunk valamelyik szomszédjába az élek súlyaival arányos valószínűséggel. A v j szomszédba érve ezt mégegyszer megcsináljuk, csak v i -t kihagyjuk a számításból. Az így kapott v k pont és v i közé felveszünk egy új élet 1 súllyal ha nem volt él, különben a meglévő él súlyát növeljük δ-val. Közben a 2 hosszú út éleinek súlyát is növeljük δ-val. p r valószínűséggel behúzunk egy új élet. p d valószínűséggel kitöröljük egy pontól induló összes élet. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 50 / 66

A paraméterek különböző esetén megnézzük, hogy a súlyozott közösségek olyanok lesznek-e, mint a valóságban. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 51 / 66

A paraméterek különböző esetén megnézzük, hogy a súlyozott közösségek olyanok lesznek-e, mint a valóságban. δ = 0, δ = 0.1 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 51 / 66

A paraméterek különböző esetén megnézzük, hogy a súlyozott közösségek olyanok leesznek-e, mint a valóságban. δ = 0.5, δ = 1 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 52 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 53 / 66

Megfigyelés A megfelelő k kiválasztása nem világos, hogyan történik. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 54 / 66

Megfigyelés A megfelelő k kiválasztása nem világos, hogyan történik. Ha a gráfra úgy tekintünk, mint információk terjedésének modellje: Ha pl. két K 5 metszete 3, akkor az egyik klikkből eljut a másikba az info. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 54 / 66

Megfigyelés A megfelelő k kiválasztása nem világos, hogyan történik. Ha a gráfra úgy tekintünk, mint információk terjedésének modellje: Ha pl. két K 5 metszete 3, akkor az egyik klikkből eljut a másikba az info. De ha két K 100 metszete 3, akkor nem. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 54 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, bármely két S-beli pontra teljesül, hogy van egy őket tartalmazó olyan klikksorozat, melyre, ha két szomszédos klikk mérete k és l, metszetük pedig m, akkor f (k, l, m) > r, ahol p, q N, r R, f (k, l, m) : N N N R a modell paraméterei. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, bármely két S-beli pontra teljesül, hogy van egy őket tartalmazó olyan klikksorozat, melyre, ha két szomszédos klikk mérete k és l, metszetük pedig m, akkor f (k, l, m) > r, ahol p, q N, r R, f (k, l, m) : N N N R a modell paraméterei. p = q = 3, f (k, l, m) = 0, r = 1 = Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, bármely két S-beli pontra teljesül, hogy van egy őket tartalmazó olyan klikksorozat, melyre, ha két szomszédos klikk mérete k és l, metszetük pedig m, akkor f (k, l, m) > r, ahol p, q N, r R, f (k, l, m) : N N N R a modell paraméterei. p = q = 3, f (k, l, m) = 0, r = 1 = nemtrivi klikkek Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, bármely két S-beli pontra teljesül, hogy van egy őket tartalmazó olyan klikksorozat, melyre, ha két szomszédos klikk mérete k és l, metszetük pedig m, akkor f (k, l, m) > r, ahol p, q N, r R, f (k, l, m) : N N N R a modell paraméterei. p = q = 3, f (k, l, m) = 0, r = 1 = nemtrivi klikkek f (k, l, m) = m = Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

P. P. Zubcsek, I. Chowdhury and Zsolt Katona Information communities: The network structure of communication kézirat Definíció Legyen S a pontok egy részhalmaza. S-et akkor hívjuk információs közösségnek, ha S > p, minden pont benne van egy q pontú klikkeben, bármely két S-beli pontra teljesül, hogy van egy őket tartalmazó olyan klikksorozat, melyre, ha két szomszédos klikk mérete k és l, metszetük pedig m, akkor f (k, l, m) > r, ahol p, q N, r R, f (k, l, m) : N N N R a modell paraméterei. p = q = 3, f (k, l, m) = 0, r = 1 = nemtrivi klikkek f (k, l, m) = m = (m + 1)-közösségek (Palla, Vicsek) Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 55 / 66

Hogyan definiáljuk az f függvényt? Modell: Ha az információt megtudja valaki, akkor mindenki aki vele egy maximális klikkben van, szintén azonnal megtudja (egyszerre tudja meg mindenki). Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 56 / 66

Hogyan definiáljuk az f függvényt? Modell: Ha az információt megtudja valaki, akkor mindenki aki vele egy maximális klikkben van, szintén azonnal megtudja (egyszerre tudja meg mindenki). Utána minden élen δ valószínűséggel terjed az info. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 56 / 66

Hogyan definiáljuk az f függvényt? Modell: Ha az információt megtudja valaki, akkor mindenki aki vele egy maximális klikkben van, szintén azonnal megtudja (egyszerre tudja meg mindenki). Utána minden élen δ valószínűséggel terjed az info. Megfigyelés Egyik k méretű maximális klikkből, akkor jut át az info egy l méretűbe, ha a metszetük elég nagy részt kitesz: m k + l > r. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 56 / 66

Hogyan definiáljuk az f függvényt? Megfigyelés Egy kis maximális klikkből nem jól megy át az info egy nagyba: kl (k + l) 2 > r. Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 57 / 66

Hogyan definiáljuk az f függvényt? Megfigyelés Egy kis maximális klikkből nem jól megy át az info egy nagyba: kl (k + l) 2 > r. = f (k, l, m) = 8klm (k + l) 3 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 57 / 66

Tartalom 1 Alapkérdés 2 k-klikk perkoláció Alkalmazások 3 Súlyozott k-klikk perkoláció Alkalmazás 4 Normált klikk perkoláció 5 Szigorú klikk perkoláció 6 Osztályozás véletlen sétákkal Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 58 / 66

Másik probléma Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 59 / 66

Másik probléma k=3 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 59 / 66

Másik probléma k=3 k=4 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 59 / 66

Másik probléma k=3 k=4 k=5 Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 59 / 66

Másik probléma k=3 k=4 k=5 Ez kell Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 59 / 66

Más megközelítés Tekinthetjük úgy is a gráfot, mintha csak a maximális klikkeket keresnénk, csak bizonyos élek (hibásan) nincsenek berajzolva Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 60 / 66

Más megközelítés Tekinthetjük úgy is a gráfot, mintha csak a maximális klikkeket keresnénk, csak bizonyos élek (hibásan) nincsenek berajzolva Hasonló megközelítés, hogy az élek majdnem tranzitív relációt jelölnek Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 60 / 66

Más megközelítés Tekinthetjük úgy is a gráfot, mintha csak a maximális klikkeket keresnénk, csak bizonyos élek (hibásan) nincsenek berajzolva Hasonló megközelítés, hogy az élek majdnem tranzitív relációt jelölnek Ilyenkor pl. ezt nem akarjuk egy közösségnek: Katona Gyula Y. (BME SZIT) Közösségek keresése nagy gráfokban 2011. április 14. 60 / 66