Komplex hálózatok: alapfogalmak, modellek, módszerek London András, Németh Tamás 2015. április 13.
Motiváció Alapfogalmak Centralitás mértékek Néhány gráfmodell Hálózatok mindenhol! ábra 1: Facebook kapcsolati háló Közösségek
Hálózatok mindenhol! ábra 2: 9/11 terrorista hálózat (kapcsolatok, pénzáramlás). Bármely két pont legfeljebb 2 távolságra van egymástól. Forrás: Paul Sperry, NY Post
Motiváció Alapfogalmak Centralitás mértékek Néhány gráfmodell Hálózatok mindenhol! ábra 3: Európai légi közlekedési hálózat dinamikusan. Közösségek
Hálózatok mindenhol! ábra 4: Az USA elektromos ellátó rendszere. 2003.08.14-én az észak-keleti áramellátás teljesen leállt.
Hálózatok mindenhol! ábra 5: A Trónok harca szerepl inek interakciói (1-2. évad). Az élek vastagsága a találkozások számával arányos.
Mit l komplex? Sok egymással kapcsolatban álló és egymásra ható szerepl Adaptivitás: visszajelzés, kooperáció Növekedés, evolúció Nincs linearitás: Az egész több, mint a részek összessége!
Gráfok Deníció (Gráf) G := (V, E) gráf, ahol V = (1, 2..., N) a gráf csúcsai és E V V a gráf élei. ábra 6: Gráfok, alapfogalmak. (Forrás: Aaron Clauset, Network Analysis and Modelling course)
Gráfreprezentációk ábra 7: Gráfreprezentációk: Szomszédsági mátrix, szomszéd lista, éllista (Forrás: Aaron Clauset, Network Analysis and Modelling course)
Fokszámok, utak, komponensek A = [a ij ] R n n G szomszédsági mátrixa: i pont foka: k i = n j=1 a ij Fokszámeloszlás: P(egy véletlenül választott pont foka k) Út: csúcsok sorozata, (i, j, k,..., m, n), ahol az egymást követ csúcsok között van él; legrövidebb út két pont között: az összes lehetséges út közül a legrövidebb. Komponens, er sen összefügg komponens, stb.
Mennyire fontosak a hálózat pontjai? struktúrális tulajdonság szempontjából, például magas fokszámú a központban van valamilyen dinamikus folyamat szempontjából fontos (pl. fert zés terjedés, véletlen bolyongás) = Centralitás Minél centrálisabb annál fontosabb, minél kevésbé centrális annál kevésbé fontos
Fokszám Nagyobb fokszám fontosabb pont k i = n a j=1 ij; irányított: ki be = n a j=1 ji, ki ki = n a j=1 ij ábra 8: Be- és kifok centralitás.
Közelség (closenes), köztiség (betweennes) Closeness: mennyire van a központban a pont átlagosan milyen hosszúak a pontból induló legröviebb utak a hálózat többi pontjába C(i) = n 1 i j l, ij ahol l ij az i és j közti legrövidebb út hossza. = Számolás: Floyd-Warshall algoritmus ábra 9: Mennyi X és Y closeness értéte?
ábra 10: Mennyi X és Y betweennes értéte? Közelség (closenes), köztiség (betweennes) Betweenness: Két pont milyen messze van egymástól, ha át kell menni egy kijelölt harmadik ponton BC(k) = σ ij (k), σ ij i k j ahol σ ij a i és j közötti legrövidebb utak száma, σ ij (k) pedig azon legrövidebb i j utak száma, melyek átmennek k-n = Szorgalmi: gondolkozzunk egy O(nm) futási idej BC számító algoritmuson (m a gráf éleinek száma)
Sajátérték, PageRank Alapötlet: nem minden szomszéd egyforma súllyal számít a centralitás kiszámításánal Rekurzív formula: x (t+1) i = n j=1 w ij x (t) j Minél fontosabb a szomszéd, annál jobban járul hozzá az adott pont fontosságához Mátrix formában: Ax = λ 1 x, ahol λ 1 az A mátrixhoz tartozó legnagyobb sajátérték
Sajátérték, PageRank Mi a helyzet ha a gráf nem összefügg? = Véletlen szörföz, ld. Google keres motor 1 Rekurzió: PR(i) 1 λ n + λ j N + (i) PR(j) k ki (j), ahol λ [0, 1] paraméter (ugró faktor), N + (i) az i pont be-szomszédsága 1 Brin & Page, Computer networks and ISDN systems,1998
Gráfmodellek Milyen általános közös tulajdonságai vannak tipikus gráfoknak? Tudjuk-e valamilyen modellel közelíteni a valóságban megjelen hálózatokat? A különböz területeken (társadalom, gazdaság, biológia, technológia) megjelen hálózatok modelljei között mik a legfontosabb különbségek/hasonlóságok?
Erd s-rényi modell 2 G(n, p) minden élt p [0, 1] valószín séggel húzunk be, egymástól függetlenül élek száma várhatóan: ( n 2) p átlagos fokszám: k = (n 1)p fokszámeloszlás: ( ) n 1 P(k i = k) = p k (1 p) n 1 k, k azaz binomiális. Fontos és rendkívül sokat vizsgált matematikai modell A valóságban megjelen hálózatok jellemz en nem ilyen típusúak! 2 Erd s & Rényi, 1959
Kisvilág gráfok Stanley Milgram (1933-84) kísérlete: véletlenül kiválasztott emberek küldjenek egy levelet egy közeli ismer snek, hogy az szintén továbbküldje így, azzal a céllal, hogy egy általuk valószín leg ismeretlen bostoni orvoshoz eljusson végül a levél A 64 levél az USA 64 különböz pontjáról átlagosan 5.5 levélváltás után célba ért = Kicsi átmér : A legtávolabbi pontok sincsenek túl messzire egymstól... További fontos jellemz : háromszögek száma nagy
Watts-Strogatz modell 3 Kiindul egy 4-reguláris gráfból (minden pont foka 4) Minden élt p valószín séggel átdrótoz ( azaz (i, j) él esetén választunk véletlenül egy k pontot, és p valószín séggel töröljük (i, j)-t és behúzzuk (i, k)-t) = log n az átmér ; Ha (i, j) és (i, k) is él, akkor nagy valószín séggel (j, k) is az (azaz háromszövek száma nagy) 3 Watts & Strogatz, Nature, 1998
Barabási-Albert modell 4 Genaratív modell hogyan fejl dhet ki egy hálózat? A preferential attachment modell: 1 kezetben egy összefügg G 0 gráf n 0 ponton 2 t id pontban hozzáadunk G t -hez egy új v pontot P(v -t összekötjük egy meglév i-vel) = k i j k j 4 Barabási & Albert, Science, 1999
Barabási-Albert modell Úgynevezett skálafüggetlen hálózatot kapunk: P(k i = k) k α Hatványtörvény szerinti fokszámeloszlás: néhány pont foka nagy, viszont a legtöbb pontnak csak kevés szomszédja van Átlagos úthossz: l ln n/ ln ln n A valóságban számos hálózat ilyen tulajdonságot mutat: szociális hálók, pénzügyi hálózatok, WWW, biológiai hálózatok, közlekedési hálózatok, stb.
Közösségek Nagyméret szervez dési mintázatok keresése Bizonyos pontok hasonlóbbak/ közelebb vannak egymáshoz, míg más pontoktól távol helyezkednek el ábra 11: Hálózat három közösséggel.
Közösségek - modularitás Az adott gráf mennyire tér el egy ugyanolyan fokszámeloszlású véletlen gráftól? Modulartás = #{közösségen belüli élek} E[#{közösségen belüli élek}) egy azonos fokszámeloszlású véletlen gráfban] Newman-modularitás 5 Q = 1 2M (a ij p ij )δ(c i, C j ), i,j δ a Dirac-delta függvény, p ij pedig annak a valoszín sége, hogy i és j össze van kötve egy véletlen (null-modell) gráfban Szorgalmi: gondolkozzunk közösség keres algorimusban, melynek lényege a modularitás függvény maximalizálása 5 Newman, Physical Review E, 2004
Néhány további fontos hálózati szerkezet Mag-periféria Hagymaszerkezet Nestedness (egymásba ágyazottság) Rich club ábra 12: További tipikus hálózat szerkezetek