Véletlen gráfok, hálózatok

Véletlen gráfok, hálózatok Véletlen gráfok, hálózatok Csirik András 2018.04.25 Erdős-Rényi modell Watts-Strogatz modell Barabási-Albert modell Hálózatok a mindennapokban Hálózatok a világ minden területén megtalálhatók internet társadalom elektromos hálózatok agy tápláléklánc terrorista hálózatok tudományos hivatkozások kémiai reakciók Hálózatok a mindennapokban Összefüggő-e a hálózat? Mikor összefüggő? Pl. Vírusok terjedése számítógépen, járványok terjedése emberek között Hány és mely pontokat vehetjük ki a hálózatból hogy összefüggő maradjon? (Robosztusság) Pl. Elektromos hálózat meghibásodik-e, terrorista sejtet fel tudunk-e számolni, Ökoszisztémát mennyire veszélyezteti egy-egy faj kihalása? Hálózatok modellezése gráfokkal Probléma: a legtöbb hálózat túl nagy, nem ismerjük a pontos szerkezetét Az Erdős-Rényi modell Az Erdős-Rényi modell Véletlen gráf Két rokon modell: G(n,M) : n csúcsú és M élű gráfok közül választunk azonos valószínűséggel G(n,p) : n csúcsú gráf minden élét egymástól függetlenül azonos valószínűséggel húzzuk be Kapcsolat: G(n,p)-ben nagyságrendben (n(n-1)/2)*p él lesz. M=(n(n-1)/2)*p esetén G(n,M) és G(n,p) ugyanúgy viselkedik nagy n-ekre. G(n,p) tulajdonságai: Várható élszám: Fokszámeloszlás: Határátmenetben: Poisson(np) Átlagos fokszám: c=(n-1)p Binom(n-1,p) 1

Óriás komponens P=0 esetén a gráf üres, minden pont egy külön komponens (1 méretű), ha növeljük a pontok számát ez akkor sem változik P=1 esetén a gráf teljes, minden pont az egyetlen komponenshez tartozik (n méretű), ha növeljük a pontok számát, akkor a komponens mérete is növekszik (n-nel arányosan) Óriás komponens: olyan összefüggő komponens melynek mérete a pontok számával arányosan nő Milyen p valószínűségnél jön létre óriás komponens? Óriás komponens S: Azon pontok aránya a gráfban melyek az óriás komponensben vannak Átlagos fokszám: c=(n-1)p A következő egyenlet érvényes: Nincs zárt alak Jobb megértéshez grafikus megoldás Óriás komponens C=1 a kritikus érték, efölött megjelenik az óriás komponens A természetben előforduló hálózatokban egy pontnak sokkal több szomszédja van 1-nél Emiatt lehet az, hogy az emberek között egy pletyka mindenkihez eljuthat, vagy egy járvány mindenkire átterjedhet Az interneten is emiatt terjedhetnek el a vírusok Kis világok Óriási hálózatokban milyen távol vannak egymástól a pontok? Milgram kísérlet (1967.) USA-ban szerette volna "megmérni" két tetszőleges ember között a távolságot Ehhez kiválasztott egy célszemélyt Illetve egy tőle távoli városban élő véletlenszerű embereknek levelet küldött, amiben leírta a kísérlete célját, és megkérte őket, hogy vegyenek részt a kísérletben Amennyiben ismerik a célszemélyt, küldjék neki tovább a levelet Amennyiben nem, akkor küldjék tovább egy olyan ismerősüknek, aki nagyobb valószínűséggel ismeri a célszemélyt Eredmény: azok a levelek melyek elérték a célszemélyt átlagosan 5,5 lépésben tették ezt 2

Kis világok Az internet feltérképezése: Albert Réka, Hawoong Jeong (1998.) Egy olyan programot készítettek, amely a weblapok között lépkedett a köztük található linkeken keresztül A teljes web feltérképezése lehetetlen feladat (akkoriban 800 millió weboldal) Ehelyett kisebb részeit vizsgálták (1000,10000,.,amekkorát a számítógépük még kezelni tudott) Ezeken meghatározták az átlagos távolságot Majd a kapott eredményekre extrapoláltak Eredmény: d=0,35+2logn (az átlagos távolság kb. 19 lépés) A pontok közti átlagos távolság a pontok számának logaritmusával nő Kis világok Miért van ez így? Tegyük fel, hogy az átlagos fokszám k Ekkor egy adott pontból kiindulva az első szomszédok száma k A a kettő távolságra lévő pontok száma k^2 A d távolságra lévő pontok száma k^d Mennyit kell átlagosan lépni, hogy minden csúcsba eljussunk? k^d=n, ebből pedig d=logn/logk Hány lépésben ismered Trumpot? Csoportképződés Tényleg úgy néznek ki a valódi hálózatok, ahogy az Erdős-Rényi modell leírja őket? A társadalomban baráti társaságok/ismeretségi körök alakulnak ki (csoportok képződnek) Ennek a mérésére szolgál a csoporterősségi együttható Adott csúcs szomszédjai között a lehetséges élek milyen arányban vannak jelen (ismerőseim milyen arányban ismerik egymást) A társadalomban ezt lehetetlen lenne megmérni, de egy kis szeletében lehetséges! Tudományos életben a publikációkon keresztül vizsgálható (társszerzők) Csoportképződés A társadalomban 10.000-szer nagyobb a csoportképződési együttható, mint az E-R modell alapján lenne. A csoportképződést kimutatták: Idegsejtek között Elektromos hálózatokban Közgazdaságtanban a vállalatok között Az Erdős-Rényi modell nem jól írja le a valódi hálózatokat 3

Watts-Strogatz modell N csúcs egy körlapon elhelyezve Minden csúcsot összekötünk a tőle jobbra ill. balra levő K/2 db szomszédjával Ez a modell jól kiadja a csoportképződési együttható nagyságát Viszont a kis világ tulajdonság eltűnik Minden meglévő élt nagyobb végpontját β valószínűséggel cseréljük ki egy másik végpontra (ezt a végpontot azonos valószínűséggel választjuk, úgy hogy a gráf egyszerű maradjon) Így a csoportképződési eh. alig változik, viszont újra kis-világot kapunk Középpontok és összekötők Társadalomban vannak olyan emberek, akik kiugróan sok ismeretséggel rendelkeznek (hírességek, celebek) Világhálón vannak olyan oldalak, melyek nagyon sok linkkel rendelkeznek (Google, Facebook) Sejtben vannak olyan vegyületek, amik nagyon sok reakcióban vesznek részt (víz) Az E-R és W-S modell szerint az ilyen pontok létezésének az esélye nagyon-nagyon kicsi (közel 0) 80/20-as szabály Pareto olasz közgazdász nevéhez fűződik Borsó betakarításakor a szemek 80%-a a hüvelyek 20%-ban található Olasz termőföld 80%-a a lakosság 20%-nak kezében Linkek 80%-a a weblapok 15%-ra mutat A tudományos hivatkozások 80%-át a kutatók 38%-a kapja Az élek jelentős része a csúcsok egy kisebb hányadához tartozik E-R vagy W-S modell szerint minden csúcs nagyjából ugyanolyan lenne, nem lennének kiugróan magas fokszámú csúcsok Skálafüggetlen hálózatok Internet feltérképezésekor kapott eredmény szerint az egy lapra mutató hivatkozások számát hatványfüggvény írja le N(k) =ck^(-α) Sok csúcs kicsi fokszámmal Nagyobb fokszámú csúcsok előfordulása sem lehetetlen (csak kevésbé gyakori) Ezzel szemben az E-R és W-S modellekben nem fordulhatnak elő kiugróan magas fokszámú csúcsok Minden csúcs körülbelül ugyanannyi kapcsolattal rendelkezik A legtöbb valódi hálózat fokszámeloszlása hatványfüggvényt követ, ezeket nevezzük skálafüggetlen hálózatoknak A sok hálózatban előforduló hatványeloszlás azt sugallja, hogy a hálózatok nem véletlenszerűek, hanem valamilyen természeti törvények alapján jönnek létre. 4

Mitől jön létre a hatványfüggvény-eloszlás? Hogyan alakulnak ki a hálózatok? Az eddigi modellekben feltettük, hogy a csúcsok száma adott (n) A valóságban a hálózatok általában növekednek A gazdag egyre gazdagabb lesz Első próba: Kiindulunk n csúcsból Egyesével veszünk hozzá a hálózatunkhoz új csúcsokat, és ezeket a pontokat egymástól függetlenül, azonos valószínűséggel kötjük össze a korábbi pontokkal Ennek az a következménye, hogy a legrégebbi pontoknak lesz a legtöbb csúcsa, a legújabbaknak meg a legkevesebb A probléma az, hogy ebből a modellből is exponenciális lecsengésű fokszámeloszlás jön ki Második próba: Népszerűségi kapcsolódás Az új pontok kapcsolódása nem véletlenszerű, hanem arányos az adott pont fokszámával Ez már hatványfüggvény lecsengésű lesz Viszont ebben a modellben az új pontoknak nincs esélyük "legyőzni" a régebbieket Harmadik próba: Fitness paraméter bevezetése a csúcsokhoz Kiindulunk egy m0 pontból álló tetszőleges összefüggő gráfból Minden lépésben hozzáadunk egy új pontot a hálózathoz és összekötjük m m0 csúccsal Annak a valószínűsége, hogy ezt az új pontot az i. csúccsal összekötjük függ a csúcs k_i fokszámától: Fitness paraméterrel: Ha mind egyenlő akkor visszakapjuk a fentebbi képletet 5

Egy csúcs fokszámának időbeli változása: t_i az az időpont amikor az i. csúcs belépett a gráfba β=½ A fokszámeloszlás: Valóban hatványfüggvény A modell hiányosságai: Új összeköttetések akkor is keletkezhetnek, amikor a pontok már a hálózatban vannak (pl. Színészek új filmjei, új ismerettségek) Egyes pontok el is tűnhetnek a hálózatból (pl. weboldalak megszűnése) A valódi hálózatokban a kapcsolódási mechanizmus ettől eltérő (jóval bonyolultabb) lehet Az első modell, ami a hálózatok topológiáját összefüggésbe hozza a fejlődésükkel Rávilágít, hogy a hálózatok mögött is természeti törvények bújnak meg Tesztkérdés A hálózatok mely tulajdonságát nem tudja visszaadni a Watts-Strogatz modell? a) Kis világ b) Csoportképződés c) Csomópontok d) Mindegyik tulajdonságot jól megmagyarázza Felhasznált irodalom Barabási Albert-László: Behálózva (2002.) Wikipédia szócikkek: Erdős-Rényi model 6