Véletlen gráfok, hálózatok

Hasonló dokumentumok
Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

A Barabási-Albert-féle gráfmodell

Szalai Péter. April 17, Szalai Péter April 17, / 36

Bevezete s a ha ló zatók vila ga ba II.

Csima Judit BME, SZIT február 18.

Társadalmi és gazdasági hálózatok modellezése

Betekintés a komplex hálózatok világába

Csima Judit BME, SZIT február 17.

Statisztikai módszerek a skálafüggetlen hálózatok

Komplex hálózatok: alapfogalmak, modellek, módszerek

Összefoglalás és gyakorlás

Doktori disszertáció. szerkezete

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Alapfogalmak II. Def.: Egy gráf összefüggő, ha bármely pontjából bármely pontjába eljuthatunk egy úton.

SzA II. gyakorlat, szeptember 18.

Diszkrét matematika 2.

Hálózati elemzések az üzleti életben. Kovács Gyula Sixtep Kft.

Véletlen gráfok. Backhausz Ágnes Eötvös Loránd Tudományegyetem és MTA Rényi Alfréd Matematikai Kutatóintézet december 2.

Gráfelméleti alapfogalmak-1

A hazai elszámolásforgalom hálózati elemzése

Zsidók, tudomány és hálózatok?

A MATEMATIKA NÉHÁNY KIHÍVÁSA

Társadalmi és gazdasági hálózatok modellezése

Közösség detektálás gráfokban

Babeş-Bolyai Tudományegyetem Fizika Kar, Kolozsvár. Hegyi Géza. Filozofia és Történelem Kar, Kolozsvár. M.A. Santos, R. Coelho és J.J.

A zsebrádiótól Turán tételéig

Lokális tulajdonságok véletlen. Nagy Gábor

REKLÁMPSZICHOLÓGIA. 1/a. TÁRSTUDOMÁNYOK és ÚJ TUDOMÁNYÁGAK

KOMBINATORIKA ElŐADÁS Matematika BSc hallgatók számára. Klikkek gráfokban-1. Definíció. Egy G gráfban egy K V(G) csúcshalmazt klikknek nevezünk, ha K

Szociális hálózatok geográfiai beágyazódása

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Feladatok MATEMATIKÁBÓL

Adatszerkezetek 2. Dr. Iványi Péter

Közösségek keresése nagy gráfokban

Síkbarajzolható gráfok Április 26.

Matematika tanmenet 11. évfolyam (középszintű csoport)

Diszkrét matematika 2.C szakirány

Diszkrét matematika 2. estis képzés

Diszkrét matematika 1. estis képzés

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Gráf-algoritmusok ERŐS / GYENGE KÖTÉSEK

Összetett hálózatok a híradástechnikában

Magyar és angol szóasszociációs hálózatok vizsgálata. Orosz Katalin Kovács László Pollner Péter

Termelés- és szolgáltatásmenedzsment

Ez is Hungaricum. Kovács Vera, Palotay Dorka, Pozsonyi Enik, Szabó Csaba január 27. ELTE

Ádám Réka. Szakdolgozat Alkalmazott matematikus MSc, Sztochasztika szakirány

Társadalmi és gazdasági hálózatok modellezése

Egy negyedikes felvételi feladattól az egyetemi matematikáig

A kísérlet, mérés megnevezése célkitűzései: Váltakozó áramú körök vizsgálata, induktív ellenállás mérése, induktivitás értelmezése.

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

A számítástudomány alapjai

HAMILTON ÚT: minden csúcson PONTOSAN egyszer áthaladó út

[Biomatematika 2] Orvosi biometria

Érdemes egy n*n-es táblázatban (sorok-lányok, oszlopok-fiúk) ábrázolni a két színnel, mely éleket húztuk be (pirossal, kékkel)

1. tétel. 1. Egy derékszögű háromszög egyik szöge 50, a szög melletti befogója 7 cm. Mekkora a háromszög átfogója? (4 pont)

A társadalom hálózati jelenségeinek adatvezérelt vizsgálata I: Társadalmi terjedés. Magyar Tudomány Ünnepe 2017 Számítógépes Társadalomtudomány

Bevezete s a ha ló zatók vila ga ba

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

HAMILTON KÖR: minden csúcson PONTOSAN egyszer áthaladó kör. Forrás: (

Diszkrét matematika 2. estis képzés

Az egyszerűsítés utáni alak:

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Gráfok

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

Kettőnél több csoport vizsgálata. Makara B. Gábor

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Gráfelméleti alapfogalmak

INFORMÁCIÓTERJEDÉS MODELLEZÉSE HÁLÓZATOKON DIFFERENCIÁLEGYENLETEKKEL

Gráfelmélet Megoldások

8. OSZTÁLY ; ; ; 1; 3; ; ;.

HIDROSZTATIKA, HIDRODINAMIKA

MATEMATIKA PRÓBAÉRETTSÉGI 2013 I. rész

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

Diszkrét matematika 2. estis képzés

Szociális hálók klaszterezése

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 2 Orvosi biometria

Matematikai geodéziai számítások 6.

Az egyenes egyenlete: 2 pont. Az összevont alak: 1 pont. Melyik ábrán látható e függvény grafikonjának egy részlete?

Véletlen gráfok szerkesztésekor n csomópontból indulunk ki. p valószínűséggel két csomópontot éllel kötünk össze.

Hatvány, gyök, logaritmus. Válogatás korábbi évek érettségi feladataiból ( , emelt szint)

Gráf csúcsainak színezése. The Four-Color Theorem 4 szín tétel Appel és Haken bebizonyították, hogy minden térkép legfeljebb 4 színnel kiszínezhető.

Számelméleti alapfogalmak

BME Nyílt Nap november 21.

1. Gráfelmélet alapfogalmai

1. számú ábra. Kísérleti kályha járattal

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Puskás Béla: Hálózatelméleti alapok

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

2. Adott a valós számok halmazán értelmezett f ( x) 3. Oldja meg a [ π; π] zárt intervallumon a. A \ B = { } 2 pont. függvény.

Algoritmusok bonyolultsága

Diszkrét matematika 2.

Matematikai geodéziai számítások 6.

III. Gráfok. 1. Irányítatlan gráfok:

i p i p 0 p 1 p 2... i p i

Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

Átírás:

Véletlen gráfok, hálózatok Véletlen gráfok, hálózatok Csirik András 2018.04.25 Erdős-Rényi modell Watts-Strogatz modell Barabási-Albert modell Hálózatok a mindennapokban Hálózatok a világ minden területén megtalálhatók internet társadalom elektromos hálózatok agy tápláléklánc terrorista hálózatok tudományos hivatkozások kémiai reakciók Hálózatok a mindennapokban Összefüggő-e a hálózat? Mikor összefüggő? Pl. Vírusok terjedése számítógépen, járványok terjedése emberek között Hány és mely pontokat vehetjük ki a hálózatból hogy összefüggő maradjon? (Robosztusság) Pl. Elektromos hálózat meghibásodik-e, terrorista sejtet fel tudunk-e számolni, Ökoszisztémát mennyire veszélyezteti egy-egy faj kihalása? Hálózatok modellezése gráfokkal Probléma: a legtöbb hálózat túl nagy, nem ismerjük a pontos szerkezetét Az Erdős-Rényi modell Az Erdős-Rényi modell Véletlen gráf Két rokon modell: G(n,M) : n csúcsú és M élű gráfok közül választunk azonos valószínűséggel G(n,p) : n csúcsú gráf minden élét egymástól függetlenül azonos valószínűséggel húzzuk be Kapcsolat: G(n,p)-ben nagyságrendben (n(n-1)/2)*p él lesz. M=(n(n-1)/2)*p esetén G(n,M) és G(n,p) ugyanúgy viselkedik nagy n-ekre. G(n,p) tulajdonságai: Várható élszám: Fokszámeloszlás: Határátmenetben: Poisson(np) Átlagos fokszám: c=(n-1)p Binom(n-1,p) 1

Óriás komponens P=0 esetén a gráf üres, minden pont egy külön komponens (1 méretű), ha növeljük a pontok számát ez akkor sem változik P=1 esetén a gráf teljes, minden pont az egyetlen komponenshez tartozik (n méretű), ha növeljük a pontok számát, akkor a komponens mérete is növekszik (n-nel arányosan) Óriás komponens: olyan összefüggő komponens melynek mérete a pontok számával arányosan nő Milyen p valószínűségnél jön létre óriás komponens? Óriás komponens S: Azon pontok aránya a gráfban melyek az óriás komponensben vannak Átlagos fokszám: c=(n-1)p A következő egyenlet érvényes: Nincs zárt alak Jobb megértéshez grafikus megoldás Óriás komponens C=1 a kritikus érték, efölött megjelenik az óriás komponens A természetben előforduló hálózatokban egy pontnak sokkal több szomszédja van 1-nél Emiatt lehet az, hogy az emberek között egy pletyka mindenkihez eljuthat, vagy egy járvány mindenkire átterjedhet Az interneten is emiatt terjedhetnek el a vírusok Kis világok Óriási hálózatokban milyen távol vannak egymástól a pontok? Milgram kísérlet (1967.) USA-ban szerette volna "megmérni" két tetszőleges ember között a távolságot Ehhez kiválasztott egy célszemélyt Illetve egy tőle távoli városban élő véletlenszerű embereknek levelet küldött, amiben leírta a kísérlete célját, és megkérte őket, hogy vegyenek részt a kísérletben Amennyiben ismerik a célszemélyt, küldjék neki tovább a levelet Amennyiben nem, akkor küldjék tovább egy olyan ismerősüknek, aki nagyobb valószínűséggel ismeri a célszemélyt Eredmény: azok a levelek melyek elérték a célszemélyt átlagosan 5,5 lépésben tették ezt 2

Kis világok Az internet feltérképezése: Albert Réka, Hawoong Jeong (1998.) Egy olyan programot készítettek, amely a weblapok között lépkedett a köztük található linkeken keresztül A teljes web feltérképezése lehetetlen feladat (akkoriban 800 millió weboldal) Ehelyett kisebb részeit vizsgálták (1000,10000,.,amekkorát a számítógépük még kezelni tudott) Ezeken meghatározták az átlagos távolságot Majd a kapott eredményekre extrapoláltak Eredmény: d=0,35+2logn (az átlagos távolság kb. 19 lépés) A pontok közti átlagos távolság a pontok számának logaritmusával nő Kis világok Miért van ez így? Tegyük fel, hogy az átlagos fokszám k Ekkor egy adott pontból kiindulva az első szomszédok száma k A a kettő távolságra lévő pontok száma k^2 A d távolságra lévő pontok száma k^d Mennyit kell átlagosan lépni, hogy minden csúcsba eljussunk? k^d=n, ebből pedig d=logn/logk Hány lépésben ismered Trumpot? Csoportképződés Tényleg úgy néznek ki a valódi hálózatok, ahogy az Erdős-Rényi modell leírja őket? A társadalomban baráti társaságok/ismeretségi körök alakulnak ki (csoportok képződnek) Ennek a mérésére szolgál a csoporterősségi együttható Adott csúcs szomszédjai között a lehetséges élek milyen arányban vannak jelen (ismerőseim milyen arányban ismerik egymást) A társadalomban ezt lehetetlen lenne megmérni, de egy kis szeletében lehetséges! Tudományos életben a publikációkon keresztül vizsgálható (társszerzők) Csoportképződés A társadalomban 10.000-szer nagyobb a csoportképződési együttható, mint az E-R modell alapján lenne. A csoportképződést kimutatták: Idegsejtek között Elektromos hálózatokban Közgazdaságtanban a vállalatok között Az Erdős-Rényi modell nem jól írja le a valódi hálózatokat 3

Watts-Strogatz modell N csúcs egy körlapon elhelyezve Minden csúcsot összekötünk a tőle jobbra ill. balra levő K/2 db szomszédjával Ez a modell jól kiadja a csoportképződési együttható nagyságát Viszont a kis világ tulajdonság eltűnik Minden meglévő élt nagyobb végpontját β valószínűséggel cseréljük ki egy másik végpontra (ezt a végpontot azonos valószínűséggel választjuk, úgy hogy a gráf egyszerű maradjon) Így a csoportképződési eh. alig változik, viszont újra kis-világot kapunk Középpontok és összekötők Társadalomban vannak olyan emberek, akik kiugróan sok ismeretséggel rendelkeznek (hírességek, celebek) Világhálón vannak olyan oldalak, melyek nagyon sok linkkel rendelkeznek (Google, Facebook) Sejtben vannak olyan vegyületek, amik nagyon sok reakcióban vesznek részt (víz) Az E-R és W-S modell szerint az ilyen pontok létezésének az esélye nagyon-nagyon kicsi (közel 0) 80/20-as szabály Pareto olasz közgazdász nevéhez fűződik Borsó betakarításakor a szemek 80%-a a hüvelyek 20%-ban található Olasz termőföld 80%-a a lakosság 20%-nak kezében Linkek 80%-a a weblapok 15%-ra mutat A tudományos hivatkozások 80%-át a kutatók 38%-a kapja Az élek jelentős része a csúcsok egy kisebb hányadához tartozik E-R vagy W-S modell szerint minden csúcs nagyjából ugyanolyan lenne, nem lennének kiugróan magas fokszámú csúcsok Skálafüggetlen hálózatok Internet feltérképezésekor kapott eredmény szerint az egy lapra mutató hivatkozások számát hatványfüggvény írja le N(k) =ck^(-α) Sok csúcs kicsi fokszámmal Nagyobb fokszámú csúcsok előfordulása sem lehetetlen (csak kevésbé gyakori) Ezzel szemben az E-R és W-S modellekben nem fordulhatnak elő kiugróan magas fokszámú csúcsok Minden csúcs körülbelül ugyanannyi kapcsolattal rendelkezik A legtöbb valódi hálózat fokszámeloszlása hatványfüggvényt követ, ezeket nevezzük skálafüggetlen hálózatoknak A sok hálózatban előforduló hatványeloszlás azt sugallja, hogy a hálózatok nem véletlenszerűek, hanem valamilyen természeti törvények alapján jönnek létre. 4

Mitől jön létre a hatványfüggvény-eloszlás? Hogyan alakulnak ki a hálózatok? Az eddigi modellekben feltettük, hogy a csúcsok száma adott (n) A valóságban a hálózatok általában növekednek A gazdag egyre gazdagabb lesz Első próba: Kiindulunk n csúcsból Egyesével veszünk hozzá a hálózatunkhoz új csúcsokat, és ezeket a pontokat egymástól függetlenül, azonos valószínűséggel kötjük össze a korábbi pontokkal Ennek az a következménye, hogy a legrégebbi pontoknak lesz a legtöbb csúcsa, a legújabbaknak meg a legkevesebb A probléma az, hogy ebből a modellből is exponenciális lecsengésű fokszámeloszlás jön ki Második próba: Népszerűségi kapcsolódás Az új pontok kapcsolódása nem véletlenszerű, hanem arányos az adott pont fokszámával Ez már hatványfüggvény lecsengésű lesz Viszont ebben a modellben az új pontoknak nincs esélyük "legyőzni" a régebbieket Harmadik próba: Fitness paraméter bevezetése a csúcsokhoz Kiindulunk egy m0 pontból álló tetszőleges összefüggő gráfból Minden lépésben hozzáadunk egy új pontot a hálózathoz és összekötjük m m0 csúccsal Annak a valószínűsége, hogy ezt az új pontot az i. csúccsal összekötjük függ a csúcs k_i fokszámától: Fitness paraméterrel: Ha mind egyenlő akkor visszakapjuk a fentebbi képletet 5

Egy csúcs fokszámának időbeli változása: t_i az az időpont amikor az i. csúcs belépett a gráfba β=½ A fokszámeloszlás: Valóban hatványfüggvény A modell hiányosságai: Új összeköttetések akkor is keletkezhetnek, amikor a pontok már a hálózatban vannak (pl. Színészek új filmjei, új ismerettségek) Egyes pontok el is tűnhetnek a hálózatból (pl. weboldalak megszűnése) A valódi hálózatokban a kapcsolódási mechanizmus ettől eltérő (jóval bonyolultabb) lehet Az első modell, ami a hálózatok topológiáját összefüggésbe hozza a fejlődésükkel Rávilágít, hogy a hálózatok mögött is természeti törvények bújnak meg Tesztkérdés A hálózatok mely tulajdonságát nem tudja visszaadni a Watts-Strogatz modell? a) Kis világ b) Csoportképződés c) Csomópontok d) Mindegyik tulajdonságot jól megmagyarázza Felhasznált irodalom Barabási Albert-László: Behálózva (2002.) Wikipédia szócikkek: Erdős-Rényi model 6