INFORMÁCIÓTERJEDÉS MODELLEZÉSE HÁLÓZATOKON DIFFERENCIÁLEGYENLETEKKEL

Hasonló dokumentumok
A MATEMATIKA NÉHÁNY KIHÍVÁSA

Hálózati folyamatok közelít differenciálegyenletei

Véletlen gráfok, hálózatok

A Barabási-Albert-féle gráfmodell

Társadalmi és gazdasági hálózatok modellezése

Véletlen gráfok. Backhausz Ágnes Eötvös Loránd Tudományegyetem és MTA Rényi Alfréd Matematikai Kutatóintézet december 2.

0,424 0,576. f) P (X 2 = 3) g) P (X 3 = 1) h) P (X 4 = 1 vagy 2 X 2 = 2) i) P (X 7 = 3, X 4 = 1, X 2 = 2 X 0 = 2) j) P (X 7 = 3, X 4 = 1, X 2 = 2)

Komplex hálózatok: alapfogalmak, modellek, módszerek

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Populációdinamika kurzus, projektfeladat. Aszimptotikus viselkedés egy determinisztikus járványterjedési modellben. El adó:

Szalai Péter. April 17, Szalai Péter April 17, / 36

Statisztikai módszerek a skálafüggetlen hálózatok

Gibbs-jelenség viselkedésének vizsgálata egyszer négyszögjel esetén

Taylor-polinomok. 1. Alapfeladatok április Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Érdemes egy n*n-es táblázatban (sorok-lányok, oszlopok-fiúk) ábrázolni a két színnel, mely éleket húztuk be (pirossal, kékkel)

A mérési eredmény megadása

1. Példa. A gamma függvény és a Fubini-tétel.

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

Végeselem modellezés alapjai 1. óra

1. A k-szerver probléma

Csima Judit BME, SZIT február 18.

1. tétel - Gráfok alapfogalmai

: s s t 2 s t. m m m. e f e f. a a ab a b c. a c b ac. 5. Végezzük el a kijelölt m veleteket a változók lehetséges értékei mellett!

Lineáris algebra 2. Filip Ferdinánd december 7. siva.banki.hu/jegyzetek

SzA II. gyakorlat, szeptember 18.

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Arany Dániel Matematikai Tanulóverseny 2017/2018-as tanév 2. forduló Haladók II. kategória

L'Hospital-szabály március 15. ln(x 2) x 2. ln(x 2) = ln(3 2) = ln 1 = 0. A nevez határértéke: lim. (x 2 9) = = 0.

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Abszolút folytonos valószín ségi változó (4. el adás)

Diszkrét matematika 2.C szakirány

Bevezetés. 1. fejezet. Algebrai feladatok. Feladatok

Társadalmi és gazdasági hálózatok modellezése

Összefoglalás és gyakorlás

Bevezetés az állapottér-elméletbe Dinamikus rendszerek állapottér reprezentációi

Lineáris egyenletrendszerek

Haladók III. kategória 2. (dönt ) forduló

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

Bevezetés. Párhuzamos vetítés és tulajdonságai

Betekintés a komplex hálózatok világába

Függvények határértéke, folytonossága

Információterjedés hálózatokon Voter modell

Skalárszorzat, norma, szög, távolság. Dr. Takách Géza NyME FMK Informatikai Intézet takach/ 2005.

Hajlított tartó elmozdulásmez jének meghatározása Ritz-módszerrel

24. szakkör (Csoportelméleti alapfogalmak 3.)

Lin.Alg.Zh.1 feladatok

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Utolsó el adás. Wettl Ferenc BME Algebra Tanszék, Wettl Ferenc (BME) Utolsó el adás / 20

26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA

Tűgörgős csapágy szöghiba érzékenységének vizsgálata I.

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

6. gyakorlat. Gelle Kitti. Csendes Tibor Somogyi Viktor. London András. jegyzetei alapján

22. GRÁFOK ÁBRÁZOLÁSA

Gépi tanulás és Mintafelismerés

A KroneckerCapelli-tételb l következik, hogy egy Bx = 0 homogén lineáris egyenletrendszernek

Biztosítási ügynökök teljesítményének modellezése

Gráfelméleti alapfogalmak-1

Megoldások 9. osztály

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A maximum likelihood becslésről

ARCHIMEDES MATEMATIKA VERSENY

Klár Gergely 2010/2011. tavaszi félév

Ferenczi Dóra. Sorbanállási problémák

Kinematika szeptember Vonatkoztatási rendszerek, koordinátarendszerek

Hódmezővásárhelyi Városi Matematikaverseny április 14. A osztályosok feladatainak javítókulcsa

Számítógépes Grafika mintafeladatok

Differenciálegyenletek megoldása próbafüggvény-módszerrel

Matematika (mesterképzés)

Matematika III előadás

Diszkrét matematika 1. estis képzés

Bázistranszformáció és alkalmazásai 2.

Függvények július 13. f(x) = 1 x+x 2 f() = 1 ()+() 2 f(f(x)) = 1 (1 x+x 2 )+(1 x+x 2 ) 2 Rendezés után kapjuk, hogy:

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

KOVÁCS BÉLA, MATEMATIKA I.

2. gyakorlat. A polárkoordináta-rendszer

TARTALOM. Ismétlő tesztek ÚTMUTATÁSOK ÉS EREDMÉNYEK...255

Puskás Béla: Hálózatelméleti alapok

6. Előadás. Megyesi László: Lineáris algebra, oldal. 6. előadás Bázis, dimenzió

Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.

MATEMATIKA A és B variáció

Analitikus térgeometria

Lagrange-féle multiplikátor módszer és alkalmazása

Függvények növekedési korlátainak jellemzése

15. LINEÁRIS EGYENLETRENDSZEREK

Keresztmetszet másodrendű nyomatékainak meghatározása

Lin.Alg.Zh.1 feladatok

Bóra Eszter. Véletlen gráfok és társadalmi hálózatok. Eötvös Loránd Tudományegyetem Természettudományi Kar. Témavezet : Backhausz Ágnes

Diszkrét matematika 2. estis képzés

1. Online kiszolgálóelhelyezés

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

(x 5) 5 = y 5 (1) 4 x = y (2) Helyettesítsük be az els egyenletbe a második alapján y helyére 4 x-et. Így (x 5) 5 = 4 x 5 adódik.

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

7. gyakorlat. Lineáris algebrai egyenletrendszerek megoldhatósága

Lineáris algebra és a rang fogalma (el adásvázlat, szeptember 29.) Maróti Miklós

Valószín ségszámítás és statisztika

Átírás:

INFORMÁCIÓTERJEDÉS MODELLEZÉSE HÁLÓZATOKON DIFFERENCIÁLEGYENLETEKKEL Eötvös Loránd Tudományegyetem Természettudományi Kar BSc szakdolgozat Készítette: Korányi Gerg Matematika BSc Matematikai elemz szakirány Témavezet : Simon L. Péter Alkalmazott Analízis és Számításmatematikai Tanszék 2015

Köszönetnyilvánítás Szeretném megköszönni témavezet mnek, Simon L. Péternek a téma felvetését, a kérdéseimre adott válaszait, elismer szavait és nem utolsó sorban, hogy megismertette velem a dierenciálegyenleteket. Szeretném rajta kívül megköszönni barátn mnek, hogy majd egy éven keresztül lankadatlanul hallgatta kimerít beszámolóimat a szakdolgozatomról.

Tartalomjegyzék 1. Hálózati modellek 6 1.1. Az Erd s - Rényi modell....................... 6 1.2. A Watts - Strogatz modell...................... 10 1.3. A Barabási - Albert modell..................... 12 1.4. Teljes gráfok, reguláris gráf..................... 15 2. Hálózati folyamatok 16 2.1. A matematikai modell........................ 16 2.2. Különböz típusú járvány- és információterjedési modellek.... 16 2.3. A numerikus szimuláció....................... 18 3. Híresztelés terjedését leíró teljes dierenciálegyenletrendszerek 27 3.1. A két csúcsú teljes gráf........................ 27 3.2. A három csúcsú teljes gráf...................... 31 3.3. Összevonás teljes gráfon....................... 34 3.3.1. A két csúcsú teljes gráf................... 35 3.3.2. A három csúcsú teljes gráf.................. 37 3.3.3. n csúcsú teljes gráf...................... 38 4. Általános dierenciálegyenletek 41 4.1. Homogén fokszámeloszlású gráf................... 41 4.2. Heterogén fokszámeloszlású gráf................... 48 4.3. Összefoglalás............................. 54 3

Bevezetés A hálózatok nagyon különböz formában, ám számtalan mennyiségben jelennek meg körülöttünk. Az egyik legismertebb közülük az internet, melyben számítógépek sokasága van összekötve egymással, ezzel egy digitális hálót létrehozva melynek köszönhet en igen gyors adatátvitelre van lehet ség. Ez egy zikailag létez háló, hiszen a gépek konkrét kábeleken (wi esetében rádióhullámokon) keresztül kommunikálnak. Bár fogalmilag nem teljesen különül el számunkra, de egy másik hálózat a világháló, melyek weboldalakból állnak és a közöttük vezet kapocs egy link az egyik oldalról a másikra. A hálózatok egy másik csoportja, mellyel nap mint nap "találkozunk" a szociális hálók világa, az ismeretségeink, vagy "kézzel foghatóan" a Facebook, melyekben a csúcsok mi, emberek vagyunk és akkor van két személy között kapocs, ha ismerik egymást. Hálózatot alkotnak az utak, hálózatot alkotnak a sejtek, s t még nyelvi jelenségek tanulmányozása közben is felbukkannak hálók. A 20. század végére kialakuló hálózatkutatás f célja, többek között, hogy feltárja, hogy hogyan is jönnek létre ezek a hálózatok, hogyan és milyen paraméterekkel lehet ket minél pontosabban leírni, mennyiben különböznek vagy egyeznek meg egymással, mit lehet mondani a komplexitásukról és sebezhet ségükr l. A hálózatok ismerete nagyon fontos biztonságtechnikai szempontból, hogyan lehet kivédeni például egy hecker támadást, gazdasági szempontból, hogyan terjesszük el egy információt minél jobban, közegészségügyi szempontból, hogyan cselekedjünk egy járvány felbukkanásakor, tartani kell-e az elterjedését l vagy inkább rövidtávon kipusztul, mikor kell elkezdeni vakcinákat gyártani, beoltani az embereket vagy akár egészségügyi szempontból is fontos lehet a hálózatok ismerete, hiszen testünk is egy hatalmas háló, benne a gének szövevényes kapcsolataival, ami összeomlásának a megértése segíti a betegségek elleni harcot. Egyszóval világunkat behálózzák a hálózatok, ezen gondolat felismerése egy új tudományterületet hívott életre, mely manapság is az egyik legkutatottabb. Mi, magyarok számára különösen kedves lehet ez a terület, mert a világ egyik legismertebb hálózatkutatója Barabási Albert László. Ezen szakdolgozat, bár a hálózatok témakörében íródott, mégsem az el bb említette kérdésekre kíván válaszolni, hanem arra keresem a választ, hogyha egy hálózaton elindítunk egy folyamatot, ami csúcsokról csúcsokra terjed, annak hogyan lehet megjósolni hosszútávú viselkedését. Itt gondolhatunk betegségterjedésre egyedek között, aktivitás terjedésére biológiai neurális hálókon, vírusterje- 4

désre a világhálón vagy éppen információterjedésre emberek között. Dolgozatom megírása közben azt az utat fogom újrajárni és bemutatni, ami mentén én is megismerkedtem és elmerültem hálózatkutatás témakörében. 5

1. Hálózati modellek Ebben a szakaszban ismertetem a leggyakrabban vizsgált hálózat típusokat, melyeken hálózati folyamatokat vizsgálnak és igyekszem röviden utalni is arra, hogy hogyan alakultak ki és fejl dtek az egyes modellek. 1.1. Az Erd s - Rényi modell Mint említettem az egyik legfontosabb kérdés, hogy hogyan lehet leírni, modellt találni a hálózatokra. Az els jelent sebb munka 1959-b l származik Erd s Páltól és Rényi Alfrédtól. A szakirodalomban ezt az id pontot szokták a hálózatkutatás születéseként megjelölni. Azt mondták, hogy a hálózatok tulajdonképpen csúcsok összekötve élekkel, tehát matematikai szempontból egy gráf. Abból a feltételezésb l indultak ki, hogy a hálózatok véletlenszer en vannak összerakva, a csúcsok között létrejöv kapcsolódást pusztán a véletlen befolyásolja. 1. Deníció (Erd s - Rényi véletlen gráf). Adott n csúcs és m él esetén, az Erd s - Rényi véletlen gráf egy egyenl valószín séggel, véletlenszer en választott gráf az összes, ilyen értékekkel rendelkez ( ( ) n 2) m darab gráf közül. Ez a deníció azonos azzal, mintha az egyes élek létrehozásának p = m ( n 2) valószín ségét adtuk volna meg a behúzandó élek száma helyett. A gráf fokszámeloszlása binomiális eloszlású, azaz annak a valószín sége, hogy egy csúcs k-ad fokú ( ) n 1 P (d(v) = k) = p k (1 p) n 1 k k A csúcsok fokszámának várható értéke (n 1)p, ami nagy n esetén tekinthet np-nek. Mint ismeretes, a binomiális eloszlás nagy csúcsszám esetén Poissoneloszlással közelíthet, azaz P (d(v) = k) = (np)k e np k! n np = c. 6

1. ábra. Erd s - Rényi véletlen gráf fokszámeloszlása különböz p értékek esetén. n = 1000 Erd s és Rényi eredménye a gráf legnagyobb komponensével kapcsolatos. 1. Tétel (Erd s-rényi). Jelöljön G(n, p) egy olyan n csúcsú gráfot, ahol egy él behúzásának valószín sége p. Ekkor a gráf legnagyobb komponensének méretére igaz, hogy O(log(n)) ha np < 1 M(G) = O(n 2 3 ) ha np = 1 O(n) ha np > 1 Azaz a felfedezésük jelent sége, hogy ha elképzeljük, hogy folyamatosan növeljük p értékét, akkor nem egy egyre nagyobb hálót kapunk (háló alatt most lényegében a legnagyobb komponenst értve), hanem van egy kritikus érték, ahol hirtelen megjelenik a háló, a sok különálló komponens összeáll egy nagy egésszé. Az eredményt úgy is lehet interpretálni, hogyha azt a kérdést tesszük fel, hogy vajon hány élt kell minden csúcsból átlagosan behúzni, hogy a gráf összefügg legyen, akkor a válasz valamivel több, mint 1, holott az emberek többsége valószín leg sokkal többre gondolna. 7

(a) p = 0, 02 (b) p = 0, 045 (c) p = 0, 2 2. ábra. Erd s - Rényi véletlen gráfok különböz p értékek esetén. n = 25 Az Erd s-rényi véletlen gráf np > 1 esetén rendelkezik a valós hálózatok egy nagyon fontos jellemz jével, a kis-világ tulajdonsággal, azaz, hogy bármely két pont között vezet legrövidebb utak hossza (és ezek átlaga) lényegesen kisebb, mint a csúcsok száma. Igazolható, hogy ez O(log(n)) nagyságrend [1], ami kifejezi azt a népszer meggyelést, hogy közvetlen ismeretségeken keresztül bármely embert átlagosan 6 lépés távolság alatt elérhetünk. Ezt a meggyelést el ször Karinthy Frigyes írta le Láncszemek cím novellájában: Annak bizonyításául, hogy a Földgolyó lakossága sokkal közelebb van egymáshoz, mindenféle tekintetben, mint ahogy valaha is volt, próbát ajánlott fel a társaság egyik tagja. Tessék egy akármilyen meghatározható egyént kijelölni a Föld másfél milliárd lakója közül, bármelyik pontján a Földnek - fogadást ajánl, hogy legföljebb öt más egyénen keresztül, kik közül az egyik neki személyes ismer se, kapcsolatot tud létesíteni az illet vel, csupa közvetlen - ismeretség - alapon. Az Erd s - Rényi gráf, bár ajánl egy modellt a hálózatok vizsgálatára, mégsem tekinthetjük tökéletesnek. Az egyik probléma az, hogy, mint az 1 ábrán is látható, a Poisson-eloszlás exponenciális lecsengés, a legtöbb csúcs az np várható érték körül helyezkedik el, és nincsenek nagyon eltér értékek. Azaz a társadalomban mindannyian ugyanannyi ismer ssel rendelkezünk, minden weboldalra nagyjából ugyanannyi link mutat, minden reptérre nagyjából ugyanannyi reptérr l juthatunk el. Szociológusok kimutatták, hogy a legtöbben nagyjából 1000 személyes ismeretséggel rendelkezünk, ekkor ha társadalmunk szociális hálója valóban véletlen háló volna, akkor annak a valószín sége, hogy van olyan ember akinek legalább, 1200 ismer se van i=1200 500i i! e 500 4 10 10. 8

A valós hálózatokban, szemben az Erd s - Rényi véletlen gráal, a kiugróan magas fokszámú csúcsok tipikusnak mondhatóak. A másik tulajdonság, amiben elmarad a modell a valóságos hálóktól, az úgynevezett klaszterezettségi együttható. 2. Deníció (Klaszterezettségi együttható). Legyen G(V,E) gráf, V = n, v i E, ekkor C(G) = 1 n n i=1 C(v i) a gráf klaszterezettségi együtthatója, ahol C(v i ) = {(v j, v k ) {v i, v j }, {v i, v k }, {v j, v k } E} / ( deg(v i) ) 2 egy csúcs klaszterezettségi együtthatója. Azaz valamivel szabatosabban egy csúcs klaszterezettségi együtthatója azt fejezi ki, hogy a barátaim milyen valószín séggel ismerik egymást, egy gráfé pedig, hogy az mennyire épül fel klaszterekb l, azaz a csúcsok mennyire rendezkednek csoportokba, ahol a csoporton belül a tagok ismerik egymást, de csoportok egymáshoz csak néhány kapcsolattal köt dnek. Mint láttuk a véletlen gráfokban, annak a valószín sége, hogy legjobb barátom ismeri egy másik barátomat pontosan ugyanannyi, mint hogy ismeri az amerikai elnököt. Felmerült tehát az igény olyan modell megalkotására, ami a kis-világ tulajdonság mellett, a valóságos hálózatokra jellemz, magasabb klaszterezettségi együtthatóval rendelkezik. 3. ábra. Legrövidebb utak átlagos hossza és klaszterezettségi együttható három valós gráfon, összehasonlítva azonos csúcsszámú véletlen gráal (n) és átlagos fokszámmal (k). (Színészek: n = 225.226, k = 61; Elektromos hálózat:n = 4.941, k = 2, 67; C.elegans féreg: n = 282, k = 14) A színészek hálózatában a csúcsok a színészek és két színész között vezet él, ha játszottak közösen egy lmben. Az elektromos hálózatban a csúcsok transzformátorok és alállomások, két csúcs között vezet él, ha van közöttük vezeték. A C.elegans féreg hálózatban a csúcsok a féreg idegrendszerében megtalálható idegsejtek, és két csúcs között akkor vezet él, ha van közöttük kapcsolat szinapszis vagy réskapcsolat révén. Látható, hogy míg az átlagos távolságban (L) a véletlen modell jól teljesít, addig a klaszterezettségi együtthatója (C) sokkal kisebb a valós hálózatoknál meggyelhet értékeknél. [2] 9

1.2. A Watts - Strogatz modell Duncan Watts és Steven Strogatz 1998-ban megjenet cikkükben deniáltak egy új modellt [2]. 3. Deníció (Watts - Strogatz modell). Adott n, k és p paraméterek esetén a W (n, k, p) Watts - Strogatz gráf a következ képpen épül fel: 1. vegyünk egy n csúcsú körgráfot, ahol minden csúcsot összekötünk a k legközelebbi szomszédjával. 2. végigmegyünk minden élen (a kisebb index fel l a nagyobb felé) és egymástól függetlenül megszüntetjük ket p valószín séggel 3. újra végigmegyünk és minden törölt él helyett véletlenszer en behúzunk egy új élt, ami abból a csúcsból vezet, ahol töröltük, egy tetsz leges másikba (a) p = 0, 1 (b) p = 0, 2 (c) p = 0, 8 4. ábra. Watts - Strogatz gráfok különböz p értékek esetén. n = 25 k = 4 Így egy olyan gráfot kapunk, aminek nk 2 éle van, és átmenetet jelent a p = 0 esethez tartozó reguláris és p = 1 esethez tartozó véletlen gráf között. Az el bbi esetben 1 a klaszterezettségi együttható, de nincs kis-világ tulajdonság, utóbbiban éppen fordítva, van kis-világ, de alacsony a klaszterezettségi együttható. Watts és Strogatz megmutatták, hogy p értéke választható úgy, hogy mindkét feltétel teljesüljön. S t, ami igazán meglep, hogy már néhány él újrahúzása is jelent sen lecsökkenti az utak hosszát, de a klaszterezettségi együtthatót nem befolyásolja számottev en. 10

Bár a Watts - Strogatz modell jobban hasonlít a valóságos hálózatokra mint az Erd s - Rényi véletlen gráf, a másik említett tulajdonságban, a kiugró fokszámú csúcsok, az úgynevezett hubok tekintetében ez sem tekinthet kielégít nek. A Watts - Strogatz modellben is exponenciális lecsengés a csúcsok fokszámának eloszlása. 5. ábra. Watts - Strogatz gráf fokszámeloszlása különböz p értékek esetén n = 1000 k = 10 (a) Az USA repül tér hálózata: két reptér (b) Az USA autóút-hálózata: két nagyváros össze van kötve, ha vezet össze van kötve, ha van közöttük közvet- közöttük len repül járat autópálya 6. ábra. Az autóút hálózat egy Watts - Strogatz gráfhoz hasonlít, azaz nincsenek benne hubok, szemben a repül tér hálózattal, ahol megjelennek nagy forgalmú repterek, csomópontok. Azaz nem minden valós hálózatban jelennek meg hubok, de a legtöbb esetben igen. 11

1.3. A Barabási - Albert modell Számos különböz valós hálózatot megvizsgálva kiderült, hogy a fokszámeloszlás hatványfüggvénnyel adható meg. 4. Deníció (Skálafüggetlen hálózat). Egy hálózat skálafüggetlen, ha benne a csúcsok fokszámeloszlása hatványfüggvényt követ, azaz P (deg(v) = k) = ck γ valamilyen γ értékkel és c konstanssal. A valós hálózatokban γ értéke tipikusan 2 és 3 között van. Valami nincs meg az el bbi két modellben, ami a valóságos hálókban megvan, amelynek következtében az eloszlásfüggvény megváltozik. Valójában két nagyon er s hipotézis áll a modellek mögött. Az egyik, hogy a hálózat mérete statikus, nem változik, nem n. Valójában azonban minden háló kis hálózatként jött létre és folyamatosan új csúcsok kapcsolódtak hozzá. A másik, hogy mikor behúzunk egy új élt, az véletlenszer en kapcsolódik egy csúcshoz. Igazából van egy preferenciasorrend, ami alapján egy csúcs nagyobb valószín séggel kapcsolódik egy új csúcshoz, kézenfekv nek t nik ezt a fokszámok alapján meghatározni, azaz minél nagyobb egy csúcs fokszáma, annál nagyobb valószín séggel kapcsolódik hozzá egy új csúcs. Egy új reptér közvetlen járatai nagyobb valószín séggel fognak egy központi reptérre menni, egy új oldalról nagyobb valószín séggel mutat majd link a Facebbok-ra, mint más oldalakra. Ezen két gondolat alapján jön létre a Barabási - Albert modell. 5. Deníció (Barabási - Albert modell). Adott n és m értékek esetén a Barabási - Albert gráf a következ képpen épül fel: 1. vegyünk egy m 0 > m csúcsú teljes gráfot, majd ismételjük meg a következ két lépést (n m 0 )-szor 2. (növekedés) adjunk a gráfhoz egy új csúcsot 3. (preferenciális kapcsolódás) húzzunk be az új csúcsból m különböz csúcshoz éleket, úgy hogy P (v s csúcshoz vezet él) = deg(vs) i deg(vi) 12

7. ábra. Barabási - Albert gráf kialakulása. n = 30 m = 1 Mivel minden új csúcs a bekötésekor m darab új élt hoz be, ezért a fokszámok összege ilyenkor 2m-mel n, azaz összesen 2mn darab él fut az n darab csúcs között, így az átlagos fokszám 2m. Az utóbbi 10 év egyik legfontosabb tanulsága a hálózatkutatásban, hogy minden hálóban ahol hubok jelennek meg, növekedés és preferenciális kapcsolódás együttesen jelen van. Tehát lényegében két nagyon természetesen jelen lév folyamat hozza létre a skálafüggetlen hálókat. Ezeket a hubokat szokás a hálók achilles-sarkának is nevezni és ez rá is mutat a jelent ségükre. Az internetben minden pillanatban több száz router nem m ködik, az internet egésze mégis igen. Ha véletlenszer en kilövünk pár kapcsolati pontot, akkor az egész még m ködni fog, mivel rengeteg a kis csomópont és csak néhány nagyobb van, ezért nagyon kicsi a valószín sége, hogy egy nagyot találunk el. Tehát véletlen hibák nem tudják tönkretenni a hálót. Persze ennek az az ára, hogyha ha célzottan lövünk ki pár nagyobb kapcsolati pontot, akkor a háló nagyon gyorsan szét tud esni, ami biztonságtechnikai szempontból nagyon fontos. Ezt a tulajdonságot nevezzük robosztusságnak. 13

8. ábra. Barabási - Albert gráf fokszámeloszlása különböz m értékek esetén n = 1000 9. ábra. Barabási - Albert gráf fokszámeloszlása log log skálán. n = 1000 m = 2. A piros egyenes a regressziós egyenes, amit a log(p (k)) = 2, 6992 log(k) + 1, 4871 függvény ír le. A kék, több azonos paraméterrel létrehozott gráf fokszámának átlagolása után, ezen átlagok logaritmusa által meghatározott görbe. A regressziós egyenest e-re emelve kapjuk, hogy P (k) 2m k 2.7 Bár a Barabási - Albert féle modell a fokszámeloszlás tekintetében sokkal jobban leírja a valóságos hálózatokat, és rendelkezik kis-világ tulajdonsággal is, mégsem maradéktalanul kielégít. Egyrészt a klaszterezettségi együtthatója jóval kisebb a valós hálókénál másrészt ebben a modellben a kés bb bekapcsolódó éleknek nincs lehet sége feltörni. Amelyik csúcs el bb került a rendszerbe, az 14

szükségképpen mindig jobb helyzetben lesz az utána következ kkel szemben, lévén több lehet sége van kapcsolatok gy jtésére. A valós hálózatokban ugyan tényleg nehezebb érvényesülnie a kés bb jöv nek, de nem lehetetlen, mert egy új csúcs rendelkezhet olyan innovációval, ami érdekesebbé teszi sok más csúccsal szemben. Egy összetettebb és pontosabb modellt kaphatunk, ha bevezetjük az alkalmasság fogalmát, ami a csúcs kapcsolatokért való versenyzési képességét jelenti és a csúcs alkalmasságát nem csupán a kapcsolatok száma határozza meg, mint eddig. 1.4. Teljes gráfok, reguláris gráf Véletlen gráfok egyik igen fontos típusa a reguláris véletlen gráf. 6. Deníció. Egy n csúcsú r-reguláris véletlen gráf egy azonos valószín séggel, véletlenszer en választott gráf, az összes n csúcsú r-reguláris gráfok halmazából. Ennek egy speciális esete az n csúcsú teljes gráf, ahol minden csúcs minden csúccsal össze van kötve, tehát ez egy n 1-reguláris (véletlen) gráf. Egy - egy hálózati folyamat vizsgálatakor hasznos ezen teljes gráfokon tesztelni, mert ez lényegében azt jelenti, hogy a hálózatnak nincs szerepe, hiszen minden csúcs hatással van egymásra. 15

2. Hálózati folyamatok Ebben a szakaszban ismertetem a leggyakrabban vizsgált hálózati folyamatokat, és kitérek a numerikus szimulációval történ tesztelésre is. 2.1. A matematikai modell Adott egy n csúcsú irányítatlan gráf, valamint egy véges állapothalmaz {a 1, a 2,... a m } mely megadja, hogy az egyes csúcsok milyen állapotban lehetnek. Adottak továbbá az átmenetek λ ij rátái, melyekkel meghatározhatóak egy csúcs a i állapotból a j állapotba történ átmenetének valószín sége. Egy csúcs állapotának változását Poisson-folyamat írja le (azaz diszjunkt id intervallumokban bekövetkez átmenetek száma függetlenek egymástól, azonos hosszúságú intervallumokon bekövetkez átmenetek számát leíró valószín ségi változók azonos eloszlásúak, egyszerre csak egy átmenet történik) így annak a valószín sége, hogy egy a i állapotban lév v csúcs t id alatt az a j állapotba kerül P v (a i a j ) = 1 e λij t. Az állapothalmazt és az átmenetek rátáit együttesen dinamikának nevezik. 2.2. Különböz típusú járvány- és információterjedési modellek Most rátérek konkrét dinamikák ismertetésére. Az els, a legegyszer bb és gyakran vizsgált az SIS típusú járványterjedés. Ebben az esetben a csúcsok kétféle állapotban lehetnek egészséges (S) és fert z (I). Kétféle átmenet lehetséges: fert zés, mely során egy egészséges egyedet annak k I szomszédai közül egy fert z egyed megfert z, ennek rátája k I τ. Illetve gyógyulás, mely során egy fert z egyed egészséges lesz γ rátával a szomszédai állapotától függetlenül. Egy másik járványterjedési dinamika az SIR típusú, melyben a csúcsok háromféle állapotban lehetnek. Az el z höz képest új állapot az immunis (R). Ugyanaz a két átmenet lehetséges, mint el bb, annyi különbséggel, hogy gyógyulás során a fert z egyedek nem egészséges, hanem immunis állapotba kerülnek, azaz már nem terjeszt k, de már nem is fert zhet ek. Ha az immunitás nem végeleges, akkor SIRS típusú dinamikáról beszélünk, melyben egy újabb átmenet lehetséges, amely során egy immunis egyed újra egészséges és ezáltal fert zhet lesz. 16

Ha a megfert zött egyedek nem azonnal válnak fert z vé, akkor bevezetünk egy új állapotot exposed (E), ekkor az SEIR (ha a meggyógyult egyed nem nyer immunitást, akkor SEIS) dinamikához jutunk. Ebben a megfert zött egyedek el ször egy várakozó állapotba kerülnek, amikor még nem fert znek, de már nem is egészségesek. Az összes el bb vázolt modellt realisztikusabbá lehet tenni azzal, hogy belevesszük a természetes népességváltozást, a halált és a születést. Ha a modellhez hozzákapcsoljuk, azt a tényt hogy bizonyos betegségekkel szemben születésünkt l fogva lehetünk immunisak, akkor jutunk az M SIR vagy M SEIR modellekhez. A járványterjedési modellekb l kiindulva kezdték el vizsgálni a híresztelések terjedésének modellezését. Ezek a modellek szociológiai vizsgálatokból indultak ki, melyek során emberek egy csoportja által alkotott ismeretségi hálókon terjed pletykák, híresztelések, információk terjedését vizsgálták. Az információ minél szélesebb, minél célzottabb elterjesztése politikailag vagy gazdaságilag is nagyon fontos lehet. Az SIR dinamikához hasonlóan itt is háromféle állapotban lehetnek a csúcsok, tájékozatlan (I) aki nem ismeri a pletykát, terjeszt (S) aki ismeri a pletykát és terjeszti is, valamint akadályozó (R) aki ismeri ugyan a pletykát de nem terjeszti. Az általánosan használt jelölések itt kissé zavaróan pont fordítva vannak, ennek az oka, hogy a spreader és ignorant szavak kezd bet i. Kétféle átmenet lehetséges. Egyfel l egy tájékozatlan a terjeszt szomszédainak számával arányos valószín séggel megismeri a pletykát és maga is terjeszt lesz. Ennek az átmenetnek a rátája k S λ. Ez kifejezi, hogy minél többen tudnak a pletykáról a környezetemben, annál valószín bb, hogy valaki el is fogja mondani. Másfel l egy terjeszt akadályozóvá válik a terjeszt és akadályozó szomszédai számával arányos valószín séggel. Az átmenet rátája k SR α Ez kifejezi azt, hogy egy pletykát a környezetemben minél többen tudnak (azaz minél több a terjeszt és az akadályozó) annál kevésbé valószín, hogy tovább akarom terjeszteni, azaz annál valószín bb, hogy akadályozóvá válok. A modellt szokás azzal nomítani, hogy egy terjeszt spontán módon válik akadályozóvá, ezzel beépítve a modellbe, hogy elfelejt dik a pletyka. Ennek rátája a δ bármilyen szomszédok számától függetlenül. Én a δ = 0 esetet vizsgálom szakdolgozatomban. Alább összefoglalom a az el bb ismertetett dinamikák jellemz it: 17

SIS járványterjedés A csúcsok állapotainak halmaza: {S(egészséges), I(fert z )} Lehetséges átmenetek és rátáik: S τk I I I γ S k I az S csúcs I típusú szomszédainak száma SIR(S) járványterjedés A csúcsok állapotainak halmaza: {S(egészséges), I(fert z ), R(immunis)} Lehetséges átmenetek és rátáik: S τk I I I γ R R µ S k I az S csúcs I típusú szomszédainak száma csak akkor, ha az immunitás nem végleges Híresztelés terjedés A csúcsok állapotainak halmaza: {I(tájékozatlan), S(terjeszt ), R(akadályozó)} Lehetséges átmenetek és rátáik: I λk S S S αk SR+δ R k S az I csúcs S típusú szomszédainak száma k SR az S csúcs S és R szomszédainak együttes száma 2.3. A numerikus szimuláció Mivel én els sorban az információterjedéssel foglalkoztam, ezért az utolsóként említett dinamika numerikus szimulációját ismertetem. Legyen adott egy n csúcsú gráf (éllistával vagy szomszédsági mátrixszal). A rendszer állapottere az {1, 2, 3} n halmaz vektorai. Egy t id pontban az v(t) {1, 2, 3} n vektor i edik koordinátája v i (t) a gráf i edik csúcsának állapotát adja meg. v i (t) =1 ha tájékozatlan, 2 ha terjeszt és 3 ha akadályozó. Mind az I S, mind az S R átmenetet független Poisson-folyamatnak tekintjük, azaz annak a valószín sége, hogy t id alatt egy I csúcs - melynek k S db S típusú szomszédja van - S típusúvá válik 1 e λks t, ahol λ a korábban említett átmeneti ráta. Ugyanígy, annak a valószín sége, hogy t id alatt egy S csúcs - melynek k SR db S és R típusú szomszédja van - R típusúvá válik 1 e αksr t, ahol α ezen átmenet rátája. A szimuláció lépései: 1. Kezdetben adottak: n csúcsú gráf éllistával megadva 18

v 0 {1, 2, 3} n a csúcsok kezdeti állapotát megadó kezd vektor, jellemz en néhány 2-est tartalmaz, a többi koordináta 1-es λ, α az átmenetek rátái t ezt a számot kell en kicsire kell választani, hogy a szimuláció sokszori megismétlése jól közelítse a Poisson-folyamatot. Ennek a helyes megválasztását ellen rizhetjük úgy, hogy ennyi id alatt csak egy csúcsnál történik változás. A következ két lépést vagy egy el re rögzített értékszer ismételjük meg, vagy addig amíg van S típusú csúcs. A terjedés teljes lefutásának szimulálásához célszer az utóbbit választani. 2. Generálunk egy r [0, 1] n véletlen számokból álló vektort 3. Leszámoljuk az éllista alapján, hogy minden csúcsnak hány S és R típusú szomszédja van, majd végigmegyünk az összes csúcson, és annak típusa alapján megállapítjuk, hogy történik-e átmenet: Ha v j (t) = 1 és r j < 1 e λks t akkor v j -t 2-re állítjuk Ha v j (t) = 2 és r j < 1 e αksr t akkor v j -t 3-ra állítjuk Ha t-t kell en kicsire választjuk, akkor használhatjuk az 1 e x x közelítést, azaz 1 e λks t λk S t, illetve 1 e αksr t αk SR t közelítéseket. Ahhoz, hogy minél pontosabb közelítést kapjunk, amikor a szimulációt megismételjük mindig új kezd vektort generálunk, kiszámítjuk az állapotvektorokat t, 2 t, 3 t,... id pillanatokban majd vesszük a kapott eredmények átlagát. Ha véletlen gráfon zajló folyamatot modellezünk, akkor nem egy gráf adott, hanem gráfok egy G halmaza, amelyben a véletlen gráfok vannak. Ekkor minden lépésben veszünk egy véletlen gráfot G-b l, vagy generálunk egyet, és a fent leírt lépéseket használva kiszámítjuk az állapotvektorokat és azokat átlagoljuk ki. Ahhoz hogy a kapott eredményeket vizuálisan is megjeleníthessük, minden állapotvektorhoz létrehozunk egy másik, összesít vektort (I(t), S(t), R(t)) ahol I(t) = v(t)-ben lév 1-esek száma, S(t) = v(t)-ben lév 2-esek száma és R(t) = v(t)-ben lév 3-asok száma, azaz minden pillanatban a különböz típusú csúcsok száma. A nekik megfelel arányvektor: (i(t), s(t), r(t)) = (I(t)/n, S(t)/n, R(t)/n), amit azért célszer felvenni, hogy az 19

esetlegesen eltér csúcsszámú gráfokat is össze tudjuk hasonlítani. Minden ábrán feltüntetem az r értéket, azaz az akadályozók végs számát. Mivel s = 0 így, i = 1 r, azaz mindhárom típus végs értékét megadtuk, és r megmutatja, hogy a gráf csúcsainak hány százaléka tudta meg az információt. Zölddel rajzoltam a tájékozatlanok, feketével a terjeszt k, pirossal az akadályozók arányát. 10. ábra. Erd s - Rényi véletlen gráfon végzett szimuláció, az id függvényében ábrázolva a tájékozatlanok i(t), terjeszt k s(t) és akadályozók r(t) arányát. n = 1000 p = 0, 1 λ = 0, 5 α = 1 20

11. ábra. Erd s - Rényi véletlen gráfon végzett szimuláció, t függvényében ábrázolva az i, s, r arányokat. A folyamat gyorsabban folyik le, ennek megfelel en több a terjeszt, és így az információ is jobban elterjed. n = 1000 p = 0, 1 λ = 1 α = 1 12. ábra. Watts - Strogatz gráfon végzett szimuláció, t függvényében ábrázolva az i, s, r arányokat. n = 1000 k = 20 p = 0, 1 λ = 0, 5 α = 1 21

13. ábra. Watts - Strogatz gráfon végzett szimuláció, t függvényében ábrázolva az i, s, r arányokat. n = 1000 k = 20 p = 0.1 λ = 1 α = 1 14. ábra. Barabási - Albert gráfon végzett szimuláció, t függvényében ábrázolva az i, s, r arányokat. n = 1000 m = 2 λ = 0, 5 α = 0, 1 22

15. ábra. Barabási - Albert gráfon végzett szimuláció, t függvényében ábrázolva az i, s, r arányokat. n = 1000 m = 2 λ = 1 α = 0, 1 16. ábra. Reguláris véletlen gráfon (n = 1000 k = 10), Erd s - Rényi véletlen gráfon (n = 1000 p = 0, 01 k = 9, 96), Watts - Strogatz gráfon (n = 1000 k = 10 p = 0, 1 k = 10) és Barabási - Albert gráfon (n = 1000 m = 5 k = 10) végzett összehasonlító szimuláció, t függvényében ábrázolva az r arányokat. k az átlagos fokszám a gráfokban. λ = 1 α = 1 23

17. ábra. Reguláris véletlen gráfon (n = 1000 k = 10), Erd s - Rényi véletlen gráfon (n = 1000 p = 0, 01 k = 9, 96), Watts - Strogatz gráfon (n = 1000 k = 10 p = 0, 1 k = 10) és Barabási - Albert gráfon (n = 1000 m = 5 k = 10) végzett összehasonlító szimuláció, t függvényében ábrázolva az r arányokat. λ = 2 α = 1 Mivel az Erd s - Rényi véletlen gráf van legközelebb a reguláris gráfhoz, ezért a két gráfon lefutó folyamatok is nagyon hasonló ütemben folynak le. A Watts - Strogatz gráf ugyan közel reguláris, de nagyon nem véletlenszer, ezért is tér el az el z kett t l. A Barabási - Albert gráf fokszámeloszlása nagyon heterogén, ezért a lefolyás is lassabb, hiszen a csúcsok többségének fokszáma 5, amik lassabban terjesztik az információt. Ehhez képest nem sok nagy fokszámú hub van, ami viszont gyorsít a terjedés sebességén. 24

18. ábra. Barabási - Albert gráfon végzett regresszió α és log(r ) között. Kékkel a szimuláció által mért adatok, pirossal a bel lük számolt regressziós egyenes (R 2 = 0, 9851). n = 500 m = 2 λ = 0, 7 α = 0.1, 0.105,..., 0.6 A kapott regressziós egyenes 1, 8165α + 0, 0562 = log(r ), amit e-re emelve kapjuk, hogy e 1,8165α r 19. ábra. Barabási - Albert gráfon végzett regresszió 1 λ és log(r ) között. Kékkel a szimuláció által mért adatok, pirossal a bel lük számolt regressziós egyenes (R 2 = 0, 9959) n = 500 m = 2 λ = 0.1, 0.105... 1 α = 0, 1 A kapott regressziós egyenes 0, 1234 1 λ + 0, 0439 = log(r ), amit e-re emelve kapjuk, hogy e 0,1234 1 λ r 25

20. ábra. Barabási - Albert gráfon végzett regresszió α λ és log(r ) között. Kékkel a szimuláció által mért adatok, pirossal a bel lük számolt regressziós egyenes (R 2 = 0, 9621) n = 500 m = 2 λ = 0.3, 0.305... 0.8 α = 0.3, 0.305... 0.8 A kapott regressziós egyenes 1, 1310 α λ + 0, 0671 = log(r ), amit e-re emelve kapjuk, hogy e 1,1310 α λ r Azaz az el z három regresszió alapján Barabási-Albert gráfon r -t közelíthetjük e C α λ értékkel. 26

3. Híresztelés terjedését leíró teljes dierenciálegyenlet-rendszerek Ebben a fejezetben felírom az els dierenciálegyenleteket. Ezek a gráf teljes szerkezetét, minden csúcsának pontos állapotát tartalmazva jönnek létre. 3.1. A két csúcsú teljes gráf El ször a két csúcsú teljes gráfon lefutó folyamatokat írjuk le. Ez egyfel l megmutatja a felírható dierenciálegyenletek létrejöttét, másfel l tesztelhetjük vele, hogy a szimuláció mennyire pontos, végül bemutatom rajta az összevonással kapható egyenleteket. Egy adott id pontban a rendszer minden csúcsa az {I, S, R} halmaz egy elemének állapotában van, azaz a rendszer megadható egy 3 2 hosszúságú vektorral, oly módon, hogy a vektorban az egyes állapotok valószín ségei vannak. A rendszer dinamikáját az átmenet mátrix határozza meg, mely megadja, hogy egy állapotból milyen valószín séggel jut át egy másik állapotba a rendszer egységnyi id alatt. A rendszer állapotát a t id ben az x : R {II, IS, IR, SI, SS, SR, RI, RS, RR} függvény írja le, ami azt adja meg, hogy milyen állapotban van az 1. illetve 2. csúcs. A rendszerrel a következ dolgok történhetnek egy rövid id alatt: II II IS IS, SS IR IR SI SI, SS SS SS, SR, RS SR SR, RR RI RI RS RS, RR RR RR Vezessük be a következ jelölést: P XY (t) := P (x(t) = XY ), ahol X, Y {I, S, R} A teljes valószín ség tétele alapján felírhatjuk a következ egyenleteket, az el bb felírt átmeneteket felhasználva: 27

P II (t + t) = P (x(t + t) = II x(t) = II) P II (t) (3.1) P IS (t + t) = P (x(t + t) = IS x(t) = IS) P IS (t) (3.2) P IR (t + t) = P (x(t + t) = IR x(t) = IR) P IR (t) (3.3) P SI (t + t) = P (x(t + t) = SI x(t) = SI) P SI (t) (3.4) P SS (t + t) = P (x(t + t) = SS x(t) = SI) P SI (t) + P (x(t + t) = SS x(t) = IS) P IS (t) + P (x(t + t) = SS x(t) = SS) (3.5) P SR (t + t) = P (x(t + t) = SR x(t) = SS) P SS (t) + P (x(t + t) = SR x(t) = SR) P SR (t) (3.6) P RI (t + t) = P (x(t + t) = RI x(t) = RI) P RI (t) (3.7) P RS (t + t) = P (x(t + t) = RS x(t) = SS) P SS (t) + P (x(t + t) = RS x(t) = RS) P RS (t) (3.8) P RR (t + t) = P (x(t + t) = RR x(t) = RS) P RS (t) + P (x(t + t) = RR x(t) = SR) P SR (t) + P (x(t + t) = RR x(t) = RR) P RR (t) (3.9) Most vegyük újra a lehetséges átmeneteket és adjuk meg a valószín ségeiket: Jelölés: P (ZW XY ) := P (x(t + t) = XY x(t) = ZW ), ahol X, Y, Z, W {I, S, R}. Használni fogom az 1 e x = x illetve e x = 1 x közelítéseket. P (II II) = 1, mivel II állapotból nem tud elmozdulni a rendszer P (IS IS) = 1 (1 e λ t ) = 1 λ t, P (IS SS) = 1 e λ t = λ t 28

P (IR IR) = 1 P (SI SI) = 1 λ t, P (SS SS) = 1 2α t, P (SR SR) = 1 α t, P (SI SS) = λ t P (SS SR) = P (SS RS) = α t P (SR RR) = α t P (RI RI) = 1 P (RS RS) = 1 α t, P (RS RR) = α t P (RR RR) = 1 Most írjuk vissza ezeket a (3.1)-(3.9) egyenletekbe: P II (t + t) = 1 P II (t) P IS (t + t) = (1 λ t) P IS (t) P IR (t + t) = 1 P IR (t) P SI (t + t) = (1 λ t) P SI (t) P SS (t + t) = λ t P SI (t) + λ tp IS + (1 2α t) P SS (t) P SR (t + t) = α t P SS (t) + (1 α t) P SR (t) P RI (t + t) = 1 P RI (t) P RS (t + t) = α t P SS (t) + (1 α t) P RS (t) P RR (t + t) = α t P RS (t) + α t P SR (t) + 1 P RR (t) Végül az azonos index tagokat bal oldalra rendezve, t-val elosztva és lim -t alkalmazva mindkét oldalra, kapjuk, hogy t 0 P II = 0 (3.10) P IS = λp IS (3.11) P IR = 0 (3.12) P SI = λp SI (3.13) P SS = λp SI + λp IS 2αP SS (3.14) P SR = αp SS αp SR (3.15) P RI = 0 (3.16) 29

P RS = αp SS αp RS (3.17) P RR = αp RS + αp SR (3.18) Az y(t) = P II P IS P IR P SI P SS P SR P RI P RS P RR 0 0 0 0 0 0 0 0 0 0 λ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 λ 0 0 0 0 0 és A = 0 λ 0 λ 2α 0 0 0 0 0 0 0 0 α α 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 α 0 α 0 0 0 0 0 0 0 α 0 α 0 jelöléseket bevezetve a dierenciálegyenlet az ẏ = Ay alakban írható le. Vegyük a v I = (2, 1, 1, 1, 0, 0, 1, 0, 0), v S = (0, 1, 0, 1, 2, 1, 0, 1, 0), v R = (0, 0, 1, 0, 0, 1, 1, 1, 2) vektorokat. Ezeket felhasználva kapjuk a korábban bevezetett függvényeket, amelyeket már ábrázolhatunk: I(t) =< v I ; y(t) > S(t) =< v S ; y(t) > R(t) =< v R ; y(t) > Most és a kés bbiekben is a dierenciálegyenleteket a MATLAB ode45 megoldójával oldottam meg. Célszer a numerikus megoldást és a szimulációt egy képen megjeleníteni, ezzel tesztelve, hogy mennyire pontos a dierenciálegyenlet. 21. ábra. Két csúcsú teljes gráfon végzett szimuláció és a dierenciálegyenletrendszer numerikus megoldásának (szürke karika) összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. λ = 0, 5 α = 1 30

22. ábra. Két csúcsú teljes gráfon végzett szimuláció és a dierenciálegyenletrendszer numerikus megoldásának (szürke karika) összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. λ = 1 α = 1 Mivel a rendszernek három végállapota lehet II, IR, RR és én az IS illetve SI állapotokból indítom, ezért mindenképpen az RR állapotba fog eljutni. Így az R csúcsok aránya a teljes hálózatban 1 lesz. 3.2. A három csúcsú teljes gráf Az el z ekben leírt módon eljuthatunk a három csúcsú teljes gráfot leíró teljes dierenciálegyenlet-rendszerhez: P III = 0 (3.19) P IIS = 2λP IIS (3.20) P ISI = 2λP ISI (3.21) P SII = 2λP SII (3.22) P IIR = 0 (3.23) P IRI = 0 (3.24) P RII = 0 (3.25) P ISS = 2λP ISS 2αP ISS + λp ISI + λp IIS (3.26) P SIS = 2λP SIS 2αP SIS + λp SII + λp IIS (3.27) P SSI = 2λP SSI 2αP SSI + λp SII + λp ISI (3.28) P ISR = λp ISR αp ISR + αp ISS (3.29) 31

P IRS = λp IRS αp IRS + αp ISS (3.30) P SIR = λp SIR αp SIR + αp SIS (3.31) P RIS = λp RIS αp RIS + αp SIS (3.32) P SRI = λp SRI αp SRI + αp SSI (3.33) P RSI = λp RSI αp RSI + αp SSI (3.34) P IRR = αp ISR + αp IRS (3.35) P RIR = αp SIR + αp RIS (3.36) P RRI = αp SRI + αp RSI (3.37) P SSS = 6αP SSS + 2λP ISS + 2λP SIS + 2λP SSI (3.38) P SSR = 4αP SSR + λp ISR + λp SIR + 2αP SSS (3.39) P SRS = 4αP SRS + λp IRS + λp SRI + 2αP SSS (3.40) P RSS = 4αP RSS + λp RSI + λp RIS + 2αP SSS (3.41) P SRR = 2αP SRR + 2αP SSR + 2αP SRS (3.42) P RSR = 2αP RSR + 2αP SSR + 2αP RSS (3.43) P RRS = 2αP RRS + 2αP SRS + 2αP RSS (3.44) P RRR = 2αP RRS + 2αP RSR + 2αP SRR (3.45) Egy szükséges feltétel a helyességhez, hogy az egyenletek bal oldalainak összege 0, hiszen minden átmenet megjelenik pozitív és negativ el jellel is, más-más sorban. Nem feltétlen elégséges, hiszen el fordulhat, hogy egy átmenetr l teljesen megfeledkeztünk és akkor mindkét el jellel hiányzik, azaz az összeg így is 0 lesz. 32

23. ábra. Háromszög gráfon végzett szimuláció és a dierenciálegyenlet-rendszer numerikus megoldásának (szürke karika) összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. λ = 0, 5 α = 1 24. ábra. Háromszög gráfon végzett szimuláció és a dierenciálegyenlet-rendszer numerikus megoldásának (szürke karika) összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. λ = 1 α = 1 Most 8 végállapota van a rendszernek: III, IIR, IRI, RII, IRR, RIR, RRI, RRR. Mivel egy S típusú és két I típusú csúccsal indult a szimuláció, ezért az utolsó 4 állapotba állhat be a rendszer, azaz el fordulhat, hogy nem mindenhova jut el az információ, ezért most r 1. 33

A feladathoz tartozó A átmenet mátrix most 27 27 méret. Az el bb leírt módon nagyobb teljes gráfhoz is meghatározható az ez az átmenet mátrix, tehát a dierenciálegyenlet-rendszer. Bár ennek felírása nagyon pontos leírást ad a folyamat terjedésér l, de ennek az az ára, hogy n csúcs esetén 3 n darab egyenletet kell felírni és megoldani. Mivel a numerikus megoldás számítása során nagyjából pár ezres nagyságrend egyenletet lehet kezelni, ezért az ilyen irányú fejl dés meglehet sen korlátozott. Lényegében maximum 8 csúcsú (tetsz leges) gráfon folyó folyamatok pontos számítására van lehet ség. 3.3. Összevonás teljes gráfon Nagyméret lineáris közönséges dierenciálegyenlet-rendszereket, összevonással (lumping) kisebb méret rendszerekre hozhatunk, melyek megoldása ugyan nem szolgáltat ugyanannyi információt, mint az eredeti rendszer megoldása, de számunkra értékes információkat ez is tartalmazhat, és ezáltal nagyobb rendszereket is kezelhetünk. A most következ szakaszban, nem vesszük gyelembe a gráf teljes kinézetét, csak a benne lév I és S típusú csúcsok számát. Mivel a hálózat mérete állandó, n csúcsú gráf, ezért ha megadjuk az I és S csúcsok számát, akkor tulajdonképpen az R típusú csúcsok száma is adott, hiszen összegük n. Ilyen módon a rendszer megadható az x : R {1,..., n} 2 függvénnyel, ahol x 1 (t) a t id pontban a hálózat I típusú csúcsainak és x 2 (t) az S típusú csúcsainak a száma. Világos, hogy x 1 (t) + x 2 (t) n minden esetben teljesül. Ez a fajta összevonás kézenfekv nek t nik, mert információ (vagy betegség) terjedésekor az egyik legfontosabb kérdés, hogy a teljes hálózat hány százalékát érinti a folyamat. Ez az összevonás gyelmen kívül hagyja a csúcsok között lév esetleges hierarchiát, nem tudja megválaszolni, hogy egy konkrét csúcs milyen állapotba került a folyamat végére. Ráadásul ez az összevonás nem mindig tehet meg. Nem elég ugyanis meghatározni a csoportokat, amire felosztjuk a gráfot, hanem a köztük történ átmeneteket is fel kell tudnunk írni. Teljes gráfok esetén ez sikerül, hiszen itt minden csúcs kapcsolatban van egymással. 34

3.3.1. A két csúcsú teljes gráf Vezessük be a következ jelölést: P i,j (t) := P (x(t) = (i, j)) i = 0, 1, 2 j = 0, 1, 2 i + j 2 Most az el bb leírt módon építjük fel a dierenciálegyenleteket. A teljes várható érték tétel alapján: P 2,0 (t + t) = P (x(t) = (2, 0) x(t) = (2, 0)) P 2,0 (t) (3.46) P 1,1 (t + t) = P (x(t) = (1, 1) x(t) = (1, 1)) P 1,1 (t) (3.47) P 1,0 (t + t) = P (x(t) = (1, 0) x(t) = (1, 0)) P 1,0 (t) (3.48) P 0,2 (t + t) = P (x(t) = (0, 2) x(t) = (1, 1)) P 1,1 (t) + P (x(t) = (0, 2) x(t) = (0, 2)) P 0,2 (t) (3.49) P 0,1 (t + t) = P (x(t) = (0, 1) x(t) = (0, 2)) P 0,2 (t) + P (x(t) = (0, 1) x(t) = (0, 1)) P 0,1 (t) (3.50) P 0,0 (t + t) = P (x(t) = (0, 0) x(t) = (0, 1)) P 0,1 (t) + P (x(t) = (0, 0) x(t) = (0, 0)) P 0,0 (t) (3.51) Vegyük lehetséges átmeneteket és adjuk meg a valószín ségeiket: Jelölés: P (i 2, j 2 i 1, j 1 ) := P (x(t + t) = (i 1, j 1 ) x(t) = (i 2, j 2 )) P (2, 0 2, 0) = 1 P (1, 1 1, 1) = 1 λ t P (1, 0 1, 0) = 1 P (1, 1 0, 2) = λ t P (0, 2 0, 2) = 1 2α t P (0, 2 0, 1) = 2α t P (0, 1 0, 1) = 1 α t P (0, 1 0, 0) = α t P (0, 0 0, 0) = 1 35

Most írjuk vissza ezeket a (3.46)-(3.51) egyenletekbe: P 2,0 (t + t) = 1 P 2,0 (t) P 1,1 (t + t) = (1 λ t) P 1,1 (t) P 1,0 (t + t) = 1 P 1,0 (t) P 0,2 (t + t) = λ t P 1,1 (t) + (1 2α t)p 0,2 (t) P 0,1 (t + t) = 2α t P 0,2 (t) + (1 α t) P 0,1 (t) P 0,0 (t + t) = α t P 0,1 (t) + 1 P 0,0 Végül, mint az el bb az azonos index tagokat bal oldalra rendezve, t-vel elosztva és lim -t alkalmazva mindkét oldalra, kapjuk, hogy t 0 P 2,0 = 0 (3.52) P 1,1 = λp 1,1 (3.53) P 1,0 = 0 (3.54) P 0,2 = λp 1,1 2αP 0,2 (3.55) P 0,1 = 2αP 0,2 αp 0,1 (3.56) P 0,0 = αp 0,1 (3.57) Vegyük a v I = (2, 1, 1, 0, 0, 0), v S = (0, 1, 0, 2, 1, 0), v R = (0, 0, 1, 0, 1, 2), valamint az y(t) = (P 2,0, P 1,1, P 1,0, P 0,2, P 0,1, P 0,0 ) T bevezetett skaláris szorzatokat: vektorokat majd a korábban I(t) =< v I ; y(t) > S(t) =< v S ; y(t) > R(t) =< v R ; y(t) > 36

25. ábra. Két csúcsú teljes gráfon a korábbi (3.10)-(3.18) egyenletekb l álló rendszer (fekete karika) és a most kapott 6 egyenletb l álló rendszer (kék szaggatott) i, s, r arányai az id függvényében λ = 1 α = 1 Látható, hogy az új rendszer pontosan illeszkedik a korábbira, tehát az el bbi 9 egyenletet sikerült 6 másik egyenlettel helyettesíteni, ha csak a csúcsok arányainak megoszlását vesszük gyelembe. Természetesen ez az egyszer sítés abból fakad, hogy míg az el bb pontosan tudtuk mindkét csúcsról minden pillanatban, hogy milyen állapotban van, addig most csak az egyes típusok arányait tudjuk megmondani. 3.3.2. A három csúcsú teljes gráf P i,j (t) := P (x(t) = (i, j)) i = 0, 1, 2, 3 j = 0, 1, 2, 3 i + j 3 Teljesen hasonló módon juthatunk el a háromszög gráf összevonásakor keletkez egyenletrendszerhez. Most P i,j -re i = 0, 1, 2, 3 j = 0, 1, 2, 3 i + j 3 teljesül. P 3,0 = 0 (3.58) P 2,1 = 2λP 2,1 (3.59) P 2,0 = 0 (3.60) P 1,2 = 2λP 2,1 2αP 1,2 2λP 1,2 (3.61) P 1,1 = 2αP 1,2 λp 1,1 λp 1,1 (3.62) P 1,0 = αp 1,1 (3.63) 37

P 0,3 = 2λP 1,2 6αP 0,3 (3.64) P 0,2 = λp 1,1 + 6αP 0,3 4αP 0,2 (3.65) P 0,1 = 4αP 0,2 2λP 0,1 (3.66) P 0,0 = 2αP 0,1 (3.67) A korábbival megegyez módon most is ábrázolhatjuk az eredményt. Látható, hogy a korábbi 27 egyenletb l álló rendszer helyett, most csupán 10-zel le tudtuk írni ugyanolyan pontosan a folyamatot. Természetesen a gráf egyes csúcsainak pontos állapotát most sem tudjuk, csak az egyes csúcsok számának arányát. 26. ábra. Háromszög gráfon a korábbi 3.19-3.45 egyenletekb l álló rendszer (fekete karika) és a most kapott 10 egyenletb l álló rendszer (kék szaggatott) i, s, r arányai az id függvényében λ = 1 α = 1 3.3.3. n csúcsú teljes gráf Adott n csúcsú teljes gráf esetén: P i,j (t) i = 0, 1,..., n j = 0, 1,..., n i + j n legyen, mint fent. Most megadom a teljes gráf összevonása után kapott egyenletrendszert. Ha az I típusú csúcsok száma k(= 0, 1,..., n) akkor az S típusú csúcsok száma legfeljebb n k, azaz legfeljebb n k + 1 féle (0, 1,..., n k) lehet. Így a teljes egyenletrendszer mérte (n+1)+n+(n 1)+ +(n k +1)+ +1 = (n+2)(n+1) 2 = O(n 2 ), azaz a teljes 3 n méret rendszert sikerült polinomiális nagyságrend re összevonni. Ez bár nagy ugrás az el z ekhez képest, mégsem tekinthet gyakorlati szempontból kielégít nek, hiszen mint korábban említettem, pár ezres nagyságrendnél 38

nagyobb dierenciálegyenlet-rendszer kezelhetetlen, így ezzel a módszerrel csak pár tíz csúcsú teljes gráfot lehet leírni. El ször a széls esetekre írjuk fel a megfelel egyenleteket. Ha csak I típusú csúcs van, akkor a rendszer nem mozdul ki bel le. P n,0 = 0 (3.68) A P k,0 állapot stabil, tehát nincs benne negatív tag. Csak egy S R átmenet következtében juthatott ebbe az állapotba, azaz ha volt 1 S típusú és n k 1 R típusú csúcs, ekkor a megfelel egyenlet: P k,0 = α(n k 1)P k,1 k = 0, 1,..., n 1 (3.69) Ha nincs R típusú csúcs (tehát k és n k I, illetve S típusú csúcs van), akkor kétféleképpen juthat ki ebb l az állapotból. Egyrészt I S átmenettel, ahol mind a k db I csúcsnak n k db S szomszédja van, és ezen átmenetek egymástól függetlenül megtörténhetnek. Másrészt S R átmenettel, ahol mind az n k db S csúcsnak n k 1 db S szomszédja van, és ezen átmenetek egymástól függetlenül megtörténhetnek. Bejuthat ebbe az állapotba egy I S átmenettel, azaz volt k + 1 db I és n k 1 db S csúcs. Ebben az esetben mivel minden I csúcsnak az összes S szomszédja, ezért az egyenlet: P k,n k = λk(n k)p k,n k α(n k)(n k 1)P k,n k + λ(k + 1)(n k 1)P k+1,n k 1 k = 0, 1,..., n 1 (3.70) Végül írjuk fel az általános esetet, ahol k db I és l db S típusú csúcs van, és nem egyezik meg a korábbi széls esetekkel. Kétféleképpen juthat ki a rendszer ebb l az állapotból. Egyfel l fert zés útján, ahol a k db I csúcs egymástól függetlenül válhat terjeszt vé az l db S szomszédja hatására. Másfel l, ha egy S csúcs válik R típusúvá, annak n k 1 db S és R szomszédja hatására. Ugyanezen két módon jöhet be ebbe az állapotba a rendszer. A kezdetben k + 1 db I csúcs valamelyike terjeszt vé válik annak l terjeszt szomszédja hatására, vagy az l+1 db S csúcs egyike válik akadályozóvá annak n k 1 db S és R szomszédja hatására. 39

P k,l = λklp k,l αl(n k 1)P k,l + λ(k + 1)(l 1)P k+1,l 1 + α(l 1)(n k 1)P k,l+1 (3.71) k = 0, 1,..., n 1 l = 1, 2,..., n 1 k + l < n 27. ábra. Teljes gráfon a dierenciálegyenlet numerikus megoldása (szürke karika) és a szimuláció összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. n = 15 λ = 0, 5 α = 1 28. ábra. Teljes gráfon a dierenciálegyenlet numerikus megoldása (szürke karika) és a szimuláció összehasonlítása, t függvényében ábrázolva az i (zöld), s (fekete), r (piros) arányokat. n = 35 λ = 1 α = 1 40

4. Általános dierenciálegyenletek Az el bbiekben láttuk, hogy egy speciális a gráfon, a teljes gráfon az összevonással kapott dierenciálegyenlet-rendszer nagyon pontosan leírja a folyamatot. Nem csak annak végállapotát, de id beni lefolyását is megadja a rendszer megoldása. Azt is láttuk, hogy a kezdeti rendszer exponenciális méretét polinomiális nagyságúra lehet csökkenteni, ami megnöveli azon hálózat méretét, amit így le lehet írni. Azonban ez a leírás is korlátozott, hiszen n, azaz a hálózat méretének növekedtével az egyenletrendszer mérete egyre kezelhetetlenebbé válik. Jó lenne olyan méret rendszert találni, ami n növekedtével, annak kisebb rendjével n ne, vagy konstans lenne. Valószín leg nem meglep, hogy ha egy nagy hálózatot minél kevesebb egyenlettel próbálunk leírni, akkor ez a leírás egyre pontatlanabb lesz, vagy egyre kevesebb információt fog szolgáltatni. A korábbiakban látott pontosság nem lehet a kit zött cél, ha csökkenteni akarjuk a rendszer méretét. A most következ szakaszban két újabb egyenletrendszert ismertetek, ami már közel konstans nagyságú, de a λ és α ráták jó aránya esetén mégis elég jó közelítést ad a folyamat leírására. 4.1. Homogén fokszámeloszlású gráf Az információterjedés legegyszer bb modelljében azt feltételezik, hogy a folyamat leírható, két függvénnyel, a tájékozatlan és terjeszt egyedek számával az id függvényében, azaz I(t)-vel és S(t)-vel. Ekkor a következ egyenleteket írhatjuk fel: I = λn S I (4.1) Ṡ = λn S I αn S S,R (4.2) Ṙ = αn S S,R (4.3) Ahol N S I az SI típusú élek, N S S,R pedig az SS és SR típusú élek együttes számát adja meg. Igazából mivel I(t) + S(t) + R(t) = n ezért elég két egyenlet is, a harmadik már egyértelm en adódik. Az egyenletrendszer akkor hasznos, ha ezt a két számot ki tudjuk fejezni a három függvény segítségével. Ez nem tehet meg egzakt módon, de bizonyos gráfoknál használt közelítések jó eredményt adhatnak. Az egyik lehetséges közelítés, ha feltesszük, hogy a gráf fokszemeloszlása közel homogén, minden csúcs nagyjából ugyanakkora fokszámú. Jelöljük ezt az átlagos 41

fokszámot k-val és vegyünk egy I típusú csúcsot. Mivel a maradék n 1 csúcs közül S(t) db terjeszt van, ezért ennek az I típusú csúcsnak várhatóan k S(t) n 1 db terjeszt ismer se van. Mivel összesen I(t) db terjeszt van, kapjuk, hogy N S I = I(t)k S(t) n 1. Hasonló módon juthatunk el, az N S S,R = S(t)k S(t)+R(t) n 1 összefüggéshez. Visszaírva kapjuk, hogy I(t) = λi(t)k S(t) n 1 Ṡ(t) = λi(t)k S(t) S(t) + R(t) αs(t)k n 1 n 1 (4.4) (4.5) S(t) + R(t) Ṙ(t) = αs(t)k n 1 Most osszuk el az összes egyenletet n-nel. A korábban használt (4.6) i(t) = I(t)/n, s(t) = S(t)/n, r(t) = R(t)/n, jelölésekre áttérve, és felhasználva, hogy nagy n esetén n 1 n, kapjuk, hogy [6] i = λkis (4.7) ṡ = λkis αks(s + r) (4.8) ṙ = αks(s + r) (4.9) A kezdeti feltételek: i(0) = (n 1)/n, s(0) = 1/n mivel i(t) + s(t) + r(t) = 1 így r(0) = 0. Látható, hogy már a (4.4) - (4.6) egyenletek is konstans méret rendszert alkotnak, de a (4.7) - (4.9) egyenltek már n értékét l is függetlenek. Ahhoz, hogy ilyen kisméret egyenletrendszerrel írjuk le a folyamatot két nagyon er s feltételt is tettünk. Egyfel l, hogy a fokszámok nagyjából egyenletesen oszlanak el (holott, mint arról már korábban szó volt sok hálózatnál ez nem így van) másfel l, hogy az S(t)/n arány ami a gráf egészében jelenlév S csúcsok arányát adja meg, az jól közelíti minden egyes I csúcs szomszédai között lév S csúcsok arányát. Ez utóbbi feltevés nagyon nem teljesül például egy körgráf esetén, ami pedig reguláris gráf, tehát az el bbi feltétel pontosan teljesül. 42

29. ábra. A dierenciálegyenlet-rendszerb l számított r(t) függvény különböz λ értékek esetén. Minél kisebb ez a λ érték, annál lassabb a folyamat lefolyása λ = 0.2, 0.4,..., 2 α = 1 k = 8 30. ábra. A (4.7)-(4.9) rendszerb l számított r(t) függvény különböz k értékek esetén. Látható, hogy az r érték nem függ k megválasztásától, csak a folyamat lefolyásának sebességét befolyásolja úgy, hogy minél kisebb a k annál lassabban áll le. λ = 1 α = 1 k = 3, 4,..., 10 A rendszer pontatlanságát a két el bb említett feltételezés okozza, viszont ha egy teljes gráfot veszünk akkor mindkét közelítés pontos lesz, így az egyenletrendszer is közel pontosan leírja a folyamatot. Ha pedig véletlen reguláris gráfot vizsgálunk, akkor az átlagos fokszámmal való számolás lesz pontos. 43