A magyar vasúti infrastruktúra gráfelméleti elemzése



Hasonló dokumentumok
Diszkrét matematika 2.C szakirány

Gráfelméleti alapfogalmak-1

Diszkrét matematika 2. estis képzés

Diszkrét matematika 2.C szakirány

Diszkrét matematika 1. estis képzés

Diszkrét matematika 2.C szakirány

Közösség detektálás gráfokban

Diszkrét matematika 2. estis képzés

Összefoglalás és gyakorlás

Diszkrét matematika 2. estis képzés

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

A számítástudomány alapjai

SzA II. gyakorlat, szeptember 18.

22. GRÁFOK ÁBRÁZOLÁSA

Elemi statisztika fizikusoknak

Diszkrét matematika 2.

Diszkrét matematika 2. estis képzés

Statisztikai módszerek a skálafüggetlen hálózatok

A Barabási-Albert-féle gráfmodell

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

Euler tétel következménye 1:ha G összefüggő síkgráf és legalább 3 pontja van, akkor: e 3

Diszkrét matematika 1. estis képzés

Diszkrét matematika 2.C szakirány

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Gráfelméleti feladatok. c f

Adatszerkezetek 2. Dr. Iványi Péter

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Diszkrét matematika 2.

Feladatok, amelyek gráfokkal oldhatók meg 1) A königsbergi hidak problémája (Euler-féle probléma) a

Diszkrét matematika 2.C szakirány

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Prímszámok statisztikai analízise

Szalai Péter. April 17, Szalai Péter April 17, / 36

Társadalmi és gazdasági hálózatok modellezése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A leíró statisztikák

Algoritmusok bonyolultsága

Matematikai geodéziai számítások 6.

Érdemes egy n*n-es táblázatban (sorok-lányok, oszlopok-fiúk) ábrázolni a két színnel, mely éleket húztuk be (pirossal, kékkel)

Érettségi előkészítő emelt szint évf. Matematika. 11. évfolyam. Tematikai egység/fejlesztési cél

Gráfok 2. Legrövidebb utak, feszítőfák. Szoftvertervezés és -fejlesztés II. előadás. Szénási Sándor

Matematikai geodéziai számítások 6.

Diszkrét matematika 2. estis képzés

Doktori disszertáció. szerkezete

MATEMATIKA HETI 5 ÓRA. IDŐPONT: Június 4.

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Gráfelméleti alapfogalmak

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

A hazai elszámolásforgalom hálózati elemzése

Gráfalgoritmusok ismétlés ősz

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

24. tétel. Kombinatorika. A grá fok.

A továbbiakban Y = {0, 1}, azaz minden szóhoz egy bináris sorozatot rendelünk

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Véletlen gráfok, hálózatok

Alapfogalmak II. Def.: Egy gráf összefüggő, ha bármely pontjából bármely pontjába eljuthatunk egy úton.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Ramsey-féle problémák

Algoritmuselmélet. Legrövidebb utak, Bellmann-Ford, Dijkstra. Katona Gyula Y.

bármely másikra el lehessen jutni. A vállalat tudja, hogy tetszőlegesen adott

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

1. tétel - Gráfok alapfogalmai

Sapientia - Erdélyi Magyar TudományEgyetem (EMTE) Csíkszereda IRT- 4. kurzus. 3. Előadás: A mohó algoritmus

Síkba rajzolható gráfok

1. tétel. 1. Egy derékszögű háromszög egyik szöge 50, a szög melletti befogója 7 cm. Mekkora a háromszög átfogója? (4 pont)

A 3D képgenerálás komplexitása

Magyar és angol szóasszociációs hálózatok vizsgálata. Orosz Katalin Kovács László Pollner Péter

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2005

Matematika tanmenet 11. évfolyam (középszintű csoport)

Diszkrét Matematika MSc hallgatók számára 7. Előadás Párosítási tételek Előadó: Hajnal Péter Jegyzetelő: Kovácsházi Anna

Gépi tanulás a gyakorlatban. Lineáris regresszió

Megerősítéses tanulás 7. előadás

A valószínűségszámítás elemei

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Diszkrét matematika 2.

Villamos autókból álló taxi flotta számára létesítendő töltőállomások modellezése

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

Számítógép hálózatok, osztott rendszerek 2009

Minimum követelmények matematika tantárgyból 11. évfolyamon

Osztályozóvizsga és javítóvizsga témakörei Matematika 9. évfolyam

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

( 1) i 2 i. megbízhatóságú a levont következtetése? A matematikai statisztika eszközeivel értékelje a kapott eredményeket!

Matematika. 9.osztály: Ajánlott tankönyv és feladatgyűjtemény: Matematika I-II. kötet (Apáczai Kiadó; AP és AP )

HÁLÓZAT Maximális folyam, minimális vágás

26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA

Diszkrét matematika 2.C szakirány

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Algoritmuselmélet. Bonyolultságelmélet. Katona Gyula Y.

PRÓBAÉRETTSÉGI 2004.május MATEMATIKA. KÖZÉPSZINT I. 45 perc

Komplex hálózatok: alapfogalmak, modellek, módszerek

Társadalmi és gazdasági hálózatok modellezése

Koordináta geometria III.

Átírás:

A magyar vasúti infrastruktúra gráfelméleti elemzése Ferenci Tamás tamas.ferenci@medstat.hu 2012. június 3.

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Köszönetnyilvánítás Gecse Gergelynek (BCE, Vállalatgazdaságtan Intézet, Logisztika és Ellátási Lánc Menedzsment Tanszék), amiért megtanította nekem az infrastruktúra alapjait Balázs Mártonnak (BME, Matematika Intézet, Sztochasztika Tanszék), amiért megtanította nekem rendesen a valószínűségszámítást... és a http://www.vasutallomasok.hu/-nak (majd kiderül miért)

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Problémafelvetés Komplex hálózatok empirikus vizsgálata: rengeteg eredmény az utóbbi 10 évben Newman (2003) csoportosítása: társadalmi, információs, technológiai, biológiai hálózatok Matematikai alap: gráfelmélet, ill. véletlen gráfmodellek által sugalltak A munka célja: a magyar vasúti infrastruktúra vizsgálata a fentiekben fontos jellemzőkre

Irodalmi előzmények Latora Machiori (2002): kis világ effektus a bostoni metrón, lokális és globális hatékonyság Sen et al (2003): kis világ effektus az indiai vasúthálózaton Seaton Hackett (2004): bostoni (reanalízis) és bécsi metró Kurant Thiran (2006): svájci és európai vasúthálózat, varsói metró Li Cai (2007): kínai vasút skálafüggetlensége Lee et al (2008): szöüli metró Sienkiewicz Holyst (2008): 22 lengyel város tömegközlekedése Wang et al (2009): kínai vasút (mégegyszer, másképp) Nem találtam még csak utalást sem arra, hogy a magyar vasúti infrastruktúrát valaha vizsgálta volna bárki ilyen szempontból.

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Pár fontos definíció I. A gráf egy G = (V, E) rendezett pár A számunkra most érdekes esetben (véges, irányítatlan gráf) V egy tetszőleges nemüres, véges ( V < ) halmaz, elemeinek neve: csúcs, pont (vagy szögpont) E egy V -beli rendezetlen párokból álló halmaz (tehát e E-re e = (v 1, v 1 ) ahol v 1, v 2 V ), elemeinek neve: él A legtipikusabb interpretációban a csúcsok bizonyos objektumoknak felelnek meg, az élek a köztük lévő kapcsolatoknak Az élekhez súlyokat is rendelhetünk egy w : E R függvény segítségével, w (e) az e él valamilyen (valós) jellemzője Ha e = (v 1, v 1 ) akkor azt mondjuk, hogy az e él illeszkedik a v 1 csúcsra (és persze a v 2 -re is)

Pár fontos definíció II. Egy csúcs deg (v) fokszáma a rá illeszkedő élek száma (deg (v) = e E:v e 1) Egy (v 0, e 1, v 1, e 2, v 2,..., v k 1, e k, v k ) sorozatot élsorozatnak nevezünk, ha e i = (v i 1, v i ) (azaz végig lehet élek mentén lépkedni a v 0, v 1,..., v k csúcsokon) Egy élsorozat út, ha nem érinti kétszer ugyanazt a csúcsot (azaz i j-re v i v j ) Azt mondjuk, hogy v a és v b a gráf ugyanazon komponensében van, ha van köztük út (el lehet lépkedni az egyikből a másikban a gráf élei mentén) Ha a gráf összes csúcsa egyetlen komponensben van, akkor a gráfot összefüggőnek nevezzük (minden pontból minden pont elérhető az élek mentén lépkedve)

Pár fontos definíció III. Egy (v 0, e 1, v 1, e 2, v 2,..., v k 1, e k, v k ) út hosszának a ki=1 w (e i ) mennyiséget nevezzük (Élsúlyozatban gráfban legyen w 1, azaz minden élhez rendeljük az 1 súlyt, ekkor a fenti hossz a szükséges lépések száma) Két pont, v a és v b között a legrövidebb út az az út, mely v a és v b között húzódik, és az ilyen tulajdonságú utak között minimális hosszúságú Ez a hossz a két pont geodetikus távolsága a gráfban, jele d ab Egy gráf diam (G) átmérője a legnagyobb geodetikus távolság, mely található pontjai között: diam (G) = max i,j V d ij

Tartalom Reprezentációs kérdések Adatszerzés 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Tartalom Reprezentációs kérdések Adatszerzés 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Reprezentációs kérdések Adatszerzés Miért elemezzük a vasútat gráfként? A vasúti infrastruktúra is felfogható úgy, mint objektumok és köztük kapcsolatok Jó ötlet lehet tehát gráfként elemezni! (Persze alkalmasan kell definiálni, hogy mi legyen az objektum (csúcs) és a kapcsolat (él) a gráf-reprezentációban) Mint hálózat, Newman kategorizálásában: technológiai hálózat

Vasúti hálózat gráf-reprezentációja Reprezentációs kérdések Adatszerzés Csúcsok az állomások/megállóhelyek (továbbiakban röviden: állomások), ez biztos De mi legyen az él? Ennek definíciója dönti el, hogy mit akarunk reflektálni a gráfban (mit fog jelenteni a távolság, fokszám stb.) Több lehetőséget is használtak már az irodalomban: Átszállások tere, P tér Állomások tere, I tér 1 Menetrendi megállások tere, L tér 1 A szakirodalomban érdekes módon ennek az egynek nem adtak rövid nevet, úgyhogy én neveztem el I térnek (utalva az infrastruktúrára)

Átszállások tere, P tér Reprezentációs kérdések Adatszerzés Két állomás össze van kötve, ha köztük átszállás nélkül el lehet jutni (legalább egy járat érinti mindkettőt) Fizikai távolság kimarad, az átszállások számát reflektáljuk Ilyen módon minden állomás, ahol ugyanazon vonat megáll, klikket képez (teljesen összekötött)

Állomások tere, I tér Reprezentációs kérdések Adatszerzés (A szakirodalomban érdekes módon ennek az egynek nem adtak rövid nevet, úgyhogy én neveztem el I térnek (utalva az infrastruktúrára)) Két állomás össze van kötve, ha közvetlen szomszédok a fizikai infrastruktúrán (megy közöttük vonal, amin nincs más állomás) Menet közben érintetett állomások számát, vagy a fizikai távolságot reflektáljuk A vonalak végeinél a pontoknak 1 lesz a fokszáma ( end-of-line hatás)

Menetrendi megállások tere, L tér Reprezentációs kérdések Adatszerzés Két állomás össze van kötve, ha van legalább egy vonat, ami közvetlenül egymás után a két állomáson áll meg Szükséges megállások számát reflektáljuk (ami persze több lehet, mint a menet közben érintett állomások száma)

Tartalom Reprezentációs kérdések Adatszerzés 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Szóba jövő adatforrások Reprezentációs kérdések Adatszerzés MÁV: a vasútrendszer csak térképként, a menetrend csak PDF-ben, Elvira csak on-line lekérdezéssel... HÜSZ-ben csak bizonyos távolságok (nem is sok) Megoldás a http://www.vasutallomasok.hu/ lett

Adatgyűjtés Reprezentációs kérdések Adatszerzés Az oldalon a vasútvonalak struktúrája meglehetősen szabályos, HTML-kódban elérhető Saját fejlesztésű Visual C# programmal (HTMLAgilityPack segítségével) harvest

Az adatgyűjtés problémai Reprezentációs kérdések Adatszerzés Sajnos az oldal a 2007-es állapotokat mutatja Továbbá egyéb, nem gépesíthető, mindenképp kézzel elvégzendő adattisztítási feladatok is vannak, amiket nem lehet ilyen módon megspórolni (pl. Szajol és Szolnok között nincsen fizikailag két összeköttetés csak azért, mert a 100-as és 120-as vonal is átmegy rajtuk ezt a program magától persze nem tudja kitalálni) Itt tehát még lehetne javítani...

Elemzése Reprezentációs kérdések Adatszerzés Így rekonstruálható a magyar vasúthálózat Fizikailag az infrastruktúra, nem a rajta közlekedő vonatok: tehát most I terű elemzést fogunk végezni (Elvileg a P tér rekonstrukciója nem nehéz, általában ún. klikkesítéssel szokták megoldani, azaz egy adott vasútvonal valamennyi állomását összekötik mindegyik másikkal ez lényegében azt feltételezi, hogy minden vonalon van legalább egy (személy)vonat, ami érinti a vonal összes állomását) Elemzés R statisztikai programcsomag alatt, az igraph könyvtár használatával történt (a szkript a szerzőnél elérhető kérésre) Még rengeteg további dolgot lehetne vizsgálni, ez csak ízelítő...

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Alapvető adatok V = 1256 E = 1406 Összefüggő gráf... de még csak nem is kétszeresen (pont)összefüggő: 160 állomás van (ún. artikulációs pontok), amit elhagyva nő a komponensek száma (155 esetben 2-re, 5 esetben 3-ra) Gyakorlati jelentősége csekély: legfeljebb 20 állomás választható le (Mátészalka elhagyásával) (Emiatt egy állomás elhagyásával okozott kár mérésére nem ez lesz a jó mérőszám)

Átmérő diam (G) = 622 km, Mándok és Rédics között

Átmérő diam (G) = 622 km, Mándok és Rédics között

Átmérő diam (G) = 622 km, Mándok és Rédics között

Átmérő diam (G) = 622 km, Mándok és Rédics között 120 állomást kell érinteni, minimum 3 átszállás, minimum 11:37 menetidő (de ehhez már 5 átszállás kell!), minimum 6 780 Ft másodosztályon

Átlagos fokszám, sűrűség Átlagos fokszám: z = E V = 1,12 Sűrűség (megvalósult élek aránya a maximális lehetségeshez viszonyítva): ρ = E V ( V 1) /2 = 0,0018

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Átlagos távolságok Átlagos geodetikus távolság: l = Harmada az átmérőnek 1 1 2 n (n + 1) d ij = 237,2 km i j Harmonikus jellegű átlag (az ellenállóképességhez jön majd jól, mert l =, ha nem összefüggő a gráf és így d ij = is lesz): 1 l h = 1 2 n (n + 1) 1 d 1 ij i j = 143,9 km Felfogható úgy is, hogy dij 1 távolságokat elhagytuk egyfajta közelség; a nulla

Geodetikus távolságok eloszlása A geodetikus távolságok eloszlása (hisztogram és magfüggvényes sűrűség-becslő): Állomások közötti legrövidebb távolságok eloszlása Relatív gyakoriság 0.0000 0.0005 0.0010 0.0015 0.0020 0.0025 0.0030 0 100 200 300 400 500 600 700 Távolság [km] A harmonikus átlag tehát a balra ferdeség miatt kisebb

Klasztereződés (tranzitivitás) Globális tranzitivitás (a szomszédom szomszédja mekkora valószínűséggel az én szomszédom is?): C (1) = 3 háromszögek száma összekötött hármasok száma = 0,001868 Lokális tranzitivitás (a fenti kiszámolva a csúcsokra, majd ez átlagolva): C (2) = 0, 001091

A kisvilág-hatás értékelése Az I terű reprezentáció nem igazán alkalmas a kisvilág-hatás megítélésére (A tranzitivitás például nyilvánvalóan megkérdőjelezhető értelmű fogalom az I téren) Ehhez jobban illene valamilyen súlyozatlan (tehát bináris), kapcsolatokat reprezentáló tér, például a P

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Fokszám-eloszlás Az állomások fokszámainak eloszlása: A magyar vasúthálózat fokszámeloszlása Relatív gyakoriság 0.0 0.2 0.4 0.6 0.8 1.0 1 2 3 4 5 6 7 8 Fokszám A továbbiakban az 1-et elhagyjuk (end-of-line hatás)

Fokszám-eloszlás Az állomások fokszámainak eloszlása féllogaritmikus skálán: A magyar vasúthálózat fokszámeloszlása (féllogaritmikus skála) Relatív gyakoriság 0.002 0.005 0.020 0.050 0.200 0.500 2 3 4 5 6 7 8 Fokszám Ez az ábra a p k e k/c jellegű exponenciális fokszám-lecsengés megítéléséhez hasznos

Fokszám-eloszlás Az állomások fokszámainak eloszlása logaritmikus skálán: A magyar vasúthálózat fokszámeloszlása (logaritmikus skála) Relatív gyakoriság 0.002 0.005 0.020 0.050 0.200 0.500 2 3 4 5 6 7 8 Fokszám Ez az ábra a p k k α jellegű hatványfüggvény szerinti (power law) fokszám-lecsengés megítéléséhez hasznos

Bevezetés, irodalmi áttekintés Fokszám-eloszlás Itt nehéz dönteni a kettő között; hatványfüggvényt használva az illesztéshez: A magyar vasúthálózat fokszámeloszlása (logaritmikus skála) és az illesztett power law eloszlás 95% os CI vel Relatív gyakoriság 0.002 0.005 0.010 0.020 0.050 3 4 5 6 7 8 Fokszám (Az illesztés az eredeti fokszámokból történt, ML-elven, ezért nem a legjobban illeszkedő egyenest kaptuk, az nem is lenne jó módszer) Konkrét paraméterek: x min = 3 (illeszteni amúgyis az eloszlás szélére kell), α = 4,805

5 4 3 2 1 Bevezetés, irodalmi áttekintés Fokszám-korreláció Vizualizálható az élek végén lévő fokszámok kontingenciatáblájával, mozaik ábrát használva: Fokszámok mozaikábrája 1 2 3 4 5 6 7 8 8 7 6

Fokszám-korreláció Szokták ezt a (Pearson-féle) lineáris korrelációs együtthatóval jellemezni; itt most r = 0,45 Mivel r > 0, pozitív asszortivitású hálózatról beszélhetünk (a nagyobb fokszámú pontok preferenciálisan nagyobb fokszámú pontokkal kapcsolódnak) Itt érzékelhető az ismérvek diszkrét jellege, így az r használata némiképp megkérdőjelezhető; a Goodman Kruskal γ értéke 0,67 (egybevág az előbbivel)

A skálafüggetlenség értékelése A skálafüggetlenség kis jóindulattal megvalósul Az értékelést nehezíti, hogy kicsi a maximális fokszám

Tartalom 1 Bevezetés, irodalmi áttekintés 2 3 Reprezentációs kérdések Adatszerzés 4

Kérdésfeltevés Hogy viselkedik a hálózat, ha csúcsokat eltávolítunk belőle ( támadás )? Itt most: terroristák felrobbantják az állomást, műszaki hiba miatt használhatatlanná válik stb. Viselkedés mérése: mennyit romlik a hálózat funkcionalitása (Funkcionalitás értsd: nehezebb (vagy akár lehetetlen) lehet eljutni vasúttal két pont között) Ennek mérése: hogyan változik az átlagos geodetikus távolság Mivel adott esetben a hálózat több komponensre is széteshet, a harmonikus jellegű átlagot fogjuk használni Eltérő feltevések a támadás jellegéről

Legérzékenyebb pontok Egyetlen állomás eltávolítására a legnagyobb romlás az elérhetőségben (emlékeztetőül: kezdetben l h = 143,9 km): Állomás neve l h l h /l h Bp.-Keleti 155,1 +7,73% Bp.-Kelenföld 153,7 +6,81% Bp.-Déli 153,5 +6,61% Kőbánya-Kispest 152,6 +5,99% Budafok 151,0 +4,93% Székesfehérvár 148,7 +3,32% Füzesabony 148,6 +3,27% Debrecen 148,0 +2,80% Rákosrendező 147,9 +2,78% Hatvan 147,9 +2,78%

A romlás szemléltetése Bp.-Keleti példáján A fentiek szerint a magyar vasúti infrastruktúra legérzékenyebb pontja Bp.-Keleti Az ennek eltávolításakor fellépő +7, 73 % romlás közelebbi szemléltetése az eltávolítás előtti és utáni távolság-eloszlással: Állomások közötti legrövidebb távolságok eloszlása, teljes hálózat Relatív gyakoriság 0.0000 0.0015 0.0030 0 100 200 300 400 500 600 700 Távolság [km] Állomások közötti legrövidebb távolságok eloszlása, Bp. Keleti eltávolítása után Relatív gyakoriság 0.0000 0.0015 0 100 200 300 400 500 600 700 Távolság [km]

A romlás szemléltetése Bp.-Keleti példáján Kicsit közvetlenebbül összehasonlíthatóan: Bp. Keleti eltávolításának hatása az átlagos távolságra Relatív gyakoriság 0.0000 0.0005 0.0010 0.0015 0.0020 0.0025 0.0030 Teljes hálózat Bp. Keleti eltávolítása után 0 100 200 300 400 500 600 700 Távolság [km]

Bevezetés, irodalmi áttekintés Egy állomás eltávolítása Általában, egy pont eltávolítása esetén a romlás eloszlása (boxplot-tal): Az átlagos távolságok eloszlása egy állomás eltávolítása után (egzakt) Teljes hálózat átlagos távolsága 144 146 148 150 152 154 Átlagos távolság eltávolítás után [km] (Az nem ellentmondás, hogy az átlagos távolság csökkenhet is, hiszen az elhagyás után a gráf mérete is kisebb lesz)

Két állomás eltávolítása Az előbbi olyan értelemben volt egzakt, hogy mind az 1256 állomás elhagyásának esetére kiszámoltuk az elhagyás utáni átlagos távolságot Két (és pláne több) állomás esetére ez már nem járható út, a lehetőségek kombinatorikusan nőnek (két állomást ) = 788140 módon lehet elhagyni) ( 1256 2 Ehelyett Monte Carlo-szimulációt használtam: 1000 véletlenszerű eltávolítási szituációból (pl. itt: véletlenül, visszatevés nélkül választott állomás-pár eltávolítása 1000-szer megismételve) számoltam az eloszlást

Két állomás eltávolítása Az átlagos távolságok eloszlása két állomás eltávolítása után (MC szimuláció, 1000 futtatás) Teljes hálózat átlagos távolsága 144 146 148 150 152 154 Átlagos távolság eltávolítás után [km]

Bevezetés, irodalmi áttekintés Az MC-szimulációs módszer megbízhatósága Az eloszlás szélei nem lesznek olyan pontosak (függ a szerencsétől, hogy pont kisorsuljuk-e az extrém eseteket)...... de egyébként megbízható módszer Ezt szemléltethetjük az eloszlás stabilizálódásával: Eltávolítás utáni átlagos távolság eloszlása (boxplot) 145 146 147 148 149 Két állomás eltávolítása utáni átlagos távolság eloszlásának alakulása az MC szimulációs futtatások számának függvényében 1 3 5 7 9 12 15 18 21 24 27 30 33 36 39 42 45 48 Az MC szimuláció futtatásainak száma

Az MC-szimulációs módszer megbízhatósága A medián stabilizálódása: Eltávolítás utáni átlagos távolság mediánja 144.5 144.6 144.7 144.8 144.9 145.0 145.1 145.2 Két állomás eltávolítása utáni átlagos távolság mediánjának alakulása az MC szimulációs futtatások számának függvényében 0 200 400 600 800 1000 Az MC szimuláció futtatásainak száma

Az MC-szimulációs módszer megbízhatósága Látványos, ha az 0-, 0,1-, 0,25-, 0,5-, 0,75-, 0,9-, 1-kvantiliseket ( seven number summary ) vizsgáljuk, ezzel ragadva meg az eloszlást: Két állomás eltávolítása utáni átlagos távolság nevezetes kvantiliseinek alakulása az MC szimulációs futtatások számának függvényében 1 Eltávolítás utáni átlagos távolságok nevezeti kvantilisei 144 146 148 150 152 154 0.9 0.75 0.5 0.25 0.1 0 0 200 400 600 800 1000 Az MC szimuláció futtatásainak száma

Az MC-szimulációs módszer megbízhatósága Látványos, ha az 0-, 0,1-, 0,25-, 0,5-, 0,75-, 0,9-, 1-kvantiliseket ( seven number summary ) vizsgáljuk, ezzel ragadva meg az eloszlást: Két állomás eltávolítása utáni átlagos távolság nevezetes kvantiliseinek alakulása az MC szimulációs futtatások számának függvényében Eltávolítás utáni átlagos távolságok nevezeti kvantilisei 143.5 144.0 144.5 145.0 145.5 146.0 146.5 1 0.9 0.75 0.5 0.25 0.1 0 0 200 400 600 800 1000 Az MC szimuláció futtatásainak száma

Az MC-szimuláció értékelése Tökéletesen látszik, hogy az extrémebb kvantilisek stabilizálódnak lassabban De 500 futtatás tulajdonképpen már ezeknek is elég (1000 biztosan) Ha nem nagyon az eloszlás széle érdekel minket, akkor gyors eredményhez már 2-300 futtatás is elég

Véletlen támadás Feltételezés: a támadók véletlenszerűen választanak állomásokat és kapcsolják ki őket Hogyan függ a hálózat teljesítménye (itt: átlagos úthossz) a kiiktatott állomások számától? Lényegében tehát: az előbbiek folytatása több állomásra Az összehasonlíthatóság kedvéért minden esetre MC-szimulált az eloszlás, 1000 futtatással

Véletlen támadás 1 2 3 4 5 6 7 8 9 10 145 150 155 160 165 170 A magyar vasúthálózat leromlása különbözo számú, véletlenszeruen választott állomás eltávolítására MC szimuláció, 1000 futtatás Kiesett állomások száma Eltávolítás utáni átlagos távolság eloszlása [km]

Véletlen támadás Csak a mediánokat ábrázolva: A magyar vasúthálózat leromlása különbözo számú, véletlenszeruen választott állomás eltávolítására Eltávolítás utáni átlagos távolság eloszlásának mediánja [km] 144 146 148 150 152 154 1 2 3 4 5 6 7 8 9 10 Kiesett állomások száma MC szimuláció, 1000 futtatás

Véletlen támadás értékelés Megállapíthatjuk, hogy a magyar vasúthálózat meglehetősen védett a véletlen állomás-kiesésekkel szemben: még 10 állomás kiesésekor is csak 4,36% a medián romlás az átlagos távolságban (Már ebből is sejthető, hogy célirányos támadásnál rosszabb lesz a helyzet, hiszen olyan állomást is lehet találni, aminek elhagyásával önmagában ennél nagyobb a kár... )

Koncentrált támadás módszertan Szokásos feltételezés: a támadók a legnagyobb fokszámú pontokkal kezdik a támadást, és haladnak a kisebb fokszámú pontok felé Itt nem a leglogikusabb, mert a legnagyobb fokszám nem feltétlenül a legkritikusabb csúcs (Például a két legnagyobb fokszámú állomás (8, Debrecen és Szolnok) egyike sincs benne a 10 legérzékenyebb állomásban, sőt, még a kettő együttes elhagyásakor is l h = 150,7 km, ami +4,69%-os növekedés csak) Ehelyett: megpróbáljuk megkeresni, hogy melyik állomáskombináció elhagyása okozza ténylegesen a legnagyobb kárt A kimerítő keresés, mint láttuk, nem reális

Koncentrált támadás módszertan De most az MC-szimuláció helyett egy másik trükköt alkalmazunk A legnagyobb kárt okozó 1 állomás megtalálásához még kimerítő keresés (már csináltuk is) Viszont a legnagyobb kárt okozó 2 állomáshoz már nem kimerítő keresést csinálunk, hanem megnézzük, hogy az előbbi állomás után a megmaradt V 1 állomásból melyik állomást kell még elhagyni, hogy a legnagyobb legyen a kárt (Lényegében azt feltételezzük, hogy a legnagyobb kárt okozó 2 állomás tartalmazza azt is, ami önmagában a legnagyobb kárt okozza)

Koncentrált támadás módszertan És így tovább: a legnagyobb kárt okozó 3 állomás megtalálásához a legnagyobb kárt okozó 2 állomás elhagyása után maradt gráfban keressük (feltesszük, hogy a legnagyobb kárt okozó 3 állomásban benne van az a 2 is, amik önmagukban a legnagyobb kárt okozó 2 állomást jelentik) stb. Lényegében mohó keresést csinálunk

Koncentrált támadás eredmény Állomás neve l h l h /l h Bp.-Keleti 155,1 +7,73% +Rákosrendező 167,4 +16,3% +Kiskunhalas 206,8 +43,7% +Aszód 221,7 +54,0% +Újszász 230,1 +59,9% +Kál-Kápolna 239,3 +66,2% +Debrecen 247,2 +71,7% +Karcag 268,2 +86,3% +Almásfüzítő 278,1 +93,2% +Görögszállás 288,3 +100,3%

Koncentrált támadás eredmény, grafikusan A magyar vasúthálózat leromlása különbözo számú, legnagyobb kárt okozó módon választott állomás eltávolítására Eltávolítás utáni átlagos távolság 150 200 250 1 2 3 4 5 6 7 8 9 10 Eltávolított állomások száma Közelítés mohó algoritmussal

Koncentrált támadás összevetés a véletlen támadással A koncentrált és a véletlen támadás hatásának összehasonlítása Koncentrált Véletlen Eltávolítás utáni átlagos távolság 150 200 250 1 2 3 4 5 6 7 8 9 10 Eltávolított állomások száma Közelítés mohó algoritmussal

Koncentrált támadás értékelés Sokkal nagyobb károkozás (átlagos távolság értelemben) mint véletlen támadásnál 10 állomás kikapcsolásával akár meg is duplázható az átlagos távolság Furcsa lehet viszont, hogy jelentéktelennek tűnő, és önmagukban tényleg nem kritikus állomások is megjelennek a listán A magyarázat, hogy ezek azért fontosak most, mert szétejtik több komponensre a hálózatot Erre pedig érzékeny a harmonikus átlag (adott állomásból nem elérhető állomásokra dij 1 = 0 lesz)

Koncentrált támadás értékelés A komponensek számának alakulása a fenti elhagyási sorrendnél: Komponensek számának alakulása koncentrált támadáskor Komponensek száma 0 2 4 6 8 10 1 2 3 4 5 6 7 8 9 10 Elhagyott állomások száma

Komponensek alakulása koncentrált támadáskor Még fontosabb a komponensek mérete: Komponensek nagyságának alakulása koncentrált támadáskor Komponensek nagysága 0 200 400 600 800 1000 1200 1 2 3 4 5 6 7 8 9 10 Elhagyott állomások száma Látható, hogy drasztikus a szétesés, különösen a harmadik elhagyás után ( megfeleződik a magyar vasúthálózat)

Koncentrált támadás értékelés Az is észrevehető, hogy az egyes állomások kiejtésének hatása között hatalmas interakció van: Bp.-Keleti és Rákosrendező együttes elhagyásának a hatása egészen más, mint a külön-külön történő elhagyásuk hatása: Bp. Keleti és Rákosrendezo eltávolításának hatása az átlagos távolságra Relatív gyakoriság 0.0000 0.0005 0.0010 0.0015 0.0020 0.0025 0.0030 Teljes hálózat Rákosrendezo eltáv. után Bp. Keleti eltávolítása után Mindketto eltávolítása után 0 200 400 600 800 Távolság [km]

Koncentrált támadás értékelés (Érdekes a létrejött bimodalitás, bár nem teszteltem rigorózusan, felteszem, hogy ennek oka az, hogy a kelet nyugat összeköttetés nagyon megnehezül, vö. a magyar vasúthálózat Budapest-centrikus jellege)

Az ellenállóképesség értékelése A fenti számítások legnagyobb hibája, hogy tetszőleges két pont közötti eljutás azonos súllyal esik latba... noha stratégiai szempontból nyilván nem ugyanolyan fontos az országnak a Mándok és Rédics közötti eljutás biztosítása, mint a Budapest és Győr közötti (Esetleg valamiféle súlyozással (pl. forgalomarányos) kezelhető ez a probléma, hogy ne minden kilométer ugyanúgy számítson ) A másik probléma, hogy a több komponensre esés meglehetősen érzékenyen érinti a harmonikusan átlagolt geodetikus távolságot Felmerül a lehetőség, hogy a hálózatban keletkezett kár mérésére ezért más metrikát (is) érdemes lenne alkalmazni

Ami még hátra van... P terű reprezentáció (nem annyira nehéz) G terű reprezentáció (zűrös ügy, mert a menetrendi adatokra is szükség volna) Az állomások földrajzi koordinátáinak lementése után térképes illusztrációk is lehetségesek Az előbbiekben lehetőségként említett dolgok végigszámolása Kiszámolgatni mindent a cikkekből a magyar hálózatra is...