Szalai Péter. April 17, Szalai Péter April 17, / 36

Hasonló dokumentumok
Szinguláris érték felbontás Singular Value Decomposition

Szociális hálózatok Gráf alapú módszerek. Adatbányászat. Klaszterezés Szociális hálózatok. Szegedi Tudományegyetem. Adatbányászat

Véletlen gráfok, hálózatok

Hálózatok fejlődése A hatványtörvény A preferential attachment A uniform attachment Vertex copy. SZTE Informatikai Intézet

A Barabási-Albert-féle gráfmodell

Közösség detektálás gráfokban

Csima Judit BME, SZIT február 18.

Principal Component Analysis

Diszkrét matematika 2.

Csima Judit BME, SZIT február 17.

Komplex hálózatok: alapfogalmak, modellek, módszerek

Társadalmi és gazdasági hálózatok modellezése

Szinguláris értékek. Wettl Ferenc április 12. Wettl Ferenc Szinguláris értékek április / 35

Szinguláris értékek. Wettl Ferenc április 3. Wettl Ferenc Szinguláris értékek április 3. 1 / 28

Társadalmi és gazdasági hálózatok modellezése

Betekintés a komplex hálózatok világába

Közösségek keresése nagy gráfokban

Mátrixok 2017 Mátrixok

Alkalmazott algebra - SVD

Bevezetés az algebrába 2 Vektor- és mátrixnorma

A MATEMATIKA NÉHÁNY KIHÍVÁSA

7. Régió alapú szegmentálás

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Diszkrét matematika 2.C szakirány

Algoritmusok bonyolultsága

Gráfelmélet. I. Előadás jegyzet (2010.szeptember 9.) 1.A gráf fogalma

Statisztikai módszerek a skálafüggetlen hálózatok

Hierarchikus skálafüggetlen gráfok generálása fraktálokkal

Szociális hálók klaszterezése

Algoritmuselmélet. Bonyolultságelmélet. Katona Gyula Y.

A hazai elszámolásforgalom hálózati elemzése

Diszkrét matematika 2. estis képzés

Algoritmuselmélet. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 13.

Társadalmi és gazdasági hálózatok modellezése

Adatbányászat. Klaszterezés Szociális hálózatok Szegedi Tudományegyetem

Saj at ert ek-probl em ak febru ar 26.

GROVER-algoritmus. Sinkovicz Péter. ELTE, MSc II dec.15.

Szociális hálózatok geográfiai beágyazódása

Miért fontos számunkra az előző gyakorlaton tárgyalt lineáris algebrai ismeretek

Hálózati elemzések az üzleti életben. Kovács Gyula Sixtep Kft.

Kvadratikus alakok és euklideszi terek (előadásvázlat, október 5.) Maróti Miklós, Kátai-Urbán Kamilla

Sajátértékek és sajátvektorok. mf1n1a06- mf1n2a06 Csabai István

Számítógép hálózatok, osztott rendszerek 2009

Vektorok, mátrixok, lineáris egyenletrendszerek

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Sali Attila Budapest Műszaki és Gazdaságtudományi Egyetem. I. B. 137/b március 16.

Diszkrét matematika 2.C szakirány

Alapfogalmak a Diszkrét matematika II. tárgyból

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Shor kvantum-algoritmusa diszkrét logaritmusra

Diszkrét matematika 2.C szakirány

Vektorterek. =a gyakorlatokon megoldásra ajánlott

Algoritmuselmélet. Mélységi keresés és alkalmazásai. Katona Gyula Y.

Hash-alapú keresések

1. Diagonalizálás. A Hom(V) diagonalizálható, ha van olyan bázis, amelyben A mátrixa diagonális. A diagonalizálható van sajátvektorokból álló bázis.

Bonyolultságelmélet gyakorlat 06 Gráfos visszavezetések II.

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

Matematika elméleti összefoglaló

Mérnökgeodéziai hálózatok dr. Siki Zoltán

Zsidók, tudomány és hálózatok?

Algoritmuselmélet. Gráfok megadása, szélességi bejárás, összefüggőség, párosítás. Katona Gyula Y.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Gráfelmélet/Diszkrét Matematika MSc hallgatók számára. 13. Előadás

Rang, sajátérték. Dr. Takách Géza NyME FMK Informatikai Intézet takach/ február 15

Tanmenet a évf. fakultációs csoport MATEMATIKA tantárgyának tanításához

Numerikus módszerek 1.

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

Diszkrét matematika 2. estis képzés

Érdemes egy n*n-es táblázatban (sorok-lányok, oszlopok-fiúk) ábrázolni a két színnel, mely éleket húztuk be (pirossal, kékkel)

1. Bázistranszformáció

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

PONTFELHŐ REGISZTRÁCIÓ

Összefoglalás és gyakorlás

Bevezete s a ha ló zatók vila ga ba II.

Első zárthelyi dolgozat megoldásai biomatematikából * A verzió

Lineáris algebra numerikus módszerei

1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)

Mérnökgeodéziai hálózatok feldolgozása

CHT& NSZT Hoeffding NET mom. stabilis november 9.

Markov-láncok stacionárius eloszlása

Lineáris algebra 2. Filip Ferdinánd december 7. siva.banki.hu/jegyzetek

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2012

Lineáris algebra mérnököknek

Lin.Alg.Zh.1 feladatok

Kupacrendezés. Az s sorban lévő elemeket rendezzük a k kupac segítségével! k.empty. not s.isempty. e:=s.out k.insert(e) not k.

TANMENET. a matematika tantárgy tanításához 10. E.osztályok számára

LINEÁRIS ALGEBRA. matematika alapszak. Euklideszi terek. SZTE Bolyai Intézet, őszi félév. Euklideszi terek LINEÁRIS ALGEBRA 1 / 40

Gráfalgoritmusok ismétlés ősz

Saj at ert ek-probl em ak febru ar 22.

ANOVA,MANOVA. Márkus László március 30. Márkus László ANOVA,MANOVA március / 26

bármely másikra el lehessen jutni. A vállalat tudja, hogy tetszőlegesen adott

Diszkrét matematika 2. estis képzés

Diszkrét matematika 2 (C) vizsgaanyag, 2012 tavasz

A maximum likelihood becslésről

26. MINIMÁLIS KÖLTSÉGŰ UTAK MINDEN CSÚCSPÁRRA

Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok

Lineáris leképezések (előadásvázlat, szeptember 28.) Maróti Miklós, Kátai-Urbán Kamilla

Compressed Sensing. Sipos Roland Adatbányászat szeminárium Május 22.

Átírás:

Szociális hálók Szalai Péter April 17, 2015 Szalai Péter April 17, 2015 1 / 36

Miről lesz szó? 1 Megfigyelések Kis világ Power-law Klaszterezhetőség 2 Modellek Célok Erdős-Rényi Watts-Strogatz Barabási modell Copy-modell 3 Spektrál gráf partícionálás Matek SVD Feladat Szalai Péter April 17, 2015 2 / 36

Section 1 Megfigyelések Szalai Péter April 17, 2015 3 / 36

Subsection 1 Kis világ Szalai Péter April 17, 2015 4 / 36

Kis világ jelenség A kisérlet: Milgram 1969 Nebraska Boston Szalai Péter April 17, 2015 5 / 36

Kis világ jelenség A kisérlet: Milgram 1969 Nebraska Boston Eredmény: 20%-nak sikerült Átlagos lépésszám: 6.5 Ugyanez facebookon: 2008: 5.28 2011: 4.74 Szalai Péter April 17, 2015 5 / 36

Kis világ jelenség A kisérlet: Milgram 1969 Nebraska Boston Eredmény: 20%-nak sikerült Átlagos lépésszám: 6.5 Ugyanez facebookon: 2008: 5.28 2011: 4.74 A 1 2 3 4 5 6 Figure: Six degrees of separation B Szalai Péter April 17, 2015 5 / 36

Subsection 2 Power-law Szalai Péter April 17, 2015 6 / 36

Power-law eloszlás Power-law eloszlás Az X valváltozó eloszlása power-law eloszlás, ha: Pr(X = x) = Cx α Szalai Péter April 17, 2015 7 / 36

Power-law eloszlás Power-law eloszlás Az X valváltozó eloszlása power-law eloszlás, ha: Pr(X = x) = Cx α Szalai Péter April 17, 2015 7 / 36

Power-law eloszlás Power-law eloszlás Az X valváltozó eloszlása power-law eloszlás, ha: Vegyük a logaritmusát: p(x) = Pr(X = x) = Cx α log(p(x)) = log(c) αlog(x) = log(y) = αlog(x) + C ami log-log skálán: y = αx + C Szalai Péter April 17, 2015 8 / 36

Power-law eloszlás Power-law eloszlás Az X valváltozó eloszlása power-law eloszlás, ha: Pr(X = x) = Cx α Empirikus adatban a leggyakoribb eloszlás. Örökifjú, f (cx) = g(c)f (x) egyetlen megoldása. Először Nature biológiai vonatkozás Példák: Vagyon eloszlás (Pareto 80-20) Hashtagek népszerűség eloszlása Szavak előfordulása Ismeretségi gráfok fokszám eloszlás!!! Szalai Péter April 17, 2015 9 / 36

Subsection 3 Klaszterezhetőség Szalai Péter April 17, 2015 10 / 36

Klaszterezhetőség Csoportulások Csoportok közotti kapcsolatok = Egyének közötti kapcsolatok Skálafuggetlen tulajdonság Klaszterezés problémája Később Szalai Péter April 17, 2015 11 / 36

Klaszterezhetőség Figure: Facebook klaszterezve Szalai Péter April 17, 2015 12 / 36

Section 2 Modellek Szalai Péter April 17, 2015 13 / 36

Subsection 1 Célok Szalai Péter April 17, 2015 14 / 36

Hálózatmodellek Miért? Jelenségek megértése (Mi történik facebookon?) Szimuláció Mérések Validálás: Fokszám eloszlása power-law? Kis világ tulajdonság teljesül? Klaszterezhetőség? Néhány hálózatmodell: Erdős-Rényi Watts-Strogatz Barabási-Albert Broder Szalai Péter April 17, 2015 15 / 36

Erdős-Rényi modell G(n, p) = (V, E), ahol V = [1,... n] és Pr((i, j) E)) = p Más megfogalmazás: G(N, M) = (V, E), ahol V = N és E = M. Kapcsolat a két modell között: M = ( ) N p 2 Szalai Péter April 17, 2015 16 / 36

Erdős-Rényi modell G(n, p) = (V, E), ahol V = [1,... n] és Pr((i, j) E)) = p Más megfogalmazás: G(N, M) = (V, E), ahol V = N és E = M. Kapcsolat a két modell között: M = ( ) N p 2 Szalai Péter April 17, 2015 17 / 36

Erdős vizualizáció Figure: Erdő gráf azonos N, M esetén Szalai Péter April 17, 2015 18 / 36

ER gráf tulajdonságai Néhány tulajdonság: Átlag fokszám 2 E n = 2(n 2)p n = (n 1)p Fokszám-eloszlás: Pr(d(v) = k) = ( ) n 1 k p k (1 p) n 1 k Poisson Pr(d(v) = k) = d(v)k e z k! Összefüggőség: np < 1 legnagyobb összefüggő komponens O(log(n)) np = 1 legnagyobb összefüggő komponens O(n 2 3 ) np > 1 legnagyobb összefüggő komponens O(n) és a második O(log(n)) Átmérő: log(n) log(p(n 1) Pr(G) = p E(G) (1 p) (n 2) E(G) Szalai Péter April 17, 2015 19 / 36

Watts-Strogatz Kifejezetten a kis világ tulajdonság modellezésére talalták ki. G(n, k, p) 1 Körön elhelyezünk n pontot. 2 A k távolságra lévőket összekötjük. 3 Minden élet p valószínűséggel átkötünk véletlen helyre. Szalai Péter April 17, 2015 20 / 36

Watts-Strogatz Kifejezetten a kis világ tulajdonság modellezésére talalták ki. G(n, k, p) 1 Körön elhelyezünk n pontot. 2 A k távolságra lévőket összekötjük. 3 Minden élet p valószínűséggel átkötünk véletlen helyre. Figure: n=8,k=2 Szalai Péter April 17, 2015 20 / 36

Watts-Strogatz Kifejezetten a kis világ tulajdonság modellezésére talalták ki. G(n, k, p) 1 Körön elhelyezünk n pontot. 2 A k távolságra lévőket összekötjük. 3 Minden élet p valószínűséggel átkötünk véletlen helyre. Tulajdonságok: G WS (n, k, p) közel azonos a C n + 2C n 2 + + kc n k + G ER(n, p) gráffal. Poisson + konstans fokszámeloszlás.e Részgráfok ritkák a függetlenség miatt. Grid modell ( [d(u,v) r ] v;v u [d(u,v) r ] Ω(n r 2 r 1 ) lépést használ. ).Minden decentralizált algoritmus Szalai Péter April 17, 2015 21 / 36

Barabási-Albert modell 1 Kiindulunk egy G 0 gráfból m 0 éllel. 2 Felveszünk egy új pontot. 3 Bekötjük m helyre. 4 Bekötés valószínűsége: p(v) = d(v,t) w V d(w,t). Tulajdonságok: Fokszámeloszlás: hatvány. Kis világ tulajdonság: teljesül Klaszterezhetőség: nem teljesül. Szalai Péter April 17, 2015 22 / 36

Broder Másolásos modell 1 Kiindulunk egy G 0 gráfból m 0 éllel. 2 Felveszünk egy új pontot. 3 Válsztunk egy már meglévő pontot. 4 Ha d élet kell behúzni akkor α valószínűséggel másolunk egy élet és (1 α)-val egyenletesen választunk egy csúcsot. Tulajdonságok: Fokszámeloszlás: hatvány. Kis világ tulajdonság: teljesül Klaszterezhetőség: teljesül. Szalai Péter April 17, 2015 23 / 36

Section 3 Spektrál gráf partícionálás Szalai Péter April 17, 2015 24 / 36

Négyzetes hiba (MSE) Mátrixra A B? Szalai Péter April 17, 2015 25 / 36

Négyzetes hiba (MSE) Mátrixra A B? (A B) 2 nem egy szám = nem jó. Szalai Péter April 17, 2015 25 / 36

Négyzetes hiba (MSE) Mátrixra A B? (A B) 2 nem egy szám = nem jó. Megoldás: Frobénius norma: A = i,j a 2 ij MSE: A B 2 F = i,j (a ij b ij ) 2 Szalai Péter April 17, 2015 25 / 36

SVD - Singular value decomposition Tetszőleges A m n-es mátrixhoz létezik Q R m n, D R n n és P R n n mátrixok, hogy ahol: Ekkor: Q és P ortonormált. D pedig diagonális. A = Q D P, a ij = k q ik d k p jk Továbbá: A F = i,j a2 ij = i d 2 i Szalai Péter April 17, 2015 26 / 36

SVD - Singular value decomposition Legjobb k-rangú közeĺıtése egy mátrixnak: Vegyük a k legnagyobb szinguláris értéket. A többit töröljük (0-ra cseréljük) és a hozzá tartozó vektorokat is. Miért szinguláris? AA T p i = P T D T Q T QDPp i = P T D 2 P(0,..., 1,..., 0) T = d 2 i v i d i -k a sajátértékek gyökei. P oszlopai az AA T sajátvektorai. Szalai Péter April 17, 2015 27 / 36

Mire jó az SVD? Mult óra vége. Ajánló rendszerek (Robi) Spektrál felbontás Szalai Péter April 17, 2015 28 / 36

Subsection 3 Feladat Szalai Péter April 17, 2015 29 / 36

Spektrál klaszterezés hasonlósági gráfokra Legyen G(V, E) egy gráf és X G a gráfot reprezentáló mátrix. Preferenciák gráf klaszterezésnél: Hasonlók egy klaszterbe kerüljenek. A különböző klaszterekbe kerülők ne hasonĺıtsanak. Tehát a célunk: 1 Maximalizálni az csoporton belüli össz súlyt. 2 Minimalizálni a csoportok közöttit. Legyen a két klaszter G A és G B és A, B hozzájuk tartozó ponthalmaz. cut(a, B) = i A,j B x ij Szalai Péter April 17, 2015 30 / 36

Spektrál klaszterezés hasonlósági gráfokra Legyen G(V, E) egy gráf és X G a gráfot reprezentáló mátrix. Preferenciák gráf klaszterezésnél: Hasonlók egy klaszterbe kerüljenek. A különböző klaszterekbe kerülők ne hasonĺıtsanak. Tehát a célunk: 1 Maximalizálni az csoporton belüli össz súlyt. 2 Minimalizálni a csoportok közöttit. Legyen a két klaszter G A és G B és A, B hozzájuk tartozó ponthalmaz. cut(a, B) = i A,j B min cut(a, B) x ij Szalai Péter April 17, 2015 31 / 36

Spektrál klaszterezés hasonlósági gráfokra Legyen G(V, E) egy gráf és X G a gráfot reprezentáló mátrix. Preferenciák gráf klaszterezésnél: Hasonlók egy klaszterbe kerüljenek. A különböző klaszterekbe kerülők ne hasonĺıtsanak. Tehát a célunk: 1 Maximalizálni az csoporton belüli össz súlyt. 2 Minimalizálni a csoportok közöttit. Legyen a két klaszter G A és G B és A, B hozzájuk tartozó ponthalmaz. cut(a, B) = Nem elég. Lehet, hogy elfajuló. i A,j B min cut(a, B) x ij Szalai Péter April 17, 2015 31 / 36

Spektrál klaszterezés hasonlósági gráfokra Megoldás ( cut(a, B) min + vol(a) ahol vol(a) az A-ból induló össz élsúly. Laplace mátrix ) cut(a, B), vol(b) Legyen D(i, i) = j x ij, fokszám mátrix. Ekkor a Laplace mátrix. L = D X, Szalai Péter April 17, 2015 32 / 36

Számolás Legyen f egy n dimenziós vektor (csúcsok száma). Ekkor: f T Lf = f T Df f T Xf = i d i f 2 i i,j f i f j w ij = 1 2 i j x ij f 2 i 2 ij f i f j x ij + j ( ) x ij i fj 2 = 1 2 ij x ij(f i f j ) 2 Szalai Péter April 17, 2015 33 / 36

Miért jó ez? 1 2 ij x ij(f i f j ) 2 Jelentése f { 1, 1} n esetén? min p x ij (p i p j ) 2 = min p (p T Lp) i,j p = (1 1... 1) T a minimumot adja. Legyen plusz feltétel i p i = 0, jelentése, hogy A = B. Szalai Péter April 17, 2015 34 / 36

Gyakorlatban Normalizáljuk L-t: L = D 0.5 (D A)D 0.5 A felbontás második sajátvektora a jó klasszifikáló. Más megoldás Klikk perkoláció (második óra). NP-nehéz probléma. Szalai Péter April 17, 2015 35 / 36

Miről volt szó? 1 Megfigyelések Kis világ Power-law Klaszterezhetőség 2 Modellek Célok Erdős-Rényi Watts-Strogatz Barabási modell Copy-modell 3 Spektrál gráf partícionálás Matek SVD Feladat Szalai Péter April 17, 2015 36 / 36