Önszerveződő adatbázisok

Hasonló dokumentumok
Összefoglalás és gyakorlás

Keresımarketing. 1.1 PPC Pay per Click kampány

Önszerveződő adatbázisok

Keresőmarketing ONLINE MARKETING III. ELŐADÁS KOVÁCS ISTVÁN. BME Menedzsment és Vállalatgazdaságtan Tanszék

Pozíció: Értékesítést támogató asszisztens

Pécsi Tudományegyetem

Info-kommunikációs technológiák a vállalati szektorban

KERESŐOPTIMALIZÁLÁSI TANULMÁNY OLDALRA SEOTOOLS.HU. Budapest,

WEB 2.0 tipikus szolgáltatások

Hangtechnikus Hangtechnikus Hangmester Hangtechnikus

Kiss Krisztina: Közösségi tartalomszolgáltatás a Pécsi Tudományegyetem Benedek Ferenc Jogtudományi és Közgazdaságtudományi Szakkönyvtárában

KÖZÖSSÉGI PORTÁL HASZNÁLATA AZ INFORMATIKAI TÁRGYÚ

Soroksár Kommunikációs- és médiastratégiája

Online kérd íves felmérés a Gazdálkodás olvasóinak és szerz inek körében

A távmunka és a távdolgozók jellemzői

SZENT ISTVÁN EGYETEM JÁSZ-NAGYKUN-SZOLNOK MEGYÉBEN MŰKÖDŐ ÉLELMISZER KISKERESKEDELMI VÁLLALKOZÁSOK. Doktori (PhD) értekezés 2004.

Tartalomjegyzék 3 Szerző 6 I. Bevezető 7 II. A keresőoptimalizálás alapjai 9 SEO vs Google Ads 9 Miért pont a Google? 12 Internetes keresők 12 Miért

Karsai Judit: A kapitalizmus új királyai. Kockázati tőke Magyarországon és a közép-kelet-európai régióban

BELÜGYI RENDÉSZETI ISMERETEK

INFORMÁLNI, INTEGRÁLNI, INSPIRÁLNI

Akadémiai írás BGF KVIK Szakdolgozatok tartalmi elvárásai

BELÉNYI GYULA: AZ ALFÖLDI VÁROSOK ÉS A TELEPÜLÉSPOLITIKA ( )

TEL.: 47/ , FAX: 47/

A megváltozott munkaképességű személyek foglalkoztatási helyzete

Vertikális portálok és látogatóik április tel.: (06-1) fax (06-1) Budapest, Petneházy u. 52.

A doktoranduszok életpályáján adódó problématerületek vizsgálata

MÁSODIK TÍPUSÚ TALÁLKOZÁS A MÁTRÁBAN CLOSE ENCOUNTERS OF THE SECOND KIND IN MÁTRA HILL

Hallgatói szemmel: a HÖK. A Politológus Műhely közvélemény-kutatásának eredményei

Bodnár Réka Kata Gondolatok a tájkép turisták célterület-kiválasztását befolyásoló hatásáról

Az állásfoglalás a következő fontosabb megállapításokat tartalmazza: Az e-kereskedelem nemzetközi, és nem szorítható az EU határai közé.

Általános Szerződési Feltételek. ( napjától hatályos szöveg)

BABÓT E G Y E Z T E T É S I D O K U M E N T U M HOSSZÚ TÁVÚ TELEPÜLÉSFEJLESZTÉSI KONCEPCIÓJA MEGBÍZÓ:Babót Önkormányzata

A nem önkormányzati fenntartásban működő médiumok Szentes városában.

Emberi Erőforrások Minisztériuma Aszódi Javítóintézet, Általános Iskola, Szakiskola és Speciális Szakiskola

Kedves Olvasó! Kívánom Önöknek, hogy érték- és kapcsolatteremtő, ismeretközvetítő kiadványainkat hatékonyan hasznosítsák munkájukban!

INFORMATIKA 5. évfolyam

MATEMATIKA C 8. évfolyam 10. modul ÁTLAGOS?

Magyarajkú, nem-magyar állampolgárságú tanulók nevelésének, oktatásának helyzete a magyar közoktatásban. Készítette: Kováts András és Medjesi Anna

Tex and Co Kft Budapest, Francia út 54. ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK (egységes szerkezetbe foglalt) I. Általános rendelkezések

AJÁNLATI DOKUMENTÁCIÓ

Nemzeti Fejlesztési és Gazdasági Minisztérium támogatásával megvalósuló KKC-2008-V számú projekt B2CR ONLINE KOMMUNIKÁCIÓ

ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK (ÁSZF)

Tájékoztató a közigazgatási szakvizsga követelményrendszeréről

KUTATÁS KÖZBEN. A nemkormányzati szervezetek gyermekvédelmi tevékenysége Ukrajnában. kutatás közben 879

Moodle tanulói kézikönyv

Előterjesztés Békés Város Képviselő-testülete december 16-i ülésére

AZ ÜLJÜNKBE.HU ADATKEZELÉSI TÁJÉKOZTATÓJA az adatvédelem és adatkezelés elveiről, gyakorlatáról

6/2010. számú Jegyzői Utasítás A Személyügyi Kézikönyvről

Készült: Szentes Város Önkormányzata Polgármesteri Hivatala Közgazdasági Osztályán, 2005 novemberében.

INFORMATIKA 1-4. évfolyam

A Fon Cookie szabályzata

Projekt: ÁROP-1.A Gyöngyös Város Önkormányzatának szervezetfejlesztése

Pongrácz Tiborné S. Molnár Edit: A gyermekvállalási magatartás alakulása

J/55. B E S Z Á M O L Ó

Elemzések a gazdasági és társadalompolitikai döntések előkészítéséhez július. Budapest, április

Közhasznúsági Jelentés (2009. év)

Hatályos: november 1-től (1501) Közzététel napja: október 15.

Tel.: 34/ Fax: 34/ Pf.: 8. Webcím:

Villamos szakmai rendszerszemlélet

Puskás Béla: Hálózatelméleti alapok

1. Az internet és használata

KÖLCSÖNIGÉNYLŐ LAP (KÖLTSÉGVETÉSI INTÉZMÉNYEK RÉSZÉRE) mobil telefonszám: statisztikai számjel: adószám: - - végzés/azonosító száma: - -

DOKTORI (PhD) ÉRTEKEZÉS TÉZISEI NYUGAT-MAGYARORSZÁGI EGYETEM

Rajz és vizuális kultúra 1-2. évfolyam

A SunCity Tattoo & Piercing Szalon Szeged Adatvédelmi,- És Adatkezelési Szabályzata TARTALOMJEGYZÉK

A Ridikül című online női internetes portál tartalmának szolgáltatása (tájékoztató az eljárás eredményéről)

A mai problémákra mai megoldások kellenek.

NYÍRMADA VÁROS INTEGRÁLT VÁROSFEJLESZTÉSI STRATÉGIÁJA

Tervek és a valóság A pénzbeli családtámogatási ellátások vizsgálata a kormányprogramok tükrében

TÁMOP /K-2015

Az akadémiai kutatás feladatai, szükséges feltételei és lehetőségei a hazai innováció terén. Inzelt Péter inzelt@sztaki.

INFORMATIKA HELYI TANTERV

Tartalomjegyzék. 5. A közbeszerzési eljárás főbb eljárási cselekményei. 6. Eljárási időkedvezmények a közbeszerzési törvényben

Papp Gábor Előadás, október 19. Bűnözés és vándorlás

A7-0124/ Irányelvi javaslat (COM(2013)0512 C7-0215/ /0246(COD)) 1 cím A Bizottság által javasolt szöveg

PIB tájékoztatás. A költségvetési gazdálkodás eredményességének javítása (Gazdálkodási projekt)

4. évfolyam 6. évfolyam 8. évfolyam 10. évfolyam 12. évfolyam

Magyarországi lelkigondozó szolgálatok hálózati együttműködésének lehetőségei és kihívásai

Zöld energiával a zöld Magyarországért weboldal marketing szempontú elemezése

Az ELTE angol francia szakán végzett, ugyanakkor Svédországban is tanult. Miért ott?

Adatkezelési tájékoztató

Verseny a gyorsan növekvő piacokon

Tájékoztató és szabályzat a sütik alkalmazásáról. (Tájékoztató letöltése ITT)

{simplecaddy code=1005}

ADATVÉDELMI BIZTOSI AJÁNLÁS. Megfigyelés, adatgyűjtés céljából üzemeltetett képfelvevő, -rögzítő berendezésekkel kapcsolatban

103. számú melléklet: 104. számú Elıírás. Hatályba lépett az Egyezmény mellékleteként január 15-én

PageRank algoritmus Hubs and Authorities. Adatbányászat. Webbányászat PageRank, Hubs and Authorities. Szegedi Tudományegyetem.

Papp Gyula Dr. Cserhátiné Vecsei Ildikó Kölcsey Ferenc Református Tanítóképző Főiskola

Hogyan lehet hasznosítani egy egyszerő könyvtárhasználati kérdıív eredményeit a gyakorlatban?

Az Alsóvárosi Óvoda Pedagógiai Programja

TDA-TAR ÉS O-TDA FOLYADÉKÁRAMOK ELEGYÍTHETŐSÉGÉNEK VIZSGÁLATA STUDY OF THE MIXABILITY OF TDA-TAR AND O-TDA LIQUID STREAMS

11. NEMZETKÖZI VÁNDORLÁS. Gödri Irén FŐBB MEGÁLLAPÍTÁSOK

Biatorbágyi Családsegítő Központ és Gyermekjóléti Szolgálat. Szervezeti és Működési Szabályzata

Közigazgatási szerződés

ÜGYFÉLSZOLGÁLATI MONITORING VIZSGÁLAT A FŐTÁV ZRT. RÉSZÉRE MÁSODIK FÉLÉV

Tűzvédelmi előírások

HELYI TANTERV TARTALOMJEGYZÉKE 3

Ez a weboldal elég gyorsan betöltődik. A weboldal mérete (kilobyte) megfelelő. A betöltődő adatok száma elfogadható. Keresőbarát a weblap URL címe.

PIB előterjesztés a 4. szakasz Személyügyi Kézikönyvére

Tűzvédelmi Műszaki Irányelv TvMI 10.1:

Átírás:

High Speed Networks Laboratory 1/40

Önszerveződő adatbázisok 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis Evolúció alkotta adatbázis 2. Önszerveződő adatbázis: struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai 2/40

Paradigmaváltás az adatbázisokban Mennyi zenét tárolsz a számítógépeden? Régen: rengeteg zene a számítógépen Hatalmas adatbázisban Viszonylag struktúrálva Most: Kevés zene a gépen, csak amire azonnal szükség van Túlnyomó részben: YouTube & Google Egy struktúrálatlan halmazból keressük ki 3/40

Paradigmaváltás az adatbázisokban Eddig Relációs adatbázis Elosztott adatbázis Lekérdezés: erősen megnövelte a kommunikációs költségek részarányát az adatbázis-kezelés költségein belül Ötlet: próbáljuk meg az adatokat a felhasználás közelében elhelyezni. Osztott adatbázisok. Az osztott adatbázis egy fizikailag megosztott, de logikailag egységes adatbázis. 4/40

Amerre mozdul a világ: Megtervezett adatbázis evolúció alkotta adatbázis Elosztott adatbázisok: A kommunikációs költségek csökkenése. Mindenki a számára ismerős adatokat gondozza. Egy-egy csomópont kiesése esetén a többi adatai továbbra is elérhetőek. Lehetséges a moduláris tervezés, a rugalmas konfigurálás. Rugalmasabb adatstruktúra kell Önszerveződő adatbázisok: A kapcsolódást nem egy központi egység határozza meg A csomópontok saját maguk döntik el, hova kapcsolódnak 5/40

Önszerveződő adatbázisok 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis Evolúció alkotta adatbázis 2. Önszerveződő adatbázis: struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai 6/40

Mit az önszerveződő adatbázis? A szó tág értelmében Önszerveződő adatbázis = (struktúra,lekérdezés) Az adatbázis önszerevződő jellege meghatározza a kialakuló topológiát A topológia meghatározza, milyen a hatékony keresés Önszerveződő adatbázis példák: Internet Blogok Google Fordító Szocális hálózat P2P hálózat Folding@home 7/40

Önszerveződő hálózat: Az Internet Általános értelemben: Nagy bonyolult hálózatok Hálózat komplexitása Sok csomópont Sok kapcsolat Heterogén csomópont típusok és kapcsolattípusok Tisztán kivehető tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Az Internet fejlődési trendek Felhasználók számának drámai növekedése Kicsi mobil eszközök Szerteágazó szabványok, sok gyártó Heterogén eszközök Virtuális hálózatok fizikai hálózakon VPNs, virtual ISPs Milyen struktúra lakozik a komplexitás mögött? 8/40

Pillanatfelvételek A hálózatok dinamikusak Még jó, annyira gyorsan változnak az igények Jelenleg nincs lehetőség a dinamizmus vizsgálatára nagy léptékben Legtöbb adatbázis csak a pillanatnyi állapotot tárolja Ezért egy-egy elemzés csak egy pillanatfelvétel Előfordulnak statisztikai hibák Néha később módosított eredmények 9/40

Önszerveződő adatbázisok 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis Evolúció alkotta adatbázis 2. Önszerveződő adatbázis : struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai 10/40

Számunkra jelenleg lényeges paraméterek 1. Hálózat méret: Csomópontok száma Ezres, milliós, esetleg milliárdos méretek esetén lehet statisztikai adatokkal jól jellemezni egy hálózatot 2. Klaszterezettség: Csoportosulás mértéke A szomszéd node-jaim kapcsolódnak-e egymáshoz? Ha 1 akkor mindig, ha 0 akkor soha! 3. Átmérő: Kis átmérő, rövid utak, kisvilág jelleg Egy rácsban igen nagy átmérők lehetnek, míg pl. a teljes gráf átmérője 1. 4. Hasonlósági paraméter (γ): Mennyire hasonló a szerepük? (skálafüggetlen szerkezet) Ha a szám magas, akkor az egyének nagyon hasonlítanak, ha alacsony akkor (~ 2) akkor erősen eltérő szerepek vannak 5. Fokszámeloszlás: a csúcsok mekkora hányadának k a fokszáma? Egyenletes? Binomiális? Valami más? 11/40

Méret és átmérő Mekkora egy önszerveződő adatbázis? Csomópontok száma: néhány tíz milliárdok Mekkora az adatbázis átmérője? 1929: Karinthy Frigyes Láncszemek Hat lépés távolság 1967: Milgram kísérlet (a másik) Levélküldés nagy távolságra (szociológiai, földrajzi), véletlenszerűen választott emberek Információk a célszemélyről Személyes ismeretség esetén azonnal a célhoz Egyébként olyanhoz aki valószínűleg személyesen ismeri+levél a Harvardra 12/40

Milgram kísérlete (további részletek) Néha 1-2 lépés elég volt néha kilenc kellett 296 levélből 232 nem ért célba A maradékból az átlagos távolság 5.5-nek adódott (ellentmondott a tapasztalatokkal, és várakozásokkal) Az utolsó személy igen sokszor ugyanaz Legtöbbször gyorsan földrajzi közelbe értek, ahol köröztek, amíg rést nem találtak a célszemély belső köreibe Problémák Kevés célbeérkező levél Emiatt hosszabb láncok kevésbé vannak jelen (alábecslés) Többször ismételték 2002-ben e-mail verzió 2008, Microsoft.NET Messenger Service: 6.6 Hatlépésnyi távolság 13/40

Átmérő Példa: Rubik-kocka állapotai 14/40

Átmérő 15/40

The Anatomy of the Facebook Social Graph Ugander, Karrer, Backstrom, Marlow arxiv: 1111.4503v1 [cs.si] 2011. májusi állapot elemzése Aktív felhasználók: 1. Bejelentkezett a vizsgálatot megelőző 28 napban 2. Van legalább 1 ismerőse 721 millió aktív felhasználó (a Föld lakossága akkor 6.9 milliárd) 68.7 milliárd kapcsolat átlagosan 190 ismerős 16/40

Felhasználók közti átlagos távolság 4.7 lépés távolság USÁ-n belül: 4.3 Független tanulmány: átmérő ~40 Az átmérő önmagában megtévesztő 17/40

Csoportosulás mértéke A weboldalak jellemzően szoktak egymásra mutatni Minél több közös oldalra mutatnak, annál nagyobb valószínűséggel egymásra is Melyik tűnik hihetőbbnek mint weboldalak hálózata? Miért? 18/40

Klaszterezettségi együttható Globális: háromszögek száma C = tripletek száma a háromszögek számának aránya ahhoz képest, hogy mennyi lehetne C=1 Lokális: a kék csúcsra vonatkozóan c kék =1 c kék =1/3 c kék =0 C i = 2 szomszédok közötti élek N i (N i 1), ahol N(i) = #{i szomszédai} 19/40

Egy adatbázisban 20/40

Kisvilág-tulajdonság 21/40

Fokszámeloszlás A csúcsok mekkora hányadának k a fokszáma n k = hány k fokszámú csúcs van P(k) = n k, n a csúcsok száma n hisztogram 22/40

Fokszámeloszlás Binomiális Hatványfüggvény P k = n k pk (1 p) n k Véletlen hálózat Nyerőgép P k ~ k γ γ: Hasonlósági paraméter Önszerveződő hálózatok 23/40

Skálafüggetlenség A fokszámeloszlás hatványfüggvényt követ 24/40

Skálafüggetlenség szemléletesen 1. A hálózatra rázoomolva önhasonló szerkezet Pont így van a természetben is 2. Nem heterogén szerepű csomópontok Néhány központ, sok kis node 25/40

Valós hálózatok 26/40

Hogyan kapcsolódnak új pontok az adatbázishoz? Önszerveződő adatbázisok Egy már meglévő adatbázis melyik pontjához fogunk kapcsolódni? P2P hálózatban melyik fájlt töltöd le? Egy nemzetségen belül melyik fajok szaporodnak el? Minél népszerűbb Népszerűség ~ minél több kapcsolata van eddig 27/40

Preferenciális kapcsolódás Preferenciális kapcsolódás A kapcsolódáshoz a jelölt esélye arányos a fokszámmal Nagyobb fokszámú csúcshoz nagyobb eséllyel kapcsolódik i csúcsra: p i = fokszám 2 élek száma A gazdag egyre gazdagabb lesz Növekedéssel együtt: skálafüggetlen hálózat 28/40

Szűkebb értelemben vett önszerveződő hálózatok Speciális értelemben 1.Nem véletlenszerű kapcsolatok, csoportosuló 2.Kis átmérő, rövid utak, kisvilág 3.Skálafüggetlen szerkezet: erősen változó szerepek a hálózatban 29/40

Önszerveződő adatbázisok 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis Evolúció alkotta adatbázis 2. Önszerveződő adatbázis : struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai 30/40

Hogyan működnek a keresőmotorok? 31/40

Internetes keresőmotorok A keresőmotorok két fő funciója 1. Crawling és az oldalak térképének felépítése 2. Válasz a lekérdezésre 1. Crawling & Indexing A weben levő dokumentumok, fájlok, oldalak bejárása és indexelése Indexelés ~ tárgymutató egy könyv végén 2. Válaszadás a felhasználói lekérdezésre Releváns oldalak listája Sorrend 32/40

Honnan tud a keresőmotor egy oldalról? 1. Megmondjuk, hogy létezik Home page URL-je www.google.com/addurl search.yahoo.com/info/submit.html search.live.com/docs/submit.aspx XML oldaltérkép 2. Ha egy másik oldal mutat rá: keresőrobotok beindexelik Struktúra miatt működik A kapcsolatok mentén a keresőmotor bejárja = crawling Ha találnak egy új oldalt: részleteket tárolnak 33/40

Egy Google keresés 34/40

Adjunk választ! A keresőmotor egy válaszadó gép Háromféle keresés: "Do" Tranzakciós keresés valami végrehajtása: repülőjegy vásárlás, zenehallgatás "Know" Információs keresés egy zenekar neve, a város legjobb étterme "Go" Navigációs keresés Kifejezetten egy weblap keresése: menj a Facebook-ra, az NFL homepage-re Csak az a válasz érdekel, ami relevéns Hasznosság remélt sorrendjében A relevancia több, mint hogy tartalmazza a jó szavakat A keresőmotorok első napjaiban ennyi volt Nem is működött jól AltaVista Google 35/40

Search Engine Optimization Egy weboldal láthatóságának befolyásolása egy keresőmotor találati listájában Nem a keresőmotorok kijátszása Jó felhasználói élmény Az oldal szándékainak közvetítése, hogy a releváns kereséseknél ajánlhassák robots.txt: amit a keresőrobotok ne járjanak be Bejelentkezés után látható oldalak Személyes információt tartalmazó oldalak: vásárlás Oldalon belüli keresési eredmények Korai algoritmusok: Szerepelnek-e a megadott szavak Kulcsszó-sűrűség Keyword meta-tag Könnyű volt kijátszani 36/40

Mennyire fontos egy oldal? A legtöbb keresőmotornál: fontosság = népszerűség Minél népszerűbb egy oldal, annál fontosabb kell legyen az infó, ami rajta van Algoritmusokkal szűrik és rangsorolják az oldalakat relevancia és népszerűség alapján Ranking faktorok Tartalom: Az oldal szövege, címek, ismertetők. Teljesitmény: Milyen gyors? Jól működik? Megbizhatóság: Elég jó a tartalom ahhoz, hogy más oldalak ide mutassanak? Más oldalak megjelölik referenciaként? Felhasználói élmény: Hogy néz ki? Könnyű eligazodni? Magas a bounce rate? 37/40

SEO Success Factors 38/40

Search Engine Optimization Oda-vissza ható folyamat Algoritmus helyezést javító trükkök új algoritmus új trükkök Hogy pontosan hogy működik, azt a tapsztalat alapján sejteni lehet On-the-page SEO Ami az oldal szerzőjének befolyása alá tartozik Tartalom HTML Felépítés Off-the-page SEO Az olvasókon, látogatókon és a többi oldal szerzőjén múlik Linkek Megbízhatóság Közösségi média Személyes paraméterek 39/40

Search Engine Optimization White Hat technikák A felhasználónak szóljon az oldal, ne a keresőnek A weboldal struktúráját tagolttá kell tenni, megfelelő header használattal. A <title> taget megfelelően kell kitölteni. Az oldalon elhelyezett szövegeket is érdemes optimalizálni. Helyezzünk el olyan linkeket, amik egyéb aloldalakra mutatnak. Hosszú távú eredmény Black Hat technikák Hogyan tévesszük meg a keresőt Láthatatlan tartalom Más oldal megjelenítése, ha a kereső kéri = cloaking Gyors eredmény, de: ha a kereső rájön: büntetés 40/40