Online közösségi média, mint a térinformatikai elemzések adatforrása

Hasonló dokumentumok
A digitális nyomok adatszerű használatának kihívásai a területi és települési vizsgálatokban

Városi differenciák vizsgálata big data környezetben

Jakobi Ákos (ELTE, iask) Big Data, mint az okos városok "adatpillére" február 27. Okos városok és területi statisztika konferencia, Budapest

Térképanalitikai lehetőségek a webről geokódolt tartalmak értékelésére

Az információs kor területi kutatásának új forrásai: a big data

A földrajzi és a virtuális tér dualitása

Trendforduló volt-e 2013?

EOS Cégcsoport. Követelés kezelési lehetőségek az EU-n belül és kívül. Somodi Bernadett Értékesítési vezető Budapest,

dr. Jakobi Ákos Az információs kor Eötvös Loránd Tudományegyetem Regionális Tudományi Tanszék

130,00 ALL (0,94 EUR) 126,00 ALL (0,91 EUR) Ausztria 1,10 EUR (1,10 EUR) 1,27 EUR (1,27 EUR) 1,01 EUR (1,01 EUR)

Elgépiesedő világ, vagy humanizált technológia

Élelmiszervásárlási trendek

IKT eszközök. Kovács Tamás

A HÓNAP KÜLDŐORSZÁGA LENGYELORSZÁG

A HÓNAP KÜLDŐORSZÁGA UKRAJNA. Kiss Kornélia Magyar Turizmus Zrt. Budapest, június 20.

Prof. Dr. Katona Tamás. A gazdaságstatisztika oktatásának néhány kritikus pontja a közgazdászképzésben

Gondolatok a modern kartográfiáról

Európa Albánia Andorra Ausztria Belgium Bulgária Csehszlovákia Dánia Egyesült Királyság Észtország

1. táblázat - A világ tűzeseteinek összesített adatai az országokban ( )

USE ONLY EURÓPA ORSZÁGAI ÉS FŐVÁROSAI

A webanalitika változó világa 4 felvonásban

A Duna Régió Stratégia környezetvédelmi aktualitásai

OSINT. Avagy az internet egy hacker szemszögéből

A transznacionális vízgazdálkodás támogatása, a CarpatClim adatbázis. Bihari Zita Éghajlati Osztály, OMSZ

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

A hivatalos statisztika modernizációja az adatforradalom korában

A TDM szervezetek online kommunikációs eszköz használata Magyarországon

Szociális hálók mobilon Avagy mi rejlik a hívószó mögött? Dr. Forstner Bertalan. bertalan.forstner@aut.bme.hu

Big Data az adattárházban

3. melléklet: Innovációs és eredményességi mutatók Összesített innovációs index, 2017 (teljesítmény a 2010-es EU-átlag arányában)

Vonalas közlekedési létesítmények mobil térképezésével kapcsolatos saját fejlesztések

Magyarország 1,2360 1,4622 1,6713 1,8384 2,0186 2,2043

Hol szeretnék továbbtanulni? A legjobb hazai gimnáziumok diákjainak továbbtanulási tervei

SAJTÓREGGELI július 23.

KÖFOP VEKOP A jó kormányzást megalapozó közszolgálat-fejlesztés

Az okos kereskedelem. SmartCommerce

Legyen Magyarország a harcsatenyésztés európai központja, november 9.

Rosszindulatú daganatok előfordulási gyakorisága Magyarországon a Nemzeti Rákregiszter adatai alapján

A Jövő Internet Nemzeti Kutatási Program bemutatása

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

1. melléklet JELENTKEZÉSI ŰRLAPOK. 1. kategória: Online értékesített termékek biztonságossága. A részvételi feltételekhez fűződő kérdések

Térben Tudatos Társadalom

Közlekedésbiztonsági trendek az Európai Unióban és Magyarországon

Geoinformatikai rendszerek

A VÁROSI HŐSZIGET VIZSGÁLATA MODIS ÉS ASTER MÉRÉSEK FELHASZNÁLÁSÁVAL

A Jövő Internet kihívásai A jövő információs és kommunikációs technológiai MTA TRB és IB közös tudományos ülés november 17.

Skool - Médiaelemzés Időszak: május március PROFESSZIONÁLIS MULTIPLATFORMOS MÉDIAFIGYELÉS

Először éljenek együtt, de azután Az élettársi kapcsolatok megítélése Magyarországon és Európában

A jelentésről. Az egyetlen CEE online piaci körképét bemutató részletes kutatási anyag.

Magyar Közút ITS projektek 2020-ig Tomaschek Tamás Attila Verdes Máté

Mi legyen az informatika tantárgyban?

Mire kattan a nő? Central Médiacsoport Székház, március 29. Nők a mobilon túl is. Pintér Róbert

A bizalom változó mintázatai Magyarországon és Európában a válság előtt és után

Kérdés Kinek a nevéhez fűződik a projektoktatást oktatási stratégiaként történő felfogása? Kép Válasz HIBAS Válasz HELYES Válasz HIBAS

Magyar Közút ITS projektek 2020-ig

Az információs kor újszerű egyenlőtlenségei: mi derül ki a térbeli információkból? 1

A kibontakozó új hajtóerő a mesterséges intelligencia

IT megoldások a 4F rendszerben

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

A Tempus Közalapítvány által koordinált nemzetközi mobilitási ösztöndíjak. Add tovább! mobilitási élménybeszámoló

Nyugdíjasok, rokkantsági nyugdíjasok az EU országaiban

ADÓVERSENY AZ EURÓPAI UNIÓ ORSZÁGAIBAN

Intelligens közlekedési rendszerek (ITS)

TERHESSÉGMEGSZAKÍTÁSOK A DÉL-ALFÖLDÖN

KÉSZÜLÉKEK FRISSÍTÉSE

Várnai Ibolya PhD-hallgató Enyedi György Regionális Tudományok Doktori Iskola

Tudásalapú információ integráció

Általános Szerződési Feltételek Conclude Befektetési Zrt. GoldTresor online nemesfém kereskedési rendszer

Bevándorlók Magyarországon: diverzitás és integrációs törésvonalak

Álraszteres térstatisztikai műveletek a területi kutatásokban

GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR, GÖDÖLLŐ. A NUTS rendszer

Földmérési és Távérzékelési Intézet

Ingatlan-nyilvántartási megoldás a magyar állami erdőgazdálkodás számára március 18. GIS open 2010 Székesfehérvár Nyull Balázs DigiTerra Kft.

EGY ÖVEZET EGY ÚT,MINT GAZDASÁGI INNOVÁCIÓ MAGYAR LEHETŐSÉGEK

Területi fejlettségi egyenlőtlenségek alakulása Európában. Fábián Zsófia KSH

IKT trendek és tapasztalatok a BME szemszögéből

Versenyképességi tendenciák, gazdaságpolitika és értékek

KI A JÓ SZÁLLODAI CÉLKÖZÖNSÉG ÉS HOGYAN TALÁLJUK MEG ŐKET?

BŐVÍTMÉNYEK TELEPÍTÉSE ÉS SZERKESZTÉSE WORDPRESS-BEN

Információs társadalom Magyarországon

Borsod-Abaúj-Zemplén megyei fejlesztések aktuális állapota Riz Gábor országgyűlési képviselő, Borsod- Abaúj-Zemplén megye fejlesztési biztosa

CHARACTERIZATION OF PEOPLE

Innovatív trendek a BI területén

Kirobbanó Mobil Web Regionális kitekintés

1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet?

NEMZETKÖZI ADATGYŰJTÉS KIHÍVÁSAI: A BOLDOGSÁG ÉS BIZALOM KUTATÁS

DIGITÁLIS MÉRÉSEK A SZÁLLODAIPARBAN

Közösségi portálok használata

DIGITÁLIS TEREPMODELL A TÁJRENDEZÉSBEN

Technológia és Marketing összefüggése napjainkban. Technológiai eszközök a felhasználói viselkedéskutatás és a mobil marketing szolgálatában

Migráció, települési hálózatok a Kárpát-medencében. Nagyvárad, szeptember 15.

Nem minden könyvtáros grafikus, nem minden grafikus könyvtáros avagy annak (is) kell(ene) lennünk?

Migrációs trendek és tervek Magyarországon

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

Közúti forgalomszámlálás e_sensor rendszerrel Budapest dugódíj projekt (sajtóanyag)

Lakossági OKOS MÉRÉS kommunikáció. Hackl Mónika Kommunikációs vezető MAVIR ZRt.

TANULMÁNYOK A KÖZLEKEDÉS ÉS AZ

A jövő Internetje. HTE Közgyűlés május 20. Dr. Szabó Róbert, e. docens.

A női szerepek változásának időbeli, társadalmi meghatározottsága. Schadt Mária c. egyetemi tanár

Valójában mit gondol és mit akar a fogyasztó?

Átírás:

Jakobi Ákos Online közösségi média, mint a térinformatikai elemzések adatforrása 2016. október 13. ESRI Felhasználói Konferencia, Budapest

Néhány új kérdés Miként lehetne az információs kor területi különbségeinek mérésében szükségessé váló kvalitatív jellemzőket is kvantifikálni? Honnan nyerhető adat/információ az információ-használatról, az információ-minőségről stb.? Honnan szerezhetők területi információk?

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Automatikus rendszerek adatai (gépek által közvetített adatok), avagy machine to machine típusú adatok Alapvetően a fizikai világ megfigyeléséből származnak és legtöbb esetben jól strukturáltak, ám méretük és keletkezési sebességük a tradicionális megközelítéseken messze túlmutat.

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint 1. Szenzor adatok 11. Rögzített szenzorok 111. Otthon-automatizálás 112. Időjárási, szennyezési szenzorok 113. Közlekezési szenzorok, webkamerák 114. Tudományos célú szenzorok 115. Biztonsági videók, képek 12. Mobil szenzorok (nyomkövetés) 121. Személyes (mobil helymeghatározás) 122. Közúti (autók, teherszállítás) 123. Vasúti (vonatok) 124. Légi (repülőgépek) 125. Vízi (hajók) 13. Műholdas adatok 131. Topográfiai 132. Hőmérsékleti 133. Megfigyelési 134. Meteorológiai 135. Egyéb 2. Számítógépes rendszerekből származó adatok 210. Naplók (log-ok) 220. Webes naplók (web log-ok)

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Hagyományos üzleti rendszerek adatai (folyamat által közvetített adatok), avagy people to machine típusú adatok Az adatokat határozottabb strukturáltság jellemzi, kapcsolati táblákkal, metaadatokkal 1. Közhivatalok által szolgáltatott adatok 11. Orvosi/egészségügyi nyilvántartások 2. Kereskedelem által létrehozott adatok 21. Kereskedelmi tranzakciók 22. Bank-/készletnyilvántartás 23. E-kereskedelem 24. Bankkártya/hitelkártya

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Közösségi adatok (humán-eredetű információk), avagy people to people típusú adatok. Ezek az adatok csak lazán strukturáltak és gyakran irányítási kontrol nélküliek. 1. Közösségi hálók: Facebook, Twitter, Tumblr stb. 2. Blogok, hozzászólások 3. Személyes dokumentumok 4. Képek: Instagram, Flickr, Picasa stb. 5. Videók: Youtube stb. 6. Internetes keresések 7. Mobil adattartalom: szöveges üzenetek 8. Felhasználó által generált térképek 9. E-Mail

Néhány gondolat a big data jelenségről A big data eleve digitálisan keletkezik, passzív módon termelődik a mindennapi digitális interakciók melléktermékeként A sokáig csak virtuális melléktermékként számon tartott napi információhalom épp akkor válik értékessé, amikor a különböző adatokat sikerül összekötni, köztük összefüggéseket, felismerhető mintázatokat találni, s mindebből értékelhető következtetéseket levonni. A társadalom kutatói számára valóságos aranybánya (vásárlási, munkábajárási, közlekedési és egyéb szokásaink adatai) Betekintést nyújt az emberi viselkedés egyedi és társadalmi szintjeibe

Big data kihívások Magánélet és a surveillance society (a Facebook nincs ingyen!) Adathozzáférés (piaci szereplők) Adatgyűjtési technológia (webscraping, webharvesting, crawler robotok) Mit mond nekünk valójában az adott adatforrás? (reprezentativitás) Nincs előre megfogalmazott statisztikus elemzői cél, csak utólag az adatállományból találjuk azt ki big data = big errors (költséges adattisztítás)

Facebook Ország Nemek Korcsoportok Nők Férfiak 13-15 16-17 18-24 25-34 35-44 45-54 55-64 65-x Összesen Ausztria 49 51 4 8 26 28 17 11 4 2 100 Bulgária 51 49 5 7 24 29 20 9 4 2 100 Csehország 52 48 5 7 27 28 18 8 4 3 100 Észtország 54 46 5 6 24 29 19 10 5 2 100 Horvátország 48 52 4 8 28 32 16 7 3 2 100 Lengyelország 52 48 11 9 29 29 13 5 3 1 100 Lettország 54 46 4 5 29 32 16 8 4 2 100 Litvánia 54 46 6 9 30 30 14 7 3 1 100 Magyarország 52 48 6 7 23 24 20 10 7 3 100 Németország 48 52 6 7 25 28 16 12 4 2 100 Románia 50 50 7 7 29 30 17 6 3 1 100 Szerbia 46 54 6 10 31 28 16 6 2 1 100 Szlovákia 52 48 5 8 27 29 17 8 4 2 100 Szlovénia 49 51 4 7 25 30 19 9 4 2 100 Ukrajna 53 47 4 4 26 36 17 8 3 2 100 Facebook felhasználók százalékos megoszlása nem és korcsoportok szerint Európa néhány országában (a 13 évesnél idősebbek körében, 2013). Forrás: socialbakers.com

Paul Butler (2010): Visualizing friendships

Geotag-elt Flickr fotó bejegyzések száma Forrás: www.convoco.co.uk

Helyi és nem helyi lakosok (turisták) Flickr fotó-bejegyzéseinek sűrűsége Manhattan-ben Forrás: Sokol Z., 2013

Helyi és nem helyi lakosok (turisták) Flickr fotó-bejegyzéseinek sűrűsége Budapesten Forrás: Kádár B. Gede M. 2012

Csoportos térpályák Flickr fotóadatok alapján Fotókat készítő turisták mozgási útvonalainak területi mintázata Manhattan déli részén (Crandall et. al., 2009)

Párizs

London

Budapest

Geolokalizált Flickr fényképek jellemző színárnyalata Boston városának egyes körzeteiben (június-augusztusban) Woodruff (2011)

Tartalomanalitika Kik és hol tesznek közzé információkat az internetes világban Miről, avagy mely helyekről közölnek tipikusan információkat Új lehetőség az online tartalmak szövegbányászati módszerekkel történő feldolgozása számszerűsített módon is meghatározható lehet egyes helyek és terek online reprezentációja megbecsülhető az adott helyhez kötődő tudattartalmak minősége vagy nagysága

Geotagelt Wikipedia bejegyzések sűrűsége a világban Forrás: DBpedia adatok alapján a saját szerkesztés

Sűrűségi hőtérképek : Geotag-elt Wikipedia bejegyzések sűrűsödése New York körzetében Forrás: Meeks E., 2011

Egy lakosra jutó geotag-elt Wikipedia bejegyzések Nagy-Britanniában Forrás: Graham M., 2010

Egy km 2 -re jutó geotag-elt Wikipedia bejegyzések Nagy-Britanniában Forrás: Graham M., 2010

Twitter Streaming API null 1423154659.33 DENISS PASHKEVICH QUARTET \/ ARAMAIC MAN \/ BUDAPEST OPUS JAZZ CLUB by Deniss Pashkevich http:\/\/t.co\/xj5k4fvzpu null 1423154659.95 Great Britain fall to impressive Turkey in Fed Cup: A shock 2-1 defeat to Turkey in Budapest left Great Britai... http:\/\/t.co\/hddjsplkxz null 1423154695.27 We take you inside St. Stephen's Basilica in #Budapest http:\/\/t.co\/owmhjk8vri @VikingRiver #travel #boomers null 1423154718.0 Ho comprato i biglietti per Budapest che, compresa l'iscrizione al MUN, mi costeranno 160\u20ac. Da oggi sono in regime di Fiscal Compact. null 1423154735.16 Ya se estren\u00f3 en M\u00e9xico The Grand Budapest Hotel? tengo que verla! Por qu\u00e9 no se nada? #WesAnderson #LorenaG [47.479262,19.067871]} 1423154735.65 I'm at Kaeng Som Tom Yum - Thai Takeaway in Budapest https:\/\/t.co\/217gjd02ol [47.499047,19.059994]} 1423154739.03 Usher, cider and budapest. null 1423154744.65 Packing time..ready for Budapest!\nCheyenne+@OneInkSeven @Intenzeink @HustleButter @H2Ocean @KillerInkTattoo http:\/\/t.co\/qvjnls00un null 1423154748.15 Budapest is a must \ud83d\ude4a null 1423154774.52 Video: OneRepublic - Budapest (George Ezra Cover)\u00a0 http:\/\/t.co\/kv8vygphrl null 1423154775.27 RT @BestMovieLine: The Grand Budapest Hotel http:\/\/t.co\/eo5v3zhajp [47.552201,19.045819]} 1423155187.3 I'm at Filatorig\u00e1t (H5) - @bkkbudapest in Budapest https:\/\/t.co\/81rdavwwxs null 1423154792.4 Gotta leave Budapest a day early man allow

Geotag-elt Twitter bejegyzések sűrűsége Budapesten. Forrás: Fisher (2013) alapján

A Twitter aktivitás globális területi mintázata (N=10015, 2013.05.07) Forrás: tweetping.net

Néhány kiválasztott kulcsszó előfordulási viszonyai a geolokalizált Twitter bejegyzésekben az Egyesült Államokban Forrás: Floatingsheep Team (2010)

A legnépszerűbb futball klubok a Twitter bejegyzések alapján Londonban Chesire - Uberiti (2014)

Geolokalizált Twitter bejegyzések nyelv szerinti megoszlása Európában Forrás: Fischer (2011)

Geolingvisztikai térkép Twitter adatok alapján Source: Graham and Zook 2011

Geolingvisztikai térkép Twitter adatok alapján Source: Graham and Zook 2011

Az online közösségi hálók (Online Social Networks, OSN) területi kutatásának empíriái Csomópontok = felhasználók Élek = kapcsolatok Kibertéri keretek: elméleti lehetőség a tértelen kapcsolatokra (death of distance, Cairncross 1997) OSN kapcsolati hálók mégis térbeli megkötöttségeket mutatnak (geography matters, de Blij 2007, Lengyel-Jakobi 2013, Jakobi-Lengyel 2014) Közösségi oldalak, ahol döntő többségben azokkal az emberekkel való kapcsolatainkat dokumentáljuk, akikkel az eddigi offline világ hálózataiban kapcsolatba kerültünk

iwiw esettanulmány: adatbázis jellemzők Adattartalom (kapcsolati adatok): Felhasználói létszámok (települési aggregátumban) Felhasználók közötti kapcsolatszámok (települési kapcsolat-mátrix) A felhasználók lokalizációja profilinformációk alapján Legördülő menüből Kötelező Hibák nem szűrhetők Geolokalizáció: települési szinten

iwiw térbeli kapcsolatstruktúra-elemzés Települési kapcsolati koordináta-párok Kapcsolatszám (azon felhasználók száma, akiknek a másik településen is van ismerősük) Hurkok az adatvizualizációból kihagyva id1 id2 connect latitude_1 longitude_1 latitude_2 longitude_2 weight 368 574 383 46,97134 16,50487 47,10362 16,62227 3,582 571 574 923 47,05568 16,69594 47,10362 16,62227 6,213 172 574 442 47,15947 16,63766 47,10362 16,62227 4,384 286 574 98 47,25337 16,82970 47,10362 16,62227 3,455 324 574 150 47,32122 16,48816 47,10362 16,62227 3,729 18 582 952 46,85588 18,14873 46,92726 18,23469 3,597 469 582 4 500 46,86935 18,44363 46,92726 18,23469 5,088 367 582 309 47,04457 18,18686 46,92726 18,23469 3,294 156 1 113 95 46,70373 17,39398 47,17663 17,61292 3,024 798 1 113 156 47,03306 17,53200 47,17663 17,61292 3,515

iwiw esettanulmány: adatbázis jellemzők Felhasználók Települések Csomópontok száma 4.058.505 2.562 Élek (kapcsolatok) száma 785.841.313 1.372.540 Településen belüli élek száma 369.789.373 2.562 Települések közötti élek száma 415.653.749 1.369.978

Az offline és online térbeliség összefüggései Települések közötti hálózati kapcsolatok (összes iwiw kapcsolatszám, 15e db. felett) (abszolút élsúlyokkal)

A kapcsolati adatok súlyozása A települések közti összeköttetéseket minden település esetében a fontosságuk szerint súlyozni lehet. A kialakított log-normalizált kapcsolatsúly eredmények lehetővé teszik a fontos kapcsolatok kihangsúlyozását a településmérettől függetlenül is A kapcsolatsúly a megfigyelt és a véletlenszerűen várható településközti kapcsolatszám egymáshoz viszonyított arányaként került meghatározásra: K ij w Log e ij ij Log w ij / n s s i j i 1, j 1 w ij A magas pozitív kapcsolatsúly értékek erős településközti kapcsolatokra utalnak, a nagyon alacsony negatív értékek gyenge összeköttetéseket tükröznek

Hol találhatók a szoros kapcsolatok? Települések közötti súlyozott hálózati kapcsolatok (log-normalizált élsúlyokkal)

Hol találhatók a nagyon szoros kapcsolatok? A legszorosabb kapcsolatok térképe

Egyedi települési kapcsolati háló Herend hálózati kapcsolatai

iwiw kapcsolatok és a földrajz

iwiw kapcsolatok és a földrajz

Köszönöm a figyelmet! Jakobi Ákos Eötvös Loránd Tudományegyetem, jakobi@elte.hu