Városi differenciák vizsgálata big data környezetben

Hasonló dokumentumok
Térképanalitikai lehetőségek a webről geokódolt tartalmak értékelésére

Az információs kor területi kutatásának új forrásai: a big data

Online közösségi média, mint a térinformatikai elemzések adatforrása

A digitális nyomok adatszerű használatának kihívásai a területi és települési vizsgálatokban

Big Data az adattárházban

IKT eszközök. Kovács Tamás

Álraszteres térstatisztikai műveletek a területi kutatásokban

Papp-Karakas Kitti SzEK.org Webshop Start - Budapest

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Smart Destination. Szentgotthárd,

A LAKOSSÁG MINT MUNKAERŐ A LAKOSSÁG MINT FOGYASZTÓ ALTERNATÍV ADATGYŰJTÉSI TECHNIKÁK ADATFORRADALOM IDEJÉRE

Google AdWords és AdSense A Google hirdetési rendszere

Ön a megfelelő mennyiségű és minőségű információk alapján hozza meg döntéseit? Stratis Kft. / Autonomy üzleti reggeli /

A Jövő Internet Nemzeti Kutatási Program bemutatása

Kreatív értékesítési technikák a social media segítségével.

Szociális hálók mobilon Avagy mi rejlik a hívószó mögött? Dr. Forstner Bertalan. bertalan.forstner@aut.bme.hu

Közösségi kommunikáció a gyakorlatban hatékony technikák és módszerek

MEGTUDHATJUK, MIT BESZÉLNEK RÓLUNK A SOCIAL MÉDIÁBAN? REPLISE

IKT trendek és tapasztalatok a BME szemszögéből

Az információs műveltség fejlesztése A könyvtárak szemléletváltása és feladatai a 21. században

A WEBRŐL GEOKÓDOLT TARTALMAK TÉRBELI ELOSZLÁS-VIZSGÁLATA: TERÜLETI EGYENLŐTLENSÉGEK ÚJ NÉZŐPONTBÓL. Bevezetés

Adatkeresés az interneten. Cicer Norbert 12/K.

Internet(?)biztonság(?) Elek Gábor c. r. alezredes vagyonvédelmi előadó

Big Spatial Data: lehetőségek, kihívások és tapasztalatok Jakobi Ákos

Megjelenési csomagok. Szolgáltatás. Standard megjelenés- éves díj. rendelkező partnerek

Mit mond a XXI. század emberének a statisztika?

Az okos kereskedelem. SmartCommerce

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék szeptember

Stratégiai és üzleti döntéstámogatás közösségi médiaelemzéssel

A térbeli adatok megjelenítési módszerei, avagy a hazug térképek problematikája. Jakobi Ákos ELTE jakobi@caesar.elte.hu

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

7. Óravázlat. frontális, irányított beszélgetés. projektor, vagy interaktív tábla az ismétléshez,

Geoinformatikai rendszerek

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

Közösségi hálózatok használata internet marketingben

A MEGJELENÉSEK KOMMUNIKÁCIÓJA

DIGITÁLIS KOMPETENCIA FEJLESZTÉSE TANÍTÁSI ÓRÁKON

KI A JÓ SZÁLLODAI CÉLKÖZÖNSÉG ÉS HOGYAN TALÁLJUK MEG ŐKET?

Hálózatsemlegesség - egységes internet szolgáltatás-leíró táblázat

INTERNETES KERESÉS. Szórád László Óbudai Egyetem TMPK

Leolvasói rendszer kialakításának koncepciója ipari mobil eszközökkel (ipari PDA-val)

A KÖZLEKEDÉSHÁLÓZATI RENDSZER SZEREPE A BUDAPESTI AGGLOMERÁCIÓ KIS- ÉS KÖZÉPVÁROSAINAK TERÜLETI FEJLŐDÉSÉBEN

Geoportál a Közép-Magyarországi Régió területére

A cégek szerint. Alig érjük el a rajongóinkat, így már nem éri meg Facebookozni. Itt az ideje, hogy átvigyük a cégünket a Google pluszra.

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

Informatika a mentésben

A célcsoport számokban

Valójában mit gondol és mit akar a fogyasztó?

Hozzávalók keresése és csatolása

KLÍMASTRATÉGIA A FOGYASZTÓI SZOKÁSOK, ISMERETEK ÉS TERMELŐI LEHETŐSÉGEK FÉNYÉBEN

1. feladat: A decimális kódokat az ASCII kódtábla alapján kódold vissza karakterekké és megkapod a megoldást! Kitől van az idézet?

Nem minden könyvtáros grafikus, nem minden grafikus könyvtáros avagy annak (is) kell(ene) lennünk?

Dr. Péterfalvi Attila:

A felnőttkorba lépő digitális fogyasztó

ELEKTRONIKUS KERESKEDELEM. Készítette Borbola Péter

OSINT. Avagy az internet egy hacker szemszögéből

A VÁLTOZÓ VILÁG Tipping Points az információs- digitális- és média- forradalom

Tehergépjármű parkolás a hazai gyorsforgalmi úthálózaton Sándor Zsolt zsolt.sandor@mail.bme.hu

A kibontakozó új hajtóerő a mesterséges intelligencia

A hivatalos statisztika modernizációja az adatforradalom korában

dr. Jakobi Ákos Az információs kor Eötvös Loránd Tudományegyetem Regionális Tudományi Tanszék

Mi legyen az informatika tantárgyban?

MÉDIAAJÁNLAT ÉRVÉNYES 2019 SZEPTEMBER 30-TÓL VISSZAVONÁSIG.

Mire kattan a nő? Central Médiacsoport Székház, március 29. Nők a mobilon túl is. Pintér Róbert

A webanalitika változó világa 4 felvonásban

Megoldások a tehergépjárműpihenők parkolóhely előrejelző rendszereire

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

Tudásalapú információ integráció

MŰHOLDAS VÁROSI HŐSZIGET VIZSGÁLAT

Privacy problémák közösségi hálózatokban

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

Így lehet a futballból üzlet

TOP SEO Trendek 2015-ben. We understand, we deliver.

A VDSZ kommunikációja, honlap, közösségi felületek, VD, hírlevél. Hogyan lehetünk még hatékonyabbak az információközlésben, tagtoborzásban?

Kommunikációs fogalomtár. Kommunikációs felmérés 2010.

ADATROBBANÁS. A helyzet alulról január 21. Pajna Sándor. vezérigazgató

Web-böngészés igénybe vehető - VoIP igénybe vehető - Chat alkalmazások igénybe vehető - Közösségi oldalak igénybe vehető -

Közúti forgalomszámlálás e_sensor rendszerrel Budapest dugódíj projekt (sajtóanyag)

MOODLE mobileszközön

A FÖMI, mint a térbeli információ menedzsment központja. Toronyi Bence

Agrár-környezetvédelmi Modul Vízgazdálkodási ismeretek. KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI MSc

Hálózatsemlegesség - egységes internet szolgáltatás-leíró táblázat

Google Analytics és mérési lehetőségei. Békési Károly

COOKIE (SÜTI) SZABÁLYZAT

HÁLÓZATSEMLEGESSÉG - EGYSÉGES INTERNET SZOLGÁLTATÁS-LEÍRÓ TÁBLÁZAT

Generációk - kultúrák : információszolgáltatás A - Z-ig

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

Képes vagy-e szemüveg nélkül használni a telefonod? DE! 2012 NJSZT 4

Árajánlat weboldal készítésére a Magyar Könyvvizsgálói Kamara Oktatási Központ ügyfelei részére

Vonalas közlekedési létesítmények mobil térképezésével kapcsolatos saját fejlesztések

Miről lesz szó? Videó tartalom elemzés (VCA) leegyszerűsített működése Kültéri védelem Közúthálózat megfigyelés Emberszámlálás

BŐVÍTMÉNYEK TELEPÍTÉSE ÉS SZERKESZTÉSE WORDPRESS-BEN

DIGITÁLIS TEREPMODELL A TÁJRENDEZÉSBEN

Nagy Webáruház Felmérés 2015

Marketing Megfeleljen a vásárlók igényeinek nyereséges módon

A térinformatika lehetőségei a földrajzórán

KÖVETKEZŐ GENERÁCIÓS NAGYVÁLLALATI TARTALOMKEZELŐ MEGOLDÁSOK Stratis Kft. / Autonomy üzleti reggeli / Mezei Ferenc üzletág-igazgató

Irányító és kommunikációs rendszerek III. Előadás 13

I. Felsőoktatási Marketing Verseny Versenyképes honlap kritériumrendszere

Átírás:

MRTT XIV. köz- és vándorgyűlése, Nagyvárad 2016. szeptember 15-16. Városi differenciák vizsgálata big data környezetben Jakobi Ákos Eötvös Loránd Tudományegyetem Regionális Tudományi Tanszék

Mi az a big data? A big data (szabad fordításban óriási adathalmaz ) arra a hatalmas adatmennyiségre utal, amely információs világunkban gyors tempóban és folyamatosan keletkezik Feldolgozása a hagyományos kapacitásokkal és módszerekkel már-már megoldhatatlan kihívást jelent Nem csak mennyiségi értelemben vett adatrobbanás, de minőségi is A nagy adatbázisok jellemzői: Nagy adatmennyiség. Maga a méret a probléma lényege (Loukides 2010). Változatosság, az adatfajták és források sokfélesége Sebesség: az adatok keletkezésének gyorsaságára, a hasznosításhoz rendelkezésre álló időre vonatkozóan

Mi az a big data? Eleve digitálisan keletkezik, passzív módon termelődik a mindennapi digitális interakciók melléktermékeként A sokáig csak virtuális melléktermékként számon tartott napi információhalom épp akkor válik értékessé, amikor a különböző adatokat sikerül összekötni, köztük összefüggéseket, felismerhető mintázatokat találni, s mindebből értékelhető következtetéseket levonni. Eltolódás az eseti megfigyelésektől a térben és időben folytonos megfigyelésig A társadalomtudományok számára valóságos aranybánya (vásárlási, munkábajárási, közlekedési és egyéb szokásaink adatai)

Big data források állami vagy egyéb intézményi források (pl.: elektronikus egészségügyi nyilvántartások, kórházi látogatások, biztosítási nyilvántartások, iskolai adatok, banki adatok, stb.) kereskedelmi vagy tranzakciós eredetűek (pl.: bankkártya tranzakciók, online tranzakciók, mobiltelefonos fizetések, stb.) fizikai szenzoros eredetűek is (pl. műholdképek, forgalomfigyelők, időjárás figyelők adatai, beléptető kapuk, stb.) nyomkövető eszközökből származók (pl. útvonal/követési adatok mobiltelefonoktól, GPS, stb.) online tartalmakból kiolvasott információk (pl. honlap látogatottság, online keresések, közösségi média adatok, önkéntes tartalmak, stb.)

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Közösségi adatok (humán-eredetű információk), avagy people to people típusú adatok. Ezek az adatok csak lazán strukturáltak és gyakran irányítási kontrol nélküliek. 1100. Közösségi hálók: Facebook, Twitter, Tumblr stb. 1200. Blogok, hozzászólások 1300. Személyes dokumentumok 1400. Képek: Instagram, Flickr, Picasa stb. 1500. Videók: Youtube stb. 1600. Internetes keresések 1700. Mobil adattartalom: szöveges üzenetek 1800. Felhasználó által generált térképek 1900. E-Mail

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Hagyományos üzleti rendszerek adatai (folyamat által közvetített adatok), avagy people to machine típusú adatok Az adatokat határozottabb strukturáltság jellemzi, kapcsolati táblákkal, metaadatokkal 21. Közhivatalok által szolgáltatott adatok 2110. Orvosi/egészségügyi nyilvántartások 22. Kereskedelem által létrehozott adatok 2210. Kereskedelmi tranzakciók 2220. Bank-/készletnyilvántartás 2230. E-kereskedelem 2240. Bankkártya/hitelkártya

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint Automatikus rendszerek adatai (gépek által közvetített adatok), avagy machine to machine típusú adatok Alapvetően a fizikai világ megfigyeléséből származnak és legtöbb esetben jól strukturáltak, ám méretük és keletkezési sebességük a tradicionális megközelítéseken messze túlmutat.

Big data források Az ENSZ Európai Gazdasági Bizottságának (2014) statisztikai munkacsoportja szerint 31. Szenzor adatok 311. Rögzített szenzorok 3111. Otthon-automatizálás 3112. Időjárási, szennyezési szenzorok 3113. Közlekezési szenzorok, webkamerák 3114. Tudományos célú szenzorok 3115. Biztonsági videók, képek 312. Mobil szenzorok (nyomkövetés) 3121. Személyes (mobil helymeghatározás) 3122. Közúti (autók, teherszállítás) 3123. Vasúti (vonatok) 3124. Légi (repülőgépek) 3125. Vízi (hajók) 313. Műholdas adatok 3131. Topográfiai 3132. Hőmérsékleti 3133. Megfigyelési 3134. Meteorológiai 3135. Egyéb 32. Számítógépes rendszerekből származó adatok 3210. Naplók (log-ok) 3220. Webes naplók (web log-ok)

Néhány példa ízelítőül Az áramszolgáltató tudja, hogy a fogyasztó reggel mikor kel fel és este mikor fekszik le. Digitális TV szolgáltató: tudjuk mit nézel GPS, adatrögzítők az autóban: tudjuk merre jártál Fizetőkapuk: tudjuk mikor voltál ott Weboldal statisztikák: preferenciák modellezése

A területi (városi) kutatások lehetőségei Úton-útfélen hagyott térbeli tartalommal is rendelkező direkt vagy indirekt digitális nyomok Direkt digitális nyomok: okostelefonok helyalkalmazásai egyes honlapok forrása kiegészítve célzott geotag-ekkel Indirekt digitális nyomok nem szándékoltan, de mégis nagy számban keletkező spontán téradat

Városi térpályák

Csoportos térpályák big data adatok alapján Fotókat készítő turisták mozgási útvonalainak területi mintázata Manhattan déli részén (Crandall et. al., 2009)

Párizs

London

Budapest

Geotagelt Twitter bejegyzések sűrűsége Budapesten Fischer (2013)

Helyi és nem helyi lakosok (turisták) Flickr fotó-bejegyzéseinek sűrűsége Manhattan-ben Forrás: Sokol Z., 2013

Helyi és nem helyi lakosok (turisták) Flickr fotó-bejegyzéseinek sűrűsége Budapesten Forrás: Kádár B. Gede M. 2012

Geolokalizált Flickr fényképek jellemző színárnyalata Boston városának egyes körzeteiben (június-augusztusban) Woodruff (2011)

A legnépszerűbb futball klubok a Twitter bejegyzések alapján Londonban Chesire - Uberiti (2014)

Egy big spatial data empíria: webről geokódolt tartalmak térbeli eloszlásvizsgálata Weboldalak és azok tartalmainak földrajzi azonosítása Az internet strukturálatlan tartalmainak térbeli értékelése A világhálón számos olyan tartalom lelhető fel, amely földrajzilag azonosítható ugyan, de geotag nem kapcsolódik hozzá Adatbányászati technikákkal földrajzi helyzetet jelölő adatok keresése, így a hozzá kapcsolódó tartalom földrajzi azonosítása

Kulcsszó-keresés és címazonosítás

A borsodi kulcsszó előfordulásai a találatok megbízhatósága szerint Budapesten

A borsodi kulcsszó előfordulásai a találatok megbízhatósága szerint Budapest belvárosában

Egy címen több találatot is feljegyezhettünk: A borsodi kulcsszó előfordulásai Budapest belvárosában

Sűrűségtérképek különböző kernel-beosztások mellett: A Dreher kulcsszó-előfordulások különböző interpolált modelljei Budapesten (kernel 0,01; 0,02; 0,03; 0,05 fok, weight population = találati score)

Brand wars: Adidas vs. Nike Budapesten

Általános keresőkifejezés: az egészség kulcsszó-előfordulások interpolált modellje Budapesten

Az egészség kulcsszó-előfordulások száma Budapesten (1x1 km-es térbeli rácsmodell)

A szórakozás és az egészség kulcsszavak előfordulásainak dominancia-viszonyai a főváros környékén (1x1 km-es körzetekben)

Köszönöm a figyelmet!