Adatbányászat és a közösségi hálózatok



Hasonló dokumentumok
Innovatív trendek a BI területén

Tartalom. Jó hogy jön Jucika, maga biztosan emlékszik még, hányadik oldalon van a Leszállás ködben.

Versenyelőnyszerzés az intelligens megoldások korában. Rehus Péter, SWG CEE, IS brand igazgató November 5.

A szak specializációi

Konkurencia figyelés a közösségi média támogatásával.

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Valójában mit gondol és mit akar a fogyasztó?

Papp Attila. BI - mindenkinek

Eredményesebb vállalkozás hatékony kommunikációval. - nem többet, hanem máshogy kell költeni -

MEGTUDHATJUK, MIT BESZÉLNEK RÓLUNK A SOCIAL MÉDIÁBAN? REPLISE

Big Data az adattárházban

A webanalitika változó világa 4 felvonásban

User journey. Utazz velünk a jövőbe! Németh Iván Ads Interactive Media Group

Értékesítések (összes, geográfiai -, ügyfelenkénti-, termékenkénti megoszlás)

Retro adatbányászat. Kovács Gyula Andego Tanácsadó Kft.

Webanalitika a mindennapokban

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

S atisztika 1. előadás

Facebook karácsony a magyar kkv-knál

S atisztika 2. előadás

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

Marketing Megfeleljen a vásárlók igényeinek nyereséges módon

Változó vásárlói szokások nyomon követése 2016 Szeptember SAP Forum. Komjáthy Csaba

Privacy problémák közösségi hálózatokban

Kreatív értékesítési technikák a social media segítségével.

Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0. A Wolfram Alpha tudásgép.

Sütik kezelése (cookie)

Milyen sütiket és mire használ az OTP Bank?

KÖZÖSSÉGI MÉDIA ESZKÖZÖK SZEREPE A VÁLLALATI TUDÁSMEGOSZTÁSBAN

Egy hirtelen ötlet december 30. felmerült egy kérdés: Vajon mi jellemző a magyar fiatalok közösségi média használatára?

Sütik (cookie) kezelése

ENELFA záró konferencia január. 21. századi oktatási trendek, e-learning - Cesim OnService pilot tréningek

Sütik (cookie) kezelése

Mezőgazdasági külső információs rendszerek fejlesztése

PREDIKTÍV ANALITIKÁVAL A KORAI ISKOLAELHAGYÓK SZÁMÁNAK CSÖKKENTÉSÉÉRT

elemér ISKOLAI ÖNÉRTÉKELŐ RENDSZER TANULÓI KÉRDŐÍV

A MEGJELENÉSEK KOMMUNIKÁCIÓJA

A kibontakozó új hajtóerő a mesterséges intelligencia

Kiút vagy zsákutca? A növényi és egyéb anyagok jövője az étrend-kiegészítő készítményekben. MÉKISZ-konferencia november 11.

Nem minden könyvtáros grafikus, nem minden grafikus könyvtáros avagy annak (is) kell(ene) lennünk?

Self service reporting fogások, technikák és megoldások controllereknek, nem csak Excel alapon

Történet John Little (1970) (Management Science cikk)

Microsoft tesztvezetés

társadalomtudományokban

Közlekedés és környezet

KI A JÓ SZÁLLODAI CÉLKÖZÖNSÉG ÉS HOGYAN TALÁLJUK MEG ŐKET?

Szociális hálók mobilon Avagy mi rejlik a hívószó mögött? Dr. Forstner Bertalan. bertalan.forstner@aut.bme.hu

Határtalan jelentések

OSINT. Avagy az internet egy hacker szemszögéből

Inbound marketing. Damjanovich Nebojsa, Senpai Consulting, HubSpot viszonteladó

A gazdaságinformatikus mesterszak tantervi hálója

BitTorrent felhasználók értékeléseinek következtetése a viselkedésük alapján. Hegedűs István

TDK tájékoztató Gazdaságinformatika Intézeti Tanszék szeptember

Projektvezetői döntések támogatása webbányászattal

4. Modul: ROBOTPILÓTA. Ne legyél az Online Marketing rendszered rabszolgája! TERVEZZ!

Big Data technológiai megoldások fejlesztése közvetlen mezőgazdasági tevékenységekhez

DIGITÁLIS MARKETING ÉS ÉRTÉKESÍTÉSI CSATORNÁK MIT ÉS HOGYAN HASZNÁLJAK?

A társadalomkutatás módszerei I. Outline. A mintaválasztás A mintaválasztás célja. Notes. Notes. Notes. 13. hét. Daróczi Gergely december 8.

Eredmények. 132fő 13% 58% 92 ügyfél 40 piackutató. Innováció kutatás NRC - Médiapiac. tartja innovatívnak az online kutatást

Üzleti modellen alapuló webes tudásprezentáció

EPALE. Európai elektronikus platform a felnőttkori tanulásért. Karvázy Eszter Nemzeti Szakképzési és Felnőttképzési Hivatal december 9.

PIACKUTATÁS (MARKETINGKUTATÁS)

Változások előtt hol áll a banki (adat)elemzés? Nándorfi György

Több mint BI (Adatból üzleti információ)

A GASZTRO VIDEÓK TÉRNYERÉSE. Gasztro trendek, #foodporn a címlapon Krankovics Béla // május 17.

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Számítógépes döntéstámogatás. Bevezetés és tematika

Stratégiai és üzleti döntéstámogatás közösségi médiaelemzéssel

A következő kérdések az digitális média és a digitális eszközök használatát vizsgálják különböző szempontokból. Ideértjük az asztali számítógépeket,

OKTATÁSKUTATÓ ÉS FEJLESZTŐ INTÉZET TÁMOP / századi közoktatás fejlesztés, koordináció. elemér ISKOLAI ÖNÉRTÉKELŐ RENDSZER

2.1. Itt az idő egy kis kritikus gondolkodásra

Számítógépes döntéstámogatás. Fogalmakat is kezelni tudó számítógépes döntéstámogatás A DoctuS rendszer

Ön a megfelelő mennyiségű és minőségű információk alapján hozza meg döntéseit? Stratis Kft. / Autonomy üzleti reggeli /

A Jövő Internet Nemzeti Kutatási Program bemutatása

Vezetői információs rendszerek

Hogyan használják ki az ügyvédek az internet nyújtotta lehetőségeket?

A KÖRNYEZETTUDATOSSÁG VIZSGÁLATA A HEVES MEGYEI TÉRSÉGBEN TALÁLHATÓ EGYETEMISTÁK KÖRÉBEN

Palaczk Péter A marketing folyamatok adattárház alapú támogatása

A következő kérdések az digitális média és a digitális eszközök használatát vizsgálják különböző szempontokból. Ideértjük az asztali számítógépeket,

Csalásfelderítés és előrejelzési megoldás május 20.

Szobafestő Attila. Készítette: KRQ,

Az infoszféra tudást közvetítő szerepe a mai társadalomban

Multifunkcionális, multimédia elemeket tartalmazó mobil elérésű távoktatási tananyag összeállítása és tesztelése

Google AdWords és AdSense A Google hirdetési rendszere

Nagy Webáruház Felmérés 2015

Élő online bemutatók a oldalon v1.0

AZ IGAZI BIG DATA hogyan használják a világban és egyáltalán használják-e hazánkban?

Magánpraxis helye a Facebookon

A benchmarking fogalma

BARANGOLÁS AZ E-KÖNYVEK BIRODALMÁBAN Milyen legyen az elektonikus könyv?

2008 IV. 22. Internetes alkalmazások forgalmának mérése és osztályozása. Április 22.

KIDSOASIS ÁLOM-MÁSODÁLLÁS

A logika határokat szab és azt mondja: LEHETETLEN *

1 Mit értünk cookie, böngésző helyi tárolás ("cookie és hasonló technológia") alatt?

Takács Gábor mérnök informatikus, okl. mérnöktanár

Dr. Sasvári Péter Egyetemi docens

Big Data adattárházas szemmel. Arató Bence ügyvezető, BI Consulting

EPALE. A felnőttkori tanulás elektronikus európai platformja június 15. NSZFH, Vedovatti Anildo

Felhőalkalmazások a. könyvvizsgálatban

6. lépés: Fundamentális elemzés

Átírás:

DTR Beadandó feladat OE-NIK Adatbányászat és a közösségi hálózatok Beírtak engem mindenféle Könyvbe és minden módon számon tartanak. Porzó-szagú, sötét hivatalokban énrólam is szól egy agg-szürke lap. Ó, fogcsikorgatás. Ó, megalázás, hogy rab vagyok és nem vagyok szabad. Nem az enyém már a kezem, a lábam, és a fejem, az is csak egy adat. - KOSZTOLÁNY DEZSŐ Készítette: Kovács Zoltán 2013/2014 1. félév

TARTALOM Bevezető... 2 Adatbányászatról általánosságban... 3 Adatbányászat, üzleti analitika... 4 Új trend kezd kibontakozni... 4 Marketing, és a közösségi média... 5 A közösségi adatbányászat... 5 Társdalomtudomány és a közösségi hálózatok... 6 Profil... 7 Adatgyűjtés, NSA és ami mögötte van... 8 Mire használhatók az összegyűjtött anyagok?... 9 1

BEVEZETŐ Dolgozatom témájául, a közösségi hálózatok és az adatbányászat kapcsolatát választottam. Véleményem szerint az ezen hálózatok működésének kiaknázása, a "Big Data", adatbányászat és ezek elemzése nélkül nem lenne megfelelő. Nagyon sok területre kihatással van a közösségi hálózatokból nyert adatok elemzése. A médiától kezdve a marketingen át, egészen az oly vitatott megfigyelési botrányokig, ami manapság eléggé előtérbe került, hogy jogosan vagy alaptalanul azt mindenki döntse el maga. Ha ezeket együtt társadalomtudományi szempontból is vizsgálnánk, érdekes dolgokra bukkanhatunk. Dolgozatomban ezeket a területeket fogom érinteni, kisebb-nagyobb kitérőkkel. 2

ADATBÁNYÁSZATRÓL ÁLTALÁNOSSÁGBAN Az adatbányászat a nagy mennyiségű adatokban rejlő információk félautomatikus feltárása különféle algoritmusok alkalmazásával. A leggyakrabban céljának az érdekes, értékes, értelmes összefüggések keresését értjük nagy adathalmazokban. A megfogalmazásokban szereplő szavaknak különös súlya van és egyik sem elhagyható (ahogyan sokan teszik). Az adatbányászatnak mindig üzleti célúnak és szemléletűnek kell lennie, értékelni kell minden esetben, hogy egy-egy feltárt összefüggés hordoz-e értéket potenciálisan a szervezet számára. Végezetül magyarázhatónak kell lennie az összefüggésnek, azaz fel kell tárni azt, hogy miért és hogyan jutottunk egy következtetésre, nem elegendő elfogadni az eredményeket. Az adatbányászat egy olyan módszertan, amely adatbázisokból olyan implicit és rejtett információkat, összefüggéseket, mintázatokat nyer ki, amelyek a gyakorlatban is hasznosíthatók. Az adatbányászat felhasználja a tudomány több ágának eredményeit: a matematikán belül a statisztikát, számítástudományon belül a mesterséges intelligenciát, valamint az információtechnológia eszközeit. Szubjektív vagy nem egyértelműen eldönthető, esetleg vitatható dolgokat az adatbányászati módszerek legfeljebb közelítéssel tudnak megoldani, de a közelítés pontossága, jósága sosem tárható fel, azaz használhatatlan eredményeket kapnánk. A megfogalmazás másik erőssége, hogy ebbe az adatbányászat számos ága belefér, így pl. szövegbányászat és a génkutatás is. Szűk értelemben azonban adatbányászat alatt a strukturált adatbázisokban tárolható adatokon értelmezett összefüggés-kereső tevékenységeket értjük. 3

ADATBÁNYÁSZAT, ÜZLETI ANALITIKA Itbusiness.hu, 2012. januári cikke alapján Az elemzőeszközöket a vállalati vezetők leghatékonyabb fegyverei között tartják számon. Manapság különösen az előrejelzésre képes algoritmusokat becsülik sokra a bizonytalan gazdasági környezetben. Nem felejthetjük el, hogy igen veszélyes terület is tud lenni, ugyanis egy rossz döntéssel jól menő cégek mehetnek tönkre, pillanatok alatt. A közösségi hálózatok térnyerésével egy közzétett információ pillanatok alatt elterjed. Hogy mennyire képes a közösségi média befolyásolni például pénzügyi világot, még nem ismert. Az IDC (International Data Corporation) előrejelzése alapján, a vállalkozások 2015-re kb. 120 milliárd dollárt fognak költeni hardverre, szoftverre és szolgáltatások beszerzésére, melyekkel jobban kihasználják a nagy adatban (Big Data) rejlő lehetőségeket, és hogy pontosabb elemzéseket készíthessenek, hatékonyabban menedzseljék pénzügyi műveleteiket. Ehhez a prediktív analitikát használják. Hogy mi is az a prediktív analitika? Az adatbányászat és a matematikai elemzés eszközeivel dolgozik, hogy összefüggésekre leljen az adattömegben rejlő mintázatok között, és előre jelezze az üzleti trendeket például a fogyasztói aktivitásban. Azonban az eredményei nem valósidejűek. ÚJ TREND KEZD KIBONTAKOZNI Szintén az IDC előrejelzése erősíti meg, hogy a hálózatelemzés, a közösségi hálózatok terjedésével a social decision, a tudásmenedzsment és a BI 1 -megoldások alkalmazása a mobileszközökről azok az irányok, amelyek új utat mutatnak. Alkalmazási fókuszterület továbbra is 1 BI: B usiness Intelligence, üzleti intelligencia 4

a kockázatkezelés, a teljesítménymenedzsment, valamint a marketingmenedzsment. A prediktív analitika és a vizuális adatfelderítés a legnépszerűbb döntéstámogatási módszerek között foglal helyet. Szakértők állítása szerint az elmúlt években legfőképp az adatgyűjtésen volt a hangsúly, majd a közösségi hálózatok terjedésével az adatok kinyerése és részletes elemzése került előtérbe. Offline elemzésről jobban megéri áttérni az online elemzési formára, ugyanis sokkal nagyobb potenciál rejlik a valós idejű elemzésekben. A teljes szöveg-, videó- és hangbányászat mellett egyszerre komplexebb adattömeget vizsgálhatunk. A minél pontosabb jóslatok elkészítéséhez egyre fontosabbá válik a szimuláció és az előrejelzés. Vajon képesek leszünk-e az adatbázisokba gyűjtött adatok elemzésével a "jövőbe látni" vagy következtetéseket levonni? MARKETING ÉS A KÖZÖSSÉGI MÉDIA Socialmediadata.com, Adam, 2013. januári bejegyzése lapján A vállalkozások többségének elengedhetetlen, hogy jelen legyen az interneten. Alapvető fontosságú számukra, hogy használják a közösségi médiát, ami változatos és nagy mennyiségű adatot biztosít ahhoz, hogy saját termékeik és szolgáltatásaik felé irányítsák a felhasználókat, és ily módon építsék a márka identitását. A KÖZÖSSÉGI ADATBÁNYÁSZAT A közösségi média adatbányászat fontos kutatási területté vált, ami hatalmas mennyiségű adatot kezel. Ezekből az adatokból kinyert minták segítségével sok problémára megoldást találhatunk. A social engineer vagy a vezető adatelemző (chief data scientist) ezeknek az 5

adatoknak az elemzésével segíti a vállalkozások intelligens fejlődését és különféle hatékony üzleti tervek kidolgozását mindezeket a társadalmi-háló elemzésével, ahol fórumok, blogok, videó megosztó portálok, közösségi oldalak tartalmát vizsgálják. Nem csak arra kéne összpontosítani, hogy a felhasználók hogyan használják ezeket az oldalakat, milyen termékeket, szolgáltatásokat használnak, hanem hogy hogyan reagálnak jelentős eseményekre, és mi befolyásolja döntésüket. Ezeknek az adatoknak az összességéből többféle profil is felállítható. Bizonyos szempontokat figyelembe véve ezek nem csak a marketingeseknek lehet hasznos, hanem választások előtt a politikai pártoknak vagy éppen a titkosszolgálatoknak. Esettanulmány (New Look): Néhányan azt mondják, eldobható; mások szerint trendi, de egy dolog biztos napjaink legújabb divatja a gyors megtérülés szerint él vagy hal. Hat hétig várni egy felmérés eredményére, nem lehet opció. Elég kitenni valamit a közösségi hálózatra, megosztani, twittelni róla. Pillanatok alatt elterjed és az embereknek véleményük lesz róla. Ezután nincs más dolgunk, mint kielemezni ezeket az adatokat. TÁRSDALOMTUDOMÁNY ÉS A KÖZÖSSÉGI HÁLÓZATOK Az adatok halmaza mindig valós cselekvéseket fed le, azok elemzése alapján pedig sokat tudunk meg a cselekvőről. Megtudhatjuk például, olyan ember vagy-e, aki visszafizeti a hiteleit, ahogy azt is, hajlamos vagy-e a cukorbetegségre. Minderre az adatok azért képesek, mert a társadalmi környezet jelentősen befolyásolja, hogy ki is vagy. Ha látom, hogyan viselkedsz egy adott helyzetben, akkor hozzáképzelem, mit tennél egy másik szituációban annak alapján, hogy melyik társadalmi csoport tagja vagy. Rengeteget lehet így megtudni az emberekről, még akkor is, ha ezek nem szó szerint jelennek meg az adatokban. Az emberek viselkedését nagyon meghatározza társadalmi környezetük, az, 6

hogy mit tartanak helyes viselkedésnek, és hogy mi mindent tanulnak el egymástól. Így az adatok sokaságának elemzése elsősorban a kapcsolatok megtalálásáról szól. Adott emberek kapcsolatairól és a viselkedési módok közötti összefüggésekről. PROFIL Origó, Simon Tamás, 2013. októberi cikke nyomán A morzsák, amit magad után hagysz az online világban, az egész életedet elmeséli, megmutatja aktuális választásaidat. Ez alapjaiban más, mint amit a Facebook-ra kiírsz. Oda ugyanis azt írod ki, amilyen lenni szeretnél, amit el szeretnél hitetni magadról az emberekkel. Azt, hogy valójában ki vagy, sokkal inkább megmutatja, hogy hol időzöl, vagy mit vásárolsz. Amellett se mehetünk el szó nélkül, amivel a facebook kísérletezik mostanában. Tervezik bevezetni azt az új funkciót, amivel figyelik a felhasználó egérmozdulatait, hogy éppen a hirdetések felett van-e vagy csak üzenetet ír, netalántán egy cég frissen posztolt termékein akadt meg a szeme. Kosztolányi Dezső írta az alábbi Beírtak engem mindenféle Könyvbe sorokat, Beírtak engem és minden módon számon tartanak. mindenféle könyvbe c. versében. Vajon mit írna ma a költő? Nem hiszem, hogy nagyon mást, ugyanis ezek a sorok máig nem Porzó-szagú, sötét hivatalokban énrólam is szól egy agg-szürke lap. Ó, fogcsikorgatás. Ó, megalázás, hogy rab vagyok és nem vagyok szabad. vesztették el aktualitásukat, Nem az enyém már a kezem, a lábam, sőt. Felhasználói szokásaink, és a fejem, az is csak egy adat. mobilos és netes aktivitásunk követéséből és elemzéséből lassan tényleg adatokká válunk, amelyeket fel lehet használni társadalmi folyamatok modellezésében, trendek megjóslásában esetleg megfigyelésekhez. Az adatelemzés lehetővé te- 7

szi például olyan csoportok és összefüggések felfedezését, amelyekre egyébként nem derülne fény. A társadalomtudósok szerint ezeknek a rejtett, úgynevezett niche-csoportoknak a felfedezése lehet az új megközelítés egyik legnagyobb haszna. Az adatok társadalomtudományi alkalmazásánál azonban van egy komoly probléma: az adatok jelentős része már cégektől (például Google, Facebook) vagy állami szervektől származik. A Big Datában a cégek is egyre nagyobb lehetőségeket látnak. Egyik konferencián a Microsoft munkatársa elmondta: ők a közösségi hálón található történteket elemzik. Hangulatokra, trendekre, véleményvezérekre vadásznak, az eredményeket aztán a marketingkampányokban szeretnék felhasználni. Az előadó felhívta a figyelmet arra, hogy ugyanez a módszer a választási kampány alatt is alkalmazható. Becslések szerint 2020-ra körülbelül 40 000 petabájtnyi tudományos adat halmozódik fel, de ezzel együtt is valószínű, hogy unokáink csak nevetnek majd azon, hogy Big Datának neveztük a mostani évtizedeket. ADATGYŰJTÉS, NSA ÉS AMI MÖGÖTTE VAN MTI, 2013. júniusi cikke nyomán A Washington Post és a Amikor feltölt vagy valamilyen más módon elküld tartalmakat a Szolgáltatásainkba, világszerte érvényes engedélyt ad a Google-nak az ilyen tartalmak felhasználására, hosztolására, tárolására, reprodukálására, módosítására, származékos művek létrehozására, megosztására, közzétételére, nyilvános előadására, nyilvános megjelenítésére és terjesztésére GOOGLE ÁLTALÁNOS SZERZŐDÉSI FELTÉTELEK Guardian cikke szerint, több nagy szolgáltató - mint például a Google vagy éppen a Facebook hozzáférést biztosított az amerikai hírszerzésnek felhasználók adataihoz. Cégek természetesen tagadják, a titkosszolgálat pedig azzal védekezik, 8

hogy csak külföldiek adatait érinti, bár azt sem tagadják, hogy véletlenül több millió amerikai adatai is hozzájuk kerülhetett. A hírszerző irodák széleskörű adatbányászatot folytattak a legnagyobb internetes cégeknél, így hozzájuthattak felhasználók fotóihoz, beszélgetéseihez, emaileihez. George W. Bush elnöksége alatt 2007-től férhetett hozzá az NSA 2 és az FBI 3 a Microsoft, a Google, a Facebook, a Skype, és az Apple szervereihez. James Clapper az amerikai nemzeti hírszerzés igazgatója elismerte az adatbányászatot. Ezek már szinte tények, bár elismerni senki nem fogja. És mégis mit tehet egy átlagos felhasználó ez ellen, ha nem tetszik neki? Nagyrészt semmit, mert ezek a szolgáltatások annyira összefonódtak az internettel, hogy kikerülhetetlen a használatuk. MIRE HASZNÁLHATÓK AZ ÖSSZEGYŰJTÖTT ANYAGOK? Megtudhatjuk belőle, ki, mikor merre járt, kivel beszélt meg találkozót, közösségi oldalakon megjelent eseményekre hogy reagált. Különféle adatbányászati technikák segítségével kapcsolati hálók, illetve kommunikációs minták készíthetők. Mivel az adatok konkrét személyekhez köthetők, így egy teljes profil állítható fel, emberek, csoportok életmódjáról, napi rutinjáról. Adatelemzés terén a különböző elemző technikák és a Big Data, lehetőséget teremt arra, hogy ezt a hatalmas méretű adattömeget hatékonyan feldolgozzák. Hasonló témáról beszélt Ságvári Bence a CIO Hungary 2013 Konferencián, érdemes átlapozni az előadását. 2 NSA: National Security Agency (Nemzetbiztonsági Ügynökség) 3 FBI: Federal Bureau of Investigation (Szövetségi Nyomozó Iroda) 9

IDÉZETT FORRÁSMUNKÁK Adam. Discover What Mining Social Media Data Means? Socialmediadata.com, 2013. január. Az NSA feltörte a Google és a Yahoo kommunikációs csatornáit is. MTI, 2013. június. Bence, Ságvári. Adatok leszünk mindannyian. CIO Hungary Konferencia, Balatonalmádi, 2013-április 18-19. Memória alapú alkalmazásplatformok. itbusiness.hu, 2012. január. Tamás, Simon. Új korszak kezdődött a tudományban. Origo.hu, 2013. október. 10