BIG DATA ELEMZÉSEK LEHETŐSÉGEI A KÖRNYEZETVÉDELMI MODELLEZÉSBEN Dr. Torma A. 2015.11.13.
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 2 Tartalom 1. A Big Data fogalma 2. Pár érdekes adat a Big Data világából 3. Big Data felhasználás klasszikus területei 4. Big Data elemzésekben rejlő hasznok és kihívások 5. Pár érdekesebb technika Big Data elemzésekhez 6. Felhasználhatóság és rizikók a környezetvédelem területén 7. Továbbvezető kutatási kérdések
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 3 1. A Big Data fogalma (1)» > tera-; petabyte» technológiai szint függő» típusfüggő» strukturális heterogenitás (5%)» magas változatosság» alacsony értéksűrűség (low value density)» keletkezés és feldolgozás is» real time analízisek» jelentős eltérések» források komplexitása
1. A Big Data fogalma (2) big data kifejezés gyakorisága dokumentumokban Forrás: ProQuest Research Library 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 4
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 5 2. Pár érdekes adat a Big Data világából 2011-ben: 1,8 zettabyte adatmennyiség (10 21 ) napi szinten 2,5 exabyte bővülés 2 évente duplázódó adatmennyiség 60 mrd. tablet = 250 terabyte adatfeldolgozás = 1-2 millió könyv elolvasása egy szempillantás alatt óránként 20 terabyte adat a turbina működéséről 95% strukturálatlan adathalmaz havonta ~100 mrd. keresés a Google-ön
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 6 3. Big Data felhasználás klasszikus területei (1) Közgazdaságtudomány» vásárlói szokások feltérképezése» preferenciaválasztások Politika Kutatás fejlesztés» választási kampányok (pl. Obama újraválasztása) Egészségügy» járványok elemzése» életmód és egészségi állapot feltérképezése» drogprevenció Katasztrófavédelem» autonóm közlekedés (önvezető jármű)» DNS szekvenálás» klímamodellezés (NCCS) Társadalomtudományok» szociológiai / szociográfiai elemzések Ipari folyamatok» folyamatelemzés» veszteségfeltárás» folyamatelemzés» előrejelzések Mezőgazdaság» terméshozam előrejelzések» precíziós mezőgazdaság
3. Big Data felhasználás klasszikus területei (2) CERN Nagy Hadronütköztető»»»» 2015/11/13 150 millió szenzor 40 millió adat másodpercenként az adatok mindössze 0,001% kerül elemzésre > 200 petabyte évente ha minden adatot elemeznének: 150 mill. petabyte / év > 200-szor annyi, mint a világ többi része Dr. TORMA A. >> Széchenyi István Egyetem 7
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 8 3. Big Data felhasználás klasszikus területei (3) Vestas Big Data a megfelelő elhelyezés érdekében» 2,8 petabyte adat» 178 elemzett paraméter» 27x27 km-es raszter helyett 3x3 km-es raszter
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 9 4. Big Data elemzésekben rejlő hasznok és kihívások (1) Transzparencia, adatok elérhetősége Lehetőség a modellezésre / szimulációra Automatikus algoritmusok alkalmazása a szubjektív döntéshozatal helyett Adat policy (adatbiztonság, jogi kérdések) Alkalmas technológia és technikák Szervezeti kultúra és képességek Finanszírozás Adatok újrahasználhatósága Innováció serkentése Adatok hozzáférhetősége Szegmentálás Erőforrások hatékonyabb felhasználása Sztenderdek Komplex rendszerek elemzése > fenntarthatósági döntések Gazdasági szektor struktúrája, versenyhelyzete
4. Big Data elemzésekben rejlő hasznok és kihívások (2) Egyes szektorok lehetséges hasznai a big data elemzésekből Forrás: McKinsey Global Institute 2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 10
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 11 5. Pár érdekesebb technika Big Data elemzésekhez data mining crowdsourcing citizen science/ PPSR Internet of Things neural networks Big Data elemzés social media time series analysis business intelligence Industry 4.0 smart
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 12 6. Felhasználhatóság és rizikók a környezetvédelem területén komplex rendszerek elemzése technológiák optimálása és változtatása veszteségfeltárás és veszteségcsökkentés többszörös összevetés problémája előrejelzések, szimulációk big data pig data dilemma (minőség) nagy számok törvénye > helytelen trendek globális összefüggések modellezése nagy volumenű dolgok elemzése vs. mikroszintű folyamatok múltbéli predikciók rögzülése személyiségi jogok
2015/11/13 Dr. TORMA A. >> Széchenyi István Egyetem 13 7. Továbbvezető kutatási kérdések adatmennyiség és modellezési képesség összefüggései költség haszon mérleg break even pont kérdése adatminőség garantálásának kérdése social media alapú big data elemzések idősorokon alapuló előrejelzés lehetősége
KÖSZÖNÖM A MEGTISZTELŐ FIGYELMET! Dr. TORMA A. [torma@sze.hu]