A mesterséges intelligencia kihívásai Dr. Charaf Hassan, egyetemi tanár, BME-AUT
Fogalmak Mesterséges Intelligencia, AI Gépi tanulás (Machine Learning), ML Mély gépi tanulás (Deep Learning), DL Neurális hálózatok, NN Tanítás: Felügyelt, felügyelet nélkül, ST, UST Big Data, MapReduce, Hadoop Adat tudomány ( Data Science) Adatbányászat ( Data Mining) Explainable Artificial Intelligence, XAI 2
Evolúció Forrás: http://houseofbots.com/news-detail/2754-a-take-on-deep-learning 3
Pozicionálás Forrás: https://www.geospatialworld.net/blogs/difference-between-ai%ef%bb%bf-machine-learning-and-deep-learning/ 4
Pozicionálás Forrás: https://whatsthebigdata.com/2016/10/17/visually-linking-ai-machine-learning-deep-learning-big-data-and-data-science/ 5
Pozicionálás 6
AI vs ML A mesterséges intelligencia (AI) az intelligens viselkedésre képes számítógépek megalkotásának tudománya. A gépi tanulás (ML) a Stanford Egyetem definíciója szerint nem más, mint a gépeket explicit programozás nélkül bírni cselekvésre. Az okos gépek létrehozásához folyamatos AI-kutatások kellenek. 7
AI vs ML Nidhi Chappell (Intel): Az AI maga az intelligencia: hogyan tegyük a gépeket intelligenssé. A gépi tanulás pedig azon számítási módszerek implementációja, melyek ezt lehetővé teszik. Én így gondolok rájuk: Az AI a tudományos, az ML az algoritmikus hátteret adja az okosabb gépek létrejöttének. Az AI-t a gépi tanulás valósítja meg. Példa: Google keresés 8
Trendek
10
11
Az elmúlt évek trendjei
Időzítés, miért most?
A jelen A mobileszközök képessége nő A felhőszolgáltatások erősödése A dolgok internete Internet of Things (IoT), Internet of Everything (IoE) Ipar 4.0 Sok adat Big Data Biztonság 5G A viselhető eszközök gyors elterjedése Okos város, otthon, környezet, autó stb. 14
Mobil-adatforgalom Forrás: CISCO 10,7 EB = 10,7 10 18 B = 12 milliárd CD = 2,5 milliárd DVD A 2000. év teljes forgalmának a 650-szorosa! 15
Via della Conciliazione 2005. április 4. 2013. március 12. Forrás: http://www.spiegel.de/panorama/bild-889031-473266.html Forrás: http://www.spiegel.de/panorama/bild-889031-473242.html 16
Az alap séma változása Beavatkozás Érzékelés Feldolgozás 17
10+ milliárd eszköz 2017 Forrás: japantimes.co.jp/news/2014/09/30/asia-pacific/hong-kong-democracy-protesters-set-deadlinefor-demands/ 18
10+ milliárd eszköz 2017 50+ milliárd eszköz 2022 Forrás: japantimes.co.jp/news/2014/09/30/asia-pacific/hong-kong-democracy-protesters-set-deadlinefor-demands/ 19
10+ milliárd eszköz 2017 Átbocsátó képesség 50+ milliárd eszköz 2022 Forrás: japantimes.co.jp/news/2014/09/30/asia-pacific/hong-kong-democracy-protesters-set-deadlinefor-demands/ 20
10+ milliárd eszköz 2017 Átbocsátó képesség Biztonság 50+ milliárd eszköz 2022 Forrás: japantimes.co.jp/news/2014/09/30/asia-pacific/hong-kong-democracy-protesters-set-deadlinefor-demands/ 21
10+ milliárd eszköz 2017 Átbocsátó képesség Biztonság Egyéb 50+ milliárd eszköz 2022 Forrás: japantimes.co.jp/news/2014/09/30/asia-pacific/hong-kong-democracy-protesters-set-deadlinefor-demands/ 22
Mobilkommunikáció 2G 1992 Hang SMS 3G 2002 + Adat + Hely 4G 2012 + Videó + 3D grafika 5G 2022 + Tapintható internet + M2M + Tb/s + Megbízható és biztonságos > 10 Gbit/s per user < 1 ms RTT > 10k sensors per cell < 10 8 outage < 10 12 security 10x10 heterogeneity 23
A gépi tanulás célja olyan gépeket alkotni, melyek saját tapasztalataikból kiindulva képesek tanulni és alkalmazkodni. Tom Dietterich Olyan algoritmusok, amik példaadatok alapján szabályszerűségeket ismernek fel, majd ezek alapján más, a példaadatokkal megegyező struktúrájú és szemantikájú adatokról hoznak döntéseket.
Gépi tanulás A probléma megoldásához központi jelentőségű az előrejelzés Sok a múltbéli adat Az előrejelzés csak egy kis része a megoldásnak Nincs előre jelezhető minta Nincs elég múltbéli adat Túl sok üzleti szabály irányítja az adat forrásának rendszerét
Gépi tanulás - Feladatok MEGERŐSÍTÉSES TANULÁS: E módszer lényege, hogy a mesterséges ágens viselkedésével a legnagyobb hasznot hajtsa. A gép ilyenkor választ egy viselkedést, majd jutalmat, visszajelzést kap. Így tanítjuk ma a gépeket pl. különböző játékok megnyerésére. Azonban a legegyszerűbb feladatok megtanulására is nagy számú próbafeladat elvégzésére van szükség. FELÜGYELT TANULÁS : Így nevezzük, amikor a kutatók megmondják a gépnek, hogy adott bemenet esetén mi volna az elvárt kimenet. Például egy képfelismerőnek megmutatják egy autó képét és meg is mondják, hogy a helyes válasz autó. Ez a neurális hálók és egyéb ML modellek tanításának legelterjedtebb módja. FELÜGYELET NÉLKÜLI TANULÁS / PREDIKTÍV TANULÁS: Az emberek és állatok tipikusan felügyelet nélkül, környezetük megfigyelésén keresztül tanulnak. Mivel senki nem magyarázza el nekünk az összes tárgy nevét és funkcióját, az alapfogalmakat magunknak tanítjuk meg, pl: a világ háromdimenziós, a tárgyak nem tűnnek el maguktól, viszont alátámasztás hiányában leesnek. Ennek a tanulásnak a modellezésére, replikálására a tudomány ma még nem képes, legalábbis messze nem azon a szinten, amire az emberek és állatok képesek. 27
Gépi tanulás Feladatok Osztályozás: Minden adathoz valamilyen kategóriát rendelni Regresszió: Folytonos osztályozás (minden adathoz valamilyen érték rendelés egy nemdiszkrét értékhalmazból) Klaszteranalízis: Az adatokat csoportokba rendelni; a csoportok nem ismertek, mint az osztályozásnál! Dimenziócsökkentés: Adott dimenziójú inputot kisebb dimenziójúval reprezentálni Sűrűségbecslés: Adatok eloszlásának felderítése Rangsorolás: Sorba rendezés
Gépi tanulás Alkalmazások Gépi fordítás Karakterfelismerés (OCR, postai osztályozó irányítószám alapján) Spamszűrő Robotika (autonóm intelligens rendszerek) Természetes nyelvek feldolgozása Bioinformatika, gyógyszerkutatás
Gépi tanulás Modell fejlesztése
Support Vector Machine SVM Adott x i, y i, ahol i = 1 N, x i R d, y i { 1,1} Keressük f x osztályozót, hogy tetszőleges i-re f(x i ) ቊ 0 y i = +1 < 0 y i = 1 f x i = w x i b f x i =?
Neurális hálók
Gépi tanulás Feature engineering Feature engineering: Az adathalmazból azoknak a mezőknek a kiválasztása vagy az alapján olyan új mezők létrehozása, amelyek a legjobb modell előállítását segítik. (iskolázottság, kedvenc szín, éves fizetés) adathalmaz esetén ha az éves fizetés az előre jelzendő cél, az iskolázottság egy jó feature, a kedvenc szín nem Ökölszabály: próbáljunk meg olyan adathalmazt választani, hogy az egyes osztályokba esés valószínűsége monoton kövesse az adathalmaz értékének változását Továbbra is szükséges az emberi tudás, a gép csak az optimalizációs algoritmust adja!
Gépi tanulás Problémák Jó ML algoritmusok fejlesztése, megírása költséges Sok eszköz szükséges egy ML megoldás lefejlesztéséhez (adatgyűjtés, előkészítés, modellfejlesztés) Nehéz a modellt üzleti értékké fordítani, a modellt szolgáltatásként publikálni Erőforrás-igényes, nehezen skálázható
Deep Learning- indokok A számítási kapacitás gyors növekedése Sok adatunk van Sok fajta adat generálódik egyszerre GPU-k elterjedése Az igények növekedése A nagy IT cégek fejlesztéseinek gyors elterjedése és alkalmazása
Deep Learning 36
Alexnet
MI kutatások a BME-n
ALGORITMUSOK, IMPLEMENTÁCIÓK, ALKALMAZÁSOK Főbb kutatási irányok MI képességek megvalósítása (diszciplináris és algoritmikus tudás) MI képességekkel rendelkező rendszerek integrálása (informatikai tudás ) MI képességek alkalmazástechnikája (domain-specifikus tudás ) Adaptív és tanuló rendszerek Tudás- és ágens alapú rendszerek Idősorok analízise és adatbányászata Adatbiztonság Adatgyüjtés- feldolgozás, hálózati kommunikáció Robotika Járműintelligencia és kommunikáció Okos város Okos épületek FŐBB ALKALMAZÁSOK Okos technikák Autonóm járművek
Kognitív intelligencia - beszéd és képfeldolgozás Kognitív input (kép, hang, beszéd..etc.) Detekció, klasszifikáció, szegmentálás... Deep learning Képfeldolgozás, objektumok felismerése és szegmentálása Beszédfeldolgozás és generálás Természetes nyelvek feldolgozása
Természetes nyelvek Szemantikus gráfok Szemantikai elemzés 41
Tudás alapú szabályozás szenzori információk alapján intelligens otthon Home devices Alarms Appliance meters Phone Video PC HOME STATION Processors + buffers + links Resource management for QoS criteria and priorities Internet (IP protocol) (our task) Delay, packet loss prob., jitter etc.
Hangulatbányászat és analízis neurális hálókkal Importanc e sampling Natural language proc. and scoring Predicted sentiment
Idősorok: real-time outlier detekció fraudulent viselkedés és kiber támadások identifikálására Outliers? Kiber támadás? Normál internet forgalom, vagy lekérdezéses támadás Real-time predikciós és döntő algoritmusok Idősor Idősor xʹn x n k,,x n 1 Prediktor Döntés x n x n xʹn>δ y n {1,0}
MI adatbiztonsági kérdések Modell inverzió Tanulóadatok visszanyerése a tanított modellből Ellenséges minták apró, nehezen detektálható változások a tanulóhalmazban a támadó által azért, hogy az MI hibás döntéseket hozzon Kutatás: Adat- és paraméter-anonymizálás 45
Környezetérzékelés 46 2018. 10. 17.
Tesztelés és validálás Stop 47 2018. 10. 17.
Alkalmazások
IoT Érzékelés Feldolgozás Beavatkozás 49 49
A lehetőség az információban van A nyers bitek, adatbájtok valójában túl sokat nem segítenek. A feldolgozott adatok kezdenek érdekesek lenni Az elemzett adat, az összefüggések adnak értéket az adat tulajdonosának Az összevezetett multi-domain adat számos adathasznosító/vevő számára értékes Az az információ értékesíthető igazán, amely beavatkozásokat vezérel a tettre fogható információra építsünk 50
IoT elterjedése Okos, a környezetüket érzékelni és esetenként beavatkozni képes eszközök > Okos hangszórók > Okostelefonok > Autók > Szenzorok Rohamosan terjednek az IoT projektek mind az átlagemberek, mind az ipari szereplők körében A rendszerek biztonsága kritikus > Gyárak irányítása > Közlekedés, stb. 51
MAN Jármű elemzés Jármű használat elemzése Karbantartások ütemezése, például amikor amúgy is várnak a kamionok Élettartam növelése Automata elemzések, monitoring
SocialDriving Közösségi vezetés, adat megosztás Gamification OBD 2 port vagy CAN bus figyelés Személyes jutalmak, kuponok viselkedés alapján Flotta kezelés, nyomkövetés Karbantartások támogatása, hibakódok
Forgalom számlálás és Mesterséges Intelligencia Valós idejű forgalom számlálás Objektumok azonosítása Kategorizálás Autó Teherautó Kerékpár/motor Gyalogos Adat feldolgozás és elemzés
Otthoni bizonsági rendszer A biztonsági kamera intelligensen dönt, pl. arcfelismerés alapján: ki jött haza. Megtanulja, kik vannak otthon, kiket kell felismerni. Automatikusan kapcsolja a lámpát, ha hazaértem, esetleg nyitja a garázsajtót, ha felismeri a kocsit. 55
Chatbotok 56
Szentimentelemzés, véleménykinyerés 57
Saját fejlesztések Tervezz Velem chatbot >BKK útvonaltervező >Természetes nyelvű kérdéseket, mondatrészleteket értelmez >Facebook Messengerbe integrálva 58
Orvosi alkalmazások
Stroke és infraktus megelőzése Meglévő adatok elemzése Az orvosok által megfigyelt jelenségek értelmezése A múltbeli adatok és az aktuális mérések alapján számos esetben megelőzhetőek a nagyobb károk 60
Feladat Betegség
Neurális hálók Hib a - 0.06 0.0 8 0. 0-0.02
Topológia - Bemeneti réteg
Explanaible Artificial Intelligence, XAI 69
Problémák A Deep Learning területén nagy eredmények születtek Ezek a technikák a kérdésre tudnak választ adni, a cél hogy a válasz korrekt legyen, tehát a jobb pontosság a cél Sajnos nem könnyű kivenni ezekből a technikákból, hogy miért született az adott döntés. 70
XAI szükségessége Forrás: https://www.darpa.mil/program/explainable-artificial-intelligence Sajnos nem tudjuk megválaszolni a Miért-eket 71
XAI Megközelítése Forrás: https://www.darpa.mil/program/explainable-artificial-intelligence A user értse meg miért, Pl. A DeepMind 72
Kihívások 73
Kihívások Költség: A költségek el tudnak szállni, nemcsak a szoftver költsége van, hanem a folyamatos karbantartás Kultúra: A humán faktor kritikussága, állások helyzete Technológia választás: Sok lehetőség közül a megfelelő technológia kiválasztása kritikus lehet Pontos célok meghatározása Az intelligens gépek dominálni fognak. Készüljünk fel 74
Magyarországon Állami szerep: támogatás Platformok: >Ipar 4.0 platform >5G koalíció >Mesterséges Intelligencia Koalíció Összefogás szükséges ezen a területen is. Enélkül a KKV-k nehezen tudnak bekapsolódni. 75
A jövő
Befektetés a jövőbe Japán, és a világ egyik leggazdagabb embere, Masayoshi Son 100 milliárd dollárt fektet mesterséges inteligencia kutatásba, ahogy ő mondja, hogy elérjük a szingularitást. Ami pedig nem más, mint amikor a gépek inteligensebbé válnak az embereknél. Hogy ez mikor lesz, vagy hogy lesz-e egyáltalán, azt nem tudjuk. De azt tudjuk, hogy Masayoshi Son befektetései a tuti kategóriába tartoznak. Befektetett az Alibabába, amikor ott még csak 30 alkalmazott volt. A Yahoo első befektetői között volt. És most megvette az ARM csipgyártót. Az ARM többé nem tőzsdei cég. 77
Útravaló A neurális hálók visszatértek és szerepük egyre nagyobb a modern AI megoldásokban A legnagyobb sikereket felügyelt tanulással érjük el, melyek a nagymennyiségű adatot és jól bevált algoritmusokat használnak. A Spark az elosztott gépi tanulásra különösen alkalmas környezetet teremt A kihívások most a transzparencia területén vannak (XAI) 78
Köszönöm a figyelmet! Kérdések? 79