Kihívások és trendek mesterséges intelligencia alapú rendszerek tesztelésében

Hasonló dokumentumok
R3-COP. Resilient Reasoning Robotic Co-operating Systems. Autonóm rendszerek tesztelése egy EU-s projektben

Specifikáció alapú teszttervezési módszerek

Specifikáció alapú teszttervezési módszerek

Mesterséges intelligencia alapú regressziós tesztelés

Modell alapú tesztelés mobil környezetben

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Neurális hálózatok bemutató

Robusztusság tesztelés

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

Modell alapú tesztelés: célok és lehetőségek

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Hadházi Dániel.

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

Hibadetektáló rendszer légtechnikai berendezések számára

Neurális hálózatok.... a gyakorlatban

Fuzzy rendszerek és neurális hálózatok alkalmazása a diagnosztikában

Tesztelési szintek Tesztautomatizálás

CARE. Biztonságos. otthonok idős embereknek CARE. Biztonságos otthonok idős embereknek Dr. Vajda Ferenc Egyetemi docens

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

Teszttervezés. Majzik István, Micskei Zoltán. Integrációs és ellenőrzési technikák (VIMIA04) Méréstechnika és Információs Rendszerek Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Visszacsatolt (mély) neurális hálózatok

Automatikus tesztgenerálás modell ellenőrző segítségével

A szoftver tesztelés alapjai

Érzékelők az autonóm járművekben

FELÜGYELT ÉS MEGERŐSÍTÉSES TANULÓ RENDSZEREK FEJLESZTÉSE

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Szoftverminőségbiztosítás

Modellkiválasztás és struktúrák tanulása

A kibontakozó új hajtóerő a mesterséges intelligencia

Teszttervezés. Majzik István, Micskei Zoltán. Integrációs és ellenőrzési technikák (VIMIA04) Méréstechnika és Információs Rendszerek Tanszék

Intelligens közlekedés: a járműipar és járműirányítás IKT igényei, a VehicleICT projekt. Lengyel László lengyel@aut.bme.hu

Biztonságkritikus rendszerek Gyakorlat: Architektúrák

8.3. AZ ASIC TESZTELÉSE

A Jövő Internet kihívásai A jövő információs és kommunikációs technológiai MTA TRB és IB közös tudományos ülés november 17.

Intelligens Rendszerek Gyakorlata. Neurális hálózatok I.

Kovács Ernő 1, Füvesi Viktor 2

Használati alapú és modell alapú tesztelés kombinálása szolgáltatásorientált architektúrák teszteléséhez az ipari gyakorlatban

Forgalmi modellezés BMEKOKUM209

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók 2. Pataki Béla

Takács Árpád K+F irányok

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Verifikáció és validáció Általános bevezető

OO rendszerek jellemzői

Folyamatmodellezés és eszközei. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Veszély- és kockázatbecslés alapú rekonfigurált eljárás-befolyásolás a polgári légiközlekedésben

Valószínűségi modellellenőrzés Markov döntési folyamatokkal

Modellezés és szimuláció. Szatmári József SZTE Természeti Földrajzi és Geoinformatikai Tanszék

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Megerősítéses tanulás

MEMS eszközök redukált rendű modellezése a Smart Systems Integration mesterképzésben Dr. Ender Ferenc

Osztott jáva programok automatikus tesztelése. Matkó Imre BBTE, Kolozsvár Informatika szak, IV. Év 2007 január

Copyright 2012, Oracle and/or its affiliates. All rights reserved.

AZ AUTONÓM KÖZÚTI JÁRMŰVEK TESZTELÉSI ÉS VALIDÁLÁSI KIHÍVÁSAI

Légiforgalmi irányítás szektorizációs tool munkaterhelés alapú megközelítése Számel Bence Domonkos. Unrestricted

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

Szoftverminőségbiztosítás

Ambiens szabályozás problémája Kontroll és tanulás-1

Autonóm járművek városi közlekedésének kihívásai

Bodó / Csató / Gaskó / Sulyok / Simon október 9. Matematika és Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár

Tudásalapú információ integráció

Struktúra alapú teszttervezési módszerek

Alapszintű formalizmusok

Alter Róbert Báró Csaba Sensor Technologies Kft

Szoftverminőségbiztosítás

OpenCL alapú eszközök verifikációja és validációja a gyakorlatban

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Digitális technika (VIMIAA02) Laboratórium 1

Adversarial tanítás neurális hálózatokban

3D-s számítógépes geometria és alakzatrekonstrukció

Mély neuronhálók alkalmazása és optimalizálása

A fejlesztési szabványok szerepe a szoftverellenőrzésben

Digitális technika (VIMIAA02) Laboratórium 1

10-es Kurzus. OMT modellek és diagramok OMT metodológia. OMT (Object Modelling Technique)

Szoftver modul/unit tesztelés

Megoldások a mintavizsga kérdések a VIMIAC04 tárgy ellenőrzési technikák részéhez kapcsolódóan (2017. május)

Modellező eszközök, kódgenerálás

Struktúra alapú teszttervezési módszerek

Célkitűzés Megoldandó feladatok A tesztkörnyezet komponensei V&V folyamatok Eszközintegrációs szintek. Megfelelőség tanúsítása modell alapon

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék. Folyamatmodellezés

DECOS Nemzeti Nap október 15. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Konvolúciós neurális hálózatok (CNN)

Informatikai technológiák szakirány Rendszertervezés ágazat

A Feldspar fordító, illetve Feldspar programok tesztelése

Adatbányászati szemelvények MapReduce környezetben

ROBOT IRÁNYÍTÁS INFRAVÖRÖS LED TÖMBBEL

Szoftver karbantartás

NEURÁLIS HÁLÓZATOK 1. eloadás 1

Steps Towards an Ontology Based Learning Environment. Anita Pintér Corvinno Technologia Transzfer Kft

Az ellátási láncok algoritmikus szintézise

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

Szoftver értékelés és karbantartás

Modellek ellenőrzése és tesztelése

Dr. FEHÉR PÉTER Magyarországi szervezetek digitális transzformációja számokban - Tények és 1trendek

Információs Rendszerek Szakirány

Gépjármű fekete doboz az útvonalrekonstrukció új eszközei

Nagy bonyolultságú rendszerek fejlesztőeszközei

Informatikai rendszertervezés

Átírás:

Kihívások és trendek mesterséges intelligencia alapú rendszerek tesztelésében Majzik István BME VIK Méréstechnika és Információs Rendszerek Tanszék IIR Szoftvertesztelés 2019 konferencia Budapest, 2019. május 29. Budapesti Műszaki és Gazdaságtudományi Egyetem Neeraj Suri Méréstechnika és Információs Rendszerek Tanszék EU-NSF ICT March 2006

Mesterséges intelligencia alapú rendszerek Mesterséges intelligencia (MI) elemek Tudásreprezentáció, keresés, következtetés, döntéshozatal, tanulás, tervkészítés, Jellegzetes feladatok Felismerési feladatok: Objektumok, személyek, környezeti szituációk, adatsorozatok Döntési feladatok: Akciók adott kontextusban Előrejelzés: Megfigyelt viselkedés alapján Példa technológiák Mély neurális hálók Bayes-hálók Biztonságkritikus alkalmazásokban is Autonóm járművek, robotok 2

Objektum felismerés neurális hálóval 3

Mély neurális háló (deep neural network) Bemeneti réteg Rejtett rétegek Kimeneti réteg Strucc Neuronok Kapcsolatok súlyokkal 4 4

Neurális hálók jellegzetességei Tanulás Tanító halmaz + teszt halmaz Jellegzetes hiba: Rosszul felismert bemenet Ellenséges bemenet (adversarial input) + = Panda (57.7% konfidencia) Gibbon (99.3% konfidencia) 5

Neurális hálók jellegzetességei Tanulás Tanító halmaz + teszt halmaz Jellegzetes hiba: Rosszul felismert bemenet Ellenséges bemenet (adversarial input) Debuggolás Neuron aktiváltság: milyen súllyal szerepel a kimenetben Interpretálhatóság, megmagyarázhatóság Felső 5% fontos pixel (3-hoz) Felső 10% fontos pixel (3-hoz) 1 pixel támadás (nem 3 lesz) 6

Kihívások a tesztelés szempontjából Követelmények: Nem jól specifikáltak Tanuló rendszerek: tanító halmaz áll rendelkezésre mennyire jó? Mit garantálhatunk a többi bemenetre? Részletes tervek: Nehezen megfoghatók Tudásreprezentáció: komplex struktúra Neurális háló rétegei: tanult paraméterek Bemenetek hatásossága neuronokra? Teszt minőség: Nehezen mérhető Elégtelenek a klasszikus metrikák (követelmények, struktúra, forráskód fedettsége) Mi legyen a fókusz: a bemeneti domén? 7

Fekete doboz tesztelés Bemenetek automatikus generálása Készlet alapú, szisztematikus és mutációs módszerek Nincs hozzáférés a háló belsejéhez Bemenet generátor Bemenet készlet Neurális háló Kimenet értékelő ostrich spoonbill beaver armadillo cradle reel macaw... 8

Üvegdoboz tesztelés Bemenetek módosítása: Fuzzing Zaj vagy előre definiált mutációk bemeneti készleten Kiválasztás a fedettségi elemzés alapján: a neuronok kimenetének aktiváltsága Bemenet választó Bemenet mutáló Bemenet készlet Neurális háló Kimenet értékelő Fedettség elemző 9

Differenciális tesztelés Ellenséges bemenetek keresése adott hálókhoz Hálók képességeinek vizsgálata: Több, eltérő módon tanított hálóval, nagy neuron fedettséggel Azonos bemenetre adott kimenetek értékelése Bemenet generálás Neurális háló 1 Neurális háló 2 Neurális háló 3 Kimenet értékelő Különböző kimenetek Azonos kimenetek 10

További megközelítések A mélység titkai DeepSafe A háló robusztusságát vizsgálja ellenséges bemenetekre Adat-vezérelt klaszterezéssel keresi a biztonságos régiókat DeepXplore Rosszul felismert bemeneteket keres különféle módon betanított hálókat alkalmazva DeepTest Autonóm járművek tesztelésére fókuszál Kép transzformációkkal generál új bemeneteket (pl. köd, eső hatása) 11

Új szemlélet biztonságkritikus rendszerekben Biztonságkritikus rendszerek ellenőrzése Klasszikus: A tervezett funkcionalitás ellenőrzése (hibamódokra) Kiterjesztés: A szándékolt funkcionalitás szerinti ellenőrzés Road vehicles Safety of the Intended Functionality (SOTIF) Fókuszálás új kockázatokra: Elégtelen funkcionalitás Komponensek, szenzorok képességeinek korlátai Környezeti változások kezelésének korlátai A funkcionalitás használata nem validált környezetben Jellegzetes irányok az ellenőrzésben Tervek finomításának elfogadhatósága Determinisztikus működés Adaptív működés Kimerítő tesztelés Bemenet szegmentálás 12

Esettanulmány: Objektum felismerés tesztelése 13

Célkitűzések Háztartási robot tesztelése Kamera kép Felismert objektumok Teszt: Renderelt képek és elvárt eredmények; szisztematikus generálás Kihívások Objektumok és nézetek sokfélesége Minimális, reprezentatív tesztkészlet Megoldási ötletek Domén analízis: Objektum kategóriák Kritikus paraméterek megállapítása Hasonló képek klaszterezése 14

A tesztgenerálás folyamata Domén modell Objektum típusok, paraméterek, relációk, kényszerek Paraméter választás 3D elrendezések Klaszterezés és renderelés Renderelt képek Elvárt kimenetek is-in(a,b) a.extent b.extent 15

A tesztgenerálás folyamata Domén modell Objektumok variabilitása AND-OR struktúra Paraméter választás 3D elrendezések Klaszterezés és renderelés Renderelt képek Elvárt kimenetek 16

A tesztgenerálás folyamata Domén modell Generálható formák Prioritások a paraméterek hatása alapján Paraméter választás 3D elrendezések Klaszterezés és renderelés Generálható 3D elrendezések Kényszerek teljesítése (greedy algoritmus) Relációk közötti prioritások a hatásuk alapján Renderelt képek Elvárt kimenetek 17

C0: A tesztgenerálás folyamata Domén modell Paraméter választás Tesztkészlet minimalizálás hasonlóság alapján Elrendezés jellemzése: trait points (Hammersley), trait tags (forma, szín, orientáció, árnyék, ) kvantitatív jellemző számítható 3D elrendezések Klaszterezés és renderelés Klaszterek képzése, ezekből reprezentatív eset választás Renderelt képek Elvárt kimenetek 18

A tesztgenerálás folyamata Domén modell Generált képek 3D elrendezés alapján Paraméter választás Renderelt képek 3D elrendezések Klaszterezés és renderelés Elvárt kimenetek Paraméterek: Fényforrás: pozíció, felület, spektrum, intenzitás, polarizáció Közeg: átlátszóság, spektrum, textúra, részecskék Megfigyelő: helyzet, látószög Kamera hibák: tükröződés, lencsehibák, elmozdulás, 19

Esettanulmány: Környezetfüggő viselkedés tesztelése 20

Autonóm járművek és robotok tesztelése Nagyszámú releváns faktor Sok hibalehetőség Működési terület: 8 Rendszerhibák: 8 Objektum felismerés: 10 Hibakezelés: 6 Esemény felismerés: 7 Funkcionális korlátok: 8 Reagálás: 4 21

Megoldási lehetőségek Valós környezetben végzett tesztelés Valós szituációk és problémás esetek összegyűjthetők Magas biztonságintegritási szinthez: sok teszt óra és megtett kilométer szükséges Emberi vezetés: 1,09 halálos baleset 100 millió mérföldre Autonóm jármű: 275 millió mérföldnyi futással tudja ezt 95%-os konfidenciaszinttel demonstrálni 100 autonóm jármű napi 24 órában 12,5 év alatt tudja ezt teljesíteni Szimulátorban történő tesztelés Szituációk szisztematikus generálása Biztonságos viselkedés monitorozása 22

Példa projekt: Célkitűzések Környezetfüggő viselkedés tesztelése autonóm robotok esetén Teszt környezetek generálása robot misszió végrehajtásához Modell alapú megközelítés Környezeti modell: Mi lehetséges? Követelmény modell: Mi az elvárás? Teszt stratégia: Mit érdemes ellenőrizni? 23

Modellezés: Környezet és követelmények Környezeti metamodell Objektumtípusok, tulajdonságok, kapcsolatok Kényszerek: fizikai vagy alkalmazásspecifikus Követelmény scenario modellek Szituáció: környezeti minta Érzékelés: szenzor bemenetek Elvárt viselkedés: akció szekvencia 24

Tesztelési célok robusztusság teszteléshez Váratlan objektumok Szituációk kibővítése extra objektumokkal Automatikus környezeti modell generálás Fedettség: Környezeti objektumok szituációk Komplex szituációk Szituációk n-szeres kombinálása (komplex szituációra több követelmény vonatkozik) Fedettség: (Követelmény szituáció) n Extrém szituációk Szituációk mutálása: objektum tulajdonságok határértékei, kényszerek szélső értékei, megsértése Fedettség: Szituációk (tulajdonságok kényszerek) Modell alapú, szisztematikus tesztkészlet generálás 25

Példa: Komplex szituáció generálása Követelmény scenario modellek: Teszt lefutás: Kiértékelés: Generált teszt környezet: Test verdict: R3 passed R2 failed 26

Összefoglalás: Ötletek szisztematikus teszteléshez Modell alapú analízis, teszt bemenetek klaszterezése Teszt szituációk generálása fedettségi mértékekkel Flat Környezet metamodell hasroom Robot isplaced Room isplaced Thing Object target ContextEvent Környezet generálás Autonóm robot környezeti modell Szimulátor konfiguráció Szimulátor connected MovableObject target MoveEvent AppearEvent LivingBeing Noise Table Bed Animal Human 27

Források Synthesizing robust adversarial examples, A. Athalye, I. Sutskever, 2017. Reluplex: An efficient SMT solver for verifying deep neural networks, G. Katz, et al., 2017. TensorFuzz: Debugging Neural Networks with Coverage-Guided Fuzzing, A. Odena, I. Goodfellow, 2018. Concolic Testing for Deep Neural Networks, Y. Sun et al., 2018. DeepXplore: Automated whitebox testing of deep learning systems, K. Pei et al., 2017. DeepSafe: A data-driven approach for checking adversarial robustness in neural networks, D. Gopinath, G. Katz, C. S. Pasareanu, C. Barrett, 2017. DeepTest: Automated testing of deep-neural-network-driven autonomous cars, Y. Tian, K. Pei, S. Jana, B. Ray, 2017. A Stochastic Grammar of Images, S.-C. Zhu, D. Mumford, 2006. How Many Operational Design Domains, Objects, and Events?, P. Koopman, F. Fratrik, 2019. Testing of Autonomous Systems - Challenges and Current State-of-the-Art, P. Helle, C. Strobel, W. Schamai, 2016. Testing Vision-Based Control Systems Using Learnable Evolutionary Algorithms, N. Shiva, L. Briand, T. Stifter, 2018. Driving to Safety How Many Miles of Driving Would It Take to Demonstrate Autonomous Vehicle Reliability?, N. Kalra, S. M. Paddock, 2016. A Concept for Testing Robustness and Safety of the Context-Aware Behaviour of Autonomous Systems, Z. Micskei, Z. Szatmári, J. Oláh, I. Majzik, 2012. R3-COP: Resilient Reasoning Robotic Co-operating Systems, ARTEMIS project, 2012. 28