infokommunikációs technológiák IV.7 MÓDSZER KIDOLGOZÁSA FELHASZNÁLÓI ADATOK VÉDELMÉRE MOBIL ALKALMAZÁSOK ESETÉN ANTAL Margit, SZABÓ László Zsolt 2015, január 8.
BEVEZETÉS A KUTATÁS CÉLJA A felhasználó hitelesítése érintőképernyő segítségével Statikus, belépési ponthoz kötött hitelesítés Billentyűzési ritmus Kétszintű hitelesítés: Jelszó egyezése Jelszó gépelési ritmusának egyezése Kutatási kérdések: Érintőképernyőről származó jellemzők milyen mértékben segítik a felhasználók hitelesítést? Kétosztályos és egyosztályos osztályozók teljesítményének vizsgálata. Gyorsulásérzékelő szenzortól származó jellemzők hatása a hitelesítésre. Különböző típusú jelszavak gépelési ritmusa közötti különbségek vizsgálata. 2
BILLENTYŰZÉSI RITMUS Elvégzett feladatok: 2014. augusztus 1. 2014. december 31. 1. Billentyűzési ritmus: szakirodalmi áttekintés 2. SAPI-KEY1 (publikus) Statisztikai elemzés Jellemzők vizsgálata Osztályozás Autentikáció (hitelesítés): Egy- és két-osztályos osztályozási algoritmusok teljesítményének vizsgálata Hibagörbék (ROC, DET) - átlagolás Tanulási görbék 3. SAPI-KEY2 Szoftverfejlesztés Adatgyűjtés 3
Publikációk száma 1. SZAKIRODALMI ÁTTEKINTÉS 14 12 10 8 6 4 2 Billentyűzési ritmus publikációk 0 2000 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 Mit vizsgáltak? Statikus (jelszó) és dinamikus (hosszú szöveg) autentikáció Hardver és szoftver billenyűzet, hardver billentyűzet + nyomás szenzor Algoritmusok Statisztikai Neurális hálózatok Forma felismerés és gépi tanulás Jellemzők hatékonyságának vizsgálata. Idő alapú jellemzők: HD, DD, UD Nyomás Másodrendű jellemzők 4
Publikációk száma 1. SZAKIRODALMI ÁTTEKINTÉS Érintőképernyős eszközökkel végzett kutatások Mit nem vizsgáltak? Mit érdemes tovább vizsgálni? 7 6 5 4 3 2 1 0 2009 2012 2013 2014 Megjelenési év Érintőképernyő + szoftver billentyűzet Algoritmusok Egyosztályos vs. kétosztályos osztályozási algoritmusok Együttes (ensemble) vagy kombinált osztályozók (classifier combination) Jellemzők hatékonyságának vizsgálata. Érintőképernyős jellemzők: P, FA Érzékelőkből származó jellemzők vizsgálata: Gx, Gy, Gz Másodrendű jellemzők Jelszó hossza/típusa 5
2. SAPI-KEY1 ADATHALMAZ ADATGYŰJTÉS Adatgyűjtés: SAPI-KEY1 Felhasználók: 42 (24 férfi, 18 nő) Eszközök: Nexus 7 (5 felhasználó) Mobil LG Optimus L7 (37 felhasználó) Gépelt jelszó:.tie5roanl Munkamenetek: 2 menet/felhasználó Minták száma: 51 minta/felhasználó 6
2. SAPI-KEY1 ADATHALMAZ ADATGYŰJTÉS, JELLEMZŐK Adatgyűjtés: SAPI-KEY1 Dataset1: 14HT+13DD+13UD+AHT (41 jellemző) Dataset2: 14HT+13DD+13UD+14P+14FA+AHT+AP+AFA (71 jellemző) Idő alapú jellemzők: Hold time Down-Down time Up-Down time Érintés alapú jellemzők: Pressure Finger Area Másodrendű jellemzők: Average Hold time Average Pressure Average Finger Area 7
2. SAPI-KEY1 ADATHALMAZ JELLEMZŐK User11 Hold time User11 Pressure means finger area pressure updown t. downdown t. hold t.
2. SAPI-KEY1 ADATHALMAZ JELLEMZŐK RANGSOROLÁSA Filters osztályozótól független Wrappers osztályozótól függő Filters: InfoGainAttributeEval, ChiSquareAttributeEval, SymmetricalUncertainityAttributeEval, GainRatioAttributeEval, SVMAttributeEval Wrappers: WrapperSubsetEval SVM forward SVM backward k-nn forward k-nn backward Következtetések: A másodrendű jellemzők diszkrimináló ereje magas: AHT, AP, AFA. A nyomáshoz kötődő jellemzők is magas diszkrimináló erővel bírnak.
2. SAPI-KEY1 ADATHALMAZ OSZTÁLYOZÁS 42 osztály (felhasználó) Osztályozó Idő alapú jellemzők H+DD+UD+AH (41 jellemző) Idő és érintőképernyő alapú jellemzők H+DD+UD+P+FA+AH+AP+AFA (71 jellemző) Naïve Bayes 50.15% (2.86) 78.93% (2.63) Bayesian Networks 75.95% (2.65) 91.94% (1.73) C4.5(J48) 54.79% (3.84) 69.02% (3.32) k-nn (IBk) 41.07% (2.83) 72.98% (2.25) SVM (LibSVM) 61.71% (3.22) 88.33% (1.87) Random forests 82.53% (2.53) 93.04% (1.65) MLP 53.01% (3.39) 86.26% (2.19)
2. SAPI-KEY1 ADATHALMAZ AUTENTIKÁCIÓ, KÉTOSZTÁLYOS OSZTÁLYOZÁS 10 mérés (futtatás) Minden mérés: 10 rétegű keresztvalidáció Minden felhasználóra: 51 pozitív minta 100 negatív minta Adathalmaz Osztályozó Középérték Szórás 41 jellemző Random forests (t: 100) 94.94 0.52 Random forests (t: 10) 94.65 0.53 K-NN (k: 1) 87.11 1.69 K-NN (k: 3) 86.30 1.94 71 jellemző Random forests (t: 100) 97.31 0.4 Random forests (t: 10) 96.77 0.31 K-NN (k: 1) 93.15 1.64 K-NN (k: 3) 92.06 1.91
2. SAPI-KEY1 ADATHALMAZ AUTENTIKÁCIÓ, KÉTOSZTÁLYOS OSZTÁLYOZÁS 10 mérés (futtatás) 10 rétegű keresztvalidáció Minden felhasználóra: 51 pozitív minta 100 negatív minta ROC görbe DET görbe
2. SAPI-KEY1 ADATHALMAZ AUTENTIKÁCIÓ, EGYOSZTÁLYOS OSZTÁLYOZÁS LibSVM library 3.18 10 mérés (futtatás) 10 rétegű keresztvalidáció Tanítás és tesztelés: csak pozitív minták ν 71 jellemző 41 jellemző középérték szórás középérték szórás 0.02 84.26 0.33 87.51 0.3 0.05 85.10 0.28 88.14 0.3 0.07 84.23 0.29 87.20 0.28 0.10 82.14 0.21 84.93 0.21
2. SAPI-KEY1 ADATHALMAZ AUTENTIKÁCIÓ, EGYOSZTÁLYOS OSZTÁLYOZÁS Dd_Tools (version 2.1.2) 10 rétegű keresztvalidáció, tanítás: pozitív minták, tesztelés: pozitív + negatív minták Csak 3 jellemző: AHT, AP, AFA
2. SAPI-KEY1 ADATHALMAZ AUTENTIKÁCIÓ, EGYOSZTÁLYOS OSZTÁLYOZÁS Dd_Tools (version 2.1.2) 10 rétegű keresztvalidáció, tanítás: pozitív minták, tesztelés: pozitív + negatív minták knndd - k-legközelebbi szomszéd alapú adatjellemzés parzendd - Parzen sűrűség becslés svdd tartóvektor-gép alapú adatjellemzés (RBF kernel, s=6) A negatív osztályba rangsorolt minták aránya=0.1
2. SAPI-KEY1 ADATHALMAZ TANULÁSI GÖRBÉK Weka Bayes Network: 8 minta 90% osztályozási pontosság 20-25 tanítási minta elfogadható osztályozási pontosság
3. SAPI-KEY2 ADATHALMAZ SZOFTVERFEJLESZTÉS Miért? Több típusú jelszó gyűjtése Új típusú jellemzők gyűjtése: Képernyő pozíció: x, y Gyorsulások: Gx, Gy, Gz Adminisztrátor: beállítások
3. SAPI-KEY2 ADATHALMAZ ADATGYŰJTÉS Adatgyűjtés: SAPI-KEY2 Gépelt jelszavak: Easy: kicsikutyartarka Strong:.tie5Roanl Logical strong: Kktsf2!2014 Felhasználók: 54 (49 férfi, 5 nő) Munkamenetek: 3 menet/felhasználó Eszköz: Nexus 7 Minták száma: 60 minta/felhasználó 20 minta/menet 18
3. SAPI-KEY2 ADATHALMAZ ÚJ JELLEMZŐK, TANULÁSI GÖRBE meanxacceleration meanyacceleration meanzacceleration ondesk velocity totaltime totaldistance
ÖSSZEFOGLALÁS FELADATOK Feladat Alfeladat Személyek Szakirodalmi tanulmány Billentyűzési ritmus Antal Margit SAPI-KEY1 Statisztikai elemzés Antal Margit Jellemzők vizsgálata Szabó László Zsolt Osztályozás Szabó László Zsolt Autentikáció: kétosztályos osztályozás Antal Margit Autentikáció : egyosztályos osztályozás Szabó László Zsolt Hibagörbék Szabó László Zsolt Tanulási görbék Szabó László Zsolt SAPI-KEY2 Szoftverfejlesztés Antal Margit Adatgyűjtés Antal Margit 20
ÖSSZEFOGLALÁS FELADATOK Antal Margit 2014 aug-okt. Szakirodalmi áttekintés és összehasonlító tanulmány billentyűzési ritmusról; szakirodalmi áttekintés és összehasonlító tanulmány az érintési adatok biometrikus azonosításra való használatáról Elvégezve: ANTAL MARGIT (beszámoló aug.-okt.) 2014 nov- dec. A mérésekhez szükséges szoftverek feltérképezése és üzembe helyezése, adatgyűjtés megszervezése és lebonyolítása Elvégezve: ANTAL MARGIT, SZABÓ LÁSZLÓ ZSOLT (beszámoló nov.-dec.) Szabó László Zsolt 2014 aug-okt. 2014 nov- dec. Mérési környezet kialakítása, tanító- és Ateszthalmazok elkészítése, mérések elvégzése, a kapott mérési eredmények feldolgozása Kliens-szerver adatgyűjtő szoftver fejlesztése és tesztelése Elvégezve: SZABÓ LÁSZLÓ ZSOLT (beszámoló aug.- okt.) Elvégezve: SZABÓ LÁSZLÓ ZSOLT, ANTAL MARGIT (beszámoló nov.-dec.) 21
ÖSSZEFOGLALÁS PUBLIKÁCIÓK SAPI-KEY1 adathalmaz: http://www.ms.sapientia.ro/~manyi/keystroke.html ANTAL Margit, SZABÓ Lászlo Zsolt, LÁSZLO Izabella (2014), Billentyűzési ritmus alapú azonosítas és hitelesítes érintőképernyős mobileszközökön, XXIV. Nemzetközi számítástechnika és oktatási konferencia, SZÁMOKT, 2014. október 9-12., Székelyudvarhely, Románia, pp. 131-136. [PDF] [Presentation] Lászlo Zsolt SZABÓ, Margit ANTAL (2014), An evaluation of one-class and twoclass classification algorithms for keystroke dynamics authentication, VOCAL 2014, 14-17 December 2014, Veszprém, Hungary. [Presentation] 22
JÖVŐBELI TERVEK Konferencia publikáció elkészítése - http://cscs20.acs.pub.ro A SAPI-KEY2 adathalmaz: Gyorsulásérzékelő szenzortól származó jellemzők hatása a hitelesítésre. Különböző típusú jelszavak gépelési ritmusa közötti különbségek vizsgálata. Mesterségesen előállított negatív minták tanulmányozása. Folyóirat publikáció elkészítése. 23
infokommunikációs technológiák KÖSZÖNÖM A FIGYELMET!