Tormási Alex. Felismerési feladatok megoldása számítási intelligencia eszközökkel. Ph.D. tézisfüzet

Hasonló dokumentumok
DOI: /SZE.MMTDI Doktori értekezés. Tormási Alex

AZ A PRIORI ISMERETEK ALKALMAZÁSA

Számítási intelligencia

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Előrenéző és paraméter tanuló algoritmusok on-line klaszterezési problémákra

TARTALOMJEGYZÉK. TARTALOMJEGYZÉK...vii ELŐSZÓ... xiii BEVEZETÉS A lágy számításról A könyv célkitűzése és felépítése...

A TANTÁRGY ADATLAPJA

A KUTATÁS EREDMÉNYEI ZÁRÓJELENTÉS

Gál László. Doktori tézisek. Témavezető: Dr. Kóczy T. László, Dsc. egyetemi tanár, az MTA doktora. Széchenyi István Egyetem Automatizálási Tanszék

Drótposta: ; ; Honlapom:

Publikációs lista. Dr. Molnárka-Miletics Edit Széchenyi István Egyetem Matematika és Számítástudományi Tanszék

Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

MŰSZAKI TUDOMÁNY AZ ÉSZAK-KELET MAGYARORSZÁGI RÉGIÓBAN 2012

Teljesen elosztott adatbányászat alprojekt

VI. Magyar Földrajzi Konferencia

Algoritmusok Tervezése. Fuzzy rendszerek Dr. Bécsi Tamás

Autópálya forgalomszabályozás felhajtókorlátozás és változtatható sebességkorlátozás összehangolásával és fejlesztési lehetőségei

P-gráf alapú workflow modellezés fuzzy kiterjesztéssel

A k-szerver probléma

Publikációs lista. Gódor Győző július 14. Cikk szerkesztett könyvben Külföldön megjelent idegen nyelvű folyóiratcikk...

Mesterséges Intelligencia Elektronikus Almanach. MI Almanach projektismertetı rendezvény április 29., BME, I. ép., IB.017., 9h-12h.

A bemeneti feszültség 10 V és 20 V között van. 1. ábra A fuzzy tagsági függvény

HU-3515 Miskolc-Egyetemváros tel.: +36-(46) mellék: 12-16, 12-18, fax : +36-(46) elkke@uni-miskolc.hu

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

A megerosítéses tanulás és a szimulált hutés kombinált használata: algoritmusok és alkalmazások

Fuzzy Kognitív Térképek és redukált változataik viselkedésének vizsgálata

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Útjelzések, akadályok felismerése valós időben

Fuzzy szabályalapú modellek és rendszerek felépítése evolúciós technikák segítségével

MULTIMÉDIA ALAPÚ OKTATÁSI TECHNOLÓGIÁK GYAKORLATI ALKALMAZÁSÁNAK VIZSGÁLATA A KATONAI SZAKNYELVOKTATÁSBAN

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Osztályozási fák, durva halmazok és alkalmazásaik. PhD értekezés

Adatfolyam alapú RACER tömbprocesszor és algoritmus implementációs módszerek valamint azok alkalmazásai parallel, heterogén számítási architektúrákra

GÉPI ÉS EMBERI POZICIONÁLÁSI, ÉRINTÉSI MŰVELETEK DINAMIKÁJA

MŰSZAKI TUDOMÁNY AZ ÉSZAK-KELET MAGYARORSZÁGI RÉGIÓBAN 2012

Kétdimenziós mesterséges festési eljárások. Hatások és alkalmazások

Irányítási struktúrák összehasonlító vizsgálata. Tóth László Richárd. Pannon Egyetem Vegyészmérnöki és Anyagtudományok Doktori Iskola

1. Bevezetés A kutatás iránya, célkitűzése A dokumentum felépítése Irodalmi áttekintés...8

D é n e s T a m á s matematikus-kriptográfus

Fuzzy rendszerek és neurális hálózatok alkalmazása a diagnosztikában

GDF Fuzzy Robot Műhely

FUZZY KÖVETKEZTETÉS SŰRŰ ÉS RITKA SZABÁLYBÁZISOK ESETÉN. Johanyák Zsolt Csaba 1 Kovács Szilveszter 2

ICT ÉS BP RENDSZEREK HATÉKONY TELJESÍTMÉNY SZIMULÁCIÓJA DR. MUKA LÁSZLÓ

BIZONYTALAN ADATOK KEZELÉSE: FUZZY SZAKÉRTŐI RENDSZEREK

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Mi is volt ez? és hogy is volt ez?

Botzheim János szakmai önéletrajza

Hogyan írjunk szakdolgozatot? v1.1

A TANTÁRGY ADATLAPJA

VALÓS HULLÁMFRONT ELŐÁLLÍTÁSA A SZÁMÍTÓGÉPES ÉS A DIGITÁLIS HOLOGRÁFIÁBAN PhD tézisfüzet

KÉPALKOTÁSRA ALAPOZOTT RUHAIPARI

Méréselmélet MI BSc 1

Adatbányászati és gépi tanulási algoritmusok szoftver szenzorok fejlesztésére. Kulcsár Tibor

Óbudai Egyetem Neumann János Informatikai Kar. Intelligens Mérnöki Rendszerek Intézet

Az e-kereskedelem elvárásai a biometriával szemben

R3-COP. Resilient Reasoning Robotic Co-operating Systems. Autonóm rendszerek tesztelése egy EU-s projektben

LÉTRADIAGRAM FORDÍTÓK ELMÉLETE PLC VEZÉRLÉSEK SZÁMÁRA II.

YANG ZIJIAN GYŐZŐ 杨子剑

Tevékenység szemléletű tervezés magyarországi felsőoktatási intézmények pályázataiban

Mérés és modellezés Méréstechnika VM, GM, MM 1

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Érzékelés, megfigyelés, mérés, felhasználói Adatok Hatásgyakorlás a környezetre Logikai irányítás, diagnózis, kérdés, stb. 1. ábra.

Publikációs jegyzék (Pánovics János)

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

OTKA nyilvántartási szám: T ZÁRÓJELENTÉS

Fotódokumentáció. Projektazonosító: KMOP /

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Opponensi vélemény. Dósa György Tightness results for several variants of the First Fit bin packing algorithm (with help of weighting functions)

műszaki tudomány doktora 1992 Beosztás: stratégiai tanácsadó, tudományos tanácsadó Munkahelyek: Nokia -Hungary kft Veszprémi Egyetem

Neurális hálózatok bemutató

I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE

ZIJIAN GYŐZŐ YANG 杨子剑 Language technology expert specialized in machine translation evaluation

Tartalomjegyzék. Tartalomjegyzék... 3 Előszó... 9

Kovács Ernő 1, Füvesi Viktor 2

Mérnök informatikus mesterszak mintatanterve (GE-MI) nappali tagozat/ MSc in, full time Érvényes: 2011/2012. tanév 1. félévétől, felmenő rendszerben

LIST OF PUBLICATIONS

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék. Neurális hálók. Pataki Béla

Módszer köztes tárolókat nem tartalmazó szakaszos működésű rendszerek ütemezésére

Nemlineáris optimalizálási problémák párhuzamos megoldása grafikus processzorok felhasználásával

A HIBRID LINEÁRIS LÉPTET MOTOR HATÉKONYSÁGÁNAK NÖVELÉSI MÓDOZATAIRÓL

List of Publications (Pánovics János)

Genetikus algoritmusok

Információ-visszakeresı módszerek egységes keretrendszere és alkalmazásai. Kiezer Tamás

NGB_IN040_1 SZIMULÁCIÓS TECHNIKÁK dr. Pozna Claudio Radu, Horváth Ernő

Teszt generálás webes alkalmazásokhoz

Tudomány határok nélkül

SZOFTVEREK A SORBANÁLLÁSI ELMÉLET OKTATÁSÁBAN

MAGASÉPÍTÉSI PROJEKT KOCÁZATAINAK VIZSGÁLATA SZAKMAI INTERJÚK TÜKRÉBEN 1 CSERPES IMRE 2

Fuzzy számításokat segítő eljárásgyűjtemény fejlesztése

Intelligens számítástechnikai modellek identifikációja evolúciós és gradiens alapú tanuló algoritmusokkal

Modellkiválasztás és struktúrák tanulása

Kvartó elrendezésű hengerállvány végeselemes modellezése a síkkifekvési hibák kimutatása érdekében. PhD értekezés tézisei

módszertan 1. Folyamatosság - Kockák 2. Konzultáció 2 Konzulens, szakértők 4. Bibliográfia - Jegyzetek

Ph. D. értekezés tézisei

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

DIGITÁLIS TEREPMODELL A TÁJRENDEZÉSBEN

Intelligens irányítások

A TANTÁRGY ADATLAPJA

(8) Globális stabilitásvesztéséhez tartozó kritikus erő/nyomaték analitikus meghatározása felületmodell

szakmai önéletrajz Bánhalmi András Személyes információk: Végzettségek, képzések: Idegen nyelv: Oktatás:

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Átírás:

Tormási Alex Felismerési feladatok megoldása számítási intelligencia eszközökkel Ph.D. tézisfüzet Témavezető: Dr. Kóczy T. László Széchenyi István Egyetem Informatika Tanszék Infrastrukturális Rendszerek Modellezése és Fejlesztése Multidiszciplináris Műszaki Tudományi Doktori Iskola Győr, 2016

Tartalomjegyzék 1. Bevezetés 5 2. Módszertani háttér áttekintése 6 2.1. Számítási intelligencia egyes területeinek áttekintése 6 2.1.1. A számítási intelligencia 6 2.1.2. Fuzzy rendszerek 7 2.1.3. Metaheurisztikai módszerek 7 3. Tézisek 9 3.1. 3. Új, fuzzy rendszerű alapuló egy- és többvonásos karakterfelismerő módszerek 9 3.2. 4. A FUBAR-1 és FUBAR-M módszerek paramétereinek hangolása 11 3.3. Metaheurisztikai algoritmusok összehasonlítása a FUBAR módszercsalád különböző paramétereinek hangolásánál 12 4. Összegzés és kitekintés 14 5. Irodalomjegyzék 15 5.1. A tézisfüzetben szereplő hivatkozások 15 5.2. A doktori értekezésben hivatkozott publikációk 16 3

4

1. Bevezetés A különböző minták, mint például kézzel írt gesztusok és karakterek felismerése széles körben kutatott terület, mellyel már az 1900-as évek közepe óta ipari és akadémiai résztvevők egyaránt foglalkoznak. Számos módszer és rendszer született ez idő alatt, melyek nagy pontossággal képesek géppel nyomtatott szövegek, vagy akár kézzel írt szövegek felismerésére, de gyakran ezek még így sem elégítik ki a felhasználói igényeket. Ennek oka például sebességük nem elfogadható, vagy annyira általános modellt alkalmaznak, hogy az egyedi jellemzőket nem képesek figyelembe venni, tanításuk pedig egyáltalán nem lehetséges, vagy nem kifizetődő, esetleg a felismerés hatékonyságának növelése érdekében hozott kompromisszumok, megkötések kényelmetlenné teszik azok használatát. A gesztusok eredeti definíciója szerint bármilyen nem verbális kommunikációs formára utalhatnak, melynek során az emberi test valamely része (arc, kéz stb.) használt, ez lehet egyszerűbb rajz, jelnyelv, mutatás. A számítástudomány területén ez jellemzően jóval szűkebben értelmezendő, az arckifejezésekre, a kéz illetve egyéb testrészek mozgására vonatkozik, beleértve valamilyen eszköz használatát. Az értekezésben a kézzel (íróeszköz használatával) alkotott mozdulatokat jelenti. Ezen egy-, illetve többvonású kézzel generált minták topológiai jellegzetességekkel rendelkeznek, de nem teljesen rögzítettek, így felismerésük azon komplex matematikai problémák közé sorolható, melyekre nincs zárt matematikai formula és nagyfokú bizonytalanság jellemzi, mely jelentős kihívás elé állította a területen dolgozó kutatókat és fejlesztőket. Mivel a hagyományos algoritmusok nem képesek hatékonyan kezelni a felmerülő problémát, így a mesterséges intelligencia és a számítási intelligencia területén használt eszközök széles körben elterjedté váltak. Számos módszer (mint például mesterséges neurális hálózatok, rejtett Markov-modellek, Bayes-hálók) és nézőpont (például gépi látás és jelfeldolgozás) 5

alakult ki a fenti problémák kezelésére, melyek felismerési hatékonysága és erőforrásigénye nagymértékben függ egyaránt a problémára vonatkozó megszorításoktól és választott módszerektől. A jelen értekezésben tárgyalt fuzzy irányítási rendszerű egy és többvonású karakterfelismerőknél az volt a cél, hogy a szakirodalomból megismert eljárásokkal megegyező, vagy jobb, valamint a felhasználók számára elfogadható felismerési arányt, illetve kisebb hibaszázalékot biztosító olyan új algoritmusokra, illetve ezek alapjául szolgáló modellekre tegyen javaslatot, melyek könnyen kezelhetővé teszik a probléma jellegéből adódó bizonytalanságot, valamint lehetőséget nyújt a tárolt tudás egyszerű hangolására, így lehetővé téve a hatékony tanulást. A vizsgálatok során alkalmazott mintakészlettel mind egyvonású és többvonású esetben sikerült a kategóriában fellelhető szakirodalommal összemérhető, vagy annál jobb eredményt elérni. 2. Módszertani háttér áttekintése 2.1. Számítási intelligencia egyes területeinek áttekintése 2.1.1. A számítási intelligencia A számítási intelligencia (Computational Intelligence, CI) eredetileg a mesterséges intelligencia (Artificial Intelligence, AI) egyik ága volt, melyek a későbbiek során különváltak, ebből kifolyólag a két terület nehezen különböztethető meg egymástól. Számos módszer és megcélzott probléma megegyezik, jellemzően inkább csak a problémák kezelésének nézőpontjában térnek el. A megkülönböztetést tovább nehezíti, hogy a számos definíció létezik mindkettőre. A különböző meghatározások alapján a számítási intelligencia lényegét alábbi módon lehetne összefoglalni [1-6]: A számítási intelligencia a természet által 6

inspirált módszereket alkalmaz, célja intelligens megoldások létrehozása komplex problémák megoldására. Három alappillére a fuzzy logika, az evolúciós módszerek és a mesterséges neurális hálózatok. A problémákat főként numerikus, empirikus adatokra támaszkodva közelíti meg. 2.1.2. Fuzzy rendszerek A fuzzy halmazok fogalmát L. A. Zadeh vezette be 1965-ös Fuzzy sets (vagyis fuzzy halmazok) című művében [7]. Az alábbiakban a fuzzy halmazok alapfogalma és lényegi tulajdonságaik kerülnek bemutatásra a [7, 8] művek alapján. A fuzzy halmazok lényegében a klasszikus (fuzzy kontextusban crisp) halmazok általánosításának tekinthetőek abban az értelemben, hogy egy az X univerzumba tartozó tetszőleges x elem egy az alaphalmazon értelmezett A halmazba nem csak teljesen (1 értékkel), vagy egyáltalán nem (0 értékkel) tartozhat, hanem tetszőleges [0;1] intervallumbeli mértékkel. Egy adott halmazba tartozás fokát tagsági értéknek nevezzük. Ennek megfelelően egy fuzzy halmaz leírása az úgynevezett tagsági függvénnyel adható meg (a crisp halmazok karakterisztikus egyenletével analóg módon). Később Mamdani javasolt egy módszert, mely a modellt leíró fuzzy reláció ortogonális projekcióin alapult [19->9], ezzel jelentősen csökkentve az efféle rendszerek komplexitását. Az így kapott modellt egy gőzmotoros rendszer irányítására sikerrel alkalmazta. 2.1.3. Metaheurisztikai módszerek Az alábbiakban azon metaheurisztikai módszerek kerülnek említésre, melyeket az értekezésben foglalt kutatás során alkalmaztam. A bakteriális evolúciós algoritmus közvetlen elődjének az 1997 ben N. E. Nawa, T. Hashiyama, T. Furuhashi és Y. Uchikawa által bemutatott pszeudo-bakteriális genetikus algoritmus [26->10] tekinthető, melyet fuzzy logikai vezérlők generálására alkottak meg. A genetikus 7

algoritmusokhoz [27->11] képest annyiban volt új a módszer, hogy a klasszikus (genetikus algoritmusoknál alkalmazott) mutációs operátor helyett bevezették az úgynevezett bakteriális mutációt. A bakteriális evolúciós algoritmust 1999 ben N. E. Nawa és T. Furuhashi publikálták, céljuk fuzzy rendszerek optimális paramétereinek keresése volt [28], melyhez a baktériumok fejlődésének koncepcióját alkalmazták. Ez az új algoritmus a pszeudo-bakteriális genetikus algoritmusnál alkalmazott bakteriális mutáción felül a génátadás, vagy más néven a géntranszer operátort alkalmazza. A részecskesereg optimalizációs algoritmust (particle swarm optimization) R. Eberhart és J. Kennedy publikálták 1995 ben [30], céljuk nemlineáris függvények optimalizációja volt, melyre két paradigmát is javasoltak, illetve vizsgáltak. A cikkben szereplő egyik paradigma a globálisan, míg a másik paradigma a lokálisan orientált részecskesereg módszer. Az alábbiakban ezen módszer [30] és [31] szerinti bemutatása olvasható. Az algoritmus részecskék mozgásának az analógiáját alkalmazza az optimalizálás során, tehát a füst gomolygásához hasonlóan lehet elképzelni az egyes egyedek (részecskék) mozgását, de nagyon hasonlít például a madarak és a halak csoportjainak összehangolt mozgására. Ennek megfelelően a részecskesereg optimalizációs algoritmus egyaránt közel áll a mesterséges élet (artificial life), a genetikus algoritmusok, evolúciós számítás és evolúciós stratégiák területeihez. Az egyes részecskék a probléma térben található megoldás jelölteket jelképezik, amelyek a keresési térben mozognak. Az ősrobbanás nagy reccs (vagy Big Bang Big Crunch) algoritmust O. K. Erol és I. Eksin publikálták 2005 ben, mellyel céljuk egy általuk fejlesztett újszerű optimalizációs módszer bemutatása volt [32]. Az alábbiakban a [32], [33] és [34] alapján kerül összefoglalásra az algoritmus működése és főbb jellemzői. Az algoritmus lényege az univerzum fejlődési analógiájára épül, név szerint az ősrobbanás (ahol egyetlen pontból tágulással jött létre az ismert univerzum) és a nagy reccs (ahol az univerzum egyetlen pontba roskad) elméleteken alapul. Az 8

univerzum maga a probléma keresési terét, míg az univerzum egyes pontjai (az égitestek) az egyes egyedek, vagyis a probléma megoldás jelöltjei. A jóság kiszámítsa valamilyen előre megadott fitnesz függvény alapján történik, az univerzum keletkezésének analógiájára ez jelképezi a világegyetemben (keresési térben) található égitestek (egyedek) tömegét. O. K. Erol és I. Eksin benchmark jellegű tesztben összehasonlították algoritmusukat egy genetikus algoritmussal, az eredményeik alapján az új módszer több esetben felülmúlta a genetikus algoritmus által hozott eredményeket. Az imperialista kompetitív algoritmust E. Atashpaz-Gargari és C. Lucas publikálta 2007 ben [35], céljuk egy a birodalmak versengésének analógiájára épített optimalizációs algoritmus létrehozása volt 3. Tézisek 3.1. 3. Új, fuzzy rendszerű alapuló egy- és többvonásos karakterfelismerő módszerek A: Javaslatot tettem Mamdani típusú fuzzy irányító algoritmust alkalmazó, súlyozott szabály rendszeres, valamint hierarchikus fuzzy szabálylapú egy- és többvonásos karakterfelismerő (hat különböző eljárást tartalmazó) módszercsaládra. Az új eljárások kifejlesztésével az irodalomból ismert módszerekkel összehasonlításban is magas felismerési arányt és alacsony számítási komplexitást értem el. A 1: Javaslatot tettem egy-egy crisp (FUBAR-1C) és fuzzy rácson (FUBAR-1) alapuló egyvonásos felismerési módszerre és mindkettőt nagyszámú minta alapján 9

vizsgáltam meg. Megállapítottam, hogy a fuzzy rácson alapuló megoldás jobb átlagos felismerési arányt ért el. A 2: Javaslatot tettem az elvében új, hierarchikus szabálybázisú egyvonásos karakterfelismerőre (FUBAR-1H), melynek vizsgálatára prototípus rendszert hoztam létre és megmutattam, hogy a számítási igény jelentős csökkenése mellett az átlagos felismerési arány továbbra is az irodalommal konszenzusban elfogadott felismerési jóság nagyságrendjébe esik. A 3: Javaslatot tettem súlyozott szabály antecedenseket használó egyvonásos karakterfelismerő módszerre (FUBAR-1W), melynek vizsgálatára prototípus rendszert hoztam létre és nagyszámú minta vizsgálatával megmutattam, hogy az új módszer a számítási igény lényegében konstans emelkedése mellett jobb átlagos felismerési arányt ért el. A 4: Javaslatot tettem egy új fuzzy alapú többvonásos karakterfelismerő módszerre (FUBAR-M), melynek vizsgálatára prototípus rendszert hoztam lére és megállapítottam, hogy többvonásos esetben a kezdeti paraméterek mellett az átlagos felismerés arány a FUBAR-1-nél mért eredményhez képest csupán 2%-kal csökkent, ami az irodalmi kritériumok alapján még mindig elfogadható. A 5: Javaslatot tettem hierarchikus szabálybázisú többvonásos karakterfelismerő módszerre (FUBAR-MH), melynek vizsgálatára prototípus rendszert hoztam létre és megmutattam, hogy a FUBAR-MH a számítási igény jelentős csökkenése mellett a FUBAR-M-mel megegyező átlagos felismerési arányt ért el. Az A tézisben megfogalmazott eredményekhez a következő publikációk kapcsolódnak: [S01], [S02], [S03], [S04], [S05] és [S06]. 10

3.2. 4. A FUBAR-1 és FUBAR-M módszerek paramétereinek hangolása B: Szisztematikus szimulációs vizsgálattal, a szakirodalomban fellelhető ajánlásokat kiindulási értékeknek tekintve megvizsgáltam a különböző paraméterek hatását a FUBAR-1 és FUBAR-M karakterfelismerő módszerek átlagos felismerési arányaira és meghatároztam e paraméterek optimális felismerést biztosító értékeit. B 1: Megvizsgáltam a FUBAR-1 által, a bemenet mintavételezésénél használt minimális képpont távolság paraméter, valamint a különböző fuzzy rácsfelbontások hatásait a modell átlagos felismerési arányára és meghatároztam azok ideális értékét. B 2: Megvizsgáltam a FUBAR-M által, a betűk jellemzőinek kinyerésére használt különböző fuzzy rácsfelbontások hatásait a modell átlagos felismerési arányára és meghatároztam az optimális felismerést biztosító felbontást. B 3: Keresztvalidációs teszt alkalmazásával megvizsgáltam a FUBAR-M kezdeti szabálybázisának kialakításánál használt paraméterek átlagos felismerési arányra gyakorolt hatását és meghatároztam optimális felismerést biztosító értékét. A B tézisben megfogalmazott eredményekhez a következő publikációk kapcsolódnak: [S02], [S04], [S05], [S06], [S07], [S08] és [S09]. 11

3.3. Metaheurisztikai algoritmusok összehasonlítása a FUBAR módszercsalád különböző paramétereinek hangolásánál C: Vizsgálatokat végeztem az új egy- és többvonásos karakterfelismerő módszercsalád egyes elemeinek különböző paraméterhalmazai optimalizálása tekintetétben, az egyes vizsgálatok során egy vagy több különböző, populáció alapú metaheurisztikai algoritmust alkalmaztam. C 1: Javaslatot tettem egy új, multipopulációs, büntető jutalmazó bakteriális evolúciós algoritmusra a FUBAR-1 algoritmus tanítására. Megállapítottam, hogy a módszer a tanulási folyamat révén jobb átlagos felismerési arányt ért el. C 2: Javaslatot tettem egy elvében új, súlyozott hierarchikus fuzzy szabályrendszert alkalmazó egyvonásos karakterfelismerő módszerre (FUBAR- 1HW), valamint a szabálysúlyainak hangolására bakteriális evolúciós algoritmussal (BEA) és megállapítottam, hogy az új módszer a számítási igény lényegében konstans emelkedése mellett jobb átlagos felismerési arányt ért el a FUBAR-1H módszerhez viszonyítva. C 3: Javaslatot tettem egy új, dinamikus szabálysúlyokat alkalmazó egyvonásos karakterfelismerő módszerre (FUBAR-1DW), a dinamikus súlyfüggvények hangolására BEA-val. Megállapítottam, hogy az átlagos felismerési arány a módosított algoritmus esetén kis mértékben javul, azonban lényegesen jobb az egymáshoz hasonló és nehezen szeparálható betűpárok (B R, I J és K X) megkülönböztetése (azaz azok pontos felismerése) esetén. C 4: Négyféle metaherusztikai módszert (BEA, Imperialista Kompetitív Algoritmus (ICA), Részecskesereg Optimalizáció (PSO), Ősrobbanás Nagy reccs 12

algoritmus (BBBC)) és négyféle (véletlenszerű fuzzy halmazokat (RFS), háromszög alakú fuzzy halmazokat (TFS), egyke fuzzy halmazokat (SFS) használó) kiindulási szabálybázist felhasználva megvizsgáltam a FUBAR-M által elért átlagos felismerési arányokat. Az eredményeket az alábbi táblázat foglalja össze: 3.1 táblázat. A FUBAR-M által használt különböző kiindulási szabálybázisok metaheurisztikai optimalizálását követő átlagos felismerési arányok és absztrakt uniform komplexitás A legjobb átlagos felismerési arány a Absztrakt Optimalizációs kiindulási szabálybázis függvényében uniform algoritmus RFS TFS SFS komplexitás BEA 61,47% 3,85% 0% 60 ICA 83,91% 96,03% 0% 6 PSO 65,38% 59,17% 11,54% 4 BBBC 82,37% 80,9 19,13% 1 A fentiek alapján a legmagasabb felismerési arányt az ICA algoritmus adta TFS szabálybázisból kiindulva. Az absztrakt uniform komplexitást is figyelembe véve a BBBC algoritmus érte el a legmagasabb felismerési arányt RFS szabálybázisból kiindulva. A legalacsonyabb felismerési arányokat az ICA és a BEA algoritmusok adták SFS szabálybázisból kiindulva. A C tézisben megfogalmazott eredményekhez a következő publikációk kapcsolódnak: [S01], [S04], [S05], [S09], [S10], [S11], [S12], [S13] és [S14]. 13

4. Összegzés és kitekintés Dolgozatomban a számítási intelligencia eszközök felismerési problémáknál való alkalmazásával, azon belül a fuzzy szabályalapú egy- és többvonásos felismerő modellekkel és metaheurisztikai algoritmusokkal kapcsolatos kutatómunkám eredményeit foglaltam össze. A különböző felismerési problémák során a bemenet általában zajos és nagyfokú bizonytalanság jellemzi. A számítási intelligencia területén alkalmazott módszerek matematikai tulajdonságaikból adódóan azok alkalmasak a komplex problémák hatékony kezelése. E értekezés célkitűzése a szakirodalom átfogó kutatása mellett egy általánosan, több feladatra is használható, a felhasználók által is elfogadható, hatékony felismerő modellek létrehozása számítási intelligencia eszközeivel, ezek vizsgálata, valamint különböző optimalizációs algoritmusok felismerő modelleken elérhető eredményeinek vizsgálata. Az első, A téziscsoportban egy új fuzzy irányítási rendszerű egy- és többvonásos karakterfelismerő modelleket és az azokkal kapcsolatos kutatásaim eredményeit mutattam be. Jelen értekezés harmadik fejezetében ismertetett második, B téziscsoportban az A tézisben ismertetett egy- és többvonásos felismerő modellek paramétereinek hatását vizsgáltam a módszerek átlagos felismerési arányára, valamint javaslatot tettem a paraméterek optimális felismerést biztosító értékeire. A harmadik, C téziscsoportban ismertetem azon kutatási eredményeim, melyeket a számítási intelligencia területéhez tartozó metaheurisztikai algoritmusok különböző célú felhasználását vizsgálta az A és B tézisekben tárgyalt egy és többvonásos karakterfelismerő modelleken. Méréseket végeztem a modellek szabálybázisának hangolására az átlagos felismerési arány növelése érdekében a bemenetek egyedi jellemzőihez való alkalmazkodás (vagyis tanulás) révén. E optimalizációs

algoritmusokat felhasználtam a felismerő modellek javasolt módosításainál alkalmazott paraméterek hangolására, mint például a szabálysúlytényezők meghatározásánál, valamint kezdeti szabálybázisának kialakításánál. A javasolt többvonásos karakterfelismerő modelljét felhasználva összehasonlítottam több metaheurisztikai módszer teljesítőképességét kitérve az az által elérhető eredményekre, a számítások elvégzéséhez szükséges időre és az eredmények szórására. Megmutattam, hogy az A és B tézisekben bemutatott új egy és többvonásos karakterfelismerő modellek által elért átlagos felismerési arány a szakirodalomból megismert eredmények között is kiemelkedő. Továbbá a tervezett felismerőknél mért jellemzők alapján azok elérik a felhasználói elfogadási küszöböt, így valós, akár kereskedelmi célú alkalmazásra is alkalmasak lehetnek. A metaheurisztikai algoritmusokon végzett kutatásom eredményei alapján megmutattam, hogy azok alkalmasak a fent említett felismerőmodellek pontosságának javítására a paraméterek hangolása révén, továbbá ismertettem az e algoritmusok használatával kapcsolatos, a problémakörre vonatkozó tapasztalataim. Annak ellenére, hogy a felismerő modellekkel elért pontosság és a modellek rugalmassága a feldolgozott szakirodalom alapján kimagaslónak számítanak, vizsgálataim során számos további kutatási irányt vetettem fel. Ezek közül kiemelendő a hierarchikus szabálybázisokat alkalmazó felismerőmodellekkel kapcsolatos kutatások, melyek révén a számítási igény drasztikusan csökkenthető a felismerési arány számottevő romlása nélkül. A szabályhierarchia kialakítása kulcsfontosságú, ezért érdemes megvizsgálni, hogy milyen módszerrel lehet ezt megtenni a felismerő modelljénél. Másik érdekes, ígéretes kutatási irány lehet a dinamikus szabálysúlyok alkalmazása, mely a többi módszerrel ellentétben képes volt úgy javítani egy betű átlagos felismerési arányát, hogy közben nem rontotta az ahhoz nagymértékben hasonlító más szimbólumnál elért pontosságot. Mivel a felismerők modelljének tervezésekor törekedtem azok általános, online és offline típusú felhasználására, de a vizsgálatokat csak online, digitális tinta alapú bemeneti 15

adatokra végeztem el, így mindenképp vizsgálandó az, hogy offline típusú felhasználás esetén milyen módosítások szükségesek a modell felkészítésére és az milyen átlagos felismerési arányt érhet el. A tervezett modellek paramétereinek hangolására alkalmazott és vizsgált metaheurisztikai módszerek területén is számos további kutatási irány határozható meg, mint például a különböző algoritmusok együttes (vagyis a multi metaheurisztikai módszerek) használata a felismerő modelljének javításánál. További kutatások célja lehet a vizsgálat során használt metaheurisztikai algoritmusoknál megfigyelhető jellegzetes problémák kezelése, mint például az ősrobbanás nagy reccs algoritmus lokális optimumba való konvergálásának kiküszöbölése, vagy a bakteriális evolúciós algoritmus számítási igényének csökkentése. 5. Irodalomjegyzék 5.1. A tézisfüzetben szereplő hivatkozások [1] R. E. Bellman, An Introduction to Artificial Intelligence: Can Computers Think?, Boyd & Fraser Publishing Company, 1978. [2] J. C. Bezdek, On the relationship between neural networks, pattern recognition and intelligence, International Journal on Approximate Reasoning, vol. 6, pp. 85-107, 1992. [3] P. H. Winston, Artificial Intelligence, Addison Wesley, 1992. [4] R. J. Marks II, Intelligence, Computational Versus Artificial, IEEE Transactions on Neural Networks, vol. 4, no. 5, pp. 737-739, 1993. [5] S. J. Russel and P. Norvig, Artificial Intelligence: A Modern Approach, Prentice Hall, 1994. [6] D. Poole, A. Mackworth and R. Goebel, Computational Intelligence: A Logical Approach, Oxford University Press, 1998. [7] L. A. Zadeh, Fuzzy sets. Information and Control, 8(3):338 353, 1965. [8] K. T. Kóczy and D. Tikk, "Fuzzy rendszerek", Typotex Kiadó, Budapest, 2000. [9] B. Schweizer and A. Sklar, Associative functions and statistical triangle inequalities, Publicationes Mathematicae, Debrecen, 8:169 186, 1961. 16

[10] N. E. Nawa, T. Hashiyama, T. Furuhashi, and Y. Uchikawa, Fuzzy logic controllers generated by pseudo-bacterial genetic algorithm, In Proceedings of the IEEE International Conference on Neural Networks 1997, pp. 2408 2413, 1997. [11] J. H. Holland, Adaptation in Natural and Artificial Systems, The MIT Press, Cambridge, Massachusetts, 1992. [12] N. E. Nawa and T. Furuhashi, Fuzzy system parameters discovery by bacterial evolutionary algorithm, IEEE Transactions on Fuzzy Systems, 7(5), pp. 608 616, 1999. [13] J. Kennedy and R. Eberhart, Particle Swarm Optimization, In Proceedings of IEEE International Conference on Neural Networks 1995, pp. 1942 1948, 1995. [14] R. Eberhart and J. Kennedy, A New Optimizer Using Particle Swarm Theory, In Proceedings of the Sixth International Symposium on Micro Machine and Human Science, pp. 39-43, 1995. [15] O. K. Erol and I. Eksin, A new optimization method: Big Bang - Big Crunch, Advances in Engineering Software, vol. 37, Elsevier, pp. 106-111, 2005. [16] H. Tang, J. Zhou, S. Xue and L. Xie, Big Bang Big Crunch optimization for parameter estimation in structural systems, Mechanical Systems and Signal Processing, vol. 24, Elsevier, pp. 2888-2897, 2010. [17] A. Kaveh and S. Talatahari, Size optimization of space trusses using Big Bang Big Crunch algorithm, Computers and Structures, vol. 87, Elsevier, pp. 1129-1140, 2009. [18] E. Atashpaz-Gargari and C. Lucas, Imperialist Competitive Algorithm: An Algorithm for Optimization Inspired by Imperialist Competition, In Proceedings of IEEE Congress on Evolutionary Computation 2007, pp. 4661-4667, 2007. 5.2. A doktori értekezésben hivatkozott publikációk [S01] A. Tormási and J. Botzheim, Single-stroke character recognition with fuzzy method, In New Concepts and Applications in Soft Computing, Springer, pp. 27-46, 2013. [S02] A. Tormási and L. T. Kóczy, Concept and development of a fuzzy-based multi-stroke character recognizer, TECHNICAL TRANSACTIONS - AUTOMATIC CONTROL 2-AC, Poland pp. 13-22, 2013. 17

[S03] A. Tormási and L. T. Kóczy, Fuzzy-Based Multi-Stroke Character Recognizer In: M. Ganzha, L. Maciaszek, M. Paprzycki (eds.) Annals of Computer Science and Information Systems, vol. 1, Proceedings of 2013 Federated Conference on Computer Science and Information Systems (FedCSIS), IEEE, Poland, pp. 671-674, 2013. [S04] A. Tormási and L. T. Kóczy, Improving the efficiency of a fuzzy-based single-stroke character recognizer with hierarchical rule-base. In Proceedings of 13th International Symposium on Computational Intelligence and Informatics (CINTI), IEEE. pp. 421-426, 2012. [S05] A. Tormási and L. T. Kóczy, Improved fuzzy-based single-stroke character recognizer. In Proceedings of IFSA World Congress and NAFIPS Annual Meeting (IFSA/NAFIPS), IEEE, pp. 430-435, 2013. [S06] A. Tormási and L. T. Kóczy, Improving the accuracy of a fuzzy-based single-stroke character recognizer by antecedent weighting, In Recent Developments and New Directions in Soft Computing, Springer, pp. 165-179, 2014. [S07] A. Tormási and L. T. Kóczy, Comparing the efficiency of a fuzzy singlestroke character recognizer with various parameter values, In Advances on Computational Intelligence, Springer, pp. 260-269, 2012. [S08] A. Tormási and L. T. Kóczy, Fuzzy Single-Stroke Character Recognizer with Various Rectangle Fuzzy Grids, In: L. T. Kóczy, C. R. Pozna, J. Kacprzyk (eds.), Issues and Challenges of Intelligent Systems and Computational Intelligence, Springer, pp. 145-159, 2014. [S09] A. Tormási and L. T. Kóczy, Rule-Base Parameter Optimization for a Multi-Stroke Fuzzy-Based Character Recognizer, In Proceedings of the International Joint Conference IFSA - EUSFLAT 2015, Atlantis Press, Spain, pp. 1331-1337, 2015. 18

[S10] A. Tormási and L. T. Kóczy, Rule-base optimization of a multi-stroke fuzzy-based character recognition method with meta-heuristic techniques, In Proceedings of International Congress on Control and Information Processing 2013 (ICCIP 13), Poland, pp. 5-15, 2013. [S11] A. Tormási and L. T. Kóczy, Dynamic fuzzy rule weight optimization for a Fuzzy Based Single-Stroke Character Recognizer. In Proceedings of IEEE 17th International Conference on Intelligent Engineering Systems (INES), IEEE, pp. 119-124, 2013. [S12] A. Tormási and L. T. Kóczy, Identification of the initial rule-base of a multi-stroke fuzzy-based character recognition method with meta-heuristic techniques, TECHNICAL TRANSACTIONS - AUTOMATIC CONTROL 4-AC, pp. 103-115, 2013. [S13] A. Tormási and L. T. Kóczy, Comparing the Properties of Meta-Heuristic Optimization Techniques with Various Parameters on a Fuzzy Rule-Based Classifier, In Proceedings of 4th World Conference on Soft Computing, USA, pp. 45-50, 2014. [S14] A. Tormási and L. T. Kóczy, Meta-Heuristic Optimization of a Fuzzy Character Recognizer, In Fifty Years of Fuzzy Logic and its Applications, Springer, pp. 227-244, 2015. 19