Optikai karakterfelismerés



Hasonló dokumentumok
INFORMATIKA HELYI TANTERV

INFORMATIKA 1-4. évfolyam

Irinyi József Általános Iskola 4274 Hosszúpályi Szabadság tér HELYI TANTERV Informatika 4. osztály 2013

A hierarchikus adatbázis struktúra jellemzői

Az Ön kézikönyve HP SCANJET 7490C SCANNER

INFORMATIKA 5. évfolyam

Ügyvitel ágazat Ügyvitel szakmacsoport Ügyviteli titkár Szakközépiskola 9-12.évfolyam Érettségire épülő szakképzés

1. Tétel. Multimédia alapfogalmai

2.3 V ÉGBERENDEZÉSEK. Részterületek fejlődése

AZ EURÓPAI KÖZÖSSÉGEK BIZOTTSÁGA

A 109. sorszámú Irodai asszisztens megnevezésű szakképesítés szakmai és vizsgakövetelménye 1. AZ ORSZÁGOS KÉPZÉSI JEGYZÉKBEN SZEREPLŐ ADATOK

Régi, statikus adatok élővé tétele és vizsgálata

FAPEDIT, megbízható teljesítménykiírás könnyedén T:

A billentyűzet az egyik legfontosabb adatbeviteli eszköz. Egyéb utasítás hiányában a számítógép innen várja a bemenő információkat, adatokat,

Elektronikus tanulási környezet implementációs tapasztalatai empirikus felmérés alapján

Beszédfelismerés, beszédmegértés

A 21. sorszámú Távközlési technikus megnevezésű szakképesítés szakmai és vizsgakövetelménye 1. AZ ORSZÁGOS KÉPZÉSI JEGYZÉKBEN SZEREPLŐ ADATOK

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK. Az Europass kezdeményezés értékelése

Az informatika tantárgy fejlesztési feladatait a Nemzeti alaptanterv hat részterületen írja elő, melyek szervesen kapcsolódnak egymáshoz.

Az EDIMART Tolmács-és Fordításszolgáltató általános szerződési feltételei (a továbbiakban: ÁSZF)

Hálózatkezelés: Távoli elérés szolgáltatások - PPP kapcsolatok

Önálló laboratórium beszámoló

A felmérési egység kódja:

Költségvetés és árképzés az építőiparban TERC Kft., Budapest, 2013.

INFORMATIKA HELYI TANTERV

Tanári kézikönyv az Informatika az 1. és 2. évfolyam számára című munkafüzetekhez és a PC Peti oktatóprogramokhoz TANMENETJAVASLAT 2.

Intézményi helyzetelemzések módszertani leírása, eljárásrendje, Bevezetési útmutatók a Szakképzési Önértékelési Modell (SZÖM) alkalmazásához - 1/94 -

ÉRTÉKELÉS. Budapest Főváros IX. Kerület Ferencváros Önkormányzat Polgármesteri Hivatala részére végzett munkanap fényképezésről

Beszámoló az MTA Magyar nyelvészeti munkabizottsága évi tevékenységérıl

Felhasználói útmutató

1. Egy analóg vagy digitális multiméter segítségével hogyan dönthető el egy UTP kábel két végén lévő csatlakozók bekötésének helyessége?

PÉNZÜGYI KULTÚRA FEJLESZTÉSI PROGRAMOK FELMÉRÉSE

Gyarmati Dezső Sport Általános Iskola. Informatika HELYI TANTERV 6-8. ÉVFOLYAM. KÉSZÍTETTE: Oroszné Farkas Judit Dudásné Simon Edit

INFORMATIKA. Célok és feladatok évfolyam

A villamos energiára vonatkozó uniós GPP-követelmények

Az e-kereskedelem elvárásai a biometriával szemben

Szennyezőanyag-tartalom mélységbeli függése erőművi salakhányókon

A CityGuard rendszer

Élpont osztályozáson alapuló robusztus tekintetkövetés

A készletezés Készlet: készletezés Indok Készlettípusok az igény teljesítés viszony szerint

Mellékhatások és minőségi hibák kombinációs előfordulása Dr. Oláh Attila, Dr. Mészáros Márta (Magyarországi Gyógyszertörzskönyvezők Társasága)

Látás, érzékelés. Werner Ágnes. PDF created with pdffactory trial version

Vasúti infrastruktúragazdálkodás kontrolling bázisú döntéselőkészítő rendszerek alkalmazásával

Bánhalmi Árpád * Bakos Viktor ** MIÉRT BUKNAK MEG STATISZTIKÁBÓL A JÓ MATEKOSOK?

digitális tudástér Tanári útmutató

több időt ad a tanulónak: pl. egy hét. A tanár ezeket is minden esetben ellenőrzi.

BESZÁMOLÓ. a hajléktalan emberek számára fenntartott, nappali ellátást nyújtó intézmények körében végzett kutatásról

Online kérd íves felmérés a Gazdálkodás olvasóinak és szerz inek körében

Magyarajkú, nem-magyar állampolgárságú tanulók nevelésének, oktatásának helyzete a magyar közoktatásban. Készítette: Kováts András és Medjesi Anna

Az információs társadalom lehetőségeivel csak azok a személyek tudnak megfelelő módon élni, akik tudatosan alkalmazzák az informatikai eszközöket,

A NŐK GAZDASÁGI AKTIVITÁSA ÉS FOGLALKOZTATOTTSÁGA*

Word 2010 magyar nyelvű változat

BESZÁMOLÓ. a hajléktalanok átmeneti szállásainak körében végzett kutatásról március

A DIÁKHITEL Rt. szoftver és hozzá kapcsolódó oktatás beszerzése Az ajánlatkérő neve, címe, távirati címe, telefon és telefax számai:

feladatok meghatározása során elsősorban az eszközök ismeretére, az eszközökkel megvalósítható lehetőségek feltérképezésére és az alkotó

Az őrültek helye a 21. századi magyar társadalomban

HP ScanJet Pro 3500 f1 Flatbed Scanner Felhasználói útmutató

Nemzeti Vidékfejlesztési Terv ex-post értékelése. Tanácsadó és Szolgáltató Kft. zárójelentés. Budapest március 24.

MATEMATIKA A és B variáció

A magyarok tv-sorozatokkal kapcsolatos preferenciái, sorozatnézési szokásai országos megkérdezés eredményei alapján

PONTASÍTÁSOK a 2015/S számú közbeszerzés belvízi csatorna-modellek előállítására vonatkozó Műszaki Dokumentációjához

OKTATÁSI ÉS KULTURÁLIS MINISZTER /2006.

Pedagógiai program. Helyi tanterv. enyhe értelmi fogyatékos tanulók számára

JÁSZAPÁTI VÁROS ÖNKORMÁNYZATÁNAK SZERVEZETFEJLESZTÉSE

Bevezetés a vonalkódok elméletébe. Melis Zoltán BCS Hungary (C)

Magyar nyelv. 5. évfolyam

VEGA Energiagazdálkodó rendszer

A 75. sorszámú Parképítő és fenntartó technikus megnevezésű szakképesítés szakmai és vizsgakövetelménye

A pályakezdő szakmunkások munkaerő-piaci helyzete 2012

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

Hogyan böngésznek a fogyatékkal élő emberek?

A szolgáltatástervezési koncepciók készítésének gyakorlata. online kutatás elemzése

Oktatási mobilitás OKTATÁSSAL VALÓ ELÉGEDETTSÉG

KÖNYVKÖTŐ. 2. A szakképesítés OKJ-ban szereplő és egyéb adatai. A szakképesítés azonosító száma: A szakképesítés megnevezése:

TANMENET INFORMATIKA (0. évfolyamos képzés) 9.A1 9.A2 csoport

Dunaújváros kulturális intézményrendszerének vizsgálata térszemléletben

1. évfolyam. Két tanítási nyelvű 1-4. évf. Idegen nyelv - angol

Az infravörös spektroszkópia analitikai alkalmazása

FELNŐTTKÉPZÉSI MINŐSÉGIRÁNYÍTÁSI KÉZIKÖNYV

Szakmai beszámoló. az OTKA F számú kutatási projektről

Tájékoztató és minősítő rendszerek

126/2003. (VIII. 15.) KORM. RENDELET A HULLADÉKGAZDÁLKODÁSI TERVEK RÉSZLETES TARTALMI KÖVETELMÉNYÉRŐL

MATEMATIKA évfolyam

OTDK-DOLGOZAT

A negyedéves munkaerő-gazdálkodási felmérés eredményei Somogy megyében II. negyedév

PEDAGÓGUSOK ÉS AZ IKT KOMPETENCIATERÜLET

P-GRADE fejlesztőkörnyezet és Jini alapú GRID integrálása PVM programok végrehajtásához. Rendszerterv. Sipos Gergely

Ismétlődő műveletek elvégzésének automatizálása

4. évf. Informatika. 4. évfolyam

KÉPALKOTÁSRA ALAPOZOTT RUHAIPARI

Irodai berendezések nyomtató funkcióval (nyomtatók, másolók, multifunkcionális eszközök) KT-65. Érvényes: december 17-ig.

Földrajz az általános iskolák 7 8. évfolyama számára

A Gyermek Környezeti Attitűd és Tudás Skála (CHEAKS) attitűd alskálái (Leeming, Dwyer és Bracken, 1995, Varga 1997)

Lebomló polietilén csomagolófóliák kifejlesztése

INFORMATIKA Emelt szint


A TANTÁRGYTÖMBÖSÍTETT OKTATÁS BEVEZETÉSÉNEK KIDOLGOZÁSA

SZTEREO (3D-S) FOTÓLABOR AZ INFORMATIKATEREMBEN

Penta Unió Zrt. Az Áfa tükrében a zárt illetve nyílt végű lízing. Név:Palkó Ildikó Szak: forgalmi adó szakirámy Konzulens: Bartha Katalin

INFORMATIKA Helyi tantárgyi tanterv

Átírás:

Optikai karakterfelismerés Az optikai karakterfelismerés feladata A különböző formátumú dokumentumok kezelésének egyik speciális esete, amikor a kezelendő dokumentumok még nem állnak rendelkezésre elektronikus formában. Ebben az esetben szinte mindig arról van szó, hogy a dokumentumok kinyomtatva, papír alapú hordozón jelennek meg. Szövegbányászati tevékenység végzéséhez értelemszerűen digitalizálni kell a még nem digitalizált, papíron, nyomtatásban vagy írásban meglévő dokumentumokat, azaz a képként érzékelt dokumentumot szövegfájl formátumba kell átalakítani, hogy abban az után elektronikusan szerkeszthető és feldolgozható legyen. Ebben a szituációban kap szerepet az optikai karakterfelismerés (optical character recognition, OCR), amely így szövegbányászati előfeldolgozásnak tekinthető. Az optikai karakterfelismerés a mesterséges intelligencia jelfeldolgozó és generalizációs képességeit kiaknázva képes magas hatékonysággal nyomtatott, papír alapú dokumentumokon lévő karaktereket felismerni. Az alap probléma itt az, hogy a nyomtatott papír alapú dokumentumok esetében nagy zajaránnyal kell megküzdeni annak érdekében, hogy a releváns információt kihámozzuk az érzékelt képi jelek és minták közül. Nyomtatott dokumentum esetében ilyen zajnak tekinthető például egy apró folt a papíron, tintaelmosódás, tintahiány, homályos háttér, apró gyűrődés a papíron, túl közeli vagy egybeolvadó betűk, betű dőlésszögének ingadozása stb. Kézírás esetén a kihívás még nagyobb, hiszen itt a személyiségjegyek sokszínűségéből adódó írásminták kavalkádjából kell kihámozni a karaktereket. Mind a nyomtatott, mind pedig a kézírásos esetben az optikai karakterfelismerő rendszer egy tanulási fázist követően képes olyan mintákat is osztályozni (értsd a megfelelő karaktert felismerni), amelyekkel a tanulási fázisban nem találkozott, tehát megvan a szükséges generalizációs képessége. Az első üzleti alkalmazók a bankok voltak, ők használtak először optikai karakterfelismerő rendszereket. Kezdetben speciális karaktereket dolgoztak ki annak érdekében, hogy a karakterfelismerő rendszer dolgát megkönnyítsék. Így alakult ki az 1. ábrán látható többféle speciális betűtípus: E-13B (amerikai és kanadai bankok); CMC-7 (francia bankok); OCR-A, OCR-B. Az OCR-A betűtípus az 1960-as években alakult ki, amikor már érett karakter felismerő rendszerek álltak rendelkezésre, de nem voltak kellően hatékonyak. Néhány karaktert jól láthatóan eltorzítottak, egyedivé tettek, így könnyítve meg a karakterfelismerő rendszerek dolgát. Az OCR-rendszerek alapvetően két részből

2 Szövegbányászat online melléklet 1. ábra. Néhány OCR-t támogató betűtípus, fentről lefelé E-13B, CMC-7, OCR- A, OCR-B állnak: egyrészt a szkennelő fejből, amely a dokumentum egészét vagy részeit beszkenneli, másrészt pedig magából a mesterségesintelligencia-szoftverből, ami elvégzi a beérkezett minták osztályozását, azaz magát a karakterfelismerést. A nyomtatott latin vagy latin-rokon karakterek felismerése megoldott problémának tekinthető, az OCR-rendszerek igen hatékonyan képesek felismerni ezeket. A kézírás felismerése azonban még napjainkban is aktív kutatási terület, hiszen ez jóval összetettebb feladat. A 2. ábra az optikai karakterfelismerés folyamatát mutatja be. Szegmentáció Előfeldolgozás Osztályozás Nyomtatott vagy írott dokumentum Karakter izoláció végrehajtása Izolált karakterek kép formátumban Jellemvonás kiemelés (feature extraction), dimenzió redukció Jellemvonás (feature) vektorok Asszociativ memória, karakter felismerés, generalizálás Digitális karakterek fájl formátumban 2. ábra. Az optikai karakterfelismerés folyamata

Optikai karakterfelismerés 3 Szegmentáció A szegmentáció során a karakterek közötti éles határ megtalálása a cél annak érdekében, hogy téves minták ne kerüljenek osztályozásra (pl. két fél karakter). A szegmentáció feladata lehet az is, hogy a karakter-dőlésszögeket, karakterméreteket normalizálja. Sok esetben a szöveges dokumentumokban nem csak karakterek vannak, hanem képek és egyéb, a felismerés szempontjából nem lényeges szimbólumok. A szegmentáció további feladata tehát az is, hogy az ilyen, számunkra nem releváns grafikus objektumok közül kiszűrje a csak karaktereket tartalmazó szöveges részeket. A 3. ábra a szegmentáció egy esetét szemlélteti. 3. ábra. Példa szegmentációra Optikai előfeldolgozás Az előfeldolgozás a bemeneti minta komplexitásának csökkentésére szolgál, és annak legjellemzőbb vonásait elemi ki. Különösen nagy jelentősége van a kézírás felismerésekor, ugyanis az írott betűk jóval komplexebb mintákat alkothatnak, mint a nyomtatott betűk. A jellemzőkiemelés során a komplexitás úgy csökken, hogy közben a legjellemzőbb információk megmaradnak és ezáltal a későbbi feldolgozás számításigényét redukálhatjuk. Ez a folyamat tulajdonképpen egy komplexitáscsökkentéssel járó digitalizáció. A 4. ábra egy egyszerű digitalizálási módszert mutat, amikor az analóg jelre egy mátrixot reprezentáló rácshálót illesztünk, és amelyik cellán átmegy az analóg karakter, az az elem a mátrixban 1 értéket vesz fel (fekete), egyéb esetben pedig 0-t (fehér). Osztályozás Az osztályozás során történik meg a tényleges karakterfelismerés. A karakterfelismerő módszer a bemeneti jellemzővektor alapján dönti el, hogy az ismert karakterek közül melyikre hasonlít a legjobban a bemeneti vektor. Így a karakterfelismerési probléma egy asszociatív memóriát igénylő feladat, amelynek során a tárolt memóriaelemek közül kell előhívni azt, amely a bemeneti mintának legjobban megfelel. Az asszociatív memória elsősorban a mesterséges neurális hálózatok-

4 Szövegbányászat online melléklet 4. ábra. Egyszerű digitalizálási módszer nál előforduló fogalom, ugyanis ilyen neurális hálózatokkal (pl. Hopfield-hálózat) nagy hatékonyságú asszociatívmemória-megoldások implementálhatóak. Minthogy a karakterfelismerés alapvetően osztályozási probléma, ezért az 5. fejezetben bemutatott módszerek a karakterfelismerésben is alkalmazhatóak. Ettől függetlenül elmondható, hogy a neurális hálózat alapú karakterfelismerő megoldások a legelterjedtebbek az 1980-as évek óta, jelenleg azonban a szupportvektor-gépekkel (ld. a könyv 127. oldalán) történő karakterfelismerési és osztályozási problémák kutatása a legnépszerűbb. Napjainkban nem csak a nyomtatott szövegek felismerése a feladat, egyre nagyobb igény mutatkozik az emberi kézírás felismerésére is. Ennek megvalósítása komolyabb apparátust igényel, mivel az írott karakterek felismerési problémájának komplexitása meghaladja a nyomtatott betűkét. A tablet PC-k és egyéb, az emberi kézírás befogadására képes eszközök terjedésével még flexibilisebb kapcsolat valósulhat meg az ember és gép közötti, ha sikerül kellően hatékonnyá tenni a kézírás-felismerő módzsereket. Egy IBM által elvégzett felmérésből kiderült, hogy a 97% alatti hatékonyságú kézírásfelismerő-rendszereket a megkérdezett felhasználók használhatatlannak minősítették. A természetes nyelvi feldolgozást motiváló tényező a karakter felismerés terén is erőteljesen érezteti a hatását, mely szerint nem az emberek kívánják megtanulni a gépek nyelvét, hanem igyekszünk olyan gépeket fejleszteni, amelyek képesek az emberi nyelvet, illetve kézírást felismerni. Ahogyan a természetes nyelvi felismerés hiányában az ember tanult meg a gépi nyelvhez és logikához közel álló programozási nyelveket, úgy a karakterfelismerés hiányában sok esetben az ember sajátított el olyan speciális írásmódot, amit a számítógép képes volt megérteni lásd például a Palm személyi asszisztensekben (palmtop) elterjedt Graphiti karakterkészletet, amelyet a gép képes felismerni, de itt minden karaktert csak egy vonás lehet (Unistroke). Ez tehermentesítette a felismerőszoftvert a karakterszegmentáció problémájától.

Optikai karakterfelismerés 5 A trend tehát a természetes emberi kézírás számítógépes felismerése felé is mutat a nyomtatott karakterfelismerés mellett (Faaborg, 2002). Az ember képes tolerálni az érzékelt karakterek felismerésekor azok színét, stílusát, dőlésszögét, pozícióját, méretét, méretarányát és az elmosódáoskból és egyéb vizuális torzulásokból adódó zajt. Olyan emberek kézírását is képesek vagyunk elolvasni, akikét még soha nem láttuk, akiknek egyedi stílusával még soha nem találkoztunk. Az ember elképesztő sebességgel képes az új karaktertípusokat stílusokat magáévá tenni és felismerni. Hatékony gépi intelligencia kifejlesztésekor ezeket a készségeket a számítógépnek is meg kell tudnunk tanítani, legalábbis egy elfogadható szintre fejleszteni. Mivel nincsenek olyan egzakt szabályok, amelyek algoritmust adhatnának egy kézírásos szöveg karaktereinek felismerésére, így jobbhíján a felügyelt tanulás jöhet szóba, amelynek az egyes karakterek felismerésekor tolerálnia kell az esetleges zajokat. Az 5. ábra a karakterfelismerés neurális hálóval történő felismerésének folyamatábráját szemlélteti. A felismerési folyamat a neurális hálózat példákon keresztüli betanítása után következhet. A neurális hálózat az úgynevezett jellemzők kinyerése révén képes végrehajtani a halmazszeparációs problémát, ami végül jó esetben a karakterfelismerésére vezet (Araokar, 2005). Nyomtatott dokumentumok Digitalizálás Asszociatív memória (neurális súlyok) Szkenner Karakter szegmentáció Jellemző vonások kiemelése (feature extraction) Neurális hálózat (felismerés) Felismert karakter Kézírott dokumentumok PDA, tablet PC Analóg jelek 5. ábra. Karakterfelismerés neurális hálózattal Forrás: S. Araokar. Visual Character Recognition using Artificial Neural Networks. ArXiv Computer Science e-prints, (cs/0505016), 2005. A. J. Faaborg. Using neural networks to create an adaptive character recognition system, 2002.