Feladat. A levéltári anyagok digitalizálásával szemben támasztott követelmények Megrendelő: Budapest Főváros Levéltára

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Feladat. A levéltári anyagok digitalizálásával szemben támasztott követelmények Megrendelő: Budapest Főváros Levéltára"

Átírás

1 A levéltári anyagok digitalizálásával szemben támasztott követelmények Megrendelő: Budapest Főváros Levéltára Feladat A feladat egy olyan szakmai tanulmány készítése, amely bemutatja a hazai és a nemzetközi levéltári digitalizálási gyakorlatot, egyúttal javaslatot tesz a levéltári digitalizálás egységes szempont- és követelményrendszerére. Az a célja, hogy biztosítsa a digitalizálási projekteknek az E-levéltár szempontjainak megfelelő kimenetét: szabványos, hosszú távon megőrizhető, használható legyen, lehetővé tegye a különböző informatikai rendszerekben való kezelést (interoperabilitás). Gyakorlati, szakmai útmutatót, kézikönyvet is jelentsen egyben bármely levéltár számára a különböző adathordozókon rögzített képi és szöveges források digitalizálására. A projektterméknek célja nem a levéltári digitalizálás támogatása, hanem a befogadó elektronikus levéltár szempontjainak megfelelő szabályozási javaslat elkészítése, a digitalizálási projektek egységes szemléletű outputjának biztosítása, elsősorban technikai szempontból. A digitalizált állományok maguk is elektronikus iratok, hosszú távú megőrzésükhöz az elektronikusan keletkezett iratokkal azonos tárolási, megőrzési és visszakeresési beavatkozások szükségesek. A digitalizálás az elmúlt évtizedben a közgyűjtemények kiemelt feladata lett: a levéltárak mind tájékoztatási, mind állományvédelmi megfontolásból jelentős forrásokat fordítanak iratanyaguk digitalizálására. A levéltári digitalizálás azonos elvekre, technikai és formátumkövetelményekre kell, hogy épüljön, mint az iratképző szerveknél végzett digitalizálás, a projekttermék ajánlásait tehát össze kell hangolni A papír alapú dokumentumok megbízható elektronikus másolatával szemben támasztott technikai követelmények és gyakorlatban alkalmazható eljárásrend című projekttermékben rögzített követelményekkel. A levéltári digitalizálás során létrejövő adatstruktúrának illeszkednie kell az elektronikus levéltári anyag metaadatstruktúrájába, így a projekttermék ajánlásait össze kell hangolni Az elektronikus levéltári rendszer metaadatmodellje című projekttermékben rögzített követelményekkel (ez utóbbi nem készült el!!!). A speciális követelmények a levéltári anyagok egyedi értékéből, adathordozóinak speciális jellegéből és sokféleségéből, a mindezekből adódó különleges állományvédelmi követelményekből, a levéltári nyilvántartási rendszerhez igazodó metaadat-struktúra és dokumentáció szükségességéből adódnak. A termék mindezek figyelembe vételével 1. Adjon áttekintést az EU államainak közlevéltáraiban folyt legjelentősebb levéltári digitalizálási projektek során alkalmazott módszerekről és eljárásokról, a legjobb gyakorlatokról, az EU-országokban létező, hozzáférhető szabályozásokról és szakmai módszertani útmutatókról (különös tekintettel Németország, Nagy-Britannia, Franciaország, Hollandia, az Európai Unió levéltárai, valamint az EU-n kívüli államok közül Svájc gyakorlatára). 2. Külön térjen ki a nemzetközi projektekben a digitális objektumok metaadatainak a megosztása során alkalmazott szabványokra, követelményekre és eljárásokra. Mutassa be és elemezze az jelentősebb európai nemzetközi együttműködések (pl. Europeana, APENET, ICARUS) által alkalmazott megoldásokat. 3. Adjon áttekintést a hazai levéltári digitalizálás során alkalmazott módszerekről és eljárásokról, a legjelentősebb projektek szakmai értékeléséről. 4. Vizsgálja meg a levéltárakban előforduló adathordozók digitalizálásra történő előkészítésével és digitalizálásával kapcsolatos állományvédelmi szempontokat, szem előtt tartva, hogy a digitalizálás semmilyen körülmények között nem járhat az eredeti iratanyag rongálódásával, állapotának veszélyeztetésével. Fejtse ki, hogy az iratok előkészítése és digitalizálása során, milyen esetekben szükséges restaurátor közreműködését kérni, milyen védőés segédanyagok alkalmazhatók a digitalizálás során, amelyek lehetővé teszik pld. a töredezett szélű iratanyag digitalizálását. Rögzítse a vonatkozó követelményeket és ajánlásokat az adathordozók alábbi típusai szerint: különböző korú és típusú, állapotú papíralapú iratok (külön kitérve a kötetformátumokra, nagyméretű tervekre, térképekre); pergamenalapú iratok; mikrofilmek; fényképészeti anyagok (fekete-fehér és színes papírkép, képeslap, film,

2 negatív, dia, dagerrotípia, üvegnegatív); audiovizális anyagok (hangszalag, videoszalag). 5. Foglalja össze a digitális másolatkészítés technikai feltételeit, jogi követelményeit, formátumkövetelményeit, a másolatkészítés folyamatára és a digitális másolat elkészültét követő munkafolyamatokra vonatkozó követelményeket. Térjen ki a szöveges állományok karakterfelismerő alkalmazásokkal való feldolgozásának és indexelésének kérdéseire is. 6. Tegyen ajánlást a másolatokhoz rendelendő leíró és technikai metaadatokra, azok átadási és archiválási struktúrájára 7. Számolva azzal a lehetőséggel, hogy a digitális másolatok elkészülésüket követően azonnal vagy rövid időn belül nem kerülnek e-levéltári (megbízható elektronikus levéltári) megőrzésre, ismertesse az addig tartó átmeneti kezeléssel kapcsolatos követelményeket és eljárásokat, amelyek szükségesek ahhoz, hogy megbízható elektronikus levéltárba kerülésükig is megőrizzék hitelességüket, integritásukat és használhatóságukat. 8. Ismertesse a digitális másolatok felhasználásával és megosztásával kapcsolatos nemzetközi és hazai jogi szabályozást, az ezzel kapcsolatos problémákat és követelményeket (figyelembe véve a tulajdonjogi és szerzői jogi kérdéseket is). Szükség esetén fogalmazzon meg javaslatokat a hazai jogszabályok átalakítására. 9. A készítendő gyakorlati útmutató a tanulmány megállapításai alapján tömör, kézikönyv-jellegű formában készüljön el publikálásra alkalmas módon. A tematikus elemző fejezetek mellett tartalmazzon tömör, kézikönyv-jellegű gyakorlati útmutatót a digitalizálás teljes munkafolyamatára és követelményrendszerére (az iratok előkészítésétől az utómunkálatokig) az alábbi irattípusokra vonatkozóan külön-külön: 1. - papíralapú iratok 2. - papíralapú kötetek 3. - pergamenalapú oklevelek 4. - építészeti tervek, térképek 5. - fotók 6. - mikrofilmek 7. - audiovizuális anyagok Módszer, szerkezet Két főbb egység a bevezetés után: 1-8. Módszertani-elméleti rész 9. Gyakorlati kézikönyv Módszer: a hasonló tematikájú hazai és nemzetközi előzménydokumentumok összegyűjtése, áttekintése, interjú az egyes részterületek hazai szakértőivel, a fontosabb digitalizálási projektek levezénylőivel, a kiterjedt saját (Arcanum) tapasztalatok rendszerezése, bedolgozása. Interjú formájában bevonandó személyek (intézmények): Lakatos Andor (Kalocsai Főegyházmegyei Levéltár) Reisz Csaba (MOL) Körmendy Lajos (MOL 10. főosztály, oszt. vez.) Szatucsek Zoltán (MOL 16. főosztály, mb. főigazgató helyettes) P. Holl Adrien (BFL állományvédelmi oszt. vez.) Karl Heinz (Bécs, Monasterium, ICARUS) Cseh Gergő Bendegúz (ÁBTL, Informatikai, Adatrögzítő és Állományvédelmi Osztály főoszt. vez. h.)

3 Kiru: előzmények, metaadatok, Europeana Schöck Gyula, Szekszárd (reprintes) 0. Bevezetés A tanulmány célja a ki, felépítése Közgyűjtemények: levéltár, könyvtár, múzeum. Közös elemek és a levéltári specialitások. Cél: megőrzés, hozzáférhetővé tétel Források: saját, pályázat, üzleti szféra Közbeszerzési útmutató Eszközök: meglévő belső, bővítés, outsourcing; hardver, szoftver, emberek Sorrend, ütemezés 1. Nemzetközi áttekintés A fejezetben röviden ismertetjük néhány Európai Uniós és azon kívüli ország konkrét digitalizálási projektjét, gyakorlatát, hozzáférhető ajánlásait, előiratait az interneten elérhető dokumentumok alapján. USA U. S. National Archives and Records Administration: NARA: Digitization at the National Archives: Federal Agencies Digization Guidelines Initiative (FADGI): Library of Congress: Cornell University Library: Kanada Library and Archives Canada: Ausztrália National Archives of Australia: Németország Tartományi szerkezet miatt nincs egy központi nemzeti alap a digitalizálás finanszírozáshoz, azt a tartományoknak kell fizetniük. Baden-Württenberg: Prioritások: 1: ami sokakat érdekel (fotó, térkép); 2. nagy érdeklődésre számottartó anyagok a történeti kutatásokban; 3: a közeljövő évfordulóival kapcsolatosan érdeklődésre számottartó anyagok; 4: további nagy tömegeket érdeklő

4 anyagok. Két másik szempont a prioritás eldöntéséhez: vizuális anyagok, amiket nehezen lehet leírni (kép, fotó, stb.), ill. a sélülékeny, fizikailag veszélyeztetett anyagok. 10 éves akcióterv: millió oldal, ami a 7%-a a mostani anyaguknak. German Digital Library (http://www.deutsche-digitale-bibliothek.de) pl. egy közös portál, meg gyűjtő-közvetítő az Europeana felé, némi központi költségvetéssel. Nagy-Britannia Útmutatók és standardok: Hollandia National Archives of the Netherlands: Franciaország Csak franciául van bármi! Svájc Swiss Federal Archive: EU MINERVA: A MINERVA az Európai Uniós tagállamok minisztériumai közötti együttműködés, mely a kulturális és tudományos tartalmak digitalizálását hangolja össze. A program célja egy közösen elfogadott európai platform kialakítása a digitalizálásra, metaadatokra és a hosszú távú megőrzésre vonatkozó ajánlások és irányelvek megfogalmazása formájában. A nemzeti programok koordinálása mellett az európai országok, nemzetközi szervezetek és projektek közti kapcsolatok kiépítését is segíti. A program ezenfelül tanácsadó szerepet lát el, mely a már működő jó példák összegyűjtését, valamint a lundi alapelvek elfogadását és terjesztését szorgalmazza. IMPACT is a project funded by the European Commission. It aims to significantly improve access to historical text and to take away the barriers that stand in the way of the mass digitisation of the European cultural heritage Nemzetközi áttekintés Digitális objektumok metaadatai, megosztásuk szabványai, integrálásuk európai portálokba: Europeana, APENET, ICARUS Europeana:

5 APEnet: Archives Portal Europe (Európai Levéltári Portál): Archives portal Europe: APEx: Archives Portal Europe network of excellence' (Európai Levéltári Portál Kiválósági Hálózat): ICARUS (International Centre for Archival Research): Kataszteri térképek (icarus projekt): Monasterium (középkori oklevelek, icarus projekt): 3. Hazai áttekintés Megvalósult projektek, meglévő módszerek, ajánlások, előírások értékelése (interjúk és hozzáférhető dokumentumok alapján) 4. Állományvédelem Előírások, rendszabályok, eljárások a digitalizálás kapcsán felvetődő állagmegóvásra, restaurálásra, dokumentumtípusonként: különböző korú és típusú, állapotú papíralapú iratok (külön kitérve a kötetformátumokra, nagyméretű tervekre, térképekre) pergamenalapú iratok mikrofilmek fényképészeti anyagok (fekete-fehér és színes papírkép, képeslap, film, negatív, dia, dagerrotípia, üvegnegatív) audiovizuális anyagok (hangszalag, videoszalag). 5. Digitalizálás technikai feltételek követelmények formátumok eszközök eljárások digitalizálás utáni teendők OCR (mikrofilmről OCR: vizsgálódás a BFL-ben) A levéltári digitalizálás technikai feltételei Bevezetés Az eszközválasztás az anyag fizikai természete, terjedelme, hordozója, állapota szerint történik. A tervezéskor számbavett anyag és a digitalizálás célja, valamint a mozgósítható források, eszközök együtt határozzák meg a konkrét körülményeket. Ezekkel ebben a fejezetben most nem foglalkozunk, hanem az elméleti, ideális körülményeket feltételezve áttekintjük a használatos digitalizálási technikákat, eljárásokat, formátumokat, eszközöket. A legalapvetőbb fizikai megtestesülésük szerint a digitalizálandó objektumok lehetnek tárgyak, épületek, audiovizuális objektumok, vagy állóképek. Ez utóbbi alatt az összes olyan iratot, könyvet, térképet, plakátot, tervrajzot, oklevelet értjük, aminek információtartalma és fizikai megjelenése kétdimenziós állóképek formájában lényegében a maga teljességében visszaadható, reprodukálható. Nem tartozik tehát ide maga a háromdimenziós tárgy, de pl. a róla készült fotó már igen.

6 A levéltárakban őrzött kulturális közvagyon jellemzően ebbe a kategóriába tartozik, tehát a levéltári digitalizálás döntően különböző digitális formátumú állóképek készítését jelenti. Az audiovizuális anyagokkal kapcsolatos digitalizálási problémákra külön kitérünk. Az állóképeket azok fizikai jellemzői szerint egy sor különböző szempont szerint kategorizálhatjuk: hordozóanyag ( papír, fém, kő, fal, fa, bőr, textil, üveg, celluloid, stb), anyaguk kémiai összetétele (tinta, festék, ceruza, kréta, hordózó anyag optikai tulajdonságai (átlátszó, áttetsző, nem átlátszó), méret (néhány mm-től akár a több méterig), példányszám (egyedi vagy sokszorosított), stb., stb. A levéltári dokumentumok ebből a sokféleségből azért nagyobb mennyiségben csak néhány jellemző típust tartalmaznak: különböző méretű és állagú papír alapú dokumentumokat (iratok, kötetek, tervek, plakátok, térképek), pergamen alapú dokumentumokat (oklevelek), mikrofilmeket. Az állóképeket az ő információtartalmuk tíousa szerint is csoportosíthatjuk: főleg szöveges vagy képi (esetleg mindkettő) információhordozók-e? Fontos, a digitalizálás tervezésekor megfontolandó és eldöntendő kérdés, hogy annak révén mit akarunk reprodukálni: pusztán az információtartalmát-e, avagy többé-kevésbé a fizikai megjelenését is. Ha pl. a fizikai állapot reprodukálásának csak annyiban van jelentősége, hogy az irat eredetiségét szavatolja, de különben csak a rajta lévő szöveg információtartalmát akarjuk megőrizni, akkor ennek megfelelő metódust és formátumot kell választanunk. A digitalizálás lehetséges céljai A skála két végén az eredeti tökéletes reprodukálását is lehetővé tévő archív példány létrehozása és mondjuk az interneten is elfogadható sebességgel működő, kutatható állomány előállítása állhat. A két eltérő célhoz különböző paraméterű képeket kell létrehozni. Lehetőség van a szkennelés során eleve mindkettőt előállítani, ám ez esetben megvan annak a veszélye, hogy a két állomány elválik egymástól, és az utóbb végrehajtott műveleteket (pl. képkorrekció, fájlátnevezés, metaadatok hozzárendelése) kétszer kell végrehajtani, ráadásul azt is menedzselni kell ebben az esetben, mi történt meg az egyik és a másik sorozattal. A nagyobb felbontású, több színinformációt hordozó állományból később is előállíthatjuk a további, a felhasználáshoz lebutított, könnyebben kezelhető fájlokat. Felbontás és színmélység Állóképek esetén a fizikai objektumok leképezésének két független paramétere határozza meg, hogy a reprodukció mennyire valósághű : ez a felbontás és a színmélység, a színreprezentáció. Első megközelítésben azt mondhatnánk,, hogy minél nagyobb felbontású és minél nagyobb színmélységű a létrehozott digitális állományunk, annál jobban visszaadja az eredetit. Viszont ez esetben a mérete is a legnagyobb lesz, annak minden problémájával együtt (erre később még visszatérünk). Egy gépelt papírról nyilván nem érdemes mikroszkópikus felvételt készíteni, hanem az értelmes, reális felhasználási célokhoz kell a felbontást igazítani. Eszközválasztás Az eredeti anyag fizikai hordozója, állapota, mérete, az anyag mennyisége és a digitalizálás célja, minőségi követelményei határozzák meg azt, hogy milyen eszközt használjunk. Az eszközöket is jellemezhetjük ugyanis a fenti paraméterekkel: nekik is van felbontásuk, színmélységük. Fontos paraméterük még az általuk digitalizálható méret, valamint a sebességük is. A különböző gyártók eszközei eltérő metódussal, minőségben és költséggel végezhetik el a digitális képalkotást, körültekintő választással sok későbbi bosszúságtól menekülhetünk meg. Nem hagyhatjuk figyelmen kívül természetesen az árukat sem, a digitalizálási egységre jutó fajlagos költséggel mindenképpen kalkulálnunk kell. A digitalizálási folyamat eszközei közé kell sorolnunk a berendezéseket vezérlő, az átalakításokat végző számítógépeket és háttértárakat is. Ezek teljesítménye is jelentősen befolyásolhatja az egész munka hatékonyságát, árukkal, várható élettartamukkal pedig a költségoldalon kell számolnunk. Metaadatok, visszakereső rendszer A digitalizálás gyümölcseinek felhasználásához a kívánt állományokat meg kell találnunk. Ehhez értelmes mélységű adatleírásra van szükség. Ennek előállítása, a képállományokhoz való rendelése, és megfelelő navigációt, keresést biztosító rendszerbe való betöltése nélkül a digitalizálás semmit nem ér. Itt is meg kell találnunk az egyensúlyt: a reális

7 felhasználási célokhoz elégséges metaadatot kell hozzárendelnünk. A túl sok, túlságosan szétaprózott adat a felhasználást is nehézkessé teszi, és az előállítást is megnehezíti, megdrágítja. A világban elterjedő mai tendencia az, hogy még ha a háttérben vannak is bonyolultabb, kifinomultabb adatleírást, formázást, keresést támogató adatelemek, a szem előtt lévő, fő eszköz szinte csak egyetlen keresőablak. Lásd akár az Europeana-t, akár a Google-t. Követelmények Mielőtt megfogalmaznánk a levéltári anyagok digitalizálásakor elvárható követelményeket, ismerkedjünk meg kicsit részletesebben a két legfontosabb paraméterrel! Felbontás Egy digitális képet úgy képzelhetünk el, mintha a valóságot egy ablakra feszített szúnyoghálón át néznénk: egyrészt kivágunk belőle egy téglalap alakú szeletet, másrészt csak a rács lukain keresztül látjuk a valóságot. (Az egyszerűség kedvéért tekintsük most úgy, hogy egy lukon átnézve csak egyetlen dolgot tudunk megkülönböztetni: van-e ott valami, vagy nincs, a színes reprezentációról lásd alább.) A keretnek van egy befoglaló mérete, ami meghatározza, hogy a valóság mely és mekkora szeletét látjuk. A rácsnak pedig van egy sűrűsége, ami azt határozza meg, milyen finomsággal látjuk a mögötte lévő dolgokat: egy finom szúnyoghálót távolabbról nézve esetleg észre sem veszünk, míg egy sűrű ablakrács erősen bezavar a képbe. A képalkotó eszközök is ezen az elven működnek: a leképezés (input) és a megjelenítés (output) oldalán is egy téglalap alakú mátrixot képzelhetünk el, amiben meghatározott finomsággal optikailag aktív, fényt érzékelő vagy fény kibocsátására képes elemek sorakoznak. Őket pedig átlátszatlan, optikai szempontból semleges elemek keretezik. Egy ilyen egységet nevezünk pixelnek (Picture element = pixel). Hogy precízek legyünk, egy digitális kép csak a leképezéskor és a megjelenítéskor tekinthető ilyennek, a tárolt képállomány csak bizonyos speciális esetben ilyen, a pixel információt általában valamilyen kódolt formában, a hatékonyabb helykihasználás végett gyakran speciális tömörítési algoritmusokkal összecsomagolva tárolja (lásd később). Az emberi szem is egy képalkotó eszköz, és még ha a fejlettebb látás magasabb agyi folyamatok eredménye is, azért az elemi információt ennek a feldolgozási folyamatnak a kiindulópontjai, a retinánkon elhelyezkedő érzékelő sejtek adják. A szemünknek is van optikai felbontása: azt a legkisebb szöget szokás ennek mértékéül megadni, amekkora eltéréssel elkülönültnek látunk két pontszerű elemet. Ez az érték az átlagos emberi szem esetén kb. 1 ívperc, ad része. Ez a meghatározás kiküszöböli a nézés távolságából adódó változót: ha mondjuk az elkülöníthető pontok távolságával jellemeznénk a felbontást, akkor mindig hozzá kellene tenni, hogy milyen messze vannak. Ennek jelentősége nyilvánvalóvá válik, ha arra gondolunk, mit látunk a tűből és a befűzendő cérnából, ha az a mi kezünkben van, és mit, ha az utca túloldalán lévő varróműhely ablakán lesünk be. A valóságban alapesetben a puszta szemünkkel nézzük a külvilági objektumokat, pl. olvasunk egy kezünkben tartott újságot. Ez esetben a legjobb szemű emberek kb. 300 dpi (dot-per-inch, azaz 300 képpont 2.54 cm-enként) felbontó képességűek, az ennél finomabb részleteket már nem tudják megkülönböztetni. Ezért vált a 300 dpi egyébként a legáltalánosabban elterjedt kimeneti felbontássá Köznapi értelemben egy sor némiképpen eltérő mérőszámokkal jellemezhető különböző dolgot is felbontásnak nevezünk. Beszélünk egy lézernyomtató felbontásáról, egy szkenner felbontásáról, egy digitális kamera felbontásáról, egy projektor felbontásáról, egy monitor felbontásáról. Szokás megadni ezeket a pixelek abszolut számában (pl. 10,2 MP=megapixel), a sorok és oszlopok abszolut számában (pl. 1024x768), az egy hosszegységre jutó pixelek számában (pixelsűrűség, pixel/inch=ppi) nyomtatott vonalak száma hosszegységenként (line/inch=lpi), valamely szabványra való hivatkozással (pl. VGA, full HD), egy hosszmértékben (ti. hogy pl. egy térképállományban két pixel között a valóságban mekkora a távolság), stb. Ezek mindegyike lényegében ugyanazt mondja meg, hogy hány elkülönült egység lehetséges az adott eszközön. Azt ugyanakkor sokszor elmossák, hogy a különböző eszközökön ez mást jelent. Nézzük meg sematikusan, hogyan is jön létre egy digitalizált kép látványa, amit a számítógépünk monitorán szemlélünk! 1. Eredeti objektum 2. Optikai leképezés. A képi információ egy meghatározott látószögű analóg valóságszeletből a képalkotó eszköz egy fix területére vetül. Vannak kontakt eszközök (síkágyas szkenner, dokumentum szkenner, térképszkenner),

8 ahol nincs optikai konverzió, egy az egyben az érzékelő kerül az eredeti képe, és vannak valamilyen vetítést, optikai transzformációt alkalmazó eszközök (felsőfejes, könyvszkenner, digitális fényképezőgép), ahol valamilyen kicsinyíítés vagy nagyítás történhet. 3. Digitális átalakítás. A képalkotó bizonyos felbontással (finomsággal, gyakorisággal) mintát vesz a valóság vetületéből, előállanak a pixelek. 4. Enkódolás, tárolás. Valamilyen algoritmus szerint képfájlba rögzül az infó. Tömörítetlen formátum használata esetén egy képi pixel egyenértékű egy képfájl pixellel. Veszteségmentes tömörítés használata mellett úgy van kódolva egy-egy képi pixel, hogy annak teljes információtartalma veszteség nélkül kerül bele a képfájlba. Veszteséges tömörítés esetén csak valamilyen közelítő algoritmussal állítható helyre az eredetihez hasonló pixelinfó; pixelnél nagyobb egységek információtartalma egyben kódolódik. 5. Dekódolás. A képfájl kiolvasása, a pixelenkénti infó reprodukálása 6. Küldés a megjelenítőre. Az eszköz tulajdonságaihoz kell alakítani a képfájlból kiolvasott, pixelekké alakított felbontás (és szín) információkat. Nagyítás és kicsinyítés is lehetséges. 7. Látás. A megjelenítőnek a befogadóhoz viszonyított elhelyezkedése szerint újabb optikai transzformáció történik, és érvényesül az emberi szem felbontóképessége. Láthatjuk tehát, hogy a folyamat számos pontján történik olyan átalakítás, ami a felbontást is befolyásolja. Gyakorlati szempontból mégis az elsődleges képalkotó eszköz felbontása a leglényegesebb elem. Ez határozza meg leginkább, hogy milyen részletességgel, finomsággal tudjuk a képállományban eltárolni az eredeti dokumentum digitális leképezését. Az elemi képérzékelő elemek valamilyen fényérzékeny elektronikus eszközök (CCD vagy CMOS szenzorok), amik a rájuk eső fény intenzitásával arányos feszültséget képesek generálni. (Ráadásul még mindegyikük a három alapszín valamelyikére szenzitív, erről majd a következő fejezetben beszélünk). Az eszközök egyik felében az érzékelő elemek egy (vagy egymáshoz közeli néhány) sorban helyezkednek el, sűrűségük adja a vízszintes felbontást. A függőleges letapogatás úgy történik, hogy vagy az érzékelősor mozog a digitalizálandó objektum felett (síkágyas szkenner), vagy az érzékelő sor fix, és a szkennelendő anyag mozog alatta (pl. térképszkenner, dokumentumszkenner). Könnyen beláthatjuk, hogy a konstans felbontás biztosításához végtelenül precíz szabályozás szükséges: mindkét esetben precíziós, elektronikusan vezérelt motorok mozgatják a kívánt alkatrészeket. Ez esetben a felbontást a léptető motorok pozícionálásának pontossága, finomsága határozza meg. Főleg az olcsóbb eszközök között találunk olyanokat, amelyek vízszintes és függőleges felbontása eltér (pl. 600 dpi vízszintes és 1200 dpi függőleges felbontás). Ennek az az oka, hogy vagy a képérzékelők sűrűsége, vagy a mozgató motorok léptetési finomsága limitált. Maga a szkennelés addig tart, amig a teljes felület végighalad az érzékelők előtt. Az eszközök másik felében az érzékelők egy mátrixban helyezkednek el, kitöltve egy téglalap alakú felületet. Ilyenek a digitális fényképezőgépek. Szemben az előző, soronkénti letapogatást végző eszközökkel, itt egy felvétel készítése csak az expozíciós idő tartamág tart (illetve praktikusan ez megfejelve a kép tömörítésének, letárolásának, továbbításának időtartamával). A digitális fényképezőgépek mindenképpen igényelnek valamilyen optikai átalakítót, objektívet, hogy a külső kép a kisméretű érzékelő felületre kerüljön. Az objektíveknek is van felbontásuk, azonban ez még a mai, egyre nagyobb felbontású digitális lapkák idején sem jelent szűk keresztmetszetet. Itt inkább az optikai torzítás veszélye nagy, erről majd az eszköztípus ismertetésekor részletesebben szólunk. Az optikai transzformációt involváló eszközök használata esetén fontos tudnunk, kiszámolnunk az adott beállítások mellett létrejövő képfelbontást! Azok a kontakt eszközök, ahol nincs ilyen leképezés, ott biztosak lehetünk benne, hogy a képfelbontás megegyezik a felvételezéskor beállított felbontással. Ahol azonban egy objektív (pláne egy zoom-objektív! ) vetíti a képet az érzékelőre, nem lehetünk biztosak az eredményben. A legegyszerűbb módszer a valós képfelbontás meghatározására, ha rögzítjük a beállításainkat, majd egy ismert hosszúságú tárgyról (pl. egy vonalzó) próbafelvételt készítünk. Ezt nyissuk meg valamilyen képszerkesztő programban, ahol precízen leolvashatjuk, hogy 30 cm-es vonalzónk 3544 pixel, tehát a felvételezés felbontása éppen 300 dpi. Gyakori zavart jelent az eredeti dokumentum mérete, a digitális állomány vízszintes és függőleges pixeleinek számából adódó méret, valamint a képfájlok fejlécében tárolt felbontás- és méretadatok értelmezése. A szkennelő programok, képfeldolgozó alkalmazások által létrehozott képfájlok a pixelenkénti képinformációkon kívül egy sor egyéb adatot is tartalmazhatnak. Ezek a fájlok ún. fejlécében lévő metaadatok egy sor információt tartalmaznak a kép létrejöttének körülményeivel kapcsolatban (pl. digitális fényképezőgép esetén az objektív, a rekesz beállításai, az ISO fényérzékenység-érték, copyright adatok, stb.), ezekről a metaadatokról szóló fejezetben részletesebben szólunk majd.

9 Nem minden képformátum tartalmazza ugyanazokat az adatokat, és nem minden alkalmazás tölti fel az összes lehetséges adatot a fájlok fejlécébe. Ha használni akarjuk a digitális állományt, megnyitjuk azt bármilyen alkalmazásban, a megjelenítő a fájltípus azonosítása után először a fejlécadatokat olvassa ki, amelyeket azután felhasználhat a megjelenítés során is. Hogy hogyan kezeli őket (avagy kezeli-e egyáltalán), az az alkalmazástól függ. Az biztos, hogy két adatot mindig meglelünk bennük: a képfájl pixelben megadott méreteit és a kép felbontását (pl. 3000x2000 pixel, 300 dpi). Ha olyan programba töltjük be a fájlunkat, ami érti a felbontás adatot (pl. egy tördelő programba, vagy egy PDF fájlt hozunk létre az Adobe Acrobat Professional programmal), akkor az 25,4 cm x 16,9 cm méretben jeleníti meg, avagy nyomtatja ki a képünket. Ha az alkalmazás nem érti a felbontás adatot, akkor negligálja, ez esetben a 3000x2000 pixeles képünket nagy valószínűséggel a megjelenítő eszköznek (pl. monitor), vagy magának a programnak az alapértelmezett felbontása szerint kezeli (pl. 72 dpi), és 1:1 megjelenítést választva 105,8 cm x 70,6 cm méretben jeleníti meg. A három adatból kettő mindig egyértelműen meghatározza a harmadikat: így ha el is veszítjük valamiért a képekben tárolt eredeti felbontásadatot, utólag a dokumentum valóságos fizikai méreteinek lemérésével és a pixel-mérettel való arányítással újra meghatározhatjuk azt. Színreprezentáció Színmélység 1 bit 8 bit 24 bit Több bit Színmodellek RGB CMYK Tömörítés Formátumok OCR (Optical Character Recognition, Automatikus szövegfelismerés) A fizikai hordozó digitális reprezentációjához különböző módokon lehet az információtartalmat illetően digitális tartalmat hozzáadni. Ez lehet egyszerűen egy jelentésteli, következetesen használt fájlelnevezési séma, vagy bibliográfiai leírás, mutató, stb. Amikor olyan dokumentumokkal van dolgunk, amelyeknél az információtartalom hordozója alapvetően szöveg, akkor annak teljes digitális reprodukálása adja vissza a legteljesebben az eredeti információ tartalmat. Ez történhet gépeléssel, illetve OCR révén. A rendkívül időigényes és emiatt igen drága manuális adatfelvitel (gépelés, korrektúra, visszajavítás) alkalmazása a tömeges digitalizálásban lehetetlen. Ennek kiváltására olyan programokat használhatunk, amelyek képesek a szkennelt kép-állományokból szöveget előállítani. OCR-nek tehát azt az eljárást nevezzük, amelynek során a képi állományunkból egy program segítségével szöveg képződik. Ennek legnagyobb előnye a hagyományos kézi adatbevitellel szemben a vonzóan alacsony ár, a nagy feldolgozási sebesség, az egyre javuló minőség és a sokféle output lehetőség (Word, PDF, TXT, stb.). A mai OCR programok a minél hatékonyabb szövegfelismeréshez kifinomult eljárások egész tárházát integrálják: képtisztító, képjavító algoritmusok, alak-, mintafelismerés, szótárak, nyelvi szabályok használata, struktúra elemzés, mindez egy soklépcsős, sokszempontos döntési fába rendezve. Az egyes pontokon nem feltétlenül

10 abszolút igen-nem döntések születnek, hanem válasz-valószínűségek, amelyek összességének végső komplex kiértékelése adja a felismert szöveget. A programfejlesztők a sok szempontot igyekeznek optimalizálni a tipikus felhasználói igényekhez, és az annak megfelelő legjobb eredményt adó eljárást beépíteni a rendszerükbe. Vannak, lehetnek olyan, a tipikustól eltérő attribútumokkal rendelkező szövegek, amik esetén ez a gyári felismerés nem ad kielégítő eredményt. Az OCR programok ezekre az esetekre általában rendelkeznek valamilyen tanító eszköztárral, amelynek segítségével speciális betűk, karaktercsoportok felismerésére lehet megtanítani a programot. Az OCR jelenleg elsősorban nyomtatott vagy írógéppel, számítógépes nyomtatóval előállított szövegek felismerésére használható, a kézírásos szövegek automatikus felismerése jelenleg nem ad kielégítő eredményt. Napjainkban már vannak ugyan egészen jó eredményt adó folyó kézírást felismerő alkalmazások, ám ezek nem tudnak szkennelt képekből dolgozni, hanem csak valamilyen tableten, PDA-n bevitt írásból. Ennek az az oka, hogy ezek rögzítik, a felismerendő elemek szegmentálásában felhasználhatóvá teszik a kézírás jellegzetes dinamikáját, idői lefolyását, csak így tudnak elfogadható eredményt produkálni. A piacon komolyan számbavehető program 3-4 van, mi ezek közül jelenleg (2012) az Abbyy FineReader Corporate Edition 10 verziót használjuk. A karakterfelismerés folyamatának lényeges elemei nagyon hasonlóak, az elvi megfontolások megegyeznek, így a többi programra külön nem térünk ki, azok részletes ismertetése meghaladja jelen tanulmány kereteit. OCR programok: Az a tapasztalat egyébként, hogy a kereskedelmi forgalomban lévő OCR programok elsősorban az irodai felhasználókat tekintik célközönségnek, a nagytömegű digitalizálás igényeit kielégítik ugyan, de nem túlzottan támogatják: egy sor finomabb beállítás nem kellően dokumentált, néha kisebb-nagyobb hibák is előfordulnak bennük. Mindegyiknek van SDK-ja (Software Development Kit), amivel saját OCR-alkalmazást lehet felépíteni, természetesen a legfontosabb rutinok, maga az OCR-motor zárt, csak magát a felhasználói felületet, az esetleges plusz funkciókat lehet (és kell! ) beprogramozni.. Az SDK általában viszonylag drága, és speciális és mély programozói (C/C++) tudás kell a használatához, így a mezei digitalizálónak kevéssé ajánlott a használatuk. Akkor lehetne érdemes ilyen alkalmazás fejlesztésébe belefogni, ha igen nagy tömegű, speciális, egy kaptafára menő dokumentumunk van, amik esetén az asztali programverzió nem ad kielégítő eredményt (pl. ipari mennyiségű űrlap, számla feldolgozása esetén). A levéltári területen, egyáltalán, a kulturális területen nem igazán ez a jellemző, hanem inkább az, hogy sokféle dokumentum-típust kell digitalizálni, a legkülönbözőbb méretű, nyomdai kivitelű, hordozójú, állapotú, nyelvezetű szövegeket. Érdemes ugyanakkor időről-időre nyomon követni, tesztelni a megjelenő újabb programokat, verziókat, mert a fejlődés folyamatos, és főleg a nyelvészeti eszközök, a mesterséges intelligencia fejlődésével még további OCR-teljesítmény javulás várható. Alapfogalmak A OCR során az első lépés az oldalak elemzése, melynek során a program felismeri az adott oldalon található elemeket. Igazából ebben a fázisban történik még egy, a szövegminőség szempontjából nagyon fontos folyamat, a kép előfeldolgozása: kiegyenesíti az oldalt, a sorokat, képtisztító algoritmusokkal kiszűri az oldalképből a felismerést zavaró apróbb koszokat, kiemeli a felismerendő szöveget. Az egyes feldolgozandó elemek egy-egy keretet alkotnak, melyek az alábbi típusba sorolhatók: szöveg kép táblázat (vonalkód) Egy oldal igen bonyolult szerkezetű lehet (gondoljunk csak egy napilapra): több szöveghasáb, 2-3 hasábos cím, képek, illetve akár több hasábon áthúzódó táblázatok, különböző olvasásirányú blokkok. A keretek felismerésében természetesen lehetnek hibák. Manuális javítással, egy keret típusának megváltoztatásával vagy a keretvonalak javításával, kézi megrajzolásával sokat lehet segíteni a későbbi felismerési pontosságon.

11 Egy adott kerethez hozzátartozik az írás iránya. Különösen táblázatokban gyakran előfordul, hogy bizonyos cellákban függőleges irányú írás található. Ha ezeket rosszul azonosítja automatikusan a program, ezen is manuálisan javíthatunk. Az OCR programok nem kizárólag karaktereket ismernek fel, igen fejlett nyelvi háttérrel, támogatással rendelkeznek. A legegyszerűbb esetben csak az adott nyelv karakerkészletét ismeri a program, fejlettebb esetekben az adott nyelv teljes szókincsét és nyelvtanát is ismeri és ezt a felismerés során alkalmazza is. Egy adott dokumentumban több nyelvű szövegrészek is előfordulhatnak, így a szövegfelismeréshez szükség lehet egyszerre több nyelv megadására. Ekkor az adott szót a legvalószínűbb nyelvűnek tekinti a program. Például ha egy jellemzően magyar nyelvű szövegben az in memoriam latin kifejezés szerepel, akkor azt hajlamos az OCR program in memóriám -ként felismerni. Avagy az alábbi példán látható oldalon szerepel a Mohamet szó, amit a program eredetileg ebben a formában nem ismer: a számára értelemmel bíró Mohámét alakot ismeri fel helyette. Az adott nyelv szavai bővíthetők, saját szótárakat építhetünk (jellemzően pl. tulajdonnevekből), és ezzel segíthetjük a programot a helyes alak felismerésében. Ugyancsak lehetőségünk van speciális jelek, karakterek beépítésére egy adott nyelvbe (pl. a magyar nyelvet bővíthetjük az umlautos e betűvel (ë), amit nyelvészeti, néprajzi szövegekben gyakran használnak tájnyelvi szavak leírásában). A lenti példában megfigyelhetjük, hogy a felhasználói szótárba felvett tulajdonnevek hogyan hatnak a felismerésükre: Beriszló, Both, Mohamet. A fölső kép szótárhasználat nélkül, az alsó kép szótárhasználattal mutatja ugyanazon oldal OCR-ét, a baloldalon az oldal képével, a jobb oldalon pedig a felismert szöveggel.

12 A túl sok felismerési nyelv (3-4-nél több) használata viszont már rontja a felismerés minőségét. Az OCR futattása után létrejön az ún. köteg (vagy batch) állapot. Ez az OCR program saját formátuma, lényegében egy speciális, az OCR program által kezelt hierarchikus mappastruktúra,, amely tartalmazza az oldalak képállományát, a felismert szerkezeti elemeket, kereteket, és az ebből előállított, felismert, formázott szöveget is. Mérete rendkívül nagy, akár szorosa is lehet a szkennelt oldalak helyigényének (főleg azért, mert az oldalképeket tömörítetlen TIFF formátumban tárolja). Ebben a fázisban nagyon szoros kapcsolat van a kép pontjai és a szöveg betűi között, tizedmilliméteres pontossággal tudja a program, hogy mely képpontokhoz milyen karaktert rendelt, annak minden tulajdonságával: betűtípus, betűméret, betűszélesség, stb. Ez az az állapot, ahol az OCR program felületén belül lehetőségünk van a szöveg javítására. Minőséget befolyásoló tényezők Egy jó minőségű könyvet, vagy egy lézernyomtatóval kinyomtatott mai szöveget bármely OCR program 99,99%-os pontossággal reprodukál. A gyakorlatban azonban ennél általában rosszabb minőségű eredetikkel találkozunk. Mi az, ami alapvetően befolyásolja a felismerés minőségét? 1. Kézírásos szöveg nem felismerhető. 2. A nyomás minősége alapvetően meghatározó. Nagyon gyenge eredményt lehet elérni a rossz minőségű, stencilezett (elsősorban 1950-es 1960-as években keletkezett) gépiratokkal. 3. Meglepően gyenge OCR eredményt adnak a 1980-as évek vége 1990-es évek eleji, már számítógéppel, elektronikus írógéppel készült szövegek, amelyeknél hiányoztak a hosszú ékezetes betűk, nem volt stabil a betűk alapvonala (ugrált az írógépfej, pontozott a mátrixnyomató). 4. Főleg gépirat esetén az igen gyakran előforduló aláhúzással jelzett vagy szóközök beütésével ritkított kiemelések teljesen elrontják az eredményt. 5. A szöveg összefirkálását, aláhúzását, áthúzását, az egyes elemek kipipálását egy bizonyos szintig a programok tolerálják (ha ceruzával és halványan történtek), de a filctollas, golyóstollas jelöléseket már nem. 6. Semmilyen nyelven sem értelmes szövegek. Ilyenek lehetnek például régies nyelven írt szövegek, pl századi könyvek vagy azok betűhív átírásai. 7. Meglepően gyenge az OCR minősége dőlt (italic) betűtípusoknál. Ez függ az alapbetűtípustól is, minél speciálisabb, díszesebb a betű, annál gyengébb a dőlt verzió felismerhetősége is. 8. Nyomtatott anyagok esetén is meghatározó a nyomás minősége. Az emberi szem számára nem zavaró hibák (maszatos nyomat, kopott nyomóforma) is jelentősen ronthatják az OCR minőségét. Nagyon jellemző az é-ó, ó-

13 á, c-e, stb. tévesztése, ami elsősorban a tisztátalan avagy kopott nyomóformának tudható be. A fenti oldal-példa egy kinagyított részletén a mentén szóban az e, é és n betűk bizonyos részei annyira elvékonyodtak a nyomaton, hogy a program mcntcu -nak azonosította őket (fölül a felismert szöveg, alatta a kinagyított oldalkép-részlet látható). 9. Furcsa eredményeket adnak a régies helyesírású szövegek. Mivel a program a mai nyelveket ismeri, hajlamos a régies helyesírást (különösen a következetlen ékezethasználatot, pl. tanit tanít) a maival helyettesíteni. Ebből azonban számos furcsa eredmény születik, pl. a régies írású vajjon szó vájjon lesz (mint vájjon valamit), merthogy így van a program számára értelme. 10. Amennyiben rosszul állítjuk be a nyelvet, hibás eredményt kapunk. Pl. egy magyar nyelvű szöveget véletlenül angol nyelvbeállítással futtatva az összes ékezet eltűnik a szövegből. 11. Soknyelvű oldalak, pl. bibliográfiák, ahol akár 6-8 nyelv is előfordul egyetlen oldalon, nehezítve értelmetlen (folyóirat, intézmény) rövidítésekkel, ismeretlen tulajdonnevekkel. 12. Számos speciális esetben a gép képtelen a képet és a szöveget helyesen értékelni az oldalon. Ennek jellemző példája a kottás könyvek, ahol lehetetlen elkülöníteni a képet a szövegtől, így a kottákat is szövegként próbálja értékelni, illetve a szöveg elválasztójelekkel jelenik meg, itt nem is igen értelmezhető a szövegfelismerés. 13. Különleges eset (de akár gépiratban, akár nyomtatva is gyakran használatos) a ritkított írásmód. Itt számos esetben hiába ismeri fel a betűket a program, azokat csak kis százalékban tudja értelmes (ritkított) szavakká összerakni. Egyrészről örülhetünk, hogy mintegy 50%-ban sikerül a felismerés, de sajnálhatjuk a kimaradó 50%- ot. 14.Nem képes a program felismerni az alapvonalból kiugró szövegeket (az alsó-felső indexek nem ebbe a kategóriába tartoznak, azokat általában jól kezelik a programok), melynek jellegzetes példája a soron belüli törtvonalas ábrázolás. Ez igen gyakran fordul elő 2. világháború előtti rendeletszámok esetén. 15. Fenti esethez hasonló a nyomtatott lapszéli jegyzetek problémája. Ezt is igen előszeretettel használták a század fordulóján. A felismerés problémája abból származik, hogy a jegyzeteket két sor közé írták, így a fővonalban történő olvasás ezeket a betűket nem tudja értelmezni. A helyzetet megoldja, ha két külön keretbe

14 tesszük a főszöveget és a lapszéli jegyzetet. Alább a 14. és 15. pontokban jelzett hibákra láthatunk jellegzetes példát. Fölül az OCR program által automatikusan létrehozott keretek esetén, alul a manuálisan megjavított keretek esetén figyelhetjük meg a felismerés eredményét. Mindkettőben baloldalon az oldalkép látható a zöld színű felismerési keretekkel, jobb oldalon pedig a felismert szöveg.

15

16 16. A program kizárólag egyenes írású szöveget ismer fel (vízszintes vagy függőleges irányban), ferde, hajlított szövegeket nem.

17 17.Szinte használhatatlan az eredmény az újságokban, könyvekben gyakran előforduló hirdetések esetén. A bonyolult szerkezetű, speciális méretű, formájú betűtípusokat, logókat, képeket tartalmazó oldalak esetén egy-egy normálisan álló szövegrész felismerését már jó eredménynek tekinthetjük. Tanítás Minden OCR program egyik fontosnak tűnő alapfunkciója, hogy a számára ismeretlen betűk, illetve betűtípusok megtaníthatók számára, ez a Felhasználói minta tanítása funkció. A minta tanítása hasznos lehet díszes, cirkalmas betűkkel nyomtatott szövegek, speciális karaktereket (pl. matematikai jeleket, fonetikai jelöléseket, ligatúrákat) tartalmazó szövegek esetén, vagy ha rossz nyomtatási minőségű a dokumentum (pl. ha az írógéppel írt szövegben sérült valamelyik betű). A funkció bekapcsolásakor, ha a program a felismerés során ismeretlen, vagy bizonytalanul felismert karakterhez ér, megáll, és a felbukkanó panelen megadhatjuk a kívánt betűt. Ügyelni kell arra, hogy a dőlt és kövér alakok, alsó és felső indexek külön-külön megtanítandók! Egy másik betűtípussal, másik betűmérettel, esetleg eltérő felbontással szkennelt oldalkép esetén a tanított minta nem fog jól működni, annál újabb mintát kell tanítani! Amikor valamennyi kívánt betűre megtanítottuk a programot, kiléphetünk a tanítási módból, és a soron következő felismertetésekben használhatjuk a betanított mintát. A tanítással kapcsolatban az a gyakorlati tapasztalat, hogy általában csak akkor éri meg a befektetett munkát, ha ugyanaz a specialitás nagy mennyiségű szövegben (több száz oldalon) következetesen fordul elő, különben ritkán lesz jelentősen jobb az így nyert szöveg. A felismerési karakterkészlet (az ábécé) precíz beállítása és a megfelelő szótár kialakítása gyakran elégséges az elfogadható eredmény eléréséhez. Kisebb mennyiségű hibás szöveget meg esetleg érdemes egyszerűen manuálisan vagy Keresés/Csere módszerrel kijavítani. Szkennelés minősége A szövegfelismerést természetesen befolyásolja a szkennelés minősége, bár a szkennelési paraméterek viszonylag tág határai között is képes az OCR program elfogadható eredményre. Normál szövegek feldolgozásához 300 DPI, JPG tömörítésű képek elegendőek (a tömörítési arány 80% körül határozzuk meg, ahol a 100% a legjobb minőségű, legkevésbé tömörített fájlt jelenti). Apró betűs (6-7 pontos) szövegek esetén javíthat a felismerésen a 400 DPI-s szkennelés (valós, optikai felbontás). Egyszerű képek esetén elegendő a fekete-fehér (egy bites) TIFF G4 formátum. Ez igen tömör tárolású és a feldolgozás során sem nő meg a szükséges tárolókapacitás. Egy átlagos (A4-es) oldal tárigénye (300 DPI, 80%-os JPG), 1,5-2 MByte, ugyanez fekete-fehérben (300 DPI, TIFF G4 tömörítéssel) KByte, a kölönbség 15-szörös. Érdekes és nem egészen triviális tapasztalat, hogy árnyalatos (szürke vagy színes) képek esetén a külső képszerkesztő programmal végzett tónuskorrekció számos esetben inkább ront mint javít az OCR minőségén! Maga az OCR a programokban 1 bitessé alakított, fekete-fehér állományon történik, de nem mindegy, hogy ezt mi állítjuk elő valami külső programmal (a szkennelő szoftverrel, esetleg képszerkesztővel), avagy az OCR programra bízzuk ezt. Jó minőségű 1 bites képet, ahol az egyenetlen tónusú oldalak halvány és kontrasztosabb részei egyaránt használhatóak maradnak, nem egyszerű előállítani: az a tapasztalat, hogy éppen az OCR program csinálja ezt a legjobban! Akármit is módosítunk az eredeti képen feltételezve, hogy a szkennelő szoftver jól végzi a dolgát, nem állítottunk el rajta valamit végletesen, beavatkozásunk az eredeti, lehető leggazdagabb tónusinformációból elvesz, nem pedig hozzátesz. Még ha szemre esetleg azt gondolnánk, hogy a korrekció nyomán tetszetősebb, kontrasztosabb képeket kaptunk, akkor is általában rosszabb lesz a szövegfelismerés minősége, mintha semmit sem csináltunk volna. Érdemes egy kötetet egy mappába szkennelni, a fájlok elnevezésénél pedig ragaszkodni ahhoz, hogy a fájlnév feleljen meg az oldalszámnak. A 34. oldalt a 034.JPG file-ba szkenneljük, így a későbbiekben minden alkalommal könnyen tudjuk azonosítani a fájlokat. Fontos, hogy a számozatlan (pl. képmellékletek), illetve az eltérő számozású (tartalomjegyzék, külön számozott mellékletek, stb.) oldalak elnevezését egységesítsük, és az adott számozott oldal mellé rendeljük, pl. a 34. oldal utáni képmelléklet kapja a 34_1.JPG, 34_2.JPG fájlnevet. Így biztosíthatjuk, hogy a digitális képek sorrendje jól áttekinthetően megegyezzen az eredeti dokumentum oldalainak sorrendjével. Szkennelés után ellenőrizzük, egyeztessük az oldalszámokat és a fájlneveket, így könnyen kideríthető, ha valamely oldalt nem szkenneltük be: vagy azért mert hiányzik az eredetiből vagy azért mert átsiklottunk rajta. Ezzel az egyéb hibákat is kiszűrhetjük (hibás oldalszámozás az eredetiben, esetleg duplán szereplő oldalak). Futtatás, a szükséges számítógép, teljesítmény

18 Ha rendelkezésre állnak a digitális állományok, kezdődhet a szövegfelismerés, a futtatás. A hatékonyság érdekében ez jellemzően éjszaka végzett művelet, ebben a munkafázisban nincs szükség emberi beavatkozásra. Ugyanakkor a számítógép erőforrásait meglehetősen igénybe veszi, így nem érdemes futtatás közben mást is csinálni ugyanazzal a géppel. A helyesen beállított paraméterek (a dokumentum nyelve, nyelvei, esetleg páros oldalak felosztása, kép elforgatása a helyes olvasási irány megtalálásához, stb.) mellett akár sok kötet felismerését végezhetjük el. A szövegfelismerés igen nagy számítási kapacitást igényel, ami erősen függ a dokumentum jellegétől, minőségétől. Biztosan lassan fut a nagy alakú, bonyolult szerkezetű, rossz minőségű szövegek felismerése, míg a kis alakú, egyszerű szerkezetű, jó minőségű szövegek sokkal gyorsabbak. Jelentős a különbség a színes és a fekete-fehér képek futtatási idejében is: utóbbiak lényegesen gyorsabban lefutnak. Nagy tömegű feldolgozáshoz nagy teljesítményű, nagy memóriájú és nagy háttértárral rendelkező gépek szükségesek. A megfelelő hatékonysághoz többmagos processzorral rendelkező gépeket használjunk (4-8 mag), mivel a programok képesek több szálon futni, s így olyan teljesítményt érhetünk el, mint 2-4 önálló gépen. Egy éjszaka alatt egy megfelelő gépen átlagos oldal OCR-ezése biztosan elvégezhető. Kötegelt feldolgozás A tömeges digitalizálás hatékony fegyvere az OCR programok azon funkciója, amit kötegelt feldolgozásnak nevezhetünk. Megadhatjuk előre a képeket tartalmazó forrás-mappákat, beállíthatjuk a megnyitás, felismerés összes fontos paraméterét, beállíthatjuk a kimeneti formátumot (egy menetben akár többet is), az elmentendő elemek helyét. Ha mindent beállítottunk, akkor akár azonnal, vagy ha úgy tetszik, akár időzítve egy későbbi, alkalmas időpontban (pl. éjszaka vagy hétvégén) elindíthatjuk a feldolgozást, és a program automatikusan elkezdi az első input mappa feldolgozását, majd ha végez, folytatja a következővel, egészen az utolsóig. A futást bármikor megszakíthatjuk és egy későbbi időpontban újraindíthatjuk. Ha esetleg szükséges az egyes kötegek ellenőrzése, akkor is érdemes a képbetöltés, elemzés, felismertetés időigényes folyamatát ezen a módon automatizálni, és az operátori ellenőrzés után már csak a végső formátumban való mentést kell (újra) végrehajtanunk, a munka időigényes dandárja emberi beavatkozás nélkül tud történni. Átnézés, javítás Miután lefutott az OCR, létrejöttek a megfelelő köteg-fájlok. Ezután van lehetőségünk arra, hogy átnézzük az eredményeket és szükség esetén megtegyük a legfontosabb változtatásokat. Itt is hangsúlyozzuk, hogy automatikus szövegfelismerésről van szó, tökéletes szövegelőállítás ezen a módon nem lehetséges (nem érdemes), itt egy elég jó eredményt szeretnénk elérni, a lehetséges maximumot kihozni, figyelembe véve a ráfordításokat. A köteg átnézése során ne vállalkozzunk a teljes szöveg szisztematikus kijavítására, ennek időigénye vállalhatatlanul nagy! Kizárólag egy-egy oldal egészére vonatkozó hibajavításokra hagyatkozhatunk. Ezek az alábbiak lehetnek: 1. Olyan ferdén történt az oldal szkennelése, hogy manuálisan kell kiegyenesíteni a képet. 2. Szöveget is képként ismert fel a program. Ennek jellegzetes esete, hogy amikor sok kép és képaláírás van egy oldalon, bizonyos képaláírások részéve válnak a képnek. Külön keretezzük meg a képaláírást önálló szövegdobozként. 3. A program nem ismerte fel helyesen a hasábokat, a hasábok egymásba folynak. Ekkor manuálisan meghúzva a helyes hasábbeosztást, jelentősen javul a szövegfelismerés. 4. Helytelen nyelvbeállítást alkalmaztunk. Ha nagyon sok oldalnál jelentkezik a hiba, érdemes az egészet újrafuttatni a helyes nyelv(ek) megadásával, ha csak néhány oldalon, akkor ezekre megadhatjuk oldalanként a helyes nyelvbeállítást és csak ezekre futtatjuk újra felismerést. 5. A program nem ismerte fel helyesen a szöveg olvasási irányát, ezért ezt manuálisan meg kell adnunk. 6. Lapszéli jegyzeteket tartalmaz a kötet és a főszöveggel azonos keretbe került. Manuálisan javítsuk, tegyük másik keretbe a jegyzetet. Külön kell beszélnünk a táblázatokról. A gyakorlatban a táblázatok igen nagy méretűek, bonyolultak lehetnek. Már az is igen sokat javít a felismerésen, ha rásegítünk a programnak, megadjuk (ha rosszul ismerte fel), hogy táblázatról van szó. Ekkor hihetetlen intelligenciával kielemzi az oszlopokat, sorokat és megpróbálja megtalálni a legjobb cellabeosztást. Fontos, értékes, sok szöveget tartalmazó táblázatoknál érdemes ezt ellenőrizni, a javításra az alábbi lehetőségeink vannak: 1. Cellák összevonása, szétválasztása.

19 2. Cellaméretek változtatása. 3. Olvasási irány meghatározása akár cellánként külön-külön. Igen gyakori a nagyméretű táblázatoknál, hogy függőleges irásirányt alkalmaznak, amit nem mindig ismer fel a program. Ezt manuálisan javíthatjuk. Ügyeljünk azonban arra, hogy az elért eredmény és a ráfordított munka arányban álljon egymással! Az OCR program felületén egyszerre láthatjuk az oldalak képét a felismerési keretekkel és egy szövegszerkesztő-szerű felületen a felismert, a kimenetnek megfelelően formázott szöveget. Az előbbin lehet az oldal- és keretszintű javításokat eszközölni, az utóbbin pedig a szövegszintűeket. A program vizuálisan kiemeli az általa bizonytalan felismerésűnek vélt betűket, és a felismerési szótárában nem szereplő szavakat is. Ezeken könnyen végiglépdelhetünk, és eldönthetjük, javítjuk-e őket vagy sem. Nem ritkán ugyanis a bizonytalannak jelölt szavakat ennek ellenére helyesen ismeri fel a program. Ha egy oldalon bizonyos százaléknál több a bizonytalan karakter (mert például olyan nyelvű szöveg van rajta, amit nem állítottunk be felismerési nyelvnek), arra további, az egész oldalra vonatkozó vizuális figyelmeztetést ad. Sokszor elegendő csak az így megjelölt oldalakat alaposabban ellenőrizni. A szövegjavítás során használhatunk globális cseréket is: amennyiben tipikus félreolvasások vannak, megkockáztathatjuk egységesen kijavítani őket. Javíthatjuk a felismerést hozzáadott szótárral, jellemzően tulajdonnevekkel, az adott szakterület speciális szavaival. Fejleszthetjük a programot a nem jól felismert karakterek megtanításával. A gyakorlati tapasztalatunk azonban az, hogy ezen lehetőségek használatával csak korlátozott eredményeket tudunk elérni. Egy szótár összeállítása, egy betűcsomag megtanítása igen jelentős ráfordítást igényel; nagyon ritkán fordul elő, hogy a befektetés megtérüljön és jelentősen javuljon az eredmény. Mentés, output A felismert szövegünket egy sor formátumban menthetjük, a beállítható paraméterek az adott fájltípusnak megfelelőek. Fontossága okán itt most csak a három leggyakrabban használt formátumról beszélünk. RTF/DOC/DOCX A legnépszerűbb szövegszerkesztők formátumának előnyei a szövegesen mentett dokumentum kis mérete, az eredetit hűen tükröző formázás, a további szerkeszthetőség, képek beágyazásának lehetősége. Képesek a fejlécként, lábjegyzetként, tartalomjegyzékként, címfokozatokkánt azonosított elemek átvitelére ebben a formátumban, így a szöveg további használatát jelentősen megkönnyíti. A szerkeszthetőség illetve az eredeti formázás pontos megőrzése két egymással ellentétes követelmény, annak tükrében, hogy melyik funkcionalitás kerül túlsúlyba menthetünk akár formázatlan, nyers szöveget, de másik végletként, szövegdobozokkal precízen formázott, ám emiatt nehezebben újraformázható elrendezést is. A felhasználás szándéka szerint válasszunk! PDF, PDF/A Az Adobe évek során fokozatosan ipari szabvánnyá vált formátuma abban a legerősebb, amit a neve sugall: Portable Document Format, azaz hordozható dokumentum formátum. Szöveget és képet is tartalmazhat, kompakt, jól tömöríthető, platformtól függetlenül az eredetivel megegyezően képes megjelenni, beágyazva tartalmazhatja a változatlan megjelenéshez szükséges betűtípusokat, belső navigációs, annotáló eszköztárral, akár még multimédikus elemek beágyazásával is rendelkezik. A PDF/A ennek az ISO által elfogadott, szabványosított speciális esete a hosszútávú megőrzés céljaira. Kötelezően beágyazott betűtípusokat tartalmaz, tilos benne egy sor esetleges inkompatibilitást okozó eszköz használata: audió és video elemek, Java-scriptek, bizonyos tömörítésfajták. A felismert szöveget elmenthetjük szöveges PDF-ként, ami igen kis méretű, és reprodukálja az eredeti dokumentum összes elemét (betűtípusát, betűméretét, keretbeállításait, táblázatait, stb.). Hátránya, hogy az összes OCR hibát megtartja, így a hitelesség elvész. Kereshető PDF Az automatikus OCR eredményeképpen létrejött anyagok legelterjedtebben használt formátuma a kereshető, vagy más néven kétrétegű PDF (angolul leginkább a searchable PDF kiifejezést használják). Szöveges dokumentumok tömeges digitalizálása céljára jó megoldásnak tűnik minden oldalról: a hiteles reprodukció, a hosszú távú megőrzés, az interoperabilitás, a kereshetőség és az előállítási ár szempontjából egyaránt. A világban egyre szélesebb körben terjedő technológia lényege, hogy az eredeti dokumentum (könyv, irat, folyóirat, stb.) képként kerül digitalizálásra, azaz beszkenneljük, majd az automatikus karakterfelismerés segítségével a képből szöveget állítunk elő. Az előállított, mentett

20 dokumentum felső, látható rétegét a kép alkotja, az alsó, láthatatlan rétegét pedig a szöveg. A szöveg és a kép teljesen fedésben van egymással, a szavak a betűk képe, és alatta a szöveg milliméterre pontosan ugyanazon a helyen találhatók. Az így létrehozott állományok egyrészt alkalmasak a dokumentum hiteles megjelenítésére, hiszen az eredeti dokumentum képét látjuk (facsimile), másrészt lehetővé teszik a szöveges kezelést, keresést is. Ez utóbbi legfontosabb eleme a teljes szövegű keresőrendszer, amely lehetővé teszi, hogy tetszőleges szóra, kifejezésre kereshessünk. A másik fontos haszna, hogy lehetőségünk van a szöveg kiemelésére, azt szövegszerkesztőnkbe beilleszthetjük, átemelhetjük. A puszta szövegen kívül a PDF fájlok további információt tartalmazhatnak a dokumentum szerkezetéről, például logikai részeiről, a képekről, táblázatokról, bekezdésekről. Ez az információ a PDF-címkékben kerül kódolásra, és a szöveg további felhasználásakor nyer különös jelentőséget. Ha pl. egy tagged (=cimkézett) PDF fájlból a kijelölt szöveget a vágólapon át egy szövegszerkesztőbe illesztjük, vagy exportáljuk az oldal/fájl szövegét valamilyen szövegformátumba, az megőrzi az eredeti bekezdések tagolását, a sorvégi elválasztott szavakat pedig összevonja. Enélkül minden sor végén kemény sortörés szerepel, ami nagyon megnehezíti a további munkát. A kétrétegű formátumnak lényegesen nagyobb a tárhelyigénye, mint a szöveges PDF vagy WORD állományoké, hiszen a szöveg mellett a képet is tartalmazza. Nagyon nehéz döntést jelent a felső réteget alkotó kép mentési paramétereinek meghatározása. Ha az eredeti szkennelt képpel megegyezőre állítjuk be ( DPI színes JPG), egy sok oldalas dokumentum esetén igen nagy PDF fájlok jöhetnek létre. Ha fekete-fehérben mentjük, lényegesen kisebb méretet kapunk, viszont az előforduló színes vagy szürke képek élvezhetetlenek lesznek. Sajnos az OCR programok nem adnak jó automatikus lehetőséget a vegyes mentésre. A gyakorlatban fekete-fehér mentést követően a színes (az eredeti dokumentum rossz minősége miatt fekete-fehérben esetleg olvashatatlan) oldalakat színesben mentjük ki, majd a megfelelő oldalakat az Acrobat Professional program segítségével színesre cseréljük a teljes fekete-fehér állományban. A legújabb programverziók egyik újítása a vegyes raszter tartalom használata (MRC, Mixed raster content) a kimeneti PDF fájlban. Azon a tapasztalaton alapul, hogy a tipikus szöveges oldalak képe egy halvány tónusú, finom átmenetű, további információt nem tartalmazó háttérre, és a szöveges illetve képi információt tartalmazó előtérre szeparálható, amely két réteg eltérő algorítmussal tömöríthető igazán hatékonyan. Az eredmény egy színvilágában az eredetihez közelítő, ám az eredeti színes képhez viszonyítva töredék méretű állomány. Megjegyezzük, hogy nem minden esetben ad ez a módszer vizuálisan szép eredményt, ha fontos a kicsi méret, akkor érdemes vele egy próbát tenni, és csak ha kielégíti az igényeinket, akkor használni. A hosszú távú megőrzéshez egyelőre nem javasolt formátum. Ugyancsak nagyon nehezen eldönthető kérdés, hogy mi legyen egy PDF fájlban. A mi javaslatunk, jól bevált gyakorlatunk az, hogy egy fizikai kötet, mappa alkosson egy PDF fájlt. Kétségtelen, hogy ez időnként igen nagy méretű, emiatt időnként nehezen állítható elő és a kezelése sem egyszerű. Az ettől eltérő más módszerek (oldalanként, cikkenként, fejezetenként egy PDF) kétségtelenül kisebbek, viszont igen nagy számuk miatt ugyancsak nehezen kezelhetők. Szükség esetén el lehet térni az egy kötet = egy PDF szabálytól. Például előfordulhat, hogy egy folyóirat egy évfolyamát két kötetbe kötötték, de ettől függetlenül folyamatos oldalszámozású. Ekkor, ha a fájl méretei ezt lehetővé teszik, érdemes lehet összevonni a két kötetet egy PDF fájlba. Egy kötet több részre osztása akkor indokolt, ha kezelhetetlenül nagy méretű az állomány (nagy alakú, színes), ekkor kénytelenek vagyunk 2 vagy több részre osztani, két vagy több PDF-be menteni az anyagot. PDF kezelés Miután előállítottuk a végleges (fekete-fehér és színes) PDF állományokat, számos egyéb teendőnk van. Egyrészt a PDF fájl tulajdonságaiban a Title (Cím) és az Author (Szerző) mezőben adjuk meg a kötet azonosító adatait! Ez lehet egy könyv címe, és szerzője, de egy folyóirat neve, évfolyama is. A későbbiekben a PDF megjelenítésekor, azonosításakor (a beállításoktól függően) vagy ez a szöveg, vagy a PDF file neve fog szerepelni. Amennyiben a kötetünknek értelmes belső szerkezete van, helyezzünk el benne könyvjelzőket (bookmark), hogy jobban tudjunk navigálni a kötetben. Jellemző könyvjelzők: könyv fejezetcímei (pl. 1. fejezet. Magyarország története) folyóirat lapszámok (pl. 51. szám december 23.) jegyzőkönyv esetén az ülésnap dátuma, témája cikk szerző, cím: tanulmányköteteknél fontos felvenni az adott cikk adatait (pl. Borsa Iván: Középkori oklevelek)

DIGITALIZÁLÁSI STRATÉGIÁJA

DIGITALIZÁLÁSI STRATÉGIÁJA A THURY-VÁR NONPROFIT KFT. KRÚDY GYULA VÁROSI KÖNYVTÁR DIGITALIZÁLÁSI STRATÉGIÁJA 2015 Összeáll. Budai László könyvtárvezető, szakmai ig. h. Jóváhagyta: Pappné Csővári Zsófia ügyvezető ig. Érvényes: 2015.

Részletesebben

Képszerkesztés elméleti kérdések

Képszerkesztés elméleti kérdések Képszerkesztés elméleti kérdések 1. A... egyedi alkotó elemek, amelyek együttesen formálnak egy képet.(pixelek) a. Pixelek b. Paletták c. Grafikák d. Gammák 2. Az alábbiak közül melyik nem színmodell?

Részletesebben

Képszerkesztés elméleti feladatainak kérdései és válaszai

Képszerkesztés elméleti feladatainak kérdései és válaszai Képszerkesztés elméleti feladatainak kérdései és válaszai 1. A... egyedi alkotóelemek, amelyek együttesen formálnak egy képet. Helyettesítse be a pixelek paletták grafikák gammák Helyes válasz: pixelek

Részletesebben

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása Előadók: Toldi Klára Vincze Andrea 1 Előzmények 1997-2002 A nemzetközi könyvtári trendek hatására a hazai könyvtárügyben is megjelenik az informatika

Részletesebben

HITELES MÁSOLATKÉSZÍTÉSI REND

HITELES MÁSOLATKÉSZÍTÉSI REND BOLEVÁCZ ÉS VÖRÖS ÜGYVÉDI IRODA 1053 Budapest, Veres Pálné utca 9. I/2. Budapesti Ügyvédi Kamara 2291 HITELES MÁSOLATKÉSZÍTÉSI REND Kiadás dátuma 2015. február 20. 1 TARTALOM 1. A másolatkészítési rend

Részletesebben

MÁSOLATKÉSZÍTÉSI REND

MÁSOLATKÉSZÍTÉSI REND MÁSOLATKÉSZÍTÉSI REND Gyollai Ügyvédi Iroda Irodavezető: Dr. Gyollai János ügyvéd Székhely: H-1126 Budapest, Ugocsa u. 4/b Tel.: (+36 1) 487-8715 Fax: (+36 1) 487-8701 E-mail: iroda@gyollai.hu Készítés

Részletesebben

4. Javítás és jegyzetek

4. Javítás és jegyzetek és jegyzetek Schulcz Róbert schulcz@hit.bme.hu A tananyagot kizárólag a BME hallgatói használhatják fel tanulási céllal. Minden egyéb felhasználáshoz a szerző engedélye szükséges! 1 Automatikus javítás

Részletesebben

72-74. Képernyő. monitor

72-74. Képernyő. monitor 72-74 Képernyő monitor Monitorok. A monitorok szöveg és grafika megjelenítésére alkalmas kimeneti (output) eszközök. A képet képpontok (pixel) alkotják. Általános jellemzők (LCD) Képátló Képarány Felbontás

Részletesebben

A képek feldolgozásáról

A képek feldolgozásáról A képek feldolgozásáról Úgy gondoljuk joggal tételezzük fel, hogy a digitális fotótechnika elterjedésének köszönhetően nagyon sokan készítenek fotókat a különböző alkalmakkor a településeken. A régi papírképek

Részletesebben

kompakt fényképezőgép

kompakt fényképezőgép kompakt fényképezőgép A digitális fényképezőgépek legszélesebb kategóriája, minden olyan, viszonylag kis méretű gép ide sorolható, amely egymagában sokféle fotós feladatra alkalmas. Előnyük a relatíve

Részletesebben

Anyagleadási feltételek (széles formátum) Technikai paraméterek: Tisztelt Partnerünk!

Anyagleadási feltételek (széles formátum) Technikai paraméterek: Tisztelt Partnerünk! Anyagleadási feltételek (széles formátum) Tisztelt Partnerünk! Rövid tájékoztatónk azt a célt szolgálja, hogy a megadott információk alapján, az alábbi paraméterek segítségükre legyenek a gördülékeny gyártásban.

Részletesebben

Optikai szövegfelismerő program. ABBYY FineReader. 9.0 változat Felhasználói kézikönyv. 2008 ABBYY. Minden jog fenntartva.

Optikai szövegfelismerő program. ABBYY FineReader. 9.0 változat Felhasználói kézikönyv. 2008 ABBYY. Minden jog fenntartva. Optikai szövegfelismerő program ABBYY FineReader 9.0 változat Felhasználói kézikönyv 2008 ABBYY. Minden jog fenntartva. Az ebben a dokumentumban szereplő információk értesítés nélkül megváltozhatnak, és

Részletesebben

Sharpdesk Információs útmutató

Sharpdesk Információs útmutató Sharpdesk Információs útmutató Tartsa meg ezt a kézikönyvet, mivel nagyon fontos információkat tartalmaz. Sharpdesk sorozatszámok Ez a termék csak a licencekkel megegyező számú számítógépre telepíthető.

Részletesebben

Ismerkedés az új felülettel

Ismerkedés az új felülettel Ismerkedés az új felülettel A 2003-as verzióhoz képes változott a menüszerkezet. Az ablak tetején menüszalag található, amely előtérbe helyezi a legfontosabb parancsokat, így nem kell a program legkülönbözőbb

Részletesebben

A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK

A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK Boross István MNL Veszprém Megyei Levéltára Juhász Zoltán Pannon Egyetem Budapest Főváros Levéltára, 2014. május 6. MÓDSZERTANI

Részletesebben

Alapvető beállítások elvégzése Normál nézet

Alapvető beállítások elvégzése Normál nézet Alapvető beállítások elvégzése Normál nézet A Normál nézet egy egyszerűsített oldalképet mutat. Ez a nézet a legalkalmasabb a szöveg beírására, szerkesztésére és az egyszerűbb formázásokra. Ebben a nézetben

Részletesebben

Dokumentumok Information kezelése? Management Információ - management. Professzionális dokumentumkezelés hiteles másolat készítés. Offisys Kft.

Dokumentumok Information kezelése? Management Információ - management. Professzionális dokumentumkezelés hiteles másolat készítés. Offisys Kft. Dokumentumok Information kezelése? Management Információ - management Professzionális dokumentumkezelés hiteles másolat készítés Offisys Kft. 2014.10.16 Professzionális dokumentum menedzsment Rendszerezetten

Részletesebben

PDF. Tartalomjegyzék 1/21

PDF. Tartalomjegyzék 1/21 PDF Napjainkban a publikálás elterjedt formája a PDF dokumentumok előállítása. A weben ez szinte szabvánnyá vált hosszú dokumentumok esetén. Akkor is nagyon hasznos lehet, ha a gondosan megformázott word

Részletesebben

Számítógépes grafika

Számítógépes grafika Számítógépes grafika HEFOP 3.5.1 Korszerű felnőttképzési módszerek kifejlesztése és alkalmazása EMIR azonosító: HEFOP-3.5.1-K-2004-10-0001/2.0 Tananyagfejlesztő: Máté István Lektorálta: Brückler Tamás

Részletesebben

1. kép. A Stílus beállítása; új színskála megadása.

1. kép. A Stílus beállítása; új színskála megadása. QGIS Gyakorló Verzió: 1.7. Wroclaw Cím: A Print composer használata és a címkézés. Minta fájl letöltése innen: http://www.box.net/shared/87p9n0csad Egyre több publikációban szerepelnek digitális térképek,

Részletesebben

i4x50 sorozatú szkennerek

i4x50 sorozatú szkennerek i4x50 sorozatú szkennerek Szkennelésbeállítási útmutató TWAIN alkalmazásokhoz A-61839_hu A TWAIN adatforrás használata A szkennelést ellenőrző eszköz elindítása... 2 A szkennelést ellenőrző eszköz párbeszédpanele...

Részletesebben

6.1.1.2 Új prezentáció létrehozása az alapértelmezés szerinti sablon alapján.

6.1.1.2 Új prezentáció létrehozása az alapértelmezés szerinti sablon alapján. 6. modul Prezentáció A modul a prezentációkészítéshez szükséges ismereteket kéri számon. A sikeres vizsga követelményei: Tudni kell prezentációkat létrehozni és elmenteni különböző fájl formátumokban A

Részletesebben

Az MS Excel táblázatkezelés modul részletes tematika listája

Az MS Excel táblázatkezelés modul részletes tematika listája Az MS Excel táblázatkezelés modul részletes tematika listája A táblázatkezelés alapjai A táblázat szerkesztése A táblázat formázása A táblázat formázása Számítások a táblázatban Oldalbeállítás és nyomtatás

Részletesebben

Szövegszerkesztés Word XP-vel. Tanmenet

Szövegszerkesztés Word XP-vel. Tanmenet Szövegszerkesztés Word XP-vel Tanmenet Szövegszerkesztés Word XP-vel TANMENET- Szövegszerkesztés Word XP-vel Témakörök Javasolt óraszám 1. Bevezetés a Word XP használatába 2. Szöveg bevitele és módosítása

Részletesebben

KnowledgeTree dokumentumkezelő rendszer

KnowledgeTree dokumentumkezelő rendszer KnowledgeTree dokumentumkezelő rendszer Budapest, 2011. január 11. Tartalomjegyzék Tartalomjegyzék... 2 Dokumentum információ... 3 Változások... 3 Bevezetés... 4 Funkciók... 5 Felhasználói felület... 5

Részletesebben

1. tétel. A kommunikáció információelméleti modellje. Analóg és digitális mennyiségek. Az információ fogalma, egységei. Informatika érettségi (diák)

1. tétel. A kommunikáció információelméleti modellje. Analóg és digitális mennyiségek. Az információ fogalma, egységei. Informatika érettségi (diák) 1. tétel A kommunikáció információelméleti modellje. Analóg és digitális mennyiségek. Az információ fogalma, egységei Ismertesse a kommunikáció általános modelljét! Mutassa be egy példán a kommunikációs

Részletesebben

Felhasználói menütérkép

Felhasználói menütérkép Másolás Másolás Kimenet színe Auto érzékelés Fekete-fehér Színes Egyszínű Kicsinyítés/nagyítás Arányos % Független X-Y% Auto középre Változtatható % Előbeállítások Papírkészlet Kétoldalas másolás 1-1 oldalas

Részletesebben

A HunTéka elektronikus könyvtár modulja

A HunTéka elektronikus könyvtár modulja A HunTéka elektronikus könyvtár modulja A HunTéka integrált könyvtári rendszer 2002-ben debütált az MTA SZTAKI és az ikron Kft. több éves közös fejlesztésének eredményeként. Jelenleg több mint 44 intézményben

Részletesebben

Általános tájékoztató szolgáltatások megrendeléséhez

Általános tájékoztató szolgáltatások megrendeléséhez Rólunk A dinamikusan fejlődő digitális könyvpiac egyre növekvő kulturális és gazdasági jelentősségre tesz szert. Az Egora Kiadó Kft. fő célkitűzése, hogy a hazai ügyfelek számára hatékony és elérhető megoldásokat

Részletesebben

Oktatási segédanyag. Weboldalszerkesztési gyakorlatok

Oktatási segédanyag. Weboldalszerkesztési gyakorlatok Oktatási segédanyag Weboldalszerkesztési gyakorlatok Bevezetés A korábbi oktatási segédanyagokban megismertük a weboldalszerkesztés gyakorlatát. Ennek a segédanyagnak a célja, hogy gyakorlati példákon

Részletesebben

Word I. Bevezető. Alapfogalmak

Word I. Bevezető. Alapfogalmak Word I. Bevezető A szövegszerkesztők segítségével igényesen kialakított dokumentum készítésére van lehetőségünk, de használhatjuk levelek akár elektronikus levelek írására is. Tananyagunkkal a szövegszerkesztési

Részletesebben

TERC V.I.P. hardverkulcs regisztráció

TERC V.I.P. hardverkulcs regisztráció TERC V.I.P. hardverkulcs regisztráció 2014. második félévétől kezdődően a TERC V.I.P. költségvetés-készítő program hardverkulcsát regisztrálniuk kell a felhasználóknak azon a számítógépen, melyeken futtatni

Részletesebben

Képszerkesztés. Letölthető mintafeladatok gyakorláshoz: Minta teszt 1 Minta teszt 2. A modul célja

Képszerkesztés. Letölthető mintafeladatok gyakorláshoz: Minta teszt 1 Minta teszt 2. A modul célja Képszerkesztés Letölthető mintafeladatok gyakorláshoz: Minta teszt 1 Minta teszt 2 A modul célja Az ECDL Képszerkesztés alapfokú követelményrendszerben (Syllabus 1.0) a vizsgázónak értenie kell a digitális

Részletesebben

TÉRINFORMATIKA II. Dr. Kulcsár Balázs Ph.D. adjunktus. Debreceni Egyetem Műszaki Kar Műszaki Alaptárgyi Tanszék

TÉRINFORMATIKA II. Dr. Kulcsár Balázs Ph.D. adjunktus. Debreceni Egyetem Műszaki Kar Műszaki Alaptárgyi Tanszék TÉRINFORMATIKA II. Dr. Kulcsár Balázs Ph.D. adjunktus Debreceni Egyetem Műszaki Kar Műszaki Alaptárgyi Tanszék MÁSODLAGOS ADATNYERÉSI ELJÁRÁSOK Meglévő (analóg) térképek manuális digitalizálása 1 A meglévő

Részletesebben

PC-Kismester verseny első forduló feladatai. Beküldési határidő: 2014. december 6.

PC-Kismester verseny első forduló feladatai. Beküldési határidő: 2014. december 6. PC-Kismester XVIII. informatikai verseny feladatok 1. oldal, összesen: 5 5-8. osztály PC-Kismester verseny első forduló feladatai Beküldési határidő: 2014. december 6. Informatikai alapismeretek 1. A felsoroltak

Részletesebben

I. Internetes keresési feladatok (ajánlott idő: 20 perc)

I. Internetes keresési feladatok (ajánlott idő: 20 perc) I. Internetes keresési feladatok (ajánlott idő: 20 perc) A talált oldalak internet címét (URL) másold ki egy szöveges dokumentumba és mentsd Csapatnev_internet néven! A konkrét válaszokat ide a papírra

Részletesebben

Telenor Magyarország Távközlési Zrt.

Telenor Magyarország Távközlési Zrt. Telenor Magyarország Távközlési Zrt. 2045 Törökbálint, Pannon út 1. Másolatkészítési rend 1/8. oldal Tartalomjegyzék 1. A másolatkészítési rend célja... 3 2. A másolatkészítési rend tárgya... 3 3. A másolatkészítési

Részletesebben

1.1.1 Dátum és idő függvények

1.1.1 Dátum és idő függvények 1.1.1 Dátum és idő függvények Azt már tudjuk, hogy két dátum különbsége az eltelt napok számát adja meg, köszönhetően a dátum tárolási módjának az Excel-ben. Azt is tudjuk a korábbiakból, hogy a MA() függvény

Részletesebben

1. Digitális írástudás: a kőtáblától a számítógépig 2. Szedjük szét a számítógépet 1. örök 3. Szedjük szét a számítógépet 2.

1. Digitális írástudás: a kőtáblától a számítógépig 2. Szedjük szét a számítógépet 1. örök 3. Szedjük szét a számítógépet 2. Témakörök 1. Digitális írástudás: a kőtáblától a számítógépig ( a kommunikáció fejlődése napjainkig) 2. Szedjük szét a számítógépet 1. ( a hardver architektúra elemei) 3. Szedjük szét a számítógépet 2.

Részletesebben

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika Budapesti Egyetemi Katolikus Gimnázium és Kollégium ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika Reischlné Rajzó Zsuzsanna Szaktanár Endrédi Józsefné Igazgató Kelt: Budapest, 2012 március 1. tétel A kommunikáció

Részletesebben

Szövegszerkesztés alapok WORD Formázások

Szövegszerkesztés alapok WORD Formázások Szövegszerkesztés alapok WORD Formázások A formázás sorrendje 1. Begépelem a szöveget folyamatosan 2. Helyesírást ellenőrzök 3. Entert (bekezdés) vagy Shift + Entert ütök 4. Formázok KIJELÖLÖM A FORMÁZANDÓ

Részletesebben

A számítógépek felépítése. A számítógép felépítése

A számítógépek felépítése. A számítógép felépítése A számítógépek felépítése A számítógépek felépítése A számítógépek felépítése a mai napig is megfelel a Neumann elvnek, vagyis rendelkezik számoló egységgel, tárolóval, perifériákkal. Tápegység 1. Tápegység:

Részletesebben

Microsoft Excel 2010

Microsoft Excel 2010 Microsoft Excel 2010 Milyen feladatok végrehajtására használatosak a táblázatkezelők? Táblázatok létrehozására, és azok formai kialakítására A táblázat adatainak kiértékelésére Diagramok készítésére Adatbázisok,

Részletesebben

NGP Áttekintés. GEMSYS EUROPE Kft. 1147 Budapest, Gervay u. 92. www.muratec.hu www.gemsys.hu

NGP Áttekintés. GEMSYS EUROPE Kft. 1147 Budapest, Gervay u. 92. www.muratec.hu www.gemsys.hu NGP Áttekintés GEMSYS EUROPE Kft. 1147 Budapest, Gervay u. 92. www.muratec.hu www.gemsys.hu Tartalom Mi az NGP? Miért az 1.szegmensű fax gép a kiválasztott? Milyen funkciókat kínál az NGP-vel ellátott

Részletesebben

i5000 sorozatú szkennerek

i5000 sorozatú szkennerek i5000 sorozatú szkennerek Vezérlő kód információk _hu Vezérlőkód információk Tartalomjegyzék Vezérlő minta részletek... 4 Vezérlő minta tájolás... 5 Vonalkód részletek... 7 Vezérlő pozícionálása... 9 Papír

Részletesebben

StartÜzlet online számlázó modul Használati Útmutató

StartÜzlet online számlázó modul Használati Útmutató StartÜzlet online számlázó modul Használati Útmutató 1 Tartalomjegyzék Alapvető tudnivalók...3 Használatba vétel előtt megadandó és ellenőrizendő adatok...3 Alanyi adómentes vállalkozás esetén...3 Számla

Részletesebben

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1 Enterprise extended Output Management exom - Greendoc Systems Kft. 1 exom - Greendoc Systems Kft. 2 Sokféle bementi adatformátum kezelése Adatok fogadása különböző csatornákon Előfeldolgozás: típus meghatározás,

Részletesebben

Office 2007 teszt. Question 1 Válassza ki, milyen típusú SmartArt objektumok NEM készíthetők az alábbiak közül!

Office 2007 teszt. Question 1 Válassza ki, milyen típusú SmartArt objektumok NEM készíthetők az alábbiak közül! Office 2007 teszt Question 1 Válassza ki, milyen típusú SmartArt objektumok NEM készíthetők az alábbiak közül! a. Hierarchia b. Kapcsolatok c. Mátrix d. Folyamatok e. Gantt-chart Question 2 Az Access 2007-ben

Részletesebben

EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE

EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE Boross István MNL Veszprém Megyei Levéltára Juhász Zoltán Pannon Egyetem MNL Veszprém Megyei Levéltára, 2014. május 20. A MÓDSZERTANI

Részletesebben

Gábor Dénes Számítástechnikai Emlékverseny 2014/2015 Alkalmazói kategória, I. korcsoport 2. forduló

Gábor Dénes Számítástechnikai Emlékverseny 2014/2015 Alkalmazói kategória, I. korcsoport 2. forduló Gábor Dénes Számítástechnikai Emlékverseny 2014/2015 Alkalmazói kategória, I. korcsoport 2. forduló Kedves Versenyző! A feladatsor megoldására 90 perc áll rendelkezésre. A feladatok megoldásához használható

Részletesebben

Felhasználói kézikönyv

Felhasználói kézikönyv Felhasználói kézikönyv 3060 Lézeres távolságmérő TARTALOMJEGYZÉK ELEM CSERÉJE... 3 A KÉSZÜLÉK FELÉPÍTÉSE... 3 A KIJELZŐ FELÉPÍTÉSE... 3 MŰSZAKI JELLEMZŐK... 4 LÉZERES CÉLZÓ BEKAPCSOLÁSA... 4 MÉRÉSI TÁVOLSÁG...

Részletesebben

A digitális képfeldolgozás alapjai

A digitális képfeldolgozás alapjai A digitális képfeldolgozás alapjai Digitális képfeldolgozás A digit szó jelentése szám. A digitális jelentése, számszerű. A digitális információ számokká alakított információt jelent. A számítógép a képi

Részletesebben

A DALNET24 projekt aktualitásai

A DALNET24 projekt aktualitásai GISopen 2015. Székesfehérvár 2015. március 27. Doroszlai Tamás FÖMI-FFÜO ov Földmérési és Távérzékelési Intézet Digitális földhivatal Földhivatali elektronikus dokumentum kezelés Az elektronikus dokumentum

Részletesebben

Di1611/Di2011. KEZELÉSI ÚTMUTATÓ: Twain

Di1611/Di2011. KEZELÉSI ÚTMUTATÓ: Twain Di1611/Di2011 KEZELÉSI ÚTMUTATÓ: Twain Driver Tartalomjegyzék Tartalomjegyzék 1 A PC szkennelés beállítása 2 Csatlakozás az USB portra 3 A TWAIN meghajtó telepítése 3.1 A TWAIN meghajtó telepítése Plug

Részletesebben

ELO kliens funkciók összehasonlítása

ELO kliens funkciók összehasonlítása funkciók összehasonlítása összehasonlítás Java Web mobil Platform független Kliens telepítés szükséges (és Webstart) Unicode képes Vonalkód támogatása Dokumentumok egyenkénti vagy összefűzött szkennelése

Részletesebben

Felhasználói segédlet

Felhasználói segédlet Felhasználói segédlet Debrecen Megyei Jogú Város civil szervezeti számára pályázatok Civil Alapból, Kulturális Alapból és Ifjúságpolitikai Alapból történő finanszírozásának online igényléséhez 2013/04/02/

Részletesebben

PTE PMMF Közmű- Geodéziai Tanszék

PTE PMMF Közmű- Geodéziai Tanszék digitális állományok átvétele, meglévő térképek digitalizálása, meglévő térképek, légifelvételek, illetve speciális műszaki rajzi dokumentációk szkennelése és transzformálása. A leggyorsabb, legolcsóbb

Részletesebben

KARAKTERFELISMERÉS AZ EVASYS-BEN

KARAKTERFELISMERÉS AZ EVASYS-BEN KARAKTERFELISMERÉS AZ EVASYS-BEN HOL HASZNÁLHATÓ, KI HASZNÁLHATJA A Miskolci Egyetem megvásárolta a kézírásfelismerés (ICR) modult az Evasys legutóbbi licencével együtt. Ezzel lehetőség nyílt a papír alapú

Részletesebben

Programozás alapjai Bevezetés

Programozás alapjai Bevezetés Programozás alapjai Bevezetés Miskolci Egyetem Általános Informatikai Tanszék Programozás alapjai Bevezetés SWF1 / 1 Tartalom A gépi kódú programozás és hátrányai A magas szintÿ programozási nyelv fogalma

Részletesebben

Egyes esetekben e fejezet keretében készítjük el a Tartalomjegyzéket is, melynek technikai megvalósításáról majd az 5.6.6. fejezetben olvashat.

Egyes esetekben e fejezet keretében készítjük el a Tartalomjegyzéket is, melynek technikai megvalósításáról majd az 5.6.6. fejezetben olvashat. Szövegszerkesztés 1. Bevezetés Ebben a modulban a szövegszerkesztési szabályokat kívánjuk bemutatni. Feltételezzük, az olvasó már ismer legalább egy szövegszerkesztő programot, így annak teljes körű bemutatására

Részletesebben

Szakértő díjjegyzék összeállító program

Szakértő díjjegyzék összeállító program Szakértő díjjegyzék összeállító program Általános tájékoztató Szakértőknek csak a 3/1986. (II. 21.) IM rendelet (a továbbiakban: Díjrendelet) szerinti díjakat lehet elszámolni, korábbi tapasztalatok alapján

Részletesebben

MISKEI VENDEL TIPPEK ÉS TRÜKKÖK GÖMBPANORÁMA KÉSZÍTÉSÉHEZ I. 2007 Panorámakép készítése tükörtechnikával Nagyon érdekesnek tartom a gömbpanorámákat, ezért kerestem egy olyan egyszerű módszert, amivel viszonylag

Részletesebben

18. Szövegszerkesztők

18. Szövegszerkesztők 18. Szövegszerkesztők A szövegszerkesztés olyan számítógépes művelet, amelynek során később nyomtatásban megjelenő szövegegységeket, dokumentumokat hozunk létre, majd azokat papírra kinyomtatjuk. A különböző

Részletesebben

ECDL Információ és kommunikáció

ECDL Információ és kommunikáció 1. rész: Információ 7.1 Az internet 7.1.1 Fogalmak és szakkifejezések 7.1.2 Biztonsági megfontolások 7.1.3 Első lépések a webböngésző használatában 7.1.4 A beállítások elévégzése 7.1.1.1 Az internet és

Részletesebben

Az MS Word szövegszerkesztés modul részletes tematika listája

Az MS Word szövegszerkesztés modul részletes tematika listája Az MS Word szövegszerkesztés modul részletes tematika listája A szövegszerkesztés alapjai Karakter- és bekezdésformázás Az oldalbeállítás és a nyomtatás Tabulátorok és hasábok A felsorolás és a sorszámozás

Részletesebben

Gyakorló 9. feladat megoldási útmutató

Gyakorló 9. feladat megoldási útmutató Gyakorló 9. feladat megoldási útmutató 1. Minek a leírása a következő? Aktív hálózati hardver eszközök (pl.: routerek) és szoftverek segítségével létrehozott biztonsági rendszer két hálózat (jellemzően

Részletesebben

DuneHD.hu. Kompatibilis médialejátszók: Dune HD Center Dune BD Prime Dune HD Base 2.0 Dune HD Base 3.0 Dune BD Prime 3.0

DuneHD.hu. Kompatibilis médialejátszók: Dune HD Center Dune BD Prime Dune HD Base 2.0 Dune HD Base 3.0 Dune BD Prime 3.0 A Zappiti egy donationware, vagyis ingyenes program, mellyel kibővítheted Dune médialejátszód képességeit. A leírás a Zappiti 1.2.1 Beta változata alapján készült. Kompatibilis médialejátszók: Dune HD

Részletesebben

QGIS tanfolyam (ver.2.0)

QGIS tanfolyam (ver.2.0) QGIS tanfolyam (ver.2.0) I. Rétegkezelés, stílusbeállítás 2014. január-február Összeállította: Bércesné Mocskonyi Zsófia Duna-Ipoly Nemzeti Park Igazgatóság A QGIS a legnépszerűbb nyílt forráskódú asztali

Részletesebben

Fárasztó a gépelés? Nehéz helyet találni? Sokáig tart megtalálni? Az adatrögzítés elvesztegetett idő, bízza inkább szoftverünkre.

Fárasztó a gépelés? Nehéz helyet találni? Sokáig tart megtalálni? Az adatrögzítés elvesztegetett idő, bízza inkább szoftverünkre. Fárasztó a gépelés? Nehéz helyet találni? Az adatrögzítés elvesztegetett idő, bízza inkább szoftverünkre. Sokáig tart megtalálni? Naponta 1 db dokumentum előkeresése és visszahelyezése 7 perc, évente 5

Részletesebben

3. modul - Szövegszerkesztés

3. modul - Szövegszerkesztés 3. modul - Szövegszerkesztés - 1-3. modul - Szövegszerkesztés Az alábbiakban ismertetjük a 3. modul (Szövegszerkesztés) syllabusát, amely a modulvizsga követelményrendszere. A modul célja Ezen a vizsgán

Részletesebben

Ismerkedés az Office 2007 felhasználói felületével

Ismerkedés az Office 2007 felhasználói felületével Ismerkedés az Office 2007 felhasználói felületével A szalag kezelése Az új Fájl File menü A Gyorselérési eszköztár Az új nézetvezérlő elemek Összefoglalás Tudnivalók a Windows XP-t használó olvasók számára

Részletesebben

ECDL képzés tematika. Operáció rendszer ECDL tanfolyam

ECDL képzés tematika. Operáció rendszer ECDL tanfolyam Operáció rendszer ECDL tanfolyam Alapok A Windows áttekintése Asztal Tálca Start menü Lomtár használata Súgó használata Felhasználói fiókok kezelése Kijelentkezés, felhasználóváltás Fájlok és mappák Sajátgép

Részletesebben

Újdonságok az SDL Trados Studio 2009 SP2-ben

Újdonságok az SDL Trados Studio 2009 SP2-ben Újdonságok az SDL Trados Studio 2009 SP2-ben Szekeres Csaba SDL Trados partner szekeres.csaba@m-prospect.hu M-Prospect Kft. New Platform Internal Training Fókuszban Az SDL Trados Studio 2009 SP2 legfőbb

Részletesebben

Dokumentumformátumok Jelölő nyelvek XML XML. Sass Bálint sass@digitus.itk.ppke.hu. Bevezetés a nyelvtechnológiába 2. gyakorlat 2007. szeptember 20.

Dokumentumformátumok Jelölő nyelvek XML XML. Sass Bálint sass@digitus.itk.ppke.hu. Bevezetés a nyelvtechnológiába 2. gyakorlat 2007. szeptember 20. XML Sass Bálint sass@digitus.itk.ppke.hu Bevezetés a nyelvtechnológiába 2. gyakorlat 2007. szeptember 20. 1 DOKUMENTUMFORMÁTUMOK 2 JELÖLŐ NYELVEK 3 XML 1 DOKUMENTUMFORMÁTUMOK 2 JELÖLŐ NYELVEK 3 XML DOKUMENTUMFORMÁTUMOK

Részletesebben

ECDL Táblázatkezelés. www.nomina3p.hu 1. 4.1.1 A táblázatkezelés első lépései. 4.1.2 Beállítások elvégzése

ECDL Táblázatkezelés. www.nomina3p.hu 1. 4.1.1 A táblázatkezelés első lépései. 4.1.2 Beállítások elvégzése 4.1 Az alkalmazás 4.1.1 A táblázatkezelés első lépései 4.1.2 Beállítások elvégzése 4.1.1.1 A táblázatkezelő alkalmazás megnyitása és bezárása. 4.1.1.2 Egy és több munkafüzet (dokumentum) megnyitása. 4.1.1.3

Részletesebben

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu. MANYE vitaülés 2006. február 20.

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu. MANYE vitaülés 2006. február 20. Oravecz Csaba MTA Nyelvtudományi Intézet {oravecz}@nytud.hu MANYE vitaülés 2006. február 20. Bevezetés Nyelvi erőforrások, szöveges adatbázisok növekvő jelentősége. Bevezetés Nyelvi erőforrások, szöveges

Részletesebben

Technikai információk fejlesztőknek

Technikai információk fejlesztőknek Technikai információk fejlesztőknek Különbségek a Java-s nyomtatványkitöltő program és az Abev2006 között 1. A mezőkód kijelzés bekapcsolása a Szerviz/Beállítások ablakban érhető el. 2. Az xml állományok

Részletesebben

Dokumentáció. IT Worx. Web eszközök Hír box. 1. Első lépések

Dokumentáció. IT Worx. Web eszközök Hír box. 1. Első lépések Dokumentáció IT Worx Web eszközök Hír box 1. Első lépések A szöveg melletti háromszögre kattintva rendezhetjük a hír boxokat abc szerinti növekvő vagy csökkenő sorrendbe: Ha rákattintunk az egyik hír box

Részletesebben

Jel, adat, információ

Jel, adat, információ Kommunikáció Jel, adat, információ Jel: érzékszerveinkkel, műszerekkel felfogható fizikai állapotváltozás (hang, fény, feszültség, stb.) Adat: jelekből (számítástechnikában: számokból) képzett sorozat.

Részletesebben

Láthatósági kérdések

Láthatósági kérdések Láthatósági kérdések Láthatósági algoritmusok Adott térbeli objektum és adott nézőpont esetén el kell döntenünk, hogy mi látható az adott alakzatból a nézőpontból, vagy irányából nézve. Az algoritmusok

Részletesebben

NYOMTATÓK. A nyomtatók fő tulajdonságai. sebesség: felbontás nyomtatóvezérlő nyelv papír kezelés

NYOMTATÓK. A nyomtatók fő tulajdonságai. sebesség: felbontás nyomtatóvezérlő nyelv papír kezelés NYOMTATÓK A nyomtatók fő tulajdonságai sebesség: felbontás nyomtatóvezérlő nyelv papír kezelés 2 1 A nyomtatók sebessége: A nyomtatók sebessége igen széles skálán mozog. Ennek mértékét az 1 perc alatt

Részletesebben

A Paint program használata

A Paint program használata A Paint program használata A Windows rendszerbe épített Paint program segítségével képeket rajzolhat, színezhet és szerkeszthet. A Paint használható digitális rajztáblaként. Egyszerű képek és kreatív projektek

Részletesebben

A FileZilla program beállítása az első belépés alkalmával

A FileZilla program beállítása az első belépés alkalmával 6. A záróvizsga-jegyzőkönyv készítése A záróvizsga-jegyzőkönyveketa Karok többsége a jegyzőkönyvkészítésre Dr. Tánczos László által kifejlesztett Access alkalmazás használatával készíti el. A záróvizsga-jegyzőkönyv

Részletesebben

Kinek szól a könyv? A könyv témája A könyv felépítése Mire van szükség a könyv használatához? A könyvben használt jelölések. 1. Mi a programozás?

Kinek szól a könyv? A könyv témája A könyv felépítése Mire van szükség a könyv használatához? A könyvben használt jelölések. 1. Mi a programozás? Bevezetés Kinek szól a könyv? A könyv témája A könyv felépítése Mire van szükség a könyv használatához? A könyvben használt jelölések Forráskód Hibajegyzék p2p.wrox.com xiii xiii xiv xiv xvi xvii xviii

Részletesebben

TARTALOM PRIMON APP KEZELÔFELÜLET. PRIMON App 6.0 újdonságok. PRIMON App. PRIMON 6.0 és PRIMON App kompatibilis KonicaMinolta eszközök

TARTALOM PRIMON APP KEZELÔFELÜLET. PRIMON App 6.0 újdonságok. PRIMON App. PRIMON 6.0 és PRIMON App kompatibilis KonicaMinolta eszközök TARTALOM 2 3 7 7 8 8 8 9 9 9 10 10 PRIMON APP KEZELÔFELÜLET PRIMON App 6.0 újdonságok PRIMON App PRIMON 6.0 és PRIMON App kompatibilis KonicaMinolta eszközök További újdonságok PRIMON App felület már A4-es

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

A TWAIN adatforrás használata

A TWAIN adatforrás használata A TWAIN adatforrás használata A szkennelést ellenőrző eszköz elindítása... 2 A szkennelést ellenőrző eszköz párbeszédpanele... 2 A TWAIN adatforrás használata... 4 Hogyan fogjak hozzá?... 4 Beállítási

Részletesebben

RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNYEK INFORMATIKÁBÓL

RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNYEK INFORMATIKÁBÓL RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNYEK INFORMATIKÁBÓL 1. Információs társadalom 1.1. A kommunikáció 1.1.1. A jelek csoportosítása 1.1.2. Kód, kódolás, bináris kód 1.1.3. A kommunikáció általános modellje

Részletesebben

Telepítési útmutató a Solid Edge ST7-es verziójához Solid Edge

Telepítési útmutató a Solid Edge ST7-es verziójához Solid Edge Telepítési útmutató a Solid Edge ST7-es verziójához Solid Edge Tartalomjegyzék Bevezetés 2 Szükséges hardver és szoftver konfiguráció 3 Testreszabások lementése előző Solid Edge verzióból 4 Előző Solid

Részletesebben

1. oldal, összesen: 5

1. oldal, összesen: 5 1. oldal, összesen: 5 Elmélet Word 1. Döntse el az alábbi állításról, hogy a tagmondatok tartalma igaz-e, s A WORD helyesírás-ellenőrző rendszere minden helyesírási hibánkat kijavítja, mert felismeri,

Részletesebben

Szendi Attila Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2015 Sárospatak

Szendi Attila Miskolci Egyetem Könyvtár, Levéltár, Múzeum. Networkshop 2015 Sárospatak Teljes szövegű tartalmak másolásvédett üzemmódú szolgáltatása a Miskolci Egyetem Könyvtár, Levéltár, Múzeumában, nyílt forráskódú, alacsony költségű informatikai rendszerekkel. Szendi Attila Miskolci Egyetem

Részletesebben

TÉTELSOR INFORMATIKÁBÓL 2008/2009-es tanév

TÉTELSOR INFORMATIKÁBÓL 2008/2009-es tanév TÉTELSOR INFORMATIKÁBÓL 2008/2009-es tanév Budapest, 2009. május 29. Összeállította: Nagy-Szakál Zoltán 1. Információ és társadalom a. Ismertesse a mechanikus számológépek fejlődését! b. Ismertesse a mechanikus

Részletesebben

elektronikus adattárolást memóriacím

elektronikus adattárolást memóriacím MEMÓRIA Feladata A memória elektronikus adattárolást valósít meg. A számítógép csak olyan műveletek elvégzésére és csak olyan adatok feldolgozására képes, melyek a memóriájában vannak. Az információ tárolása

Részletesebben

Rendszám felismerő rendszer általános működési leírás

Rendszám felismerő rendszer általános működési leírás Rendszám felismerő rendszer általános működési leírás Creativ Bartex Solution Kft. 2009. A rendszer funkciója A rendszer fő funkciója elsősorban parkolóházak gépkocsiforgalmának, ki és beléptetésének kényelmesebbé

Részletesebben

BODROGKOZ.COM / HASZNÁLATI ÚTMUTATÓ

BODROGKOZ.COM / HASZNÁLATI ÚTMUTATÓ BODROGKOZ.COM / HASZNÁLATI ÚTMUTATÓ 1. Adminisztrációs felület elérhetősége: http://www.bodrogkoz.com/wp-admin/ vagy http://www.bodrogkoz.com/wp-login.php A honlap tesztidőszak alatt az alábbi címen érhető

Részletesebben

18. Fővárosi Informatika Alkalmazói Verseny

18. Fővárosi Informatika Alkalmazói Verseny 18. Fővárosi nformatika Alkalmazói Verseny SZÖVEGSZERKESZTÉS Elméleti feladatlap Neved:... Kerületed:... 1. Keresd meg az összetartozó fogalmakat, majd írd a táblázatba megoldást!../ 10 pont 1) dual core

Részletesebben

KOVÁCS BÉLA, MATEMATIKA I.

KOVÁCS BÉLA, MATEMATIKA I. KOVÁCS BÉLA, MATEmATIkA I. 1 I. HALmAZOk 1. JELÖLÉSEk A halmaz fogalmát tulajdonságait gyakran használjuk a matematikában. A halmazt nem definiáljuk, ezt alapfogalomnak tekintjük. Ez nem szokatlan, hiszen

Részletesebben

Programtervezés. Dr. Iványi Péter

Programtervezés. Dr. Iványi Péter Programtervezés Dr. Iványi Péter 1 A programozás lépései 2 Feladat meghatározás Feladat kiírás Mik az input adatok A megoldáshoz szükséges idő és költség Gyorsan, jót, olcsón 3 Feladat megfogalmazása Egyértelmű

Részletesebben