Digitális dokumentumok ai és s az XSLT-FO Bednarik LászlL szló Miskolci Egyetem Comenius Tanítóképz pző Főiskolai Kar
Miről l lesz szó Háttér XML nyelv Szövegfeldolgozás s dokumentum ai: TEI, DocBook DITA XML dokumentum DITA informáci ciós s típusokt DITA modell XSLT-FO
Háttér Az adatok, informáci ciók k hordozhatósága Digitalizált lt dokumentumaink többft bbféle ai A A Web általánosan használt adata: tuma: HTML nyílt szabvány, bárki b szabadon elolvashatja, letöltheti ltheti PDF a specifikáci cióját t a Adobe közreadta, fejlesztése se nagy szaktudást st igényel.
Háttér Mi az oka, hogy platform-független tárolt rolási okk tumokként mégsem m ezeket szokták emlegetni? Válasz: a ok nem választjv lasztják k szét t a tartalmat a formától. Kísérletek a tartalom és s forma szétv tválasztására
Az SGML nyelv: a dokumentumok formai jellemzőit mindig egy, az SGML állományokon kívüli fájlban f tárolja. t A tartalom és s a forma szétv tválik. Hátrányai a a dokumentum több t fájl f -ból áll, szükséges hozzá egy dokumentumtípus (DTD) definíci ciót t tartalmazó fájl és s XSL fájl.
Szövegfeldolgoz vegfeldolgozás s XML alapokon Mi az XML? Az XML, vagyis extensible Markup Language: bővíthető jelölő nyelv. bővíthető (extensible), saját elemeket lehet deklarálni, lni, jelölő (Markup), az elemek - egy megadott módon - jelöléssel különbk nböztethetőek ek meg egymást stól, nyelv (Language), rögzr gzíthető a szókincs és s a szabály.
Szövegfeldolgoz vegfeldolgozás s XML alapokon A szöveges dokumentumok esetében egyre nagyobb teret hódítanak h az XML alapú ok. Az XML dokumentumok alapvetően en elemekből épülnek fel. elemek: : jelölőkódokkal vannak körülvéve. ve. attribútum: tum: az elem paramétere, entitások: olyan változók,, amelyek más s szöveg elemekre mutatnak.
Szövegfeldolgoz vegfeldolgozás s XML alapokon Az XML alapú dokumentumok újítása a tartalom modularizálásban áll. Az XML nyelv jellegéből l fakadóan an a leíró dokumentum elemei nemcsak oz tumozási informáci ciókat tartalmaznak, hanem a tartalom jellemzésére vonatkozó elemeket is. Ilyen elemek lehetnek többek t között k a Definíci ció, Utasítás, Kérdés elemei is.
Szövegfeldolgoz vegfeldolgozás s dokumentum ai TEI A TEI (Text Encoding Initiative - Szövegk vegkódolási Kezdeményez nyezés) fontos nemzetközi zi projekt, 1987-ben egy angolszász tudományos társast rsaság g indított el. A TEI-t elsősorban sorban általános tartalmú szövegek, szépirodalmi művek, m kritikai kiadások, törtt rténeti források, illetve élőszöveg elektronikus feldolgozására alkalmazzák. k.
Szövegfeldolgoz vegfeldolgozás s dokumentum ai DocBook OASIS szervezet által kidolgozott DocBook szabvány. A szövegfeldolgoz vegfeldolgozás s terület letének másik m nagy, nemzetközileg zileg elismert jelölésrendszere a DocBook általános XML alapú dokumentum, tum, melyet az 1990-es évek közepk zepén n fejlesztettek ki, és s azóta használnak általános témájút dokumentumok és s technikai leírások tárolt rolására. ra.
Szövegfeldolgoz vegfeldolgozás s dokumentum ai A DocBook előnyei Logikus szerkezeti felépítésű,, gép g által értelmezhető,, feldolgozható,, valamint platform- és s nyelv-független, testre szabható és s bővíthetb thető Meglévő és s testre szabható szoftvereszközökkel kkel a DocBook forrásf sfájlból l konvertálhatunk: (X)HTML, HTMLhelp,, PDF, PostScript, RTF, TeX,, TXT okba
Szövegfeldolgoz vegfeldolgozás s dokumentum ai A DocBook rendszer sajátoss tossága, hogy a megjelenítési elemeknél elsődlegesen a Web-es es megjelentést támogatja. t DocBook szabvány főbb f jelölőelemei: elemei: dokumentum hierarchia definiálása (könyv, fejezet, alfejezet,..) egyéb b informáci ciós s elemek (pl. szerző adatai,..) DTD definíci ciós s elemek karakterkészlet definíci ciók meta-információk
Szövegfeldolgoz vegfeldolgozás s dokumentum ai DITA A DITA szabvány 2001-ben jelent meg az IBM cég c által. A Darwin Information Typing Architecture,, egy XML- alapú, end-to to-end architektúra ra a készk szítő,, előáll llító, száll llító - a technikai dokumentáci cióhoz. Darwin: öröklődési és s specializáci ciós s elv, Információs s típusok: t fogalom, feladat, hivatkozás Architektúra: ra: modell a tervezés és s eljárások kiterjesztésére. re.
Digitális tankönyv nyv megtervezése A tananyag tartalmának kiválaszt lasztásasa A tananyagok tagolását t kétfk tféle módon m kell elvégezni. Didaktikai tagolásn snál a tananyag logikai összefüggésrendszerét t vesszük k alapul. Technikai tagolásn snál a tananyag strukturálása, sa, hatékony programozása a cél.
Digitális oktatási anyagok készk szítésese Digitális tankönyv nyv megtervezése Technikai tagolásn snál l a tananyag elemeket a szöveg vegén n belül l meg kell különbk nböztetni. Ilyen elemek: a a szöveges elemek, az adattábla bla-elemek, a a képi k elemek, az akusztikai elemek, és párbeszédes elemek.
Digitális tankönyv nyv megtervezése DITA informáci ció típusok Fogalom (definíci ció) Feladat (tevékenys Hivatkozás (link) kenység, leírás) A téma egy önálló feldolgozási egységet get is jelent. A téma típusok tartalmazzák k a szakterületek alap osztály lyát <téma>, ahonnan öröklik az egységes ges központi k struktúrát. t.
DITA XML dokumentum Téma elemek A témának három eleme van. Az id jellemző a főf téma tag-ben A cím A törzs Ennek lehet több t választhatv lasztható eleme, amelyek közül l sok, nagyon hasonló a HTML elemekhez.
DITA XML dokumentum A DITA 24 elem kategóri riát t különbk nböztet meg. Legfontosabb elemek Topic (11 elem) Task (25 elem) Concept (2 elem) Reference (12 elem) Bookmap contents elements (27 elem) Bookmap metadata elements (33 elem)
DITA XML dokumentum A teljes dokumentum szerkezeti modellje (Topic( Topic) A dokumentum tájékoztatt koztató-apparátus Elő-utószó Mottó Tartalomjegyzék Mutató Hivatkozás Felhasznált lt irodalom OL, UL, DL: : rendezett, rendezetlen, definiciós lista Szövegen belüli li szerkesztési si eljárás
DITA XML dokumentum Fogalmi témákt A fogalmi típus egy speciális téma t elemnek a neve és s téma t szerkezete Rövid leírás: fejezet címen c belüli li alcím Elősz szó: adott rész r kereshetőségei Adott szakasz tájékoztatt koztató-apparátus Elő-ut utószó Mottó Tartalomjegyzék Mutató Hivatkozás Felhasznált lt irodalom A modell a teljes szövegre vonatkozik, akár r ismétl tlődhet a törzsen t belül. l.
DITA XML dokumentum Feladat témákt A feladat típusok speciális téma t elem nevek és téma szerkezet. Egy feladat előfelt feltételét és s egy összefüggést követnek a lépések l (egy sorrendbe helyezett lista specializáci ciója). Minden egyes lépésnek l van egy parancsa, egy választhatv lasztható informáci ciója, egy példa p lépése és s eredmény.
DITA XML dokumentum Témák k szervezése se a térkt rképekkel Az első DITA térkt rkép p az 1, 2 és 3 témát t t szervezi web-es es (HTML) felülett letté. A második m térkt rkép p az 1, 3 és 5 témákat t szervezi nyomtatható (PDF) felülett letté. A harmadik térkt rkép p mind a hat témát t t szervezi súgós felülett letté. A DITA a téma t tartalmat újrafelhasználja, lja, egyedi forrásokk sokká téve azokat.
Előny nyök
Modell
DocBook és s DITA összehasonlításasa
A szöveges dokumentumok megjelenítéséhez stíluslap luslap-nyelveket használunk. A HTML nyelvhez elsősorban sorban CSS (Cascading( Style Sheet) ) stíluslap luslap-nyelvet használunk. Az XML dokumentum formázásához az XSL stíluslap luslap-nyelv terjedt el. Az XSLT az XML struktúrák k közti k átalakításokra használhat lható,, míg m g XSL-FO, egy hagyományos stíluslap lehetőségeit kínálja. k
E két k t technológi giát t egész szíti ki egy harmadik, az ún. XPath (XML Path Language), amely nyelvi kifejezésk skészlet szlet XML dokumentumokban való keresésre, sre, kapcsolódások sok kialakítására. E három h nyelv együttesen alkotja a bővíthetb thető stíluslap luslap-nyelv családot.
1. Egy XML and XSLT dokumentum behelyezése XSLT átalakítóba. 2. Meghatározott szabályok segíts tségével XSLT dokumentumokat, az XSLT átalakítja tja FO dokumentummá. 3. Az FO dokumentumot az FO motor tárolja a memóri riában. 4. Az FO átalakító a formázási szabályoknak megfelelően en nyomtatható PDF dokumentumot készít.
Megvalósítás DITA XML szerkesztők Oxygen Editor XML szerkesztő Syntext Serna Enterprise Adobe FrameMaker 9 XMetal Author Editor
Köszönöm m a figyelmet!