A fejlesztendő tananyagok formai követelményei
Bevezető A pályázatban a tankönyvtár által preferált DocBook formátumot vállaltuk A tankönyvtár kissé speciális DocBook formátumot vár (pl. a képletek esetén) A korábbi pályázat során számos fejlesztési (technikai) tapasztalatot gyűjtöttünk: szerkesztők konverterek
Miért a DocBook? Erről a kérdésről több leírás is van, pl. a tankönyvtár oldalán Talán a legfontosabb indok, hogy olyan formátum kell: Szabványos, nyílt, időtálló Megjelenítéstől független, pl. képernyő, kivetítő, ebook olvasó, tablet, mobil, nyomtatott forma Nagy tömegben könnyen kezelhető (kötegelt feldolgozás)
A DocBookról röviden I. XML, jól strukturált, mint egy jó könyv book bookinfo [part]/chapter/sect1[/ /sect5]/para A part/ /sect5-nek kötelező title -> ebből lesz automatikus tartalomjegyzék Lehet az elején dedication, preface, végén glossary, appendix, kell bibliography (lehet fejezetenként is, minél több adattal)
A DocBookról röviden II. A tényleges szöveg para-ba kerül (néhány kivétel, pl. táblázat enrty-jébe nem kell). Kiemelés, felsorolás, táblázat, ábra, kép, egyenlet, lábjegyzet, hivatkozás Felsorolás, ábra, kép, képlet lehet cím, informal esetén nem kerül bele jegyzékbe A megjelenítést stílus fájl írja le (tankönyvtár), pl. tartalomjegyzék, irodalomjegyzék stb.
Tankönyvtár formai követelményei 4.4-es verzió, UFT-8 Képek images könyvtárba kerüljenek Videók esetén állóképet és szöveges leírást is kell megadni A képletek a DocBook XML-ben id-vel ellátottak, a math könyvtárban lévő képekre hivatkoznak, valamint kellenek MathML fájlok szöveges leírással A meta könyvtárba: Dublin Core, Marc
Videók, képek Miért kell több formában megadni? Egyszerű HTML: videó Nyomtatott forma: (nagy felbontású) kép Egyszerű szöveg, felolvasás: szöveges leírás Kereshetőséget javítja, ha van jó leírás Több felbontású / formátumú videó / kép közül elvileg az adott megjelenítőhöz optimális választható (monitor / tablet / mobil)
A képletek Miért kell három formában megadni? Egyszerű HTML: képként Létezik MathML plugin a böngészőkhöz (HTML5) PDF, MS Word elvileg lehet MathML-ből képlet Egyszerű szöveg, felolvasás esetén a szöveges Egyszerű szövegközi képleteket DocBook formázásával (+Unicode) is le lehet írni pl. x 1 0
MathML I. XML formátum, Unicode Nyílt, fejlődő (jelenleg 3-as verzió) Képletek megjelenítését (Presentation) vagy tartalmát (Content) adja meg Használhatók extra formázási paraméterek, kiemelés (keretek, színek, betűstílus), igazítás
MathML példa: ax 2 +bx+c Presentation* <mrow> <mi>a</mi> <mo> </mo> <msup> <mi>x</mi> <mn>2</mn> </msup> <mo>+</mo> <mi>b</mi> <mo> </mo> <mi>x</mi> <mo>+</mo> <mi>c</mi> </mrow> <!-- Apply func. Invisible Times, Comma, Plus --> Contnet <apply> <plus/> <apply> </apply> <apply> </apply> <times/> <ci>a</ci> <apply> </apply> <times/> <ci>c</ci> </apply> <ci>b</ci> <ci>x</ci> <power/> <ci>x</ci> <cn>2</cn>
MathML II. Hol használják? OpenOffice, LibreOffice, HTML5, MS Word 2007+ OMML, de vágólapra MML Hogyan lehet szerkeszteni? FireMath (Firefox plugin) Formulator MathML Weaver MathType (Design Science), MathMagic Hogyan lehet képpé (png) konvertálni? JEuclid, MathMagic, FireMath
DocBook készítése Szövegszerkesztővel, majd valid., konv. XML szerkesztővel (dtd, xsd alapján automatikus ellenőrzés) DocBook (WYSIWYG) szerkesztő Serna XMLmind Oxygen MS Word, OpenOffice, LibreOffice, LaTeX, majd konvertálás, majd javítás
MS Word Konvertálás I. Jól és egyszerűen formázott dokumentum Stílusok használata: Cím, Címsor1, Címsor2, Nincsenek üres sorok (két enter), több szóköz Színeket, hasábokat, kép körbefuttatásokat, átfedéseket, tartalomjegyzéket el kell távolítani RTF-en keresztül bővített, javított Majix Kis probléma a nagy képekkel Képletek 2007, 2010 OMML -> MML konverzió Sok javítás
Konvertálás II. LibreOffice /OpenOffice Képletek MathML-ben vannak Elvileg tud menteni DocBook XML-be, de alapesetben igen rossz eredményt ad Fejlesztés alatt? Pluginek?
Konvertálás III. LaTeX (tex4ht) LaTeX alapú (nem pdflatex), lényegében a csomagokat újraírva -> hiányos lehet Két konvertálási mód (beágyazott MathML és.png), de nem 1-1 megfeleltetés van köztük! Kevésbé rugalmas képletek esetén (rekurzív?), mint a LaTeX, azaz jól formázott / leírt képletek kellenek
Képletek LaTeX-ből I. A tex4ht rekurzívan elemez, így gond, ha mincsenek párban a zárójelek pl.: $\langle x^{\prime} $ Helyette: $\left\langle x^{\prime}\right\vert$ Vagy pl. $\langle x$ $\rangle$ helyett: $\langle x \rangle$ kell, stb. Általában ilyen WYSIWYG szerkesztők, vagy többszöri átírás miatt keletkeznek
Képletek LaTeX-ből II. Kisebb LaTeX hibák warrningot adnak, és nem okoznak látványos hibát, de konvertálást elrontja pl.: x_{0}{}^{2} Math és nem math környezet keveredése: \[... \] math környezetben egy tabular Subequation (számozással van gond, mert DocBookban nincs ilyen, habár ) Align (számozással van gond)
Mi mit várunk? Amit a tankönyvtár (ld. minta_2005.zip): UTF-8 kódolású, validált 4.4-es DocBook XML-t Kitöltött bookinfo blokkal images könyvtárban képek (jpg, png, gif) images vagy videos* könyvtárban videók (avi, mpg, ), ha van math könyvtárban eq_xxxx.math eq_xxxx.png párokat, ha van meta könyvtárban kitöltött dc.xml, marc.xml fájlokat
Linkek http://www.tankonyvtar.hu/ http://www.docbook.org/ http://www.w3.org/math/ http://www.w3.org/xml/ http://www.w3.org/style/xsl/