XML avagy az univerzális információelérés álma



Hasonló dokumentumok
Dokumentumformátumok Jelölő nyelvek XML XML. Sass Bálint Bevezetés a nyelvtechnológiába 2. gyakorlat szeptember 20.

Web-fejlesztés NGM_IN002_1

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Adatbázis rendszerek 7. előadás State of the art

Mesterséges Intelligencia Elektronikus Almanach

Nyilvántartási Rendszer

Az annotáció elvei. Oravecz Csaba MTA Nyelvtudományi Intézet MANYE vitaülés február 20.

A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES FELDOLGOZÁSA: ADATMODELLEZÉS ÉS SZABVÁNYOK

GIS fejlesztés Web platformra nyílt forráskódú ingyenes eszközökkel

Web-fejlesztés NGM_IN002_1

Siki Zoltán DigiKom Kft. BME ÁFGT. KÖRINFO Konferencia május 28-án

DocBook útmutató. Jeszenszky Péter Debreceni Egyetem, Informatikai Kar

Folyamatmodellezés és eszközei. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása

Aspektus-orientált nyelvek XML reprezentációja. Kincses Róbert Debreceni Egyetem, Informatikai Intézet

Önálló labor feladatkiírásaim tavasz

Az EuroOffice léphet az OpenOffice helyébe?

Intelligens közlekedési rendszerek (ITS)

Kedvenc Ingyenes editorok avagy milyen a programozó jobbkeze? PSPAD editor DEVPHP IDE

Zenetár a webszerverünkön,

13. Fájlformátumok. Schulcz Róbert Madarassy László 13. Fájlformátumok v

ADATBÁZIS-KEZELÉS - BEVEZETŐ - Tarcsi Ádám, ade@inf.elte.hu

X3D (1) XML alkalmazások. Néhány XML alkalmazás bemutatása X3D (2) Jeszenszky Péter Debreceni Egyetem, Informatikai Kar

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Internetes térkép publikálási technikák, szabványok, trendek, nyílt forráskódú megoldások

Szegfű László. Szeged M. J. Város Polgármesteri Hivatala. Nyiss a világra ODF szabvány magyarul, MűPa

Szolgáltatásorientált rendszerintegráció. SOA-alapú rendszerintegráció. Web-szolgáltatások: SOAP, WSDL

Mozgásvizsgálati mérések internetes megjelenítése. Zemkó Szonja - Dr. Siki Zoltán

Web-fejlesztés NGM_IN002_1

EGY MÓDSZERTANI KÍSÉRLET A RAKTÁRI JEGYZÉKEK SZÁMÍTÓGÉPES MEGJELENÍTÉSE

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

Modellinformációk szabványos cseréje. Papp Ágnes, Debreceni Egyetem EFK

DSD. A W3C Magyar Iroda Akadálymentesítési Törekvései Pataki Máté, Kovács László

Testreszabott alkalmazások fejlesztése Notes és Quickr környezetben

Grafikus keretrendszer komponensalapú webalkalmazások fejlesztéséhez

Rámpát a honlapokra úton az akadálymentes honlapok felé Pataki Máté

XML alapú adatbázis-kezelés. (Katona Endre diái alapján)

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Az XML szabvány. Az XML rövid története. Az XML szabvány

Fülöp Csaba, Kovács László, Micsik András

Gyakorlati vizsgatevékenység A

Webszolgáltatások (WS)

Produktív környezetben használt, nyílt forráskódú komplex térinformatikai megoldások dr. Siki Zoltán

Gyakorlati vizsgatevékenység B

Szolgáltatásintegráció (VIMIM234) tárgy bevezető

Dokumentum írás és szerkesztés: Az OOo európai nézőpontból

Kiknek szól ez a könyv? Miről szól a könyv? Hogyan épül fel a könyv? Mire van szükség a könyv használatához? Szokások Forráskód Hibajegyzék

Informatikus, Webfejlesztő. Nagy Gusztáv

Többfelhasználós és internetes térkép kezelés, megjelenítés

Szemantikus Web Semantic Web A szemantikus web alkalmas megközelítés, illetve megfelel nyelvekkel, eszközökkel támogatja az intelligens információs

A HunTéka elektronikus könyvtár modulja

XML adatbázis kezelésének lehetőségei

A szemantikus világháló oktatása

Debreceni Egyetem Informatikai Kar

Flex: csak rugalmasan!

KML Keyhole Markup Language

Mesterséges Intelligencia Elektronikus Almanach

Folyamatok rugalmas irányítása. FourCorm Kft.

Böngészők, böngészőmotorok

Web programoz as

SOA modell: Ez az interfész definiálja az elérhető adatokat, és megadja, hogy hogyan lehet azokhoz hozzáférni.

WWW Kliens-szerver Alapfogalmak Technológiák Terv. Web programozás 1 / 31

Az XML 1.0 szabvány. tanulmány. Készítette: Mészáros Tamás. Budapest, BME Méréstechnika és Információs Rendszerek Tanszék

1. Az XML és XHTML nyelvek. Az XML leíró nyelv Szabályok XHTML írásra. Tartalom Az XML leíró nyelv

GeoServer, OpenLayers és WFS. Dolleschall János

Google App Engine az Oktatásban 1.0. ügyvezető MattaKis Consulting

Készítette: Enisz Krisztián, Lugossy Balázs, Speiser Ferenc, Ughy Gergely

Szolgáltatásorientált rendszerintegráció. SOA-alapú rendszerintegráció. Enterprise Service Bus (ESB) Ercsényi András, BME IIT, 2011.

Programozás III BEVEZETÉS. Sok adatkezeléssel kapcsolatos feladat van. a/ Adatok fájlban. b/ Adatbázisban

Weboldalkészítés sablonok segítségével Nyitrai Erika. Miről lesz szó? WEBOLDALKÉSZÍTÉS SABLONOK SEGÍTSÉGÉVEL. Saját honlapot szeretnék

Objektum Vezérelt Szoftverek Analízise

XML EXtensible Markup Language

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Nagy Gábor. Informatika 16. INF16 modul. Az OpenOffice.org

Nyílt forráskódú online térképi szolgáltatások fejlesztése a FÖMI-ben

Registrum. Az első magyar ISAD/G alkalmazás. Veszprém Breinich Gábor Budapest Főváros Levéltára

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

A J2EE fejlesztési si platform (application. model) 1.4 platform. Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Szemantikus világháló a BME-n

Java I. A Java programozási nyelv

30 MB INFORMATIKAI PROJEKTELLENŐR

Dinamikus terhelés hatására létrejövő deformáció mérése. Dr. Siki Zoltán Moka Dániel BME Általános- és Felsőgeodézia tanszék

NETinv. Új generációs informatikai és kommunikációs megoldások

Webes alkalmazások fejlesztése Bevezetés. Célkitűzés, tematika, követelmények. A.NET Core keretrendszer

Boros Andrea és Ignéczi Lilla Neumann-ház, Budapest. Networkshop 2004 konferencia Győr, április 4 7.

MŰSZAKI KÖVETELMÉNYEK, A KÖRKERESŐ SZOFTVER SPECIFIKÁCIÓJA, KÖLTSÉGVETÉS. A) Műszaki követelmények

Adatbázis rendszerek 7. előadás State of the art

Válltáska Ubuntu 8.04 Hardy Heron. A Hardy Heron jelentését feszegető téma:

Zimbra levelező rendszer

Programozás. Adatbázis-kezelés (alapok) Fodor Attila

Webes alkalmazások fejlesztése

Automatizált mozgásvizsgálati mérőrendszer. Dr. Siki Zoltán BME Általános- és Felsőgeodézia tanszék

30 MB INFORMATIKAI PROJEKTELLENŐR

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

SZOFTVERES SZEMLÉLTETÉS A MESTERSÉGES INTELLIGENCIA OKTATÁSÁBAN _ Jeszenszky Péter Debreceni Egyetem, Informatikai Kar jeszenszky.peter@inf.unideb.

Szerializáció. Tóth Zsolt. Miskolci Egyetem. Tóth Zsolt (Miskolci Egyetem) Szerializáció / 22

Fejlett Adatbázis Technológiák - Jegyzet Dr. Adamkó, Attila

DIGITÁLIS KÖZTERÜLETI M SZAKI TÉRKÉP

Programozó, csoportvezető

Adatbázis rendszerek. dr. Siki Zoltán

Miért érdemes váltani, mikor ezeket más szoftverek is tudják?

Átírás:

XML avagy az univerzális információelérés álma Mészáros Tamás meszaros@mit.bme.hu Budapesti Műszaki Egyetem XML, avagy az univerzális információelérés álma 1

Ki használ XML-t? CiteSeer Youtube Origo SVG GraphML OWL MathML RDF EuropassCV BizTalk Index Wiki Amazon XMI UML DTD Matlab JAXB XQuery Microsoft Office Linux LogML Google Earth, Maps,... EDI Web 2.0 Eclipse Web Ajax Yahoo Flash.NET Firefox icalendar XPath Thunderbird SyncML SAX ebxml OpenOffice WebServices Javascript BME MIT Portál Apache MusicML XSLT SOAP PHP Skype XMLTV RSS ChessML Topic Maps blog XHTML további alkalmazások: http://xml.coverpages.org/xmlapplications.html XML, avagy az univerzális információelérés álma 2

Ki használ XML-t...? (film) XML, avagy az univerzális információelérés álma 3

Az XML (siker)története Az XML története előzményei már a hatvanas évek végén megjelentek kevés sikerrel az alapszabvány 1998-ban született meg kiegészítő szabványai 1998-2007 között folyamatosan ipari elterjedése már 2000-től jelentős (web, szoftverintegráció,...) Egy évtized alatt átjárta (átalakította) az informatikát. Miért? Személyes kapcsolódásaim Nyílt rendszerek c. tárgy (1996-2006) K+F projektek (Promanual, IKF, saját OTKA, DISCO, ) (1996-) XML-alapú webfejlesztés, oktatás, választható tárgy (1996-2006) könyvírás az IBM kaliforniai kutatólaborjában (2000) Intelligens szakirány (rendszerintegráció, információelérés) (2003-) önálló labor és diplomaterv témák tanszéki szakképzési tanfolyam (2007-) XML, avagy az univerzális információelérés álma 4

Miért jött létre az XML? World Wide Web Consortium (W3C): web technológiák fejlesztése bajban van a web (kilencvenes évek, de ma is) dinamikusan növekvő tartalom, kőkorszaki tartalomelérési módszerek a rendszerek a tartalom helyett a megjelenésre koncentrálnak a számítógép nem képes a tartalom megértésére, így nem támogatja a hatékony információelérést Szemantikus web vízió a hatékony webes információelérés álma Számítógépes szövegkezelés (-szerkesztés, -feldolgozás, stb.) a számítógép a szövegkezelés szempontjából nem több, mint egy ügyes írógép a természetes nyelvek gépi megértése (mesterséges intelligencia), azaz a hatékony szöveges információelérés egyelőre álom a hagyományos szöveg- (információ-)kereső rendszerek hatékonysága korlátos (a könyvtártudomány már az 50-es évek óta dolgozik rajta) nincs áttörés a szöveges információ kezelésében és elérésében Strukturált dokumentumkezelés segítsük a számítógépet a megértésben XML, avagy az univerzális információelérés álma 5

Strukturált dokumentum-kezelés és az XML Strukturált dokumentum-kezelés hatvanas években indult (IBM: GML) nyolcvanas évekre szabványossá vált (ISO: SGML) aztán csend: drága eszközök, eljárások, alkalmazás csak nagyoknak World Wide Web Consortium (W3C) tartalom-orientált web dokumentumok kellenek: egy *ML jó lenne az SGML drága, nehézkes, legyen egy új webre termett szabvány az SGML és a webes eszközök előnyeit ötvözve megszületett az XML Az XML (Extensible Markup Language) tartalomleírás a számítógépek (feldolgozók, keresőgépek) számára olcsó eszközök, könnyű alkalmazhatóság szabad kéz a webfejlesztőknek és tartalom készítőknek a szabványok szigorú betartása (nem HTML) XML, avagy az univerzális információelérés álma 6

Az XML rokonsága Az XML és az SGML viszonya SGML: kötetlen nyelvtan bonyolult és drága implementáció XML: az SGML egyszerűsítése, olcsóbbá tétele, vele kompatibilis Az XML és a HTML viszonya HTML: megjelenítésre koncentráló, nem bővíthető jelölésrendszer HTML: laza (nem szabványos) szintaxiskezelés XML: szigorú szintaktikai ellenőrzés és bővíthető, tartalom-orientált jelölésrendszer Az XML célkitűzései legyen egyszerűen használható a webrendszerekben, az alkalmazások széles körét támogassa, legyen kompatibilis az SGML-el, legyen egyszerű XML dokumentumokat feldolgozó programokat írni, ember által olvasható, világos szerkezetű dokumentumok legyenek, legyen egyszerű XML dokumentumokat készíteni. XML, avagy az univerzális információelérés álma 7

Mi az XML? Szöveges dokumentum formátum alapszabályaiban kötött, de azokon túl szabadon definiálható ún. jelölt szövegrészletek összekapcsolásából áll ember által is olvasható és megérthető számítógépes programok által is könnyen olvasható és megérthető Metanyelv a dokumentumok jelölésrendszerét szabadon meghatározhatjuk DTD: dokumentum deklarációs nyelv (az XML szabvány része) Schema: másik, népszerűbb deklarációs nyelv (újabb W3C szabvány) Szabványcsalád XML, Schema, XPath, XSL, XSLT, DOM, JAXB, SAX, Technológia web- és alkalmazásfejlesztési eszköztár (nem csak szövegkezelésre) XML, avagy az univerzális információelérés álma 8

Az XML, mint dokumentum formátum Dokumentum formátum szabványok de facto: DOC, PDF, RTF, de jure: HTML, SGML, XML, ODF, Szöveges vagy strukturált dokumentumok (megjelenés vagy tartalom) szövegszerkesztés és -megjelenítés információelérés (-átvitel, -tárolás) Strukturált dokumentum dokumentum definíció (DTD) strukturált dokumentum tartalom dokumentum megjelenés Jelölő nyelv a struktúra ábrázolása címkékkel a címkék típusai: procedurális és leíró Újrahasznosítható, számítógép által megérthető szöveges tartalom XML, avagy az univerzális információelérés álma 9

XML példák <név>alma Mater</név> <ember> <név>alma Mater</név> </ember> Hétfőn <ember><név>alma Mater</név></ember> levizsgázott. <p> Ez egy <i>dőlt betűvel</i> írt szöveg. </p> Hétfőn <ember><név>alma Mater</név></ember> <i>jelesre</i> vizsgázott. Hétfőn <ember><név>alma Mater</név></ember> <érdemjegy>jelesre</érdemjegy> vizsgázott. Hétfőn <ember><név>alma Mater</név></ember> <i><érdemjegy>jelesre</érdemjegy></i> vizsgázott. XML, avagy az univerzális információelérés álma 10

Az XML példák nem mindig szépek <?xml version="1.0" encoding="utf-8" standalone="no"?> <wsdl:definitions name="discoservice" targetnamespace="http://disco.mit.bme.hu/service" xmlns:wsdl="http://schemas.xmlsoap.org/wsdl/" xmlns:tns="http://disco.mit.bme.hu/service" xmlns:xsd="http://www.w3.org/2001/xmlschema" xmlns:soap="http://schemas.xmlsoap.org/wsdl/soap/"> <wsdl:types> <xsd:schema xmlns:xsd="http://www.w3.org/2001/xmlschema" targetnamespace="http://disco.mit.bme.hu/service"> <xsd:complextype name="discolanguage"> <xsd:sequence> <xsd:element name="id" type="xsd:int"></xsd:element> <xsd:element name="locale" type="xsd:string"></xsd:element> <xsd:element name="lang_id" type="xsd:int"></xsd:element> <xsd:element name="name" type="xsd:string"></xsd:element> </xsd:sequence> </xsd:complextype> <xsd:complextype name="discolanguagelist"> <xsd:sequence> <xsd:element ref="tns:discolanguage" minoccurs="0" maxoccurs="unbounded"></xsd:element> </xsd:sequence> </xsd:complextype> <xsd:complextype name="discoterm"> <xsd:sequence> <xsd:element name="id" type="xsd:int"></xsd:element> <xsd:element name="lang_id" type="xsd:int"></xsd:element> <xsd:element name="code" type="xsd:string"></xsd:element> <xsd:element name="name" type="xsd:string"></xsd:element>... XML, avagy az univerzális információelérés álma 11

Az XML, mint metanyelv Metanyelv segítségével nyelvek definiálhatók nyelv: címkekészlet és struktúra (szókincs és nyelvtan) egy deklaráció (DTD, Schema) rögzíti a nyelvet XML deklaráció példák <!ELEMENT ember (név)> <complextype name="ember"> <sequence> <element name="név" type="string"></element> </sequence> </complextype> XML, avagy az univerzális információelérés álma 12

Deklarációs rendszerek: DTD és Schema Dokumentum Típus Deklaráció (DTD) az eredeti XML szabvány része az eredeti (W3C) célnak megfelel korlátozott alkalmazás-építés (nagy deklarációs rendszerek gondja) nincsenek névterek nincs adattipizálás nem XML szintaxisú XML Schema szabvány új deklarációs rendszer adattipizálás (programozási nyelvekhez hasonló) objektum-orientált megközelítésből örökölt deklarációépítés finomítható, szűkíthető, bővíthető egyszerű és összetett típusok névtér támogatás XML szintaxis XML, avagy az univerzális információelérés álma 13

Az XML, mint szabványcsalád Jelentősebb szabványosítási szervezetek World Wide Web Consortium (W3C) ISO/IEC JTC-1 OASIS: Organization for the Advancement of Structured Information Standards Jelentősebb XML alapszabványok Extensible Markup Language (XML) (1998, 2004) XML Namespaces (1999, 2004) XML Schema (2001, 2004) DOM (1998, 2000, 2004) Simple API for XML (SAX) XML Path Language (XPath) (1999, 2007) XSL Transformations (XSLT) (1999, 2007) XHTML (2000, 2001, 2007) XQuery: An XML Query Language (2007) XML, avagy az univerzális információelérés álma 14

Az XML, mint technológia technológia: specifikáció (szabvány) és termék halmaz, amely strukturált dokumentumok készítését, feldolgozását és megjelenítését támogatja sokféle alkalmazási területen nyújt eszközöket és módszereket a feladatok megoldásához: Web megjelenés (szerver és kliens oldali transzformációk) adatcsere (formátum, transzformáció) e-üzlet szövegek reprezentációja és feldolgozása Web 2.0 szövegszerkesztők dokumentum formátuma (OpenOffice, MS Office) technikai dokumentációk nyelvezete (SGML örökség) szoftverek konfigurálása felhasználói interfészek definiálása (Windows Vista) EU önéletrajzok készítése XML, avagy az univerzális információelérés álma 15

Az XML technológia fontosabb elemei Dokumentum formátum és szövegszerkesztés grafikus, kiterjeszthető, testre szabható szövegszerkesztők Deklarációs metanyelv, alkalmazás-specifikus nyelvek grafikus metanyelv-szerkesztők nyelvi kötések programozási nyelvekhez (pl. JAXB) ipari szabványos XML nyelvek Megjelenítés (és transzformáció) megvalósítási környezettől független módszerek szabványos megjelenítési nyelvek Programozott elérés programozási nyelvtől független módszerek Tárolás és lekérdezés hagyományos, relációs adatbázisok XML kiterjesztése újszerű, natív XML adatbázisok XML, avagy az univerzális információelérés álma 16

Összefoglalás: az XML alapjai Szöveges dokumentum formátum lehetővé teszi a szövegtartalom könnyű gépi feldolgozását keresés helyett lekérdezéssel jutunk az információhoz Metanyelv a tartalom leírására (jelölésére) mesterséges nyelvet alkothatunk ezáltal lehetővé válik a jelölt tartalom gépi megértése Szabványcsalád széles körben elfogadott ipari szabványai vannak gyártói egyetértés Technológia sok területen alkalmazhatunk XML-re épülő megoldásokat és eszközöket XML, avagy az univerzális információelérés álma 17

Miért álom az univerzális információ-elérés? Elég az XML? az XML csak egy alapeszköz a W3C Szemantikus Web koncepció sok minden mást is igényel kevés dolog van készen a továbbfejlesztési irányok sem mindig világosak Azonos nyelvet beszélünk? a saját tartalmát mindenki a saját nyelvén szeretné leírni a nyelv mellett az értelmezésről is meg kell állapodni Jó nyelvet készítettünk? mások igényei jövőbeli igények, alkalmazási lehetőségek... XML, avagy az univerzális információelérés álma 18

Miért nem álom az univerzális információ-elérés? Az informatika küzdelme az inkompatibilitással az XML a kulcs? az XML univerzális, platformfüggetlen, önleíró adatformátum van egy programozási nyelvektől független, erős deklarációs rendszere olcsók és széles körben terjednek az eszközei és megoldásai automatikus nyelvi kötés programozási nyelvekhez Azonos nyelvet beszélünk? sorban jönnek létre az egyes alkalmazási területek nyelvei Jó nyelvet készítettünk? ipari konzorciumok készítik a specifikációkat ISO és W3C szabványok is születtek Az XML átalakítja az informatikai rendszereinket van gyártói egyetértés (a nagyok között is) szabványosítás! kényszer is van: ha kimaradsz, lemaradsz XML, avagy az univerzális információelérés álma 19

Az XML kettőssége : siker és kudarc(?) Adat-centrikus vs. dokumentum-centrikus XML A reprezentáció célja szöveges dokumentumot vagy programok adatait reprezentáljuk tartós vagy csak átmeneti reprezentáció (tárolás?) Deklarációs rendszer DTD is elég, vagy Schema deklarációs rendszerre van szükség szövegjelöléseket vagy adatleírást készítünk Programozói felületek Hagyományos (DOM, SAX) feldolgozás vagy adatleképezés Eltérő tervezési szempontok Eltérő alkalmazási követelmények Eltérő siker (egyelőre) XML, avagy az univerzális információelérés álma 20

Az XML előnyei és hátránya Az XML lehetővé teszi szövegek tartalom-orintentált, strukturált gépi reprezentációját, készítését, tárolását, feldolgozását, lekérdezését és megjelenítését. A számítógép képessé válik a tartalom korlátozott megértésére. Ezáltal lehetővé válik a tartalom automatikus, gépi ellenőrzése. Keresés (web) helyett lekérdezéssel (DB) juthatunk információhoz. Könnyen alkalmazható webes rendszerekben. Univerzális adatcsere formátumként hozzájárul az üzleti alkalmazások szabványos kommunikációjához Az eredeti szabvány gyenge deklarációs rendszert tartalmaz (DTD). Az időtálló deklarációk készítése gondos munkát igényel. A deklaráció tervezési hibáinak javítása igen költséges. Sok szabvány, rengeteg technológia, párhuzamosságok. Sok területen kiforratlan alkalmazói gyakorlat. XML, avagy az univerzális információelérés álma 21