Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 1 Fejlett kereső és lekérdező eszközök egy elektronikus szakfolyóirathoz (IBVS) Holl András Erdődi Péter MTA Konkoly Thege Miklós Csillagászati Kutatóintézete Cikk: http://www.konkoly.hu/staff/holl/duna/dunau.pdf
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 2 Tartalmi kivonat Az Information Bulletin on Variable Stars egy kis, elektronikus formában is megjelenő csillagászati szakfolyóirat (lásd Holl, Networkshop 2001). A folyóiratban publikált cikkekben, ábrák között, valamint a cikkekhez tartozó adatállományokban való keresés céljából új eszközt fejlesztettünk. A kereső jellemző tulajdonsága, hogy a megszokott, hasonló programoktól elvárható funkciókon túl (keresés a meta adatokban és a teljes szövegben) keresni tud ábrákat és adatállományokat is. Továbbá lehetőség van csillagászati objektumok keresésére, objektumnevek helyett: ugyanazon objektum szerepelhet különböző neveken, és bármelyik névvel megtalálható. Hasonló a szerzők nevére való keresés is: a többféle változatban használt nevek bármelyik írásmódja használható a keresési feltételben. Ezeket a tulajdonságokat nem csupán lokális szótárakkal, de GRID avagy Virtuális Obszervatórium jellegű funkcionalitással: a hálózaton elérhető szolgáltatások segítségül hívásával érjük el. A fenti rendszerre alapozva olyan lekérdezési lehetőséget is készítünk, melynek segítségével objektumnevek és adattípusok (pl. adott típusú ábra) megadásával lehet majd külső adatbázisokból linkeket generálni az IBVS ben közölt információkra.
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 3 A folyóirat Information Bulletin on Variable Stars (IBVS) kis szakfolyóirat rövid cikkek a változócsillagászat témakörében Nemzetközi Csillagászati Unió 27 es és 42 es Kommissziói MTA Konkoly Thege Miklós Csillagászati Kutatóintézete kiadásában Holl A., Networkshop 2001
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 4 Miért kell új kereső? megnövekedett az elektronikusan ekérhető terjedelem elavult a régi kereső Igények fejlettebb logikai feltétel és reguláris kifejezés kezelés bővebb keresési lehetőségek a meta adatokban (pl. objektumnév) tartalmi feltárás ábrák, adatállományok objektumok és szerzők azonosítása használt névtől és írásmódtól függetlenül az eredmények igényesebb prezentációja
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 5 Miért nem a Google? az ADS? Google: magasra ttett mérce az IBVS túl speciális, a Google nem ismeri a szerkezetét, meta adatait a Google Images nem találja meg az ábrákat biztosan NASA ADS sem megfelelő ritka frissítés
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 6 Tartalmi feltárás keresés többnyire bibliográfiai adatok szerint kulcsszavak IBVS: szabadon választható, nem segít igény cikkelemek (adatállomány, ábra: keresőtérkép, fénygörbe) szerinti keresésre ábrák és adatállományok meta adatokkal való ellátása adott kulcsszókészlet közvetlen hozzáférés az ábrákhoz, egyedi azonosító alapján adatbázisszerű használat
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 7
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 8 Összefonódó szolgáltatások emberi és gépi olvasóknak A csillagászat haszon talan tudomány: sok szabadon hozzáférhető információ IBVS elérés: szakirodalmi és objektum adatbázisok, folyóiratok IBVS linkek: NASA ADS, CDS Simbad Adataggregáció: különböző forrásból származó adatok összesítése IBVS DataService adatok más szolgáltatások számára API az ADS teljes szövegű keresőszolgáltatásához gép gép kapcsolatok; szemantikus web; OAI PMH
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 9 Névfeloldás csillagászati objektumok: egy objektum sok név melyik nevet használják a keresésnél? helyi szótár nem tartható karban! külső tudásbázis igénybevétele: CDS (Strasbourg), GCVS (Moszkva) szerzők neve: különböző névalakok, transzliterációk az ADS igeénybevétele külső tudásbázisként GRID avagy Virtuális Obszervtórium jellegű funkcionalitás: hálózati szolgáltatások beépítése alkalmazásokba
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 10 Megvalósítás ELTE IK programtervező szak kooperatív képzés az MTA KTM CsKI ben (E.P.) Perl: szabad szoftver; reguláris kifejezések támogatása magas szinten; dokumentáció CsKI ban meglévő hardver és szoftverkörnyezet adatbáziskezelők használata nélkül előnyök és hátrányok egyszerű és funkcionális kezelőfelület minden funkció elérése URL alapon
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 11
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 12 Felhasználói réteg: a kereső űrlap és a találatok megjelenítése Az alkalmazás lényegi része a két modul: az indexelő és a kereső. Az előbbi hozza létre/frissíti az adatfájlt, a második pedig a keresést végzi. A strukturált adathalmaz.
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 13
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 14 Tesztek batch tesztelés elfogadható sebesség: 2 20 másodperc Dokumentáció IBVSlatest forráskódba ágyazva készül felhasználás: a legfrissebb számok prezentálása
Networkshop, 2008 Márc. 17 19., Dunaújváros Holl Erdődi: Fejlett kereső... 15 Irodalom/URL ek Holl A., 2001, "Elektronikus folyóiratok a természettudományok területén egy hazai példa", Networkshop előadás: http://www.konkoly.hu/staff/holl/sopron/sopron.html NASA Astrophysics Data System FAQ: http://doc.adsabs.harvard.edu/abs_doc/faq.html CDS Simbad adatbázis: http://simbad.u strasbg.fr/simbad/ General Catalogue of Variable Stars: http://www.sai.msu.su/groups/cluster/gcvs/gcvs/