SZTAKIMemory A DIGITÁLIS INFORMÁCÓK HOSSZÚ TÁVÚ MEGŐRZÉSE ARCHÍVUMRENDSZER INTÉZETI KÖZÖS MEMÓRIA SZÁMÁRA

Hasonló dokumentumok
Szatucsek Zoltán MúzeumDigit, november 22.

Department of Distributed Systems MTA SZTAKI DSD

DSD DSD. Egy országos méretű orvosi adatbázissal kapcsolatos informatikai kihívások. Kovács László Pataki Balázs Pataki Máté MTA SZTAKI DSD

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

World Wide DSD Web. Csoportmunka

DRM megoldások áttekintése

KOPI. KOPI Plágiumkereső A digitális tartalmak védelmében DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

MTA SZTAKI MTA SZTAKI

Elektronikus szövegek és adatok szolgáltatás és megőrzés

KOPI. Plágiumkeresés különböző nyelvek között MTA SZTAKI DSD. Pataki Máté. Department of Distributed Systems

Best Practices for TrusBest Practices for Trusted Digital Repositories in HOPE. ted Digital Repositories in HOPE.

Az információs portáloktól a tudásportálokig

A Jövő Internet Nemzeti Kutatási Program bemutatása

Fülöp Csaba, Kovács László, Micsik András

NIIF szolgáltatások a múzeumok számára

Webes tartalmak digitális megőrzése

WEB2GRID: Desktop Grid a Web 2.0 szolgálatában

Beszámoló a 13. ECDL (European Conference on Digital Libraries) konferenciáról

Az INSPIRE előírásai szerinti hazai téradatok szolgáltatásának, forgalmazásának megoldandó kérdései. GIS OPEN konferencia

Szolgáltatási szint megállapodás

TANANYAGTÁRHÁZAK SZEREPE AZ ELEARNINGBEN. Vágvölgyi Csaba - Papp Gyula. Kölcsey Ferenc Református Tanítóképző Főiskola Debrecen

Enterprise extended Output Management. exom - Greendoc Systems Kft. 1

Szolgáltatási szint megállapodás. Verzió: 1.0. (2010. december 13.)

folyóirat: drága, monopolhelyzet a kiadás üzlet, a profit meghaladja a luxuscikkeknél

PhD dolgozatok repozitóriumi elhelyezése, DOI azonosítóval való megjelölése

Digitális kincstár digitális kincskereső Elektronikus szolgáltatások az MTA Könyvtárában

Szolgáltatás és Minőségfejlesztés a Corvinus Egyetemen Kiss György János Mogyorósi János

Kiss Gergő, Kovács László, Micsik András, Moldován István

A Nature SDIplus projekt céljai, tervei és eredményei MÁRKUS Béla NymE Geoinformatikai Kar

REAL az MTA Könyvtárának repozitóriuma

DSD. Hibatűrő keresés digitalizált magyar nyelvű szövegekben. Pataki Máté Füzessy Tamás Kovács László Tóth Zoltán MTA SZTAKI DSD

Elosztott könyvtári rendszerek megvalósítása a Z39.50 és az OAI protokoll használatával

Intézményi repozitórium -intézményi tartalomfelhő az Eötvös Loránd Tudományegyetemen

ÁROP KÉPZÉS A KONVERGENCIA RÉGIÓKBAN LÉVŐ ÖNKORMÁNYZATOKNAK FENNTARTHATÓ ÖNKORMÁNYZAT E-TANANYAGOKAT BEMUTATÓ KONFERENCIA

TÁMOP A-11/ A MAGYAR TUDOMÁNYOS MŰVEK TÁRA (MTMT) PUBLIKÁCIÓS ADATBÁZIS SZOLGÁLTATÁSOK ORSZÁGOS KITERJESZTÉSE MTMT ÉS MTMT2

Videóportálok a felsőoktatásban

NIIF Sulinet szolgáltatásai

Együttműködés, tudásmegosztás és feladatmenedzsment. avagy Microsoft eszközrendszer a vállalati folyamatok szolgálatában

30 MB INFORMATIKAI PROJEKTELLENŐR

Az Internet jövője Nemzetközi és hazai kitekintés

A jövő könyvtára a könyvtár jövője

Worldwide LHC Computing Grid


A Magyar Tudományos Művek Tára (MTMT) és hasonló törekvések a világban

Felhő rendszerek és felhő föderációk. Kacsuk Péter MTA SZTAKI

A FELSŐOKTATÁSI KÖNYVTÁRAK

Az MTMT és az Intézeti Repozitóriumok összekapcsolása bevezetési tapasztalatok SZLUKA PÉTER SEMMELWEIS EGYETEM KÖZPONTI KÖNYVTÁR

ELEKTRONIKUS DOKUMENTUMTÁROLÁSI SZOLGÁLTATÁS (EDT)

Az MTA Cloud projekt MTA Cloud projektzáró június 28.

Alkalmazásokban. Dezsényi Csaba Ovitas Magyarország kft.

Szövetségi (föderatív) jogosultságkezelés

IT trendek és lehetőségek. Puskás Norbert

Petőfi Irodalmi Múzeum. megújuló rendszere technológiaváltás

Térinformatika. Térinformatika. GIS alkalmazói szintek. Rendszer. GIS funkcionális vázlata. vezetői szintek

A Jövő Internet Nemzeti Kutatási Program és eredményei

Adatbázis rendszerek 7. előadás State of the art

Korszerű oktatási környezet kialakítása az eenvplus projektben. Márkus Béla

Adatbányászat és Perszonalizáció architektúra

Vállalati WIFI használata az OTP Banknál

Zimbra levelező rendszer

SDL Trados szervermegoldások. Szekeres Csaba SDL Trados partner M-Prospect Kft.

"sulinet+" - Végponti kapcsolatok és központi szolgáltatás-fejlesztés a közoktatási hálózatban

Mobil eszközökön tárolt adatok biztonsága

Networkshop Kaposvár Balaskó Á., Kozlovszky M., Karóczkai K., Márton I., Kacsuk P. MTA SZTAKI

Cikkarchívum fejlesztése

Multimédiás adatbázisok

Szemantikus világháló a BME-n

Az NIIF Intézet és a ÚMFT TÁMOP programok bemutatása

Sulinet + projekt. Mohácsi János Hálózati igh. NIIF Intézet október 21. Sulinet + projekt mérföldkő Budapest

A szoftverfejlesztés eszközei

Enabling Grids for E-sciencE. Grid bevezető INFSO-RI

A hibrid DB cloud biztonsági eszköztára. Kóródi Ferenc Budapest,

Tudásbázis a közgazdasági szférában

TELJESÍTÉNYMÉRÉS FELHŐ ALAPÚ KÖRNYEZETBEN AZURE CLOUD ANALÍZIS

Önálló labor feladatkiírásaim tavasz

Kiterjesztett valóság az iparban

IKT trendek és tapasztalatok a BME szemszögéből

Adatbázisok 2018-ban ADT- ARCANUM DIGITÁLIS TUDOMÁNYTÁR AKADÉMIAI KIADÓ FOLYÓIRATAI AKADÉMIAI KIADÓ MERSZ ADATBÁZIS AKADÉMIAI KIADÓ SZÓTÁRAI CAMBRIDGE

Többnyelvű tezaurusz építése és szolgáltatása webes környezetben

Új fejlesztések, együttműködések a Magyar Elektronikus Könyvtárban, 2011-ben

Hiteles Elektronikus Archívum

GDPR az EU Általános Adatvédelmi Rendelete - minden vállalkozás életét érintő jogszabály -

A Magyar Tudományos Művek Tára

Archives Portal Europe network of Excellence

Adatbázis-kezelő rendszerek. dr. Siki Zoltán

BIG DATA ÉS GÉPI TANULÁS KÖRNYEZET AZ MTA CLOUD-ON KACSUK PÉTER, NAGY ENIKŐ, PINTYE ISTVÁN, HAJNAL ÁKOS, LOVAS RÓBERT

Szoftverminőségbiztosítás

A közgyűjtemények és az e-infrastruktúra szolgáltatók

Papp Attila. BI - mindenkinek

Bánki Zsolt István Csáki Zoltán Petőfi Irodalmi Múzeum Könyvtár és Informatika. Networkshop 2014 Pécs

ekörnyezetvédelmi szolgáltatások az INSPIRE keretében Márkus Béla Giorgio Saio

OpenAIRE

Az e-learning-től az u-learning-ig

IMOLA. Integrált MOKKA2, ODR2 és OLA. Vándorgyűlés Szombathely, 2008 július 25. Monguz MTA SZTAKI konzorcium

A szoftverfejlesztés eszközei

Fejlesztés, működtetés, felügyelet Hatékony infrastruktúra IBM szoftverekkel

Az egységes tartalomkezelés üzleti előnyei

Titkosítás mesterfokon. Tíz évvel a titkosítás után. Előadó: Tóthi Dóra Kovárczi Béla András

Ficsor Lajos Általános Informatikai Tanszék Miskolci Egyetem

Párhuzamos és Grid rendszerek

Átírás:

SZTAKIMemory A DIGITÁLIS INFORMÁCÓK HOSSZÚ TÁVÚ MEGŐRZÉSE ARCHÍVUMRENDSZER INTÉZETI KÖZÖS MEMÓRIA SZÁMÁRA - DR. KOVÁCS LÁSZLÓ

MTA SZTAKI DSD - Elosztott Rendszerek Osztály Alapítva 1994 (23 év) Kutatás, fejlesztés, (on-line) szolgáltatás 15 FTE Projektek: 25 nemzetközi nagy projekt (EU, Japán - 80% tevékenység) 21 nagyobb magyar projekt (20% tevékenység) Cél: valóságban létező, működőképes, bonyolult informatikai rendszerek létrehozása a legfejlettebb technológiák alkalmazásával, jelentős hazai (társadalmi, ipari, stb.) impakt, technológia hídszerep Nem cél: publikációk előállítása (ennek ellenére Q1/D1 publikáció)

MTA SZTAKI DSD TEVÉKENYSÉGI TERÜLETEK Internet Science, Future Internet Research escience IoT (Internet of Things) Digital Library Nomadic collab. Media spaces egovernment Semantic Web Delos Delos NoE Delos NoE2 ORG Hektár Aqua MTMT-2 KOPI Web Services Cloud Computing Digital Library Collaboration World Wide Web Collaboration CORES GeneSyS StreamOnTheFly EUTIST-AMI ABILITIES SZTAKISzótár Infrawebs government portals SELECT Promóció Forum DONAU BREIN eadministration Web4Groups evoting World Wide Web

MTA SZTAKI DSD KEZDETEK Webszolgáltatások: SZTAKISzótár (1994) SZTAKI honlap (1994) SZTAKISzavazás (1996) NIIFP portál (1997) 4-es METRÓ (3D VRML model) (1997) WebArt: Kormányzat:

MTA SZTAKI DSD REFERENCIÁK Web szolgáltatások: n SZTAKISzótár (1994-) n n SZTAKI Szavazás (1996-2013) WebArt (1995-2003) n NDA@SZTAKI (Nemzeti Digitális Archívum)(1997-) n n StreamOnTheFly, radio.sztaki.hu (2003-2013) KOPI plágiumkereső (2004-) n Nemzeti repozitórium közös kereső (2014-) A labor neve: MTA SZTAKI DSD - Elosztott Rendszerek Osztály Országos szolgálat: W3C Magyar Iroda (2002-) n n n n n Intézeti belső szolgáltatások: SZTAKI Web (1994-) SZTAKI könyvtári infrastruktúra (2005-) SZTAKI repozitórium infrastruktúra (2012-) SZTAKI - MTMT interfész (2013-) 2016.09.15.

HOSSZÚ TÁVÚ DIGITÁLIS MEGŐRZÉS

Citizen Science TUDOMÁNY 2.0 Open Code Data Intensive Open Access Open Annotation Open Data Open Code Open Lab Books/Workflows Alternative Reputation System Collaborative Bibliographies Science Blog Data Intensive Citizens Science Analysis Open Workflows Pre-Print Data Gathering Publication Open Access Open Data Open Annotation Conceptualisation Review Research Cycle Science Blogs Collaborative Bibliographies Alternative Reputation

A TUDOMÁNY A JELENBEN ÉS A JÖVŐBEN A tudomány művelése egyre inkább digitális alapú Nagyfokú (folyamat és objektum) transzparencia - nem csupán lehetőség, hanem elvárás A szférában különféle típusú digitális objektumok keletkeznek (nem csupán publikációk) A digitális objektumok menedzsmentje (létrehozás, megosztás, szállítás, tárolás, hosszú távú megőrzés) a fizikai objektumok menedzsmentjéhez képest sokkal bonyolultabb, munkaigényesebb és szakmai (leginkább informatikai és archiválási) hozzáértést igényel

DIGITÁLIS OBJEKTUM KEZELÉS Kik, milyen intézmények fogják a digitális objektumok kezelését elvégezni (új memória intézmény?, könyvtárak?, levéltárak?, múzeumok?) Hálózati kutatási infrastruktúrák és intézetek (NIIFI?), domain specifikus közösségi intézmények (arxiv.org), profit és/vagy nem profit orientált cégek? A könyvtárakban, a klasszikus funkciók mellett megjelenik a digitális objektum menedzsment mint új elvárás

AZ MTA SZTAKI JELENLEGI PROBLÉMÁI (EGYBEN ÁLTALÁNOS PROBLÉMÁK IS) Tudástermés meghatározása mint menedzsment probléma Tudás hosszú távú digitális megőrzése mint tudományos/techikai/szervezési probléma Szabályozott tudásmegosztás részlegen belül (munkatársak és a generációk között) részlegek között részlegeken túl (a részlegek élettartamán túlmenően) Kontrollált tudásexport (lopás védelem) Eszközfüggetlen tudás hozzáférés (desktop, web, tablet, mobil) Tudásregiszter, kompetencia listák, teljesítmény statisztikák stb. előállítása Szellemi tulajdonkezelési szabályzatnak való megfelelés (pl. MTA Elnök 1/2013. (II.18.) rendelet)

A SZTAKIMEMORY PROJEKT VÁLASZAI Intézeti policy a megőrzendő tudásentitások meghatározására (MIT) Finoman szabályozott hozzáférési jogosultság rendszer (KI) Eszközfüggetlen rendszer elérés (desktop, web, tablet, mobil) (HOGYAN) Hosszú távú digitális objektum (a bitfolyamon túlmenő) megőrzés Szabványos (OAIS konform?) arhívum rendszer hosszú távú digitális tárolásra Kódolt adattárolás (operátori hozzáférés elleni védelem) Fizikai eszköz- és adatvédelem Aktív rendszer-karbantartás és -menedzsment

BIM - BUILDING INFORMATION MODELLING

A BIM FELHASZNÁLÁSA AZ ÉPÜLET TELJES ÉLETTARTAMÁBAN

EGY ÉPÜLET TERVEZETT ÉLETTARTAMA > 100 ÉV

BIM ALKALMAZÁSÁNAK KÖVETKEZMÉNYEI A digitális adatokat (tervrajzok, szakipari tervek, financiális tervek, látványtervek, kivitelezési tervek stb.) valamint számítógépen futtatható szakági elemzéseket tartalmazó BIM modelt legalább 100 évig kell megőrizni és közben az állandó használatát is biztosítani (épület üzemeltetés). Az informatika gyorsuló ütemben fejlődik, új szoftver verziók, új szoftverek, új digitális fájlformátumok jelennek meg, a régi formátumok és szoftverek és verzióik elavulnak, használhatatlanná válnak A digitális információ hordozók fizikailag elavulnak, a hordozó technológia is váltásra kerül (lásd pl. floppy lemezek és floppy olvasók története)

OAIS REFERENCE MODEL OPEN ARCHIVAL INFORMATION SYSTEM (ISO 14721:2003)

OAIS REFERENCE MODEL részletezve

HOSSZÚ TÁVÚ DIGITÁLIS TÁROLÁS technológia-független adat- és adatintegritás-védelem keretrendszer prezervációs stratégiák meghatározására szemantikus szintű adatmegőrzés emulációs és/vagy migrációs techológiák alkalmazása adathordozó gondozás

HOSSZÚ TÁVÚ DIGITÁLIS TÁROLÁS PROJEKTEK 4C APARSEN ARCOMEM BlogForever DAVID DIACHRON DuraArk E-ARK ENSURE ForgetIT KEEP LiWA PERICLES PrestoPRIME PROTAGE SCAPE SHAMAN TIMBUS Wf4Ever

E-ARK PROJECT SIP Submission Information Package AIP - Archival Information Package DIP - Dissemination Information Package

E-ARK PROJECT

E ARK Tools and Content formats Pre Ingest DB ERMS Export Module ERMS SIARD 2.0 E ARK SMURF (ERMS) FILES RODA In ESSArch Tools for Producer UAM QGIS GML Ingest SIP Creation tools Export tools DBPTK Prev Archival Storage Preservation Search and Order Data Management management tools E ARK SIP E ARK SIP E ARK AIP ESSArch Tools for Archive E ARK AIP DIP Creation tools E ARK DIP RODA Repository ESSArch Preservation Platform E ARK DIP E ARK SIP DB Visualisation Toolkit IP Viewer CMIS Portal Viewer Search and Display GUI IP Viewer Order Management Tool IP Viewer Oracle OLAP Viewer SIP2AIP Converter E ARK AIP HDFS Storage SOLR index Lily Ingest E ARK Web Search ERMS FILES GeoServer SIP Creator Viewers DB E ARK SIP Geo Data (SMURF) E ARK Web Access EAD Metadata OLAP QGIS AIP2DIP Converter E ARK DIP Peripleo GML

SZTAKIMEMORY PROJEKT

MEGŐRZENDŐ (SZTAKI) TUDÁS ENTITÁSOK A gyűjtőkör entitásai Megjegyzések Külső objektumok szabadalmak saját és idegen szabadalmi leírások elektronikus változatai műalkotások SZTAKI közreműködéssel készült digitális műalkotások az Intézet munkatársainak, projektjeinek stb. nevét hivatkozó média megjelenések digitális multimédia dokumentumok teljes szöveggel, teljes hang-videó felvételek Belső objektumok munkatársak szakmai profilja CV-k és egyéb szakmai hozzáértést leíró esetleg bizonyító információk (végzettségek) személyes kutatási dokumentumok, cikk gyűjtemények a munkatársak és a volt munkatársak saját személyes gyűjtése eredményezte cikk, könyv, és egyéb információk digitális objektumai az intézeti PR (multimédia) dokumentumok és azok fő változatai PR objektumok adatállományok az Intézetben keletkezett adatállományok, valamilyen adatbázis formátumban, amennyiben az mennyiségileg tárolható szoftver az Intézeti projektekben elkészült szoftver rendszerek és azok komponensei, a fő (major) és végső változatok forráskódja és futtatható változatai (pl. virtuális gépek formájában) hardver specifikációk digitális objektumok közötti felhasználó definiálta relációk és annotációk az Intézetben keletkezett hardver eszközök technikai specifikációja és teljes gyártási dokumentációja az Intézet projektjeinek összes eredménytermékei, a végső változatok beleértve a nem szöveges (multimédia) objektumokat is (pl. hang, videó) a tárolt digitális objektumok közötti nevesített felhasználó definiálta relációk és/vagy annotációk személyre szabottan kerülnek tárolásra, az annotációk formája lehet szöveges vagy képes az Intézet belső működéséséhez szükséges információk és adatállományok jelenlegi intraweb teljes tartalma valamint a létfontosságú intézeti belső adatbázisok (pl. eszközállomány) periodikus dump-jai a hosszú távú biztonságos megőrzés érdekében infrastruktúra specifikációk és nyomvonaltervek az Intézeti infrastruktúra specifikációi és nyomvonaltervek (villany, víz, gáz, hálózat, csatorna, biztonsági, tűzoltó és beléptető rendszer, stb.) épület, berendezés, bútorozás leírások az intézet épületeinek, azok berendezéseinek műszaki tervei projekt dokumentumok hozzáférés tekintetében védett személyes gyűjteménykezelés, egyénileg szabályozható egyéni hozzáférés a szoftver rendszerek munkaközi (minor) változatai nem kerülnek tárolása és megőrzésre ebben a tárolóban a projekt dokumentumok munkaközi változatai nem kerülnek tárolásra

SPECIÁLIS (?) PROBLÉMÁK AZ MTA SZTAKI ESETÉBEN Az MTA SZTAKI kutató-fejlesztő intézet és nem memória intézmény, szervezeti felépítése és működése nem konform az OAIS Referencia Modellel nincs önálló archiváló szervezeti egység -> az archiválás a könyvtár feladata lehet a könyvtárosok digitális objektumkezelési szaktudása hiányos (lásd adatbázisok, szoftver rendszerek menedzselése), jelenlegi archiválási gyakorlatuk leginkább dokumentumokra vonatkozik önarchiválás mint módszer - de a kutatók és fejlesztők archiválási szaktudása hiányos, archiválási gyakorlatuk nincs automatikus metaadat kivonatolás (az archiválás érdekében társított extra metaadatok esetében kritikus) a digitális archiválás finanszírozása (rövid de leginkább hosszú távon) nem kalkulált, ez a projektekben általában nem tervezett költségelem

ARCHÍVUM FUNKCIÓK repozitórium, digitális tárolás és visszakeresés (MM és szemantikus (RDF) tároló) teljes szövegű keresés finoman szabályozott (egyénileg, csoportosan) hozzáférési jogosultság rendszer annotáció és szemantikus reláció társítás API félautomatikus import, részben automatikus metaadat kivonatolás automatikus LOD export kódolt adattárolás érzékeny adatok esetén elosztott tárolás (3 +1 példány) törlés védelem IMPORT/EXPORT GUI1 GUI2 API OAIS ARCHIVE MM STORE RDF TRIPLESTORE

SZTAKIMemory DR. KOVÁCS LÁSZLÓ LASZLO.KOVACS@SZTAKI.MTA.HU