ECM Consulting Kft. 1119 Budapest, Puskás Tivadar u. 33. Fax: +36 (1) 999 7496 Enterprise Content Governance 2013.03.29.
Bemutató tartalma 1. Kiinduló állapot 2. Megoldás bemutatása 3. Elért eredmények
1. Kiinduló állapot
Dokumentum migráció előzményei 1. A dokumentumok számos különböző helyen, különböző rendszerekből érhetők el. 2. Lotus Notes adatbázis alapú, egyedi üzleti logikával rendelkező alkalmazás tárolja az iktatott iratokat és a hozzájuk kapcsolódó iktatási adatokat. 3. A rendszereken belül töredezett a tárolás, előfordulnak oda nem illő tartalmak, duplikációk. 4. Az idők folyamán evolúciós módon alakult a dokumentációk hozzáférés kezelése jelentős információbiztonsági problémát okozva. A CMX rendszer és a kapcsolódó tanácsadási projekt segítségével a fenti problémák megoldásra kerültek. 4
Projekt indításakor kitűzött célok 1. A projekt tárgyát képező szervezeti egység által kezelt elektronikus dokumentumok egységes struktúrájának kialakítása. 2. A projekt tárgyát képező szervezeti egység által kezelt elektronikus dokumentumok migrációja az egységes kezelést és biztonságos tárolást biztosító dokumentumtárba. 3. A digitalizált D tervek betöltése a dokumentumtárban kialakított egységes struktúrába. 4. A műszaki dokumentációk elérésének lehetővé tétele a WAM rendszerből a leíróadatok, kulcsszavak feltöltésével. 5. Információbiztonsági kockázat csökkentése a törzspéldánykezelési szabályozási környezet alapjainak megteremtésével. 5
2. Megoldás bemutatása
Migráció folyamata Üzleti szempontból értékes, de nem ECM releváns állományok Felmérés, elemzés Duplikáció analízis Hibás kiterjesztések javítása Kulcsszavazás Betöltés OCR ECM releváns állományok 7
Felmérés 1. Tárolt állományok forrásrendszerenként történő felmérése Novell alapú közös meghajtók Lotus Notes alapú dokumentációs adatbázisok Lotus Notes alapú egyedi rendszerek Munkaállomások Munkaállomások vizsgálatának előnyei: o o o A magán célú fájlok nagy része kiszűrhető (törölhető). A felesleges fájlduplikálások tovább csökkenthetőek. A lokális gépeken lévő tárhely problémák kiküszöbölhetők 2. Elemzéshez szükséges adatok összegyűjtése állományonként automatizált felmérő folyamatok segítségével. 8
Elemzés 1. Az adatok különböző paraméterek szerint (pl. méret, típus, módosítás dátuma, stb.) szétválogatásra kerülnek. 2. Automatizált folyamatok segítségével az adatok kielemzésre, a problémák felfedésre kerülnek: Az egyes állományok HASH lenyomatának elkészítésével a duplikációk kiszűrése. o Két állomány egymás duplikátuma, ha a HASH lenyomatuk és a méretük azonos. ACL-ek vizsgálata a jogosulatlan hozzáférések kiszűréséhez. Fájlkiterjesztések vizsgálata, fekete és fehér lista létrehozása. 9
Elemzés 3. Egy előzetes fehér lista alapján meghatározott releváns és fontos adatokat azonosítóval, tagekkel kerülnek ellátásra. A tagelésnek köszönhetően a dokumentumok utólag könnyebben visszakereshetőek és hivatkozhatóak lesznek. 4. Kiszűrésre és áthelyezésre kerülnek a rossz helyen tárolt tartalmak. 5. Kiszűrésre és javításra kerülnek a hibás állományok. 10
Közös meghajtókon tárolt állományok A közös meghajtókon ~1,5 Millió fájl (668 GB) található meg. ~1 Millió állománynál négyszeres ismétlődés azonosítható. A fájlok összesen 114 230 db könyvtárban vannak elhelyezve. 80 382 mappa 5 vagy kevesebb fájlt tartalmaz. 2484 mappa 100 vagy annál több fájlt tartalmaz, melyek közül 58 db 1000 vagy annál több fájlt tartalmaz (legnagyobb a 6530 db fájlt tartalmazó). 11
Közös meghajtókon tárolt állományok Darabszám Tárhely (GB) Migrálandó állományok 595 066 413 Duplikátumok 456 552 119 Nem engedélyezett típusú fájlok 394 240 136 Összesen 1 445 858 668 12
Közös meghajtókon tárolt állományok 13
Dokumentumok időbeni eloszlása Fájlok utolsó módosítási időpontja Fájlok száma (db) 1 éve nem módosult 1 439 055 2 éve nem módosult 1 365 917 3 éve nem módosult 1 288 222 4 éve nem módosult 1 161 225 5 éve nem módosult 861 414 6 éve nem módosult 748 980 7 éve nem módosult 655 223 8 éve nem módosult 543 449 14
Lotus Notes adatbázisokban tárolt állományok Összesen 224 adatbázisban 855 199 db fájl található (416 GB) 54 adatbázisban az iktatórendszer adatai, iratai találhatók meg (843 138 fájl, 400 GB) 170 db további dokumentációs adatbázis 12 061 db fájlt tartalmaz (16 GB) 15
Adattisztítás Alábbi csoportok kialakítása kiterjesztés alapján: 1. Szervezetben nem engedélyezett kiterjesztésű állományok Archiválást követően törlésre kerülnek. 2. Javítandó kiterjesztésű állományok, melyek gépelési, mentési hibák következtében keletkeztek. Javításra, majd migrálásra kerülnek. 3. Üzletileg fontos, azonban nem ECM releváns állományok (pl. futtatható állományok, média fájlok stb.) Meghatározott helyre, egységes struktúrába kerülnek migrálásra. 4. Szervezet számára értékes, ECM releváns állományok ECM rendszerbe egységes struktúrába kerülnek migrálásra. 16
Kiterjesztés alapú elemzés Csoportosítás Kiterjesztések (darabszám) Fájlok (darabszám) Fájlok mérete Nem engedélyezett 177 387 991 137 GB Javítandó 826 69 625 31 GB Üzletileg fontos, nem ECM releváns Üzletileg fontos, ECM releváns 64 339 346 323 GB 1813 1 509 144 594 GB Összesen 2856 2 306 109 1085 GB 17
Leggyakoribb fájlkiterjesztések Kiterjesztés Darabszám Átlagos fájlméret Összméret pdf 485 575 820 KB 379,7263 GB doc 350 098 276,9 KB 92,43813 GB grf 341 830 19,6 KB 6,40054 GB xls 150 398 311,7 KB 44,70116 GB jpg 149 060 1208,5 KB 171,7952 GB txt 52 776 33,9 KB 1,706683 GB 49 344 391,3 KB 18,41549 GB tif 45 488 1365 KB 59,21271 GB ins 42 917 3,1 KB 0,12791 GB Összesen 2.306.109 493,1 KB 1084,5 GB 18
Leggyakoribb fájlkiterjesztések 600000 400 500000 350 300 400000 250 300000 200 Darabszám Összméret (GB) 150 200000 100 100000 50 0 pdf doc grf xls jpg txt tif ins 0 19
Kulcsszavazás 1. A migrációt megelőzően a dokumentumok tartalma kiolvasásra kerül. 2. A társaság által használt kulcsszavak a felmérések során közösen kerülnek meghatározásra, az alábbiak szerint: Kulcsszavakat tartalmazó rendszerek információi, kapcsolódó dokumentumai begyűjtése kerülnek az ügyféltől. A kulcsszavak automatikusan kinyerésre kerülnek a kapott rendszerekből / dokumentumokból. 3. A kinyert tartalomban megtalálható kulcsszavak rögzítésre kerülnek a felmért dokumentumokhoz. A kulcsszavak keresését nem befolyásolja, hogy a tartalomban: ékezettel vagy anélkül szerepel; külön- vagy egy szóban található meg; speciális karaktereket tartalmaz. 20
Migráció A betöltés során minden migrált állomány mellé letárolásra kerül az új objektumra mutató link. A forrás rendszerek, területek munkatársak számára. a továbbiakban csak olvashatók a 1 hónap átmeneti időszakot követően a betöltött állományok törlésre kerülnek. A továbbiakban a forrásrendszerekben kizárólag az ECM rendszer állományaira mutató linkek találhatók meg. 3 hónap átmeneti időszakot követően a forrásrendszerek, területek a felhasználók számára letiltásra kerülnek. A továbbiakban kizárólag az IT munkatársai érhetik el. 6 hónap átmeneti időszakot követően a forrás rendszerek, területek tartalma archiválásra kerül. A tárterület felszabadul. 21
Utólagos OCR A nagy mennyiségű képállományon, iratképeken automatizált optikai karakterfelismerést (OCR) szükséges végezni. A megoldás automatikusan lefut a migrációt követően az érintett TIFF és PDF állományokra. Az OCR-ezett tartalmat PDF formátumban az eredeti dokumentumhoz csatolja. Az állományok rögzített attribútumai az OCR-ezését követően felülvizsgálatra kerülnek az újonnan kinyert kulcsszavak alapján. 22
CMX futási idők Rendszer Flow Futási idő (ms/db) Futási idő (nap/rendszer) File System Scan ~29 ~0,49 File System Hash ~1867 ~31,35 File System Text extraction ~1993 ~33,47 Lotus Notes Dump ~839 ~7,77 Lotus Notes Scan ~2365 ~23,41 Lotus Notes Hash ~162 ~1,60 Lotus Notes TextExtraction ~481 ~4,76 File System, Lotus Notes Keyword ~1100 ~29,36 23
3. Elért eredmények
Elért eredmények 1. Dokumentumtípusok körének azonosítása és a főtípus-altípus besorolás meghatározása. Egységes dokumentum struktúra létrehozása. 2. Leíróadatok körének meghatározása. A dokumentumok visszakereshetőségének biztosítása. 3. A szervezeti egységek által kezelt dokumentumok forrásának meghatározása. A migráció szabályainak meghatározása. 4. Társrendszerből kinyerhető adatok alapján automatizáltan végrehajtható feltöltési szabályok kialakítása. A betöltött dokumentumok eszközkezelő rendszerből történő kereshetőségének biztosítása. 25
Elért eredmények 5. Feketelista létrehozása, melyek nem kerülnek betöltésre az ECM rendszerbe. Szervezetben hivatalosan nem engedélyezett fájltípusok meghatározása. 6. Üzleti szempontból értékes, de nem ECM rendszerben kezelendő állományok listájának meghatározása, tárolási struktúrájuk kialakítása a fájlrendszeren. Szervezet számára hasznos, de nem dokumentumkezelő rendszerben kezelendő fájltípusok kiszűrése. 7. Duplikációk kiszűrése és megszűntetése. Jelentős tárterület felszabadítása. 26
Elért eredmények 8. A főtípus-altípus párokhoz törzspéldánykezelő csoport meghatározása. Letisztult jogosultságkezelési környezet kialakítása. 9. Törzspéldánykezelési szabályozási javaslat létrehozása Információbiztonsági kockázat csökkentése. 27
A projekt előnyei a szervezet számára Egy minden munkatárs által használt egységes rendszerben történik a dokumentumok kezelése. A dokumentumok kezelése a működési folyamatok mentén (főtípus-altípus besorolás szerint) történik. A leíróadatoknak és kulcsszavaknak köszönhetően a dokumentumok jól kereshetővé válnak. Közös meghajtókon történő dokumentum tárolás megszüntethetővé válik. A továbbiakban kizárólag az EDMS rendszerben történik a dokumentumok kezelése. Törzspéldánykezelési szabályozásnak köszönhetően lehetővé válik az ősfeltöltés során kialakított rend megtartása. Az egyes altípusokért felelős csoportoknak köszönhetően elkerülhetővé válik a verziók keveredése, biztosítható a végleges dokumentumok EDMS rendszerben tárolása. 28
Továbblépési lehetőségek Az aktivitás lezárását követően az alábbi feladatokat javasolt elvégezni: A projekt kiterjesztése más szervezeti egységekre is. Privát meghajtókon tárolt tartalmak elemzése, migrációja. Elektronikus postafiókokban tárolt tartalmak elemzése, migrációja. A projekt kiterjesztése más migrálandó rendszerekre is. 29
Kérdések?
Köszönjük a figyelmet! ECM Consulting Kft. Enterprise Content Management 1119 Budapest, Puskás Tivadar u. 33. Fax: +36 (1) 999 7496