Teljes név: | SZTAKIMemory - Nem törölhető digitális archívumrendszer intézeti központi memória céljára |
Kezdet: | 2017.01.01 |
Lezárás: | 2017.12.31 |
Résztvevők: | MTA SZTAKI – Institute for Computer Science and Control, Hungary |
Vezető: | MTA SZTAKI / DSD |
A SZTAKIMemory projekt célja az MTA SZTAKI-ban felgyülemlett több évtizedes tudás és kutatási-fejlesztési eredmény hosszútávú digitális megőrzését lehetővé tévő infrastruktúra megteremtése. A SZTAKIMemory alkalmazásával lehetővé válik, hogy a SZTAKI minden kutatója az általa előállított kutatási eredményeket, az eredmények eléréséhez felhasznált publikációkat, jegyzetek, szükséges adatokat, programokat, virtuális gépeket, stb. olyan módon tudja tárolni, hogy azok évek, évtizedek múlva is visszakereshetőek és visszaállíthatóak, olvashatók és futtathatóak legyenek.
Bár a jelenlegi rendszer csak az intézeten belüli adattárolás és visszakeresés lehetőségét nyújtja, a SZTAKIMemory jó alapot szolgáltata a Science 2.0 elveinek megvalósítására is. Mivel az adott kutatásis téma és eredménye egy helyen van tárolva, így ezek később a szélesebb tudományos nyilvánosság számára is megoszthatóvá válnak, és így nem csupán a kutatás eredményei, de adatai is hozzáférhetőek lesznek, ezáltal az eredmények bárki által reprodukálhatók is lehetnek.
A SZTAKIMemory az alábbi adatok tárolását teszi lehetővé:
A gyűjtőkör entitásai |
|
Külső objektumok |
|
szabadalmak |
saját és idegen szabadalmi leírások elektronikus változatai |
műalkotások |
SZTAKI közreműködéssel készült digitális műalkotások |
az Intézet nevével, munkatársainak, projektjeinek stb. nevét hivatkozó média megjelenések |
digitális multimédia dokumentumok teljes szöveggel, teljes hang-videó felvételek |
Belső objektumok |
|
munkatársak szakmai profilja |
CV-k és egyéb szakmai hozzáértést leíró esetleg bizonyító információk (végzettségek) |
személyes kutatási dokumentum, cikk gyűjtemények |
a munkatársak és a volt munkatársak saját személyes gyűjtése eredményezte cikk, könyv, és egyéb információk digitális objektumai |
PR objektumok |
az intézeti PR (multimédia) dokumentumok és azok fő változatai |
adatállományok |
az Intézetben keletkezett adatállományok, valamilyen adatbázis formátumban, amennyiben az mennyiségileg tárolható |
szoftver |
az Intézeti projektekben elkészült szoftver rendszerek és azok komponensei, a fő (major) és végső változatok forráskódja és futtatható változatai (pl. virtuális gépek formájában) |
hardver specifikációk |
az Intézetben keletkezett hardver eszközök technikai specifikációja és teljes gyártási dokumentációja |
projekt dokumentumok |
az Intézet projektjeinek összes eredménytermékei, a végső változatok beleértve a nem szöveges (multimédia) objektumokat is (pl. hang, videó) |
digitális objektumok közötti felhasználó definiálta relációk és annotációk |
a tárolt digitális objektumok közötti nevesített felhasználó definiálta relációk és/vagy annotációk személyre szabottan kerülnek tárolásra, az annotációk formája lehet szöveges vagy képes, kézzel vagy géppel írt |
az Intézet belső működéséséhez szükséges információk és adatállományok |
jelenlegi intraweb teljes tartalma valamint a létfontosságú intézeti belső adatbázisok (pl. eszközállomány) periodikus dump-jai a hosszú távú biztonságos megőrzés érdekében |
infrastruktúra specifikációk és nyomvonaltervek |
az Intézeti infrastruktúra specifikációi és nyomvonaltervek (villany, víz, gáz, hálózat, csatorna, biztonsági, tűzoltó és beléptető rendszer, stb.) |
épület, berendezés, bútorozás leírások |
az intézet épületeinek, azok berendezéseinek műszaki tervei |
A hosszútávú megőrzést többféle stratégia és technológiai megoldás biztosítja:
-
Standardokon alapuló metaadatkezelés. A SZTAKIMemory implementációja során szemantikus web technológiákat alkalmaztunk és egyben az digitális információk hosszú távú megőrzésének nemzetközi standard OAIS Reference Model-jével konform megoldást hoztunk létre. (Reference Model for an Open Archival Information System (OAIS), ISO 14721:2012 ). Ezáltal a SZTAKIMemory adatai átvihetők más olyan rendszerkbe is, amik az ISO 14721:2012 szabványt támogatják, ezáltal nem vagyunk egyetlen implementációhoz kötve.
-
Fájlrendszer alapú tárolás. Az adatokat és azok metaadatait is mind fájlrendszerben tároljuk. A metaadatokat szöveges (XML/JSON) állományok tárolják, melyekből az online hozzáféréshez és kereséshez szükséges indexet az eredeti fájlokból kiindulva mindig újra tudjuk generálni. A SZTAKIMemory tehát nem használ klasszikus adatbáziskezelő rendszert, melynek fájlformátuma idővel változhat, és a hozzá szükséges szoftvert is karban kell tartani. Ehelyett minden leíró adat gép és ember által is olvasható. Ez lehetővé teszi akár azt is, hogy akár kinyomtatott formábanis megőrizzük az metaadatokat, vagy adott esetben a kinyomtatott változatból is visszaállíthatók legyenek az eredeti metaadatok.
-
Redundáns adattárolás. Az online hozzáférhető adatokat egyszerre több szerveren szükséges tárolni, melyek földrajzilag is elkülönülnek egymástól (pl. SZTAKI egyes telephelyei, illetve külső felhőszolgáltató).
-
Archiválás. Szükség van arra, hogy az adatokat időről-időre lementsük potenciálisan lassan olvasható, de sokáig "elálló" adattárolóra (blueray, szalag, vagy akár kinyomtatva papírra). Ezeknek az olvashatóságát és és visszaállíthatóságát időről-időre ellenőrizni is kell, és a technológia fejlődésével újabb fajta tárolókra kell átmásolni az archívumot.
- Eszközfüggetlen hozzáférés. A SZTKIMemory megfelelő SZTAKI-s jogosultságokkal SZTAKIMemory desktopon, weben, mobilon, tableten keresztül is hozzáférhető. A SZTAKI munkatársai a finoman szabályozható jogosultsági rendszernek köszönhetően alapból hozzáférnek a saját és az osztályuk adataihoz, illetve az intézeti globális adatokhoz, de az adatok megoszthatók más egységekkel vagy az intézet egészével is.