projects

Jelenlegi hely

Teljes név:SZTAKIMemory - Nem törölhető digitális archívumrendszer intézeti központi memória céljára
Kezdet:2017.01.01
Lezárás:2017.12.31
Résztvevők:MTA SZTAKI – Institute for Computer Science and Control, Hungary
Vezető:MTA SZTAKI / DSD

A SZTAKIMemory projekt célja az MTA SZTAKI-ban felgyülemlett több évtizedes tudás és kutatási-fejlesztési eredmény hosszútávú digitális megőrzését lehetővé tévő infrastruktúra megteremtése. A SZTAKIMemory alkalmazásával lehetővé válik, hogy a SZTAKI minden kutatója az általa előállított kutatási eredményeket, az eredmények eléréséhez felhasznált publikációkat, jegyzetek, szükséges adatokat, programokat, virtuális gépeket, stb. olyan módon tudja tárolni, hogy azok évek, évtizedek múlva is visszakereshetőek és visszaállíthatóak, olvashatók és futtathatóak legyenek.

Bár a jelenlegi rendszer csak az intézeten belüli adattárolás és visszakeresés lehetőségét nyújtja, a SZTAKIMemory jó alapot szolgáltata a Science 2.0 elveinek megvalósítására is. Mivel az adott kutatásis téma és eredménye egy helyen van tárolva, így ezek később a szélesebb tudományos nyilvánosság számára is megoszthatóvá válnak, és így nem csupán a kutatás eredményei, de adatai is hozzáférhetőek lesznek, ezáltal az eredmények bárki által reprodukálhatók is lehetnek.

A SZTAKIMemory az alábbi adatok tárolását teszi lehetővé:

 

A gyűjtőkör entitásai

Külső objektumok

 

szabadalmak

saját és idegen szabadalmi leírások elektronikus változatai

műalkotások

SZTAKI közreműködéssel készült digitális műalkotások

az Intézet nevével, munkatársainak, projektjeinek stb. nevét hivatkozó média megjelenések

digitális multimédia dokumentumok teljes szöveggel, teljes hang-videó felvételek

Belső objektumok

 

munkatársak szakmai profilja

CV-k és egyéb szakmai hozzáértést leíró esetleg bizonyító információk (végzettségek)

személyes kutatási dokumentum, cikk gyűjtemények

a munkatársak és a volt munkatársak saját személyes gyűjtése eredményezte cikk, könyv, és egyéb információk digitális objektumai

PR objektumok

az intézeti PR (multimédia) dokumentumok és azok fő változatai

adatállományok

az Intézetben keletkezett adatállományok, valamilyen adatbázis formátumban, amennyiben az mennyiségileg tárolható

szoftver

az Intézeti projektekben elkészült szoftver rendszerek és azok komponensei, a fő (major) és végső változatok forráskódja és futtatható változatai (pl. virtuális gépek formájában)

hardver specifikációk

az Intézetben keletkezett hardver eszközök technikai specifikációja és teljes gyártási dokumentációja

projekt dokumentumok

az Intézet projektjeinek összes eredménytermékei, a végső változatok beleértve a nem szöveges (multimédia) objektumokat is (pl. hang, videó)

digitális objektumok közötti felhasználó definiálta relációk és annotációk

a tárolt digitális objektumok közötti nevesített felhasználó definiálta relációk és/vagy annotációk személyre szabottan kerülnek tárolásra, az annotációk formája lehet szöveges vagy képes, kézzel vagy géppel írt

az Intézet belső működéséséhez szükséges információk és adatállományok

jelenlegi intraweb teljes tartalma valamint a létfontosságú intézeti belső adatbázisok (pl. eszközállomány) periodikus dump-jai a hosszú távú biztonságos megőrzés érdekében

infrastruktúra specifikációk és nyomvonaltervek

az Intézeti infrastruktúra specifikációi és nyomvonaltervek (villany, víz, gáz, hálózat, csatorna, biztonsági, tűzoltó és beléptető rendszer, stb.)

épület, berendezés, bútorozás leírások

az intézet épületeinek, azok berendezéseinek műszaki tervei


A hosszútávú megőrzést többféle stratégia és technológiai megoldás biztosítja:

  1. Standardokon alapuló metaadatkezelés. A SZTAKIMemory implementációja során szemantikus web technológiákat alkalmaztunk és egyben az digitális információk hosszú távú megőrzésének nemzetközi standard OAIS Reference Model-jével konform megoldást hoztunk létre. (Reference Model for an Open Archival Information System (OAIS), ISO 14721:2012 ). Ezáltal a SZTAKIMemory adatai átvihetők más olyan rendszerkbe is, amik az ISO 14721:2012 szabványt támogatják, ezáltal nem vagyunk egyetlen implementációhoz kötve.

  2. Fájlrendszer alapú tárolás. Az adatokat és azok metaadatait is mind fájlrendszerben tároljuk. A metaadatokat szöveges (XML/JSON) állományok tárolják, melyekből az online hozzáféréshez és kereséshez szükséges indexet az eredeti fájlokból kiindulva mindig újra tudjuk generálni. A SZTAKIMemory tehát nem használ klasszikus adatbáziskezelő rendszert, melynek fájlformátuma idővel változhat, és a hozzá szükséges szoftvert is karban kell tartani. Ehelyett minden leíró adat gép és ember által is olvasható. Ez lehetővé teszi akár azt is, hogy akár kinyomtatott formábanis megőrizzük az metaadatokat, vagy adott esetben a kinyomtatott változatból is visszaállíthatók legyenek az eredeti metaadatok.

  3. Redundáns adattárolás. Az online hozzáférhető adatokat egyszerre több szerveren szükséges tárolni, melyek földrajzilag is elkülönülnek egymástól (pl. SZTAKI egyes telephelyei, illetve külső felhőszolgáltató).

  4. Archiválás. Szükség van arra, hogy az adatokat időről-időre lementsük potenciálisan lassan olvasható, de sokáig "elálló" adattárolóra (blueray, szalag, vagy akár kinyomtatva papírra). Ezeknek az olvashatóságát és és visszaállíthatóságát időről-időre ellenőrizni is kell, és a technológia fejlődésével újabb fajta tárolókra kell átmásolni az archívumot.

  5. Eszközfüggetlen hozzáférés. A SZTKIMemory megfelelő SZTAKI-s jogosultságokkal SZTAKIMemory desktopon, weben, mobilon, tableten keresztül is hozzáférhető. A SZTAKI munkatársai a finoman szabályozható jogosultsági rendszernek köszönhetően alapból hozzáférnek a saját és az osztályuk adataihoz, illetve az intézeti globális adatokhoz, de az adatok megoszthatók más egységekkel vagy az intézet egészével is.