projects

Jelenlegi hely

Teljes név:Concentrated Cooperation on Research Data
Kezdet:2020.
Lezárás:2023.
Résztvevők:
A projekt honlapja:https://science-data.hu/
Vezető:SZTAKI

A projekt célja magyar kutatási adat repozitórium létrehozása a COVID-19 járvánnyal kapcsolatos kutatások támogatása céljából. A kutatási adat repozitórium hazai és nemzetközi szinten adattárolási és repozitórium szolgáltatásokat, valamint egyértelműen (peer-to-peer módon) szabályozott és megbízható adatmegosztást biztosít.

A rendszer épít a SZTAKI és a Wigner kutatóintézetek által működtetett MTA Cloud szolgáltatásaira mind a biztonságos adattárolás, mind pedig a jól definiált hozzáférhetőségi jogosultságok tekintetében.

Bár a repozitórium generikus, elméletileg bármely kutatói közösség számára hasznos szolgáltatásokat nyújt,  előnyben részesítjük a COVID-19 járvánnyal kapcsolatos kutatók, kutató csoportok, intézmények kiszolgálását.

Az adat repozitórium fejlesztését két lépcsőben tervezzük. Az első lépcsőben megvalósul:

  • Nemzetközileg megosztott, publikációhoz társított kutatási adathalmaz tárolás.
    Maga a publikáció egyértelműen hivatkozhat a tárolt kutatási adatokra. A publikációhoz társított adat entitásokat individuálisan avagy összecsomagoltan szeretnék feltölteni, amely után a rendszer kicsomagolja és az adat hivatkozás alapján rendezetten tárolja el az entitásokat.
  • Adott tudományos közösség tudományos adatainak nemzetközi megosztása.
    A kívánt repozitórium funkciók: adatentiások individuális és burst-ös feltöltése, metaadatok individuális bevitele formon keresztül és azok burst-ös feltöltése. Az adat entitások azonosítása, böngészése, kereshetősége, individuális és keresési eredmény halmazok együttes letöltése.
  • Kutatási adatok nyílt/zárt hosszú távú nemzetközi megosztása.
    A tervezett metaadatolás teljes körű és megfelel a hosszú távú digitális tárolás elvárásainak (OAIS).

Az első lépcsőben kialakított szolgáltatás a Dataverse szoftverre épül, azt fejleszti tovább és egészíti ki a magyar igényekhez igazítva. A második lépcsőben a nyers adatok megosztására és közös előállítására, gondozására adunk megoldást. A rendszer így már a kezdetektől adja a következő szolgáltatásokat:

  • Hivatkozások létrehozása adathalmazokra és fájlokra.
    EndNote XML, RIS és BibTeX formátumok.
  • OAI-PMH (Harvesting) interfészt biztosít.
    Metaadatok nyilvánossá tétele más rendszerek felé, illetve metaadatok gyűjtése.
  • EduID bejelentkezés támogatása.
  • Schema.org JSON-LD támogatás.
    Ez lehetővé teszi a Google Dataset Search szolgáltatás használatát más szolgáltatások felől.
  • Verziókövetés.
    Az adathalmazok és fájlok változásainak listája tárolásra kerül.
  • Irányított keresés (Faceted search) támogatása.