Az ELKH Adatrepozitórium Platform infrastrukturális és tervezési megoldásai
A tudományos eredményeket megalapozó adathalmazokhoz való hozzáférhetőség, ezek nyilvánossá tétele, kereshetősége további kutatások számára nemcsak egy adott tudományterület fejlődését segítheti elő, de kaput nyit interdiszciplináris és nemzetközi kutatások számára is, ami napjainkban már egyre inkább alapelv, elvárás, esetenként követelmény. A publikációkhoz kapcsolódó adatok nyilvánossá tétele és tárolása sok esetben ad hoc módon történik, amelynek azonban számos hátránya van. A hosszú távú elérhetőség biztosítása nem egyszerű feladat, továbbá az adatok kereshetősége, elérhetősége nehézségekbe ütközhet a heterogenitás és széttagoltság miatt.
Az ELKH Adatrepozitórium Platform (ELKH ARP) projekt célja egy központi magyar kutatási adatrepozitórium létrehozása, amely lehetővé teszi a kutatási adatok FAIR*1-elvű tárolását és kezelését, illetve a publikációhoz társított kutatási adathalmazok hosszú távú tárolását és ezek (nyílt vagy zárt) megosztását adott tudományos közösség számára, tudományágak között, vagy akár nemzetközi szinten is, ezzel biztosítva egy későbbi nemzetközi kutatási infrastruktúrába való bekapcsolódás lehetőségét. Az adatrepozitórium kiépítéséhez szükséges digitális infrastruktúrát az Eötvös Loránd Kutatási Hálózat (ELKH) két kutatóhelye: a Számítástechnikai és Automatizálási Kutatóintézet (SZTAKI) és a Wigner Fizikai Kutatóközpont (Wigner FK) készíti az ELKH Titkárság támogatásával, az ELKH Adatrepozitórium projekt keretein belül.
Egy ilyen rendszerrel szemben elvárás a magas rendelkezésre állás, nagy fokú adatbiztonság, nagy sávszélességű adatkapcsolat, a hosszú távú tárolás biztosítása, hatalmas tömegű és méretű adattartalmak befogadása, és nem utolsósorban az adatok közötti hatékony kereshetőség biztosítása.
Ebben a cikkben az adatrepozitórium hardver és szoftver infrastruktúrájának tervezési szempontjait és megvalósítási lépéseit, illetve ezek fő aspektusait tekintjük át, kitérve műszaki részletekre, fontosabb tervezési döntésekre és a választott megoldásokra. Bemutatjuk, milyen szerepet játszik, és milyen előnyökkel jár az ELKH Cloud rendszeréhez való kapcsolódás, az adatbiztonság hogyan garantálható a redundancia, adatreplikáció különböző szintjeinek alkalmazásával, illetve hogyan tehetők még kényelmesebbé és hatékonyabbá a kutatóintézeti primer adatgyűjtési folyamatok, alkalmazkodva az esetleges egyedi, helyi munkafolyamatokhoz.