Fogalomtár
A
Adatarchiválás
Az adatok hosszú távú megőrzése és tárolása későbbi felhasználás céljából.
Adatdokumentáció
Az adatok jelentését, szerkezetét és előállításának folyamatát leíró információk.
Adatformátum
Az adatok tárolási módja (pl. CSV, XML…)
Adatgazdász
Olyan személy, aki adatok karbantartásáért és értelmezéséért felelős, és ismeri az adattárolási és adatmegőrzési lehetőségeket, jó gyakorlatokat.
Adathasználati megállapodás
A Data Use Agreement (DUA) egy jogi megállapodás, amely meghatározza, hogy egy adott adatállományt ki, hogyan és milyen feltételekkel használhat.
Adathitelesítés
Az adatok eredetiségének és hitelességének ellenőrzése.
Adathivatkozás
Az adatok hivatkozásának szabványos módja, amely biztosítja azok visszakövethetőségét és elismerését.
Adathozzáférési engedély
Az adatok elérésére és használatára vonatkozó engedélyezési szabályok.
Adathozzáférési szint
Az adatokhoz való hozzáférés szabályozása (pl.: nyílt, korlátozott, zárt).
Adatintegritás
Az adatok megbízhatóságának, teljességének és konzisztenciájának biztosítása.
Adatkészlet
Adatok gyűjteménye, amely egységnek tekinthető adatkezelési, jogi és megosztási szempontokból, vagyis praktikusan az adatkészlet minden elemére ugyanazok a jogi megkötések vonatkoznak, vannak közös metaadataik, és együttesen kerülnek megosztásra.
Adatkezelés
Az adatok gyűjtésének, tárolásának, feldolgozásának, megosztásának és védelmének folyamata.
Adatkezelési szabályzat / adatmenedzsment terv
Olyan formális dokumentum, amely meghatározza hogyan kell az adatokat kutatási projektek során kezelni.
Adatlicenc
Az adatok felhasználására vonatkozó jogi és etikai keretek (pl. CC )
Adatmegőrzés
Az adatok és metaadataik hosszú távú olvashatóságát és értelmezhetőségét biztosító eljárások.
Adatminőség
Az adatok pontosságát, megbízhatóságát és konzisztenciáját leíró mutatók összessége.
Adatrepozitórium
Olyan adattároló, amely - általában különböző forrásokból származó - adatcsomagok közzétételére és megosztására szolgál.
Adattároló/ Adattárolás
Az adatok tárolásának módját és technológiáját jelenti, amely lehetővé teszi az adatok rögzítését, visszakeresését és kezelését. Az adattárolás lehet lokális (pl. merevlemezen) vagy felhőalapú.
Adattisztítás
Az adatok zajának és hibáinak eltávolítása az elemzések pontosságának növelése érdekében.
Adattörténet
Hagyományosan egy történelmi tárgy tulajdonosainak és tárolási helyeinek időrendi listája. A modern kutatási adatkezelésben az adat életciklusának állomásait írja le minél részletesebben, vagyis hogyan és milyen más adatokból keletkezett, kik és milyen átalakításokat hajtottak végre rajta.
Adatvédelem
Az adatok védelmével és biztonságával kapcsolatos elvek és gyakorlatok összessége. Célja az érzékeny vagy személyes adatok illetéktelen hozzáférésének megakadályozása, például adatvédelmi szabályzatok (GDPR) betartásával.
Anonimizálás
Az egyének azonosíthatóságának megszüntetése az adatokban.
ARGOS
Az OpenAIRE és az EUDAT közös fejlesztése, adatmenedzsment terv kollaboratív megírására alkalmas szoftver.
ARK
Az ARK (Archival Resource Key) egy perzisztens azonosító típus, melyet többek között múzeumok, levéltárak, könyvtárak is használnak.
ARP AROMA
Az ARP Adatrepozitóriumban az ARP AROMA szolgáltatás segítségével az elhelyezett adatcsomagokon belüli fájlokat is el lehet látni egyedi metaadatokkal. Az adatcsomagok és az azokon belüli fájlok metaadatolása az ARP Sématárban tárolt publikus metaadatsémák szerint lehetséges.
ARP Közös kereső
Az ARP Adatrepozitóriumban lehetőség van fájlszintű metaadatok megadására is, az ezek alapján történő keresést biztosítja az ARP Közös Keresője. A szolgáltatás segítségével nem csak az ARP Adatrepozitóriumban elhelyezett, hanem más repozitóriumokban tárolt kutatási adatok között is lehet keresni.
ARP Sématár
Az ARP Sématár egy Cedar alapú metaadatkészlet repozitórium. A felhasználók egyedi igényeiknek megfelelő új metaadatkészleteket (sémákat) is létrehozhatnak.
B
Big Data
Nagy mennyiségű, változatos adatkezelési és elemzési módszereket igénylő adathalmaz.
C
CEDAR
A CEDAR (Center for Expanded Data Annotation and Retrieval) egy metaadatséma regiszter, , amely segít a kutatóknak megfelelni az adataik archiválására vonatkozó követelményeknek, hogy mások is megértsék és felhasználhassák őket.
Creative Commons (CC) licencek
A CC-licencek lehetővé teszik a szerzők számára, hogy szerzői jogaikat megtartsák, de ezzel egyidőben lehetőséget biztosítsanak – különböző korlátok között – a mű feldolgozására, terjesztésére. A projekt számos szabad licencet kínál.
CRIS (Kutatási Információs Rendszer)
Kutatási információs rendszer, amely a projektek, publikációk és kutatási adatok nyilvántartására szolgál.
D
Dataverse
Egy nyílt forráskódú platform, amelyet kutatási adatok archiválására és megosztására használnak. Lehetővé teszi a kutatók számára, hogy rendszerezetten tárolják és publikálják az adatokat. Az ARP adatrepozitórium a Dataverse adatrepozitórium továbbfejlesztett változata.
DMPonline
A Digital Curation Centre által létrehozott platform, amely lehetővé teszi, hogy a regisztrált felhasználók adatmenedzsment terveket készítsenek. Létrehozhatunk saját személyre szabott tervet, továbbá lehetőségünk van arra is, hogy több egyetem és kutatást finanszírozó szervezet előre elkészített sablon kérdéseit használjuk.
DMPTool
A Data Management Plan Tool (DMPTool) egy online eszköz, amely segít a kutatóknak adatkezelési tervet (Data Management Plan, DMP) készíteni.
DOI
A DOI (Digital Object Identifier) egy perzisztens azonosító típus, melynek használata tudományos közlemények esetén széles körben elterjedt.
Dublin Core
Egy teljesen általános metaadat-séma, mely minden dolog leírására alkalmas, ezért igen elterjedt, ISO szabvány: 15836-1:2017
E
Elsődleges adat (nyers adat)
Feldolgozatlan adat, a keletkezéskori tartalommal és formában.
F
FAIR alapelvek
Kutatási adatok kezelésére vonatkozó alapelvek, amelyek biztosítják a kutatási eredmények elérhetőségét és reprodukálhatóságát (Findable, Accessible, Interoperable, Reusable – Megtalálható, Hozzáférhető, Szabványos, Újrafelhasználható).
G
GDPR
Általános adatvédelmi rendelet, mely szabályozza a természetes személyekre vonatkozó személyes adatok kezelését.
H
Handle
A Handle System egy általános perzisztens azonosító szolgáltatási rendszer a CNRI üzemeltetésében. A Handle System szolgálja ki a DOI-kat is. A Handly System által bejegyzett perzisztens azonosítót nevezzük handle-nek.
I
Időbélyeg
Az adatok keletkezésének vagy módosításának időpontját rögzítő információ.
K
Kutatási adat
Kutatási adat minden olyan információ amely kutatási eredmények alátámasztására keletkezett. Kutatási adatok létrejöhetenk szerzők által, generálhatják eszközök, lehetnek gyűjtés vagy megfigyelés eredményei. Nem csak digitális formában léteznek kutatási adatok, ide értendők például a papír alapú jegyzetek, naplók is.
Kutatási adatmenedzsment
A kutatási adatmenedzsment, adatkezelési terv a kutatásból származott adatok létrehozására, tárolására, hozzáférésére, megosztására, újrahasznosításának biztosítására és megőrzésére vonatkozik.
Kutatási objektum
A kutatási objektum egy módszert ad arra, hogy kutatási adatokat aggregálni, csomagolni, és azonosítani lehessen az Interneten. Ehhez tartozik az adatok leírása (metaadatolása), az adatfájlok tartalmának és az azok közti kapcsolatoknak a dokumentálása.
M
Metaadat
Az adatokat leíró adat. Legáltalánosabb metaadatnak számít az adatok elnevezése, készítője és készítési dátuma. A további lehetséges metaadat leírókat sémákba szokás csoportosítani és definiálni. A legismertebb ilyen séma a Dublin Core. Egy tétel metaadatainak összességét metaadat-rekordnak hívjuk, melyek szerkezetét szabályozzák a metaadat-sémák.
Metaadatséma
A metaadatok egységesítése kulcsfontosságú a használat szempontjából. A metaadatséma a metaadatok szerkezetét írja le, milyen elemek használhatók egy metaadat rekordban, azoknak milyen értékei lehetnek, hogyan ajánlott a metaadatokat kitölteni illetve közzétenni.
N
Nyílt adat
Olyan adatok, amelyek szabadon hozzáférhetők, újrahasználhatók és megoszthatók, általában megfelelő licencek (pl. Creative Commons) mellett. A tudományban az átláthatóság és reprodukálhatóság elősegítésére használják.
Nyílt hozzáférés
A nyílt hozzáférés a közleményekhez, adatokhoz való szabad és korlátozás-mentes hozzáférést jelenti, ide értve az olvasást, letöltést és az újrafelhasználást is, a megfelelő forrásjelölés alkalmazásával. Szokás arany és zöld fokozatú nyílt hozzáférést megkülönböztetni, ahol az arany esetben a kiadó, míg a zöld esetben az intézmény vagy a kutató biztosítja a nyílt hozzáférést.
Nyílt tudomány
A nyílt tudomány olyan elvek és gyakorlatok összessége, amelyek a kutatási eredmények szabad hozzáférését és felhasználásá teszik lehetővét, ezáltal a közösségi hasznosítás lehetőségét maximálják.További ismertetőjegyei az együttműködés, átláthatóság és reprodukálhatóság.
O
Ontológia
Formálisan ábrázolt tudáshalmaz, mely fogalmak egymás közötti viszonyát reprezentálja. Az ontológia váza osztályok és tulajdonságok definíciójából áll. Például egy tudományos közleményeket leíró ontológiában lehet folyóiratcikk és könyvfejezet osztály valamint szerző és oldalszám tulajdonság. Az ontológia a matematikai logikának egy speciális formájára, a leíró logikára épül.
P
Perzisztens azonosító
Digitális objektumok hosszútávú azonosítására szolgál. Magyarul lehet még állandó azonosítónak is hívni. Angol rövidítése PID. A PID funkciója, hogy globálisan egyértelműen azonosítson egy digitális objektumot, és az is elvárt, hogy az azonosító URL-re leképezhető (resolvable, actionable) legyen. A DOI, ORCID, ISBN ismert példák PID szolgáltatásokra.
R
Regiszter
Valamilyen típusú digitális objektumok jegyzéke, a regiszteren belül egyértelmű azonosítóval ellátva. Fő célja az, hogy az objektum megtalálható legyen, és nem célja a teljes adattartalom tárolása (ellentétben a repozitóriummal). Tipikus példái: doménnév regiszter, protokoll regiszter, metaadatséma regiszter.
Repozitórium
Olyan fájlszerver, amely tudományos anyagok archiválására és hozzáférhetővé tételére szolgál.
RO-Crate
Kutatási adatcsomag-formátum, melyben az egész csomag és az egyes tartalmazott fájlok is gazdagon leírhatók metadatokkal. Ezáltal támogatja a kutatások adatainak FAIR megfelelését és hosszútávú megőrzését.
S
Származtatott adat
Olyan adat, amely más adatok feldolgozásából keletkezett, azaz nem elsődleges adat. Az angol secondary data fogalom inkább statisztikai fogalom.
Személyes adat
Személyes adatnak minősül egy természetes személlyel kapcsolatba hozható minden adat, valamint az adatból levonható, az érintettre vonatkozó következtetés.
V
Verziókezelés
Az adatállományok módosításainak követése és dokumentálása.
W
Wikidata
Egy szabad és nyílt adathalmaz, amely strukturált adatokat tartalmaz különböző témákban. A Wikidata-t a Wikimédia Alapítvány működteti, és célja, hogy központi adatforrásként szolgáljon a Wikipédia és más projektek számára.
Wikidata azonosító
Egy egyedi azonosító (Q-szám, pl. Q42), amelyet a Wikidata minden egyes adatlaphoz hozzárendel. Ez segíti a gépek és emberek számára is az adatok egyértelmű azonosítását.