Fogalomtár
A
Adatarchiválás
Az adatok hosszú távú megőrzése és tárolása későbbi felhasználás céljából.
Adatdokumentáció
Az adatok jelentését, szerkezetét és előállításának folyamatát leíró információk.
Adatformátum
Az adatok tárolási módja (pl. CSV, XML…)
Adatgazdász
Olyan személy, aki adatok karbantartásáért és értelmezéséért felelős, és ismeri az adattárolási és adatmegőrzési lehetőségeket, jó gyakorlatokat.
Adathasználati megállapodás
A Data Use Agreement (DUA) egy jogi megállapodás, amely meghatározza, hogy egy adott adatállományt ki, hogyan és milyen feltételekkel használhat.
Adathitelesítés
Az adatok eredetiségének és hitelességének ellenőrzése.
Adathivatkozás
Az adatok hivatkozásának szabványos módja, amely biztosítja azok visszakövethetőségét és elismerését.
Adathozzáférési engedély
Az adatok elérésére és használatára vonatkozó engedélyezési szabályok.
Adathozzáférési szint
Az adatokhoz való hozzáférés szabályozása (pl.: nyílt, korlátozott, zárt).
Adatintegritás
Az adatok megbízhatóságának, teljességének és konzisztenciájának biztosítása.
Adatkészlet
Adatok gyűjteménye, amely egységnek tekinthető adatkezelési, jogi és megosztási szempontokból, vagyis praktikusan az adatkészlet minden elemére ugyanazok a jogi megkötések vonatkoznak, vannak közös metaadataik, és együttesen kerülnek megosztásra.
Adatkezelés
Az adatok gyűjtésének, tárolásának, feldolgozásának, megosztásának és védelmének folyamata.
Adatkezelési szabályzat / adatmenedzsment terv
Olyan formális dokumentum, amely meghatározza hogyan kell az adatokat kutatási projektek során kezelni.
Adatlicenc
Az adatok felhasználására vonatkozó jogi és etikai keretek (pl. CC )
Adatmegőrzés
Az adatok és metaadataik hosszú távú olvashatóságát és értelmezhetőségét biztosító eljárások.
Adatminőség
Az adatok pontosságát, megbízhatóságát és konzisztenciáját leíró mutatók összessége.
Adatrepozitórium
Olyan adattároló, amely - általában különböző forrásokból származó - adatcsomagok közzétételére és megosztására szolgál.
Adattároló/ Adattárolás
Az adatok tárolásának módját és technológiáját jelenti, amely lehetővé teszi az adatok rögzítését, visszakeresését és kezelését. Az adattárolás lehet lokális (pl. merevlemezen) vagy felhőalapú.
Adattisztítás
Az adatok zajának és hibáinak eltávolítása az elemzések pontosságának növelése érdekében.
Adattörténet
Hagyományosan egy történelmi tárgy tulajdonosainak és tárolási helyeinek időrendi listája. A modern kutatási adatkezelésben az adat életciklusának állomásait írja le minél részletesebben, vagyis hogyan és milyen más adatokból keletkezett, kik és milyen átalakításokat hajtottak végre rajta.
Adatvédelem
Az adatok védelmével és biztonságával kapcsolatos elvek és gyakorlatok összessége. Célja az érzékeny vagy személyes adatok illetéktelen hozzáférésének megakadályozása, például adatvédelmi szabályzatok (GDPR) betartásával.
Anonimizálás
Az egyének azonosíthatóságának megszüntetése az adatokban.
ARGOS
Az OpenAIRE és az EUDAT közös fejlesztése, adatmenedzsment terv kollaboratív megírására alkalmas szoftver.
ARK
Az ARK (Archival Resource Key) egy perzisztens azonosító típus, melyet többek között múzeumok, levéltárak, könyvtárak is használnak.
ARP AROMA
Az ARP Adatrepozitóriumban az ARP AROMA szolgáltatás segítségével az elhelyezett adatcsomagokon belüli fájlokat is el lehet látni egyedi metaadatokkal. Az adatcsomagok és az azokon belüli fájlok metaadatolása az ARP Sématárban tárolt publikus metaadatsémák szerint lehetséges.
ARP Közös kereső
Az ARP Adatrepozitóriumban lehetőség van fájlszintű metaadatok megadására is, az ezek alapján történő keresést biztosítja az ARP Közös Keresője. A szolgáltatás segítségével nem csak az ARP Adatrepozitóriumban elhelyezett, hanem más repozitóriumokban tárolt kutatási adatok között is lehet keresni.
ARP Sématár
Az ARP Sématár egy Cedar alapú metaadatkészlet repozitórium. A felhasználók egyedi igényeiknek megfelelő új metaadatkészleteket (sémákat) is létrehozhatnak.
B
Big Data
Nagy mennyiségű, változatos adatkezelési és elemzési módszereket igénylő adathalmaz.
C
CEDAR
A CEDAR (Center for Expanded Data Annotation and Retrieval) egy metaadatséma regiszter, , amely segít a kutatóknak megfelelni az adataik archiválására vonatkozó követelményeknek, hogy mások is megértsék és felhasználhassák őket.
Creative Commons (CC) licencek
A CC-licencek lehetővé teszik a szerzők számára, hogy szerzői jogaikat megtartsák, de ezzel egyidőben lehetőséget biztosítsanak – különböző korlátok között – a mű feldolgozására, terjesztésére. A projekt számos szabad licencet kínál.
CRIS (Kutatási Információs Rendszer)
Kutatási információs rendszer, amely a projektek, publikációk és kutatási adatok nyilvántartására szolgál.
D
Dataverse
Egy nyílt forráskódú platform, amelyet kutatási adatok archiválására és megosztására használnak. Lehetővé teszi a kutatók számára, hogy rendszerezetten tárolják és publikálják az adatokat. Az ARP adatrepozitórium a Dataverse adatrepozitórium továbbfejlesztett változata.
DMPonline
A Digital Curation Centre által létrehozott platform, amely lehetővé teszi, hogy a regisztrált felhasználók adatmenedzsment terveket készítsenek. Létrehozhatunk saját személyre szabott tervet, továbbá lehetőségünk van arra is, hogy több egyetem és kutatást finanszírozó szervezet előre elkészített sablon kérdéseit használjuk.
DMPTool
A Data Management Plan Tool (DMPTool) egy online eszköz, amely segít a kutatóknak adatkezelési tervet (Data Management Plan, DMP) készíteni.
DOI
A DOI (Digital Object Identifier) egy perzisztens azonosító típus, melynek használata tudományos közlemények esetén széles körben elterjedt.
Dublin Core
Egy teljesen általános metaadat-séma, mely minden dolog leírására alkalmas, ezért igen elterjedt, ISO szabvány: 15836-1:2017
E
EduID
Az EduID azonosító olyan azonosítási lehetőség, amellyel adott felhasználó a saját intézménye által működtetett azonosítószerveren keresztül jelentkezhet be valamely más intézmény által üzemeltetett szolgáltatásba. Az EduID ezzel biztonságosabb jelszókezelést és szolgáltatáshasználatot tesz lehetővé. Az EduID rendszeréhez intézményi szinten lehet csatlakozni. A csatlakozást a Pro-M Zrt-nél lehet kezdeményezni.
Elsődleges adat (nyers adat)
Feldolgozatlan adat, a keletkezéskori tartalommal és formában.
Embargó
Tudományos és kutatási kontextusban az embargó egy időszak, amely alatt egy adott publikáció vagy adathalmaz nem hozzáférhető a nyilvánosság számára. Ez gyakran a kutatási adatok védelme vagy a tudományos folyóiratok előírásai miatt történik.
EOSC
A European Open Science Cloud (EOSC) az Európai Bizottság kezdeményezése, amelynek célja, hogy olyan infrastruktúrát fejlesszen ki, amely a nyílt tudományos gyakorlatokat népszerűsítő szolgáltatásokat nyújt felhasználóinak.
É
Érzékeny adat
Azok az adatok, amelyek különleges védelmet igényelnek (pl. személyes vagy egészségügyi adatok).
F
FAIR adat
Azokat az adatokat nevezzük FAIR-adatnak, melyek megfelelnek a FAIR-elveknek.
FAIR alapelvek
Kutatási adatok kezelésére vonatkozó alapelvek, amelyek biztosítják a kutatási eredmények elérhetőségét és reprodukálhatóságát (Findable, Accessible, Interoperable, Reusable – Megtalálható, Hozzáférhető, Szabványos, Újrafelhasználható).
Fájlelnevezési konvenciók
Szabályok és ajánlások arra vonatkozóan, hogyan nevezzük el a fájlokat, hogy azok könnyen kereshetők, rendszerezhetők és azonosíthatók legyenek. Például: „Év_Hónap_Nap_ProjektNeve_Verzió.txt”.
G
GDPR
Általános adatvédelmi rendelet, mely szabályozza a természetes személyekre vonatkozó személyes adatok kezelését.
H
Handle
A Handle System egy általános perzisztens azonosító szolgáltatási rendszer a CNRI üzemeltetésében. A Handle System szolgálja ki a DOI-kat is. A Handly System által bejegyzett perzisztens azonosítót nevezzük handle-nek.
Hozzáférhető
A FAIR mozaikszó (Findable, Accessible, Interoperable, Reusable) a kutatási adatok kezelésének szempontrendszerét írja le. Az adatokhoz és metaadataikhoz egyértelmű hozzáférési szabályok tartoznak, még ha az adatok nem is nyíltak (pl. megfelelő engedélyezési és hitelesítési mechanizmusok).
HRDA
A Research Data Alliance Hungarian National Node (HRDA) a kutatási adatok kezelését támogató Research Data Alliance (RDA) globális szervezet magyar tagja. Alapító tagjai a Számítástechnikai és Automatizálási Kutatóintézet (SZTAKI), az MTA Könyvtár és Információs Központ (MTA KIK), a HUNgarian Open Repositories (HUNOR) és a Kormányzati Informatikai Fejlesztési Ügynökség (KIFÜ). (A KIFÜ 2024. december 31-én megszűnt, feladatait több más szervezet vette át.)
I
Időbélyeg
Az adatok keletkezésének vagy módosításának időpontját rögzítő információ.
Interoperábilis / Szabványos
A FAIR mozaikszó (Findable, Accessible, Interoperable, Reusable) a kutatási adatok kezelésének szempontrendszerét írja le. Az adatok és metaadataik szabványos formátumokban és szerkezetekben érhetőek el, hogy más rendszerekkel és adatokkal együtt használhatóak legyenek.
K
Kapcsolt adatok
Az adatok összekapcsolása más adatokkal az értelmezhetőség és a visszakereshetőség érdekében.
Kapcsolt nyílt adatok
A kapcsolt nyílt adat olyan információ, amely egyszerre szabadon hozzáférhető és gépek által értelmezhető módon összekapcsolt. Egy adat lehet nyílt, de nem kapcsolt, vagy kapcsolt, de nem nyílt – a kapcsolt nyílt adat fogalma akkor érvényes, ha mindkét feltétel teljesül.
Kutatási adat
Kutatási adat minden olyan információ amely kutatási eredmények alátámasztására keletkezett. Kutatási adatok létrejöhetenk szerzők által, generálhatják eszközök, lehetnek gyűjtés vagy megfigyelés eredményei. Nem csak digitális formában léteznek kutatási adatok, ide értendők például a papír alapú jegyzetek, naplók is.
Kutatási adat életciklus
A kutatási adatok kezelésének folyamata, amely magában foglalja az adatok gyűjtését, tárolását, feldolgozását, megosztását, publikálását és hosszú távú archiválását.
Kutatási adatmenedzsment
A kutatási adatmenedzsment, adatkezelési terv a kutatásból származott adatok létrehozására, tárolására, hozzáférésére, megosztására, újrahasznosításának biztosítására és megőrzésére vonatkozik.
Kutatási életciklus
A kutatás különböző fázisainak összessége, a kezdeti ötlet kidolgozásától a kutatás végrehajtásán, publikálásán és hasznosításán át egészen az eredmények archiválásáig és újrahasznosításáig.
Kutatási objektum
A kutatási objektum egy módszert ad arra, hogy kutatási adatokat aggregálni, csomagolni, és azonosítani lehessen az Interneten. Ehhez tartozik az adatok leírása (metaadatolása), az adatfájlok tartalmának és az azok közti kapcsolatoknak a dokumentálása.
M
Megtalálható
A FAIR mozaikszó (Findable, Accessible, Interoperable, Reusable) a kutatási adatok kezelésének szempontrendszerét írja le. Az adatok és metaadataik egyértelműen azonosíthatóak és kereshetőek kell, hogy legyenek (pl. perzisztens azonosítók, kereshető metaadatok).
Metaadat
Az adatokat leíró adat. Legáltalánosabb metaadatnak számít az adatok elnevezése, készítője és készítési dátuma. A további lehetséges metaadat leírókat sémákba szokás csoportosítani és definiálni. A legismertebb ilyen séma a Dublin Core. Egy tétel metaadatainak összességét metaadat-rekordnak hívjuk, melyek szerkezetét szabályozzák a metaadat-sémák.
Metaadat-stratégia
A metaadat-stratégia határozza meg, hogy a metaadatokat hogyan gyűjtik, kezelik és érik el. Az adatokhoz kapcsolódó metaadatok (leíró adatok) kezelésének, rendszerezésének és dokumentálásának terve. Célja az adatok könnyebb visszakereshetősége, megosztása és újrafelhasználása.
Metaadatséma
A metaadatok egységesítése kulcsfontosságú a használat szempontjából. A metaadatséma a metaadatok szerkezetét írja le, milyen elemek használhatók egy metaadat rekordban, azoknak milyen értékei lehetnek, hogyan ajánlott a metaadatokat kitölteni illetve közzétenni.
N
Nyílt adat
Olyan adatok, amelyek szabadon hozzáférhetők, újrahasználhatók és megoszthatók, általában megfelelő licencek (pl. Creative Commons) mellett. A tudományban az átláthatóság és reprodukálhatóság elősegítésére használják.
Nyílt fájlformátum
Olyan fájlformátum, amely nyilvánosan dokumentált, és szabadon használható bármilyen szoftverben. Példák: TXT (Egyszerű szövegfájl formázás nélkül), ODT (OpenDocument Text), CSV (Comma-Separated Values), PNG (Portable Network Graphics).
Nyílt hozzáférés
A nyílt hozzáférés a közleményekhez, adatokhoz való szabad és korlátozás-mentes hozzáférést jelenti, ide értve az olvasást, letöltést és az újrafelhasználást is, a megfelelő forrásjelölés alkalmazásával. Szokás arany és zöld fokozatú nyílt hozzáférést megkülönböztetni, ahol az arany esetben a kiadó, míg a zöld esetben az intézmény vagy a kutató biztosítja a nyílt hozzáférést.
Nyílt tartalom licence
Olyan licenc, amely lehetővé teszi a tartalom szabad felhasználását, módosítását és terjesztését, bizonyos feltételek mellett. Ilyenek például a Creative Commons (CC) licencek vagy a GNU Free Documentation License (GFDL).
Nyílt tudomány
A nyílt tudomány olyan elvek és gyakorlatok összessége, amelyek a kutatási eredmények szabad hozzáférését és felhasználásá teszik lehetővét, ezáltal a közösségi hasznosítás lehetőségét maximálják.További ismertetőjegyei az együttműködés, átláthatóság és reprodukálhatóság.
O
Ontológia
Formálisan ábrázolt tudáshalmaz, mely fogalmak egymás közötti viszonyát reprezentálja. Az ontológia váza osztályok és tulajdonságok definíciójából áll. Például egy tudományos közleményeket leíró ontológiában lehet folyóiratcikk és könyvfejezet osztály valamint szerző és oldalszám tulajdonság. Az ontológia a matematikai logikának egy speciális formájára, a leíró logikára épül.
ORCID
Open Researcher and Contributor ID (ORCID), egy egyedi szerzőazonosító, amely segíti a kutatók egyértelmű azonosítását, a névváltozatok kezelését és a publikációik követését.
P
Perzisztens azonosító
Digitális objektumok hosszútávú azonosítására szolgál. Magyarul lehet még állandó azonosítónak is hívni. Angol rövidítése PID. A PID funkciója, hogy globálisan egyértelműen azonosítson egy digitális objektumot, és az is elvárt, hogy az azonosító URL-re leképezhető (resolvable, actionable) legyen. A DOI, ORCID, ISBN ismert példák PID szolgáltatásokra.
R
RDA
A Research Data Alliance (RDA) egy globális szervezet, amelynek célja a kutatási adatok interoperabilitásának és megosztásának elősegítése. Az RDA különböző tudományágak, szervezetek és országok között teremti meg az együttműködés lehetőségét, hogy a kutatási adatok kezelése hatékonyabbá váljon.
Re3data
A kutatási adattárak nyilvántartása (re3data.org, Registry of Research Data Repositories) egy globális nyilvántartás, amely több mint 2400 részletes adattár rekordot tartalmaz, és széles körben elismert eszköz a kutatási adatok megfelelő tárolóinak azonosítására.
Readme fájl
Egy szöveges fájl, amely általában szoftverprojektekben vagy adathalmazokban található. Tartalmazhat információkat a fájlok használatáról, a projekt céljáról és a telepítési vagy futtatási útmutatókról.
Regiszter
Valamilyen típusú digitális objektumok jegyzéke, a regiszteren belül egyértelmű azonosítóval ellátva. Fő célja az, hogy az objektum megtalálható legyen, és nem célja a teljes adattartalom tárolása (ellentétben a repozitóriummal). Tipikus példái: doménnév regiszter, protokoll regiszter, metaadatséma regiszter.
Repozitórium
Olyan fájlszerver, amely tudományos anyagok archiválására és hozzáférhetővé tételére szolgál.
Reprodukálhatóság
A kutatási eredmények megismételhetősége és független ellenőrizhetősége.
RO-Crate
Kutatási adatcsomag-formátum, melyben az egész csomag és az egyes tartalmazott fájlok is gazdagon leírhatók metadatokkal. Ezáltal támogatja a kutatások adatainak FAIR megfelelését és hosszútávú megőrzését.
ROR
A Research Organization Registry (ROR) egy nyílt, közösségi adatbázis, amely kutatóintézetek és egyetemek egyedi azonosítóit tartalmazza. Segít az intézmények egyértelmű azonosításában tudományos publikációk és kutatási adatok összekapcsolásakor.
ROR ID
A Research Organization Registry Identifier (ROR ID) egy egyedi azonosító, amelyet a Research Organization Registry (ROR) rendszer biztosít kutatóintézmények, egyetemek és más tudományos szervezetek számára.
S
Strukturált adatok
A strukturált adatok olyan adatok, amelyek szabványosított formátummal rendelkeznek a szoftverek és az emberek általi hatékony hozzáférés érdekében. Jellemzően táblázatos, sorokkal és oszlopokkal.
Származtatott adat
Olyan adat, amely más adatok feldolgozásából keletkezett, azaz nem elsődleges adat. Az angol secondary data fogalom inkább statisztikai fogalom.
Személyes adat
Személyes adatnak minősül egy természetes személlyel kapcsolatba hozható minden adat, valamint az adatból levonható, az érintettre vonatkozó következtetés.
Ú
Újrahasznosítható
A FAIR mozaikszó (Findable, Accessible, Interoperable, Reusable) a kutatási adatok kezelésének szempontrendszerét írja le. Az adatok jól dokumentáltak és egyértelmű licencelés alatt állnak, hogy más kutatók újrafelhasználhassák őket.
V
Verziókezelés
Az adatállományok módosításainak követése és dokumentálása.
W
Wikidata
Egy szabad és nyílt adathalmaz, amely strukturált adatokat tartalmaz különböző témákban. A Wikidata-t a Wikimédia Alapítvány működteti, és célja, hogy központi adatforrásként szolgáljon a Wikipédia és más projektek számára.
Wikidata azonosító
Egy egyedi azonosító (Q-szám, pl. Q42), amelyet a Wikidata minden egyes adatlaphoz hozzárendel. Ez segíti a gépek és emberek számára is az adatok egyértelmű azonosítását.