Ugrás a tartalomra

HUN-REN Adatrepozitórium Platform

Fogalomtár

Szerkesszük közösen a fogalomtárat! A módosítási és kiegészítési javaslatokat a support@researchdata.hu címre várjuk.

A

Adatarchiválás

Data archiving

Az adatok hosszú távú megőrzése és tárolása későbbi felhasználás céljából.

Adatdokumentáció

Data documentation

Az adatok jelentését, szerkezetét és előállításának folyamatát leíró információk.

Adatformátum

Data format

Az adatok tárolási módja (pl. CSV, XML…)

Adatgazda

Data owner

Személyes jogi felelőse egy adatkészletnek.

Adatgazdász

Data steward

Olyan személy, aki adatok karbantartásáért és értelmezéséért felelős, és ismeri az adattárolási és adatmegőrzési lehetőségeket, jó gyakorlatokat.

Adathasználati megállapodás

Data Use Agreement, DUA

A Data Use Agreement (DUA) egy jogi megállapodás, amely meghatározza, hogy egy adott adatállományt ki, hogyan és milyen feltételekkel használhat.

Adathitelesítés

Data authentication

Az adatok eredetiségének és hitelességének ellenőrzése.

Adathivatkozás

Data citation

Az adatok hivatkozásának szabványos módja, amely biztosítja azok visszakövethetőségét és elismerését.

Adathozzáférési engedély

Data access permission

Az adatok elérésére és használatára vonatkozó engedélyezési szabályok.

Adathozzáférési szint

Data access level

Az adatokhoz való hozzáférés szabályozása (pl.: nyílt, korlátozott, zárt).

Adatintegritás

Data integrity

Az adatok megbízhatóságának, teljességének és konzisztenciájának biztosítása.

Adatkészlet

Dataset

Adatok gyűjteménye, amely egységnek tekinthető adatkezelési, jogi és megosztási szempontokból, vagyis praktikusan az adatkészlet minden elemére ugyanazok a jogi megkötések vonatkoznak, vannak közös metaadataik, és együttesen kerülnek megosztásra.

Adatkezelés

Data management

Az adatok gyűjtésének, tárolásának, feldolgozásának, megosztásának és védelmének folyamata.

Adatkezelési szabályzat / adatmenedzsment terv

Data Management Plan (DMP)

Olyan formális dokumentum, amely meghatározza hogyan kell az adatokat kutatási projektek során kezelni.

Adatlicenc

Data licence

Az adatok felhasználására vonatkozó jogi és etikai keretek (pl. CC )

Adatmegőrzés

Data preservation

Az adatok és metaadataik hosszú távú olvashatóságát és értelmezhetőségét biztosító eljárások.

Adatmegosztás

Data sharing

Az adatok elérhetővé tétele más kutatók számára.

Adatminőség

Data quality

Az adatok pontosságát, megbízhatóságát és konzisztenciáját leíró mutatók összessége.

Adatrepozitórium

Data repository

Olyan adattároló, amely - általában különböző forrásokból származó - adatcsomagok közzétételére és megosztására szolgál.

Adatszuverenitás

Data Sovereignty

Az adatok fölötti ellenőrzés és azok joghatósága.

Adattároló/ Adattárolás

Data storage

Az adatok tárolásának módját és technológiáját jelenti, amely lehetővé teszi az adatok rögzítését, visszakeresését és kezelését. Az adattárolás lehet lokális (pl. merevlemezen) vagy felhőalapú.

Adattisztítás

Data cleaning

Az adatok zajának és hibáinak eltávolítása az elemzések pontosságának növelése érdekében.

Adattörténet

Provenance

Hagyományosan egy történelmi tárgy tulajdonosainak és tárolási helyeinek időrendi listája. A modern kutatási adatkezelésben az adat életciklusának állomásait írja le minél részletesebben, vagyis hogyan és milyen más adatokból keletkezett, kik és milyen átalakításokat hajtottak végre rajta.

Adatvédelem

Data privacy

Az adatok védelmével és biztonságával kapcsolatos elvek és gyakorlatok összessége. Célja az érzékeny vagy személyes adatok illetéktelen hozzáférésének megakadályozása, például adatvédelmi szabályzatok (GDPR) betartásával.

Anonimizálás

Anonymization

Az egyének azonosíthatóságának megszüntetése az adatokban.

ARGOS

Az OpenAIRE és az EUDAT közös fejlesztése, adatmenedzsment terv kollaboratív megírására alkalmas szoftver. 

ARK

Az ARK (Archival Resource Key) egy perzisztens azonosító típus, melyet többek között múzeumok, levéltárak, könyvtárak is használnak.

ARP AROMA

Az ARP Adatrepozitóriumban az ARP AROMA szolgáltatás segítségével az elhelyezett adatcsomagokon belüli fájlokat is el lehet látni egyedi metaadatokkal. Az adatcsomagok és az azokon belüli fájlok metaadatolása az ARP Sématárban tárolt publikus metaadatsémák szerint lehetséges. 

ARP Közös kereső

ARP Federated Search

Az ARP Adatrepozitóriumban lehetőség van fájlszintű metaadatok megadására is, az ezek alapján történő keresést biztosítja az ARP Közös Keresője. A szolgáltatás segítségével nem csak az ARP Adatrepozitóriumban elhelyezett, hanem más repozitóriumokban tárolt kutatási adatok között is lehet keresni.

ARP Sématár

ARP Schema Registry

Az ARP Sématár egy Cedar alapú metaadatkészlet repozitórium. A felhasználók egyedi igényeiknek megfelelő új metaadatkészleteket (sémákat) is létrehozhatnak.

B

Big Data

Nagy mennyiségű, változatos adatkezelési és elemzési módszereket igénylő adathalmaz.

C

CEDAR

A CEDAR (Center for Expanded Data Annotation and Retrieval) egy metaadatséma regiszter, , amely segít a kutatóknak megfelelni az adataik archiválására vonatkozó követelményeknek, hogy mások is megértsék és felhasználhassák őket.

Creative Commons (CC) licencek

Creative Commons (CC) licences

A CC-licencek lehetővé teszik a szerzők számára, hogy szerzői jogaikat megtartsák, de ezzel egyidőben lehetőséget biztosítsanak – különböző korlátok között – a mű feldolgozására, terjesztésére. A projekt számos szabad licencet kínál.

CRIS (Kutatási Információs Rendszer)

CRIS (Current Research Information System)

Kutatási információs rendszer, amely a projektek, publikációk és kutatási adatok nyilvántartására szolgál.

D

Dataverse

Egy nyílt forráskódú platform, amelyet kutatási adatok archiválására és megosztására használnak. Lehetővé teszi a kutatók számára, hogy rendszerezetten tárolják és publikálják az adatokat. Az ARP adatrepozitórium a Dataverse adatrepozitórium továbbfejlesztett változata.

DMPonline

A Digital Curation Centre által létrehozott platform, amely lehetővé teszi, hogy a regisztrált felhasználók adatmenedzsment terveket készítsenek. Létrehozhatunk saját személyre szabott tervet, továbbá lehetőségünk van arra is, hogy több egyetem és kutatást finanszírozó szervezet előre elkészített sablon kérdéseit használjuk.

DMPTool

A Data Management Plan Tool (DMPTool) egy online eszköz, amely segít a kutatóknak adatkezelési tervet (Data Management Plan, DMP) készíteni.

DOI

A DOI (Digital Object Identifier) egy perzisztens azonosító típus, melynek használata tudományos közlemények esetén széles körben elterjedt.

Dublin Core

Egy teljesen általános metaadat-séma, mely minden dolog leírására alkalmas, ezért igen elterjedt, ISO szabvány: 15836-1:2017

E

Elsődleges adat (nyers adat)

Primary data (raw data)

Feldolgozatlan adat, a keletkezéskori tartalommal és formában.

F

FAIR alapelvek

FAIR principles

Kutatási adatok kezelésére vonatkozó alapelvek, amelyek biztosítják a kutatási eredmények elérhetőségét és reprodukálhatóságát (Findable, Accessible, Interoperable, Reusable – Megtalálható, Hozzáférhető, Szabványos, Újrafelhasználható).

G

GDPR

Általános adatvédelmi rendelet, mely szabályozza a természetes személyekre vonatkozó személyes adatok kezelését.

H

Handle

A Handle System egy általános perzisztens azonosító szolgáltatási rendszer a CNRI üzemeltetésében. A Handle System szolgálja ki a DOI-kat is. A Handly System által bejegyzett perzisztens azonosítót nevezzük handle-nek.

I

Időbélyeg

Timestamp

Az adatok keletkezésének vagy módosításának időpontját rögzítő információ.

K

Kutatási adat

Research data

Kutatási adat minden olyan információ amely kutatási eredmények alátámasztására keletkezett. Kutatási adatok létrejöhetenk szerzők által, generálhatják eszközök, lehetnek gyűjtés vagy megfigyelés eredményei. Nem csak digitális formában léteznek kutatási adatok, ide értendők például a papír alapú jegyzetek, naplók is.

Kutatási adatmenedzsment

Research data management

A kutatási adatmenedzsment, adatkezelési terv a kutatásból származott adatok létrehozására, tárolására, hozzáférésére, megosztására, újrahasznosításának biztosítására és megőrzésére vonatkozik.

Kutatási objektum

Research Object

A kutatási objektum egy módszert ad arra, hogy kutatási adatokat aggregálni, csomagolni, és azonosítani lehessen az Interneten. Ehhez tartozik az adatok leírása (metaadatolása), az adatfájlok tartalmának és az azok közti kapcsolatoknak a dokumentálása.

M

Metaadat

Metadata

Az adatokat leíró adat. Legáltalánosabb metaadatnak számít az adatok elnevezése, készítője és készítési dátuma. A további lehetséges metaadat leírókat sémákba szokás csoportosítani és definiálni. A legismertebb ilyen séma a Dublin Core. Egy tétel metaadatainak összességét metaadat-rekordnak hívjuk, melyek szerkezetét szabályozzák a metaadat-sémák.

Metaadatséma

Metadata schema

A metaadatok egységesítése kulcsfontosságú a használat szempontjából. A metaadatséma a metaadatok szerkezetét írja le, milyen elemek használhatók egy metaadat rekordban, azoknak milyen értékei lehetnek, hogyan ajánlott a metaadatokat kitölteni illetve közzétenni.

N

Nyílt adat

Open Data

Olyan adatok, amelyek szabadon hozzáférhetők, újrahasználhatók és megoszthatók, általában megfelelő licencek (pl. Creative Commons) mellett. A tudományban az átláthatóság és reprodukálhatóság elősegítésére használják.

Nyílt hozzáférés

Open access

A nyílt hozzáférés a közleményekhez, adatokhoz való szabad és korlátozás-mentes hozzáférést jelenti, ide értve az olvasást, letöltést és az újrafelhasználást is, a megfelelő forrásjelölés alkalmazásával. Szokás arany és zöld fokozatú nyílt hozzáférést megkülönböztetni, ahol az arany esetben a kiadó, míg a zöld esetben az intézmény vagy a kutató biztosítja a nyílt hozzáférést.

Nyílt tudomány

Open science, Open research

A nyílt tudomány olyan elvek és gyakorlatok összessége, amelyek a kutatási eredmények szabad hozzáférését és felhasználásá teszik lehetővét, ezáltal a közösségi hasznosítás lehetőségét maximálják.További ismertetőjegyei az együttműködés, átláthatóság és reprodukálhatóság.

O

Ontológia

Ontology

Formálisan ábrázolt tudáshalmaz, mely fogalmak egymás közötti viszonyát reprezentálja. Az ontológia váza osztályok és tulajdonságok definíciójából áll. Például egy tudományos közleményeket leíró ontológiában lehet folyóiratcikk és könyvfejezet osztály valamint szerző és oldalszám tulajdonság. Az ontológia a matematikai logikának egy speciális formájára, a leíró logikára épül.

P

Perzisztens azonosító

Persistent identifier

Digitális objektumok hosszútávú azonosítására szolgál. Magyarul lehet még állandó azonosítónak is hívni. Angol rövidítése PID. A PID funkciója, hogy globálisan egyértelműen azonosítson egy digitális objektumot, és az is elvárt, hogy az azonosító URL-re leképezhető (resolvable, actionable) legyen. A DOI, ORCID, ISBN ismert példák PID szolgáltatásokra.

R

Regiszter

Registry

Valamilyen típusú digitális objektumok jegyzéke, a regiszteren belül egyértelmű azonosítóval ellátva. Fő célja az, hogy az objektum megtalálható legyen, és nem célja a teljes adattartalom tárolása (ellentétben a repozitóriummal). Tipikus példái: doménnév regiszter, protokoll regiszter, metaadatséma regiszter.

Repozitórium

Repository

Olyan fájlszerver, amely tudományos anyagok archiválására és hozzáférhetővé tételére szolgál.

RO-Crate

Kutatási adatcsomag-formátum, melyben az egész csomag és az egyes tartalmazott fájlok is gazdagon leírhatók metadatokkal. Ezáltal támogatja a kutatások adatainak FAIR megfelelését és hosszútávú megőrzését.

S

Származtatott adat

Derived data

Olyan adat, amely más adatok feldolgozásából keletkezett, azaz nem elsődleges adat. Az angol secondary data fogalom inkább statisztikai fogalom.

Személyes adat

Personal data

Személyes adatnak minősül egy természetes személlyel kapcsolatba hozható minden adat, valamint az adatból levonható, az érintettre vonatkozó következtetés.

V

Verziókezelés

Version management

Az adatállományok módosításainak követése és dokumentálása.

W

Wikidata

Egy szabad és nyílt adathalmaz, amely strukturált adatokat tartalmaz különböző témákban. A Wikidata-t a Wikimédia Alapítvány működteti, és célja, hogy központi adatforrásként szolgáljon a Wikipédia és más projektek számára.

https://www.wikidata.org

Wikidata azonosító

Wikidata Identifier

Egy egyedi azonosító (Q-szám, pl. Q42), amelyet a Wikidata minden egyes adatlaphoz hozzárendel. Ez segíti a gépek és emberek számára is az adatok egyértelmű azonosítását.