Ugrás a tartalomra

HUN-REN Adatrepozitórium Platform

Ki, mit, hova, miért? / Szabó Bálint

Előadók
Szabó Bálint

Szabó Bálint (HTK): Kapcsolódási pontok a bölcsészettudományok területén adatgazdász szemmel

Az ELTE Humán Tudományok Kutatóközpontjának adatgazdászaként kiemelten fontosnak tartom a kilenc intézetünk közötti kapcsolódási pontok feltérképezését. A földrajzi hely – legyen szó származási helyről vagy releváns érvényességi területről – szinte mindegyik kutatóintézetünkben alapvető metaadata a kutatási dokumentumainknak. Előfordul, hogy a helyadat központi jelentőségű és meghatározó, más esetekben viszont csupán kiegészítő információként rögzítik. Az előadás célja bemutatni, milyen módszerekkel és eszközökkel kezeljük a település adatainkat.
A helynevek és településnevek kezelése több szinten zajlik. Gyakran kapcsolódik terepmunkához vagy levéltári kutatáshoz. Először a kutatók rendszerezik a birtokukba került információkat, majd ezek az intézményeink által kezelt gyűjteményekbe kerülnek. Az adatok és metaadatok évtizedek alatt halmozódtak fel, egyedi táblázatokban, melyeket a létrehozó és kezelő munkatársak kutatási területük és kutatási céljaik szerint alakítottak ki. A dokumentumokban rögzített információk és a keletkezésük körülményei nem reprodukálhatók, hasznos háttér információkkal leginkább a tapasztalt kutató kollégák rendelkezhetnek, akik részt vettek az adatok felgyűjtésében. Ezek a kiindulási paraméterei általános esetben az egységesítő, rendszerező munkának, amit archívumi munkatársakkal és kutatókkal együtt végzünk.
Kihívást jelent, hogy a településadatok többféle változatban élnek. A terepmunkát végző kutató valószínűleg nem képes minden megnevezést átlátni és megfelelően rögzíteni. További nehézséget okozhat települések összevonása, szétválása vagy átnevezése, valamint a Kárpát-medence magyarlakta területeinek idegen és magyar nyelvű településnevei. Az egységesítés és ellenőrzés során ezért gyakran szükség van a meglévő adattáblák átalakítására, de fontos, hogy a kutatók továbbra is bővíthessék az eredeti táblázatokat. Ezt táblázati jellegzetességekhez igazított, automatizált módszerekkel érhetjük el, melyek biztosítják a kapcsolatot az eredeti és a rendszerezett táblázatok között. Jelenleg az Excel-adatokat KNIME szoftver segítségével szűrjük, ellenőrizzük és alakítjuk tovább automatikusan.
A cél olyan rugalmas keretrendszer kidolgozása, amely egyszerre szolgálja az adatbázisok összekapcsolhatóságát, hatékony kereshetőségét, valamint vizualizációra is alkalmassá teszi a felgyűjtött adatainkat. Előadásomban
bemutatom munkafolyamatainkat, a felmerülő dilemmákat, nehézségeket és az azokra kidolgozott megoldásokat, külön hangsúlyt helyezve arra, hogyan járulhatnak hozzá tapasztalataink más tudományterületek adatkezelési gyakorlatához is. Mivel a településnevekkel végzett munka folyamatban van, előadásomban a jelenlegi ismereteim és tapasztalataim alapján adok áttekintést a folyamatokról és eddigi eredményeinkről.

A szakmai fórum a kutatásiadat-kezelés, a kutatástámogatás, az adatrepozitóriumok és a nyílt tudomány témaköreiben zajló hazai és nemzetközi kezdeményezések, jógyakorlatok, együttműködések, valamint kihívások és technológiai megoldások bemutatására nyújtott teret. Az előadók elméleti és gyakorlati szempontból vizsgálták a kutatási adatok kezelésében és a kutatástámogatásban megfigyelhető trendeket, különös tekintettel a területtel foglalkozó szakemberek és az elérhető infrastruktúrák fejlődési és kapcsolódási lehetőségeire, megoldásaira.

Távoli videó webcím