Ugrás a tartalomra

HUN-REN Adatrepozitórium Platform

Nyolcadik magyar adatgazdász találkozó

Az ELTE Digitális Örökség Nemzeti Laboratórium (ELTE DH-LAB), a HUN-REN Adatrepozitórium Platform (HUN-REN ARP) és a Pro-M Zrt. által közösen szervezett kötetlen adatgazdász találkozó sorozat 2026-os első alkalmának a Magyar Tudományos Akadémia adott otthont. A január 23-án tartott esemény középpontjában nyelvészeti témák, elsősorban nyelvészeti korpuszok álltak.

A találkozón Lipp Veronika, az ELTE Nyelvtudományi Kutatóközpont főigazgatója köszöntötte a résztvevőket. Nyitóbeszédében gratulált a sorozathoz, támogatásáról biztosította az adatgazdászokat, valamint az adatgazdász szakma és az adatgazdász munka fontosságát hangsúlyozta.

A köszöntő után Sass Bálint (ELTE NYTK, Lexikológiai Intézet) mesélt nagyméretű korpuszokról, tokenekről, vertikális formátumról, token-annotációról és struktúra-annotációról, spanról, metaadatról, valamint gold-standardról és silver-standardról. Bemutatójában sok egyéb mellett szó esett az 1 milliárd szavas Magyar Nemzeti Szövegtárról vagy a mesterséges intelligencia tanításához használt, nyomtatásban 50km könyvnyi terjedelmű, 100 milliárd szavas óriáskorpuszról.

Kristóf Ibolya (ELTE NYTK, Lexikológiai Intézet) A magyar nyelv nagyszótárának megírásához készített, 1772 és 2020 között keletkezett magyar nyelvű, nyomtatásban megjelent szövegek bibliográfiai adatait tartalmazó Magyar történeti szövegtárról mesélt a hallgatóságnak. Előadásában beszélt kézírás-felismerésről, cédulázásról, cédulák tárolásáról, használatáról és olvashatóságáról, Horger Antalról és II. Józsefről, valamint a Prószéky-kódokról. A magyar nyelv nagyszótára sorozatban eddig 8 kötet jelent meg nyomtatásban, miközben a teljes szócikkállomány szabadon elérhető digitális adatbázisba rendezve is.

Az előadások után az érdeklődők Sidó Zsuzsa (ELTE HTK MI - MTA Művészeti Gyűjtemény) tárlatvezetésével megnézhették az MTA Művészeti Gyűjtemény tereiben látható “200 év kincsei” című kiállítást, amely az Akadémia 19-20. századi történetét és kimagasló személyiségeit mutatja be festményekkel, kéziratokkal és műtárgyakkal.

Kép
előadóterem beszélgető emberekkel
Kép
Lipp Veronika előad
Kép
Sass Bálint előad
Kép
Kristóf Ibolya előad
Kép
Előadóterem emberekkel
Kép
Sidó Zsuzsa előad
Kép
Festmények az MTA galéria falán
Kép
Csoportkép
Sass Bálint előadása:
Kristóf Ibolya előadása:

Az adatgazdász találkozó sorozat célja, hogy a hazai adatgazdászok kötetlenül találkozhassanak, beszélgethessenek, ismerkedhessenek egymással, illetve megvitathassák a terület legfrissebb híreit, eseményeit, trendjeit, problémáit. A sorozat alkalmai minden érdeklődő számára nyitottak. A következő alkalom 2026 tavaszán várható, a pontos időpontról és helyszínről a @email mailcímen szívesen adunk tájékoztatást. A szervezők minden érdeklődő adatgazdászt örömmel látnak a jövőbeni alkalmakon is!

A korábbi találkozók beszámolói itt olvashatók:

 

Fotók: Egyed-Gergely Júlia (ELTE TK), Lencsés Ákos (Pro-M Zrt.), Sidó Zsuzsa (DH-LAB/ ELTE HTK MI )