Az ELTE Digitális Örökség Nemzeti Laboratórium (ELTE DH-LAB), a HUN-REN Adatrepozitórium Platform (HUN-REN ARP) és a Pro-M Zrt. által közösen szervezett kötetlen adatgazdász találkozó sorozat 2026-os első alkalmának a Magyar Tudományos Akadémia adott otthont. A január 23-án tartott esemény középpontjában nyelvészeti témák, elsősorban nyelvészeti korpuszok álltak.
A találkozón Lipp Veronika, az ELTE Nyelvtudományi Kutatóközpont főigazgatója köszöntötte a résztvevőket. Nyitóbeszédében gratulált a sorozathoz, támogatásáról biztosította az adatgazdászokat, valamint az adatgazdász szakma és az adatgazdász munka fontosságát hangsúlyozta.
A köszöntő után Sass Bálint (ELTE NYTK, Lexikológiai Intézet) mesélt nagyméretű korpuszokról, tokenekről, vertikális formátumról, token-annotációról és struktúra-annotációról, spanról, metaadatról, valamint gold-standardról és silver-standardról. Bemutatójában sok egyéb mellett szó esett az 1 milliárd szavas Magyar Nemzeti Szövegtárról vagy a mesterséges intelligencia tanításához használt, nyomtatásban 50km könyvnyi terjedelmű, 100 milliárd szavas óriáskorpuszról.
Kristóf Ibolya (ELTE NYTK, Lexikológiai Intézet) A magyar nyelv nagyszótárának megírásához készített, 1772 és 2020 között keletkezett magyar nyelvű, nyomtatásban megjelent szövegek bibliográfiai adatait tartalmazó Magyar történeti szövegtárról mesélt a hallgatóságnak. Előadásában beszélt kézírás-felismerésről, cédulázásról, cédulák tárolásáról, használatáról és olvashatóságáról, Horger Antalról és II. Józsefről, valamint a Prószéky-kódokról. A magyar nyelv nagyszótára sorozatban eddig 8 kötet jelent meg nyomtatásban, miközben a teljes szócikkállomány szabadon elérhető digitális adatbázisba rendezve is.
Az előadások után az érdeklődők Sidó Zsuzsa (ELTE HTK MI - MTA Művészeti Gyűjtemény) tárlatvezetésével megnézhették az MTA Művészeti Gyűjtemény tereiben látható “200 év kincsei” című kiállítást, amely az Akadémia 19-20. századi történetét és kimagasló személyiségeit mutatja be festményekkel, kéziratokkal és műtárgyakkal.
Sass Bálint előadása:
Kristóf Ibolya előadása:
Az adatgazdász találkozó sorozat célja, hogy a hazai adatgazdászok kötetlenül találkozhassanak, beszélgethessenek, ismerkedhessenek egymással, illetve megvitathassák a terület legfrissebb híreit, eseményeit, trendjeit, problémáit. A sorozat alkalmai minden érdeklődő számára nyitottak. A következő alkalom 2026 tavaszán várható, a pontos időpontról és helyszínről a @email mailcímen szívesen adunk tájékoztatást. A szervezők minden érdeklődő adatgazdászt örömmel látnak a jövőbeni alkalmakon is!
A korábbi találkozók beszámolói itt olvashatók:
- Első magyar adatgazdász találkozó
- Második magyar adatgazdász találkozó
- Harmadik magyar adatgazdász találkozó
- Negyedik magyar adatgazdász találkozó
- Ötödik magyar adatgazdász találkozó
- Hatodik magyar adatgazdász találkozó
- Hetedik magyar adatgazdász találkozó
Fotók: Egyed-Gergely Júlia (ELTE TK), Lencsés Ákos (Pro-M Zrt.), Sidó Zsuzsa (DH-LAB/ ELTE HTK MI )