DATeCH 2019: Historische documenten digitaal toegankelijk maken is nog steeds een hele uitdaging.
- Gegevens
- 17 april 2019
Erfgoedteksten, teksterfgoed, tekstueel erfgoed, oude drukken, historische documenten. Hoe je ze ook benoemt, vaak komt hun volle waarde pas tevoorschijn zodra ze in digitale vorm toegankelijk zijn gemaakt. Maar hoe krijgen we al dat erfgoed gedigitaliseerd? En, nog spannender, wat wordt er daarna allemaal mogelijk?
Van 8 tot 10 mei verwelkomt Brussel de internationale conferentie DATeCH 2019 (Digital Access to Textual Cultural Heritage).
De belangstelling voor het digitaal ontsluiten van historische documenten zit al enkele jaren in de lift. Met crowdsourcing is heel veel mogelijk, zo is intussen aangetoond. Honderd vrijwilligers van de Stichting Vrijwilligersnetwerk Nederlandse Taal (SVNT) transcribeerden de Statenbijbel en nog een tiental bijbelvertalingen uit de 17de eeuw. Deze bijbels zijn vandaag digitaal en online te lezen én te doorzoeken. Samen vormen ze een corpus van 15 miljoen woorden. Een indrukwekkend staaltje crowdtyping.
Op deze website las u de voorbije jaren ook over de digitale ontsluiting van brieven die tijdens kapingen op zee buit werden gemaakt, van dialectwoordenboeken zowel in Nederland als in Vlaanderen en ander waardevol talig erfgoed.
Intussen evolueert ook de technologie. Even een reisjournaal uit de 17de eeuw scannen met OCR (Optical Character Recognition) en klaar is kees? Zo ver zijn we nog niet, maar er kan al veel worden geautomatiseerd. En eenmaal een erfgoedtekst gedigitaliseerd, is er intussen héél veel technologie om de tekst in alle mogelijke opzichten te verrijken, te analyseren en te doorzoeken.
Geïnteresseerd in de nieuwste ontwikkelingen op het gebied van het digitaliseren en toegankelijk maken van historische documenten? De DATeCH-conferentie brengt onderzoekers en praktijkmensen samen om de nieuwste inzichten en technieken uit te wisselen op het gebied van ontwikkeling, standaardisering en beschikbaarstelling van digitaal historisch materiaal.
Interdisciplinair veld
De DATeCH-conferentie richt zich tot een bij uitstek interdisciplinair publiek van onderzoekers en professionals die zich bezighouden o.a. met tekstdigitalisering, OCR, herkenning van handgeschreven teksten, Digital Humanities, beeld- en documentanalyse, digitale (erfgoed)bibliotheken, bibliotheek- en archiefwetenschap, museum- en erfgoedstudies, toegepaste computerlinguïstiek, crowdsourcing, de interactie en de interface tussen mens en machine.
Taaltechnologie voor de humane wetenschappen
DATeCH 2019 in Brussel wordt georganiseerd door het IMPACT Centre of Competence (Madrid), het Instituut voor de Nederlandse Taal (INT, Leiden), DARIAH-BE en CLARIN-VL.
Het IMPACT Centre of Competence is een internationaal expertisecentrum voor het digitaliseren en OCR'en van oude drukken. (IMPACT staat voor Improving Access to Text.)
DARIAH staat voor Digital Research Infrastructure for the Arts and Humanities en is een Europees netwerk van partners die expertise en technologieën met elkaar delen en een infrastructuur hebben opgezet om onderzoekers te ondersteunen bij het bouwen en analyseren van digitale bronnen.
CLARIN staat voor Common Language Resources and Technology Infrastructure en is een Europees consortium van taal- en spraaktechnologen die oplossingen ontwikkelen voor onderzoekers in de humane, sociale en andere wetenschappen.
DATeCH 2019 in Brussel is de derde editie van deze internationale conferentie. Van beide voorgaande edities zijn de papers en presentaties online beschikbaar.
Het volledige conferentieprogramma is te raadplegen op de website van DATeCH 2019.
Meer lezen over DARIAH-BE
Meer lezen over CLARIN