Zoekintranscripties.nl nu al beschikbaar gesteld voor publiek

Lancering zoekintranscripties.nl tijdens symposium De IJsberg zichtbaar maken
17 mei 2021

Tijdens het symposium De IJsberg zichtbaar maken lanceerde het Nationaal Archief zoekintranscripties.nl. Op deze website kunnen bezoekers handgeschreven bronnen – vaak moeilijk leesbaar – bekijken en doorzoeken. Een innovatie voor historisch onderzoek; tijdrovend archiefonderzoek kan nu veel sneller en locatieonafhankelijk.

Kansen voor historisch onderzoek

Het snel doorzoeken van archiefstukken op zoekintranscripties.nl is mogelijk omdat handgeschreven bronnen met behulp van transcriptietechniek machineleesbaar zijn gemaakt, en zijn verrijkt met kunstmatige intelligentie. Dat biedt grote kansen voor historisch onderzoek. 
Op dit moment zijn er 1,5 miljoen transcripties te bekijken op de website zoekintranscripties.nl. Daarvan zijn er 90.000 verrijkt en doorzoekbaar. Het is een eerste tussentijds resultaat dat nu al aangeboden wordt aan het publiek. De verwachting is dat deze zomer 2 miljoen verrijkte transcripties doorzoekbaar zijn op zoekintranscripties.nl. Het gaat om historische handgeschreven documenten van de Verenigde Oost-Indische Compagnie (VOC) uit de 17e en 18e eeuw van het Nationaal Archief en notariële archieven uit de 19e eeuw van het Noord-Hollands Archief en andere Regionaal Historische Centra. Zoekintranscripties.nl is qua inhoud en gekozen techniek, waar mogelijk, open source en bruikbaar voor andere erfgoedinstellingen.

Interessante vondsten in schat aan data

Tijdens het project De IJsberg zichtbaar maken zijn steeds transcripties toegevoegd aan Zenodo.org, een website voor open data. Diverse onderzoekers en historici gingen al aan de slag met deze schat aan data. Gerhard de Kok, universitair docent geschiedenis van de Universiteit Leiden, maakte bijvoorbeeld een zoekinterface en deed interessante vondsten in de automatisch getranscribeerde archiefstukken.

Zwijgende getuigen krijgen een stem

Ook schreven het Noord-Hollands Archief en het Nationaal Archief de ‘Innovatie in Archief’-onderzoek prijs uit. Het doel hiervan was studenten en onderzoekers uit te dagen om te laten zien welke nieuwe onderzoeksmogelijkheden deze data bieden. De jury kende de prijs toe aan Saskia Noot, Clare Shutt en Thijs Vorstenburg, studenten van de UVA. Zij gaven vrouwen en tot slaafgemaakten in de VOC-testamenten een stem door gebruik te maken van automatische transcripties van testamenten.

De IJsberg zichtbaar maken

In dit project De IJsberg zichtbaar maken werkt het Nationaal Archief samen met het Noord-Hollands Archief en andere Regionaal Historische Centra. Het project heeft als resultaat dat een grote hoeveelheid historische documenten met behulp van kunstmatige intelligentie automatisch is getranscribeerd, oftewel omgezet in machineleesbare tekst. Ter gelegenheid van de afsluiting van het project werd op 17 mei het symposium De IJsberg zichtbaar maken georganiseerd, over de resultaten van het project over automatische handschriftherkenning. Bekijk het symposium terug.

Betrokken partijen website

Voor de selectie van leveranciers voor de doorontwikkeling is een aanbestedingsprocedure uitgevoerd. Picturae bleek de beste partij voor de ontwikkeling van de achterkant van de projectwebsite. Picturae is een bekende in de erfgoedwereld met onder andere producten als het crowdsourcing platform Vele Handen en digitalisering van archieven. Ze zijn verantwoordelijk voor de verbetering en modernisering van de transcripties, het toekennen van entiteiten en het ontwikkelen van een transcriptie beheersysteem.
Sioux Technologies is als onderaannemer aangesloten voor de kunstmatige intelligentie. Aincient is betrokken vanwege de kennis van kunstmatige intelligentie, het erfgoedveld en projectmanagement.
Clean Code ontwikkelde de voorkant van de projectwebsite, inclusief de inrichting van de zoekmachine. Clean Code is een klein, innovatief bedrijf uit Amsterdam dat zich richt op user interfaces en data analyse. De expertise van onderaannemer Duizendvijftig is het grafisch ontwerp en het coderen.