De mensen van TRIADO: Rutger van Koert

Tribunaal Den Bosch, 1945 foto: C. Blazer
17 april 2018

Verschillende medewerkers van het project Tribunaalarchieven als digitale onderzoeksfaciliteit (TRIADO) vertellen over hun expertise en rol in het project. Met TRIADO wordt het meest geraadpleegde Tweede Wereldoorlogarchief van Nederland, het Centraal Archief Bijzondere Rechtspleging (CABR), digitaal beter doorzoekbaar gemaakt. In het onderzoeksproject wil TRIADO een efficiënte en effectieve methodiek ontwikkelen die grote hoeveelheden ongestructureerde, analoge data uit archiefcollecties om kan werken naar bruikbare digitale onderzoeksdata. De sector, onderzoekers en andere geïnteresseerden kunnen dit proces volgen via de interviewserie ‘De mensen van TRIADO’.

In de vierde aflevering van de interviewserie ‘De mensen van TRIADO’ is het woord aan Rutger van Koert, softwareontwikkelaar bij de afdeling Digital Infrastructure van het KNAW Humanities Cluster. Bekijk het interview met Rutger van Koert op Youtube.

Van bron naar digitaal leesbare tekst

Van Koert helpt bij TRIADO met het omzetten van het geschreven en/of gedrukte bronmateriaal uit het CABR naar een digitaal leesbare tekst. Daarnaast is hij verantwoordelijk voor het automatisch classificeren van die gedigitaliseerde documenten. Ook verrijkt hij die documenten met metadata. Dit gebeurt aan de hand van geavanceerde software die in de lopende tekst (plaats)namen, titels, organisaties en datums herkent en classificeert. 

Classificeren

Bij het KNAW Humanities Cluster is Van Koert onder meer verantwoordelijk voor digitale beeldanalyse in het onderzoeksproject ‘Digital Forensics’ van het Huygens ING. Daarnaast is Van Koert verantwoordelijk voor de software die elementen van vroeg moderne en middeleeuwse manuscripten kan classificeren. Dit is onvoorstelbaar ingewikkeld: hoe langer geleden een tekst opgeschreven is, hoe moeilijker het wordt om het schrift te identificeren. Tot slot zorgt Van Koert voor software die op de scan van een middeleeuws manuscript kan vaststellen of het om de oorspronkelijke tekst gaat of om aantekeningen in de marge. Daarmee kan hij die teksten dus apart laten opslaan.

Enorme tijdswinst voor onderzoekers

Volgens Van Koert kunnen onderzoekers straks dankzij de methodes die in TRIADO worden getest, met een enorme tijdwinst interessante onderzoeksgegevens uit de archieven halen en deze vergelijken met informatie uit andere archieven. Door archieven geheel digitaal te ontsluiten, krijg je straks namelijk met een druk op de knop de resultaten die je wilt hebben, in plaats van dat je eerst jaren archiefonderzoek moet doen. Als de methode die nu in het TRIADO-project wordt ontwikkeld goed werkt en zoveel mogelijk is geoptimaliseerd, dan is de kans heel groot dat deze methode ook voor andere archieven werkt. Van Koert: ‘Wat dit project zo bijzonder maakt, is de schaal waarop we nu testen. We testen nu deze methoden met een set van honderdduizenden scans in plaats van met enkele honderden’

De mensen van TRIADO

In de interviewserie 'De mensen van TRIADO' komen betrokkenen bij het project Tribunaalarchieven als digitale onderzoeksfaciliteit aan het woord. Ze vertellen over hun expertise en rol in het project. Maar ook over hun verwachtingen en het belang van TRIADO. In totaal worden ongeveer 10 mensen geïnterviewd. Marten Düring, lid van de wetenschappelijke adviescommissie, Marian Hellema, initiatiefneemster van een digitaliserings-workflow, Anne Gorter, projectmanager Nationaal Archief en Rutger van Koert, softwareontwikkelaar bij de afdeling Digital Infrastructure van het KNAW Humanities Cluster zijn inmiddels geïnterviewd.

Over TRIADO

TRIADO (Tribunaalarchieven als digitale onderzoeksfaciliteit) is een onderzoeksproject dat de beschikbaarheid van erfgoedcollecties wil verbeteren. TRIADO is een project van Netwerk Oorlogsbronnen, Huygens ING (KNAW) en het Nationaal Archief. Het project loopt tot juli 2019.