Nationaal Archief (Ministerie van Onderwijs, Cultuur en Wetenschap)

Project e-discovery: prototype waardering e-mails nu testklaar

Er komen steeds meer kansen en uitdagingen voor het archiveren van digitale overheidsinformatie. Kansen en uitdagingen die het Nationaal Archief wil ontdekken, beproeven en benutten. We steken daarom energie in archiefinnovatie. En hebben onlangs samen met ICTU een kleinschalig experiment met automatische classificatie van e-mails afgesloten. In de ICTU-labomgeving zijn door ‘machine learning’ zakelijke e-mails van niet-zakelijke gescheiden. Een prachtig voorbeeld van het toepassen van e-discovery voor informatiemanagement.

E-discovery en machine-learning

E-discovery is een methodiek waarbij grote hoeveelheden ongestructureerde digitale informatie worden doorzocht op relevante data. Aanvankelijk is de methodiek ontwikkeld om bij rechtszaken bewijsmateriaal naar boven te halen. Maar ze is minstens zo interessant voor andere toepassingen. Zeker als daarbij gebruik wordt gemaakt van ‘machine learning’; het trainen van algoritmen om steeds scherper automatisch te kunnen onderscheiden welke informatie voor een bepaald doel wel of niet van belang is. Dat doel kan liggen bij digitaal archiefbeheer (toegankelijkheid, selectie, enz.). Maar ook bij specifieke onderzoeksvragen van toekomstige gebruikers.

Samenwerking met ICTU

Innoveren doet het Nationaal Archief bij voorkeur met samenwerkingspartners. Dit in het belang van de kennisdeling en –ontwikkeling. Een natuurlijke partner is ICTU, dat al sinds jaren werkt aan software-ontwikkelprojecten voor de overheid en staat voor een kwaliteitsaanpak. ICTU wil doorgroeien als innovatieplatform waar overheden kunnen experimenteren, leren en nieuwe kennis en inzichten met elkaar delen. Daarvoor heeft ICTU een lab-omgeving opgezet: Discipl. Hier kunnen deelnemers onder meer open- source-oplossingen toepassen op specifieke vraagstukken.

Resultaten

Het experiment heeft ons een prototype opgeleverd. Dit prototype gaat de komende maanden live draaien binnen het Nationaal Archief om bruikbaarheid en betrouwbaarheid verder te testen. Volgend jaar bekijken we hoe we doorgaan met machine learning en met wie. Of we het prototype verder gaan ontwikkelen of (ook) starten met nieuwe experimenten. Het werken in de ICTU-labomgeving wordt in ieder geval voortgezet. Is het niet met e-discovery, dan wel met het experimenteren met andere methodieken die kansrijk zijn om innovatief te worden toegepast bij digitaal informatie- en archiefbeheer.

Wilt u zien hoe het prototype werkt? Dat kan! Stuur een mail naar contact@nationaalarchief.nl o.v.v. Mette van Essen, prototype e-mails.