Selectielijsten Nationaal Archief nu beter toegankelijk

Sneller zoeken door database en extra metadata
Foto van een computerfolder.
3 december 2019

De toegankelijkheid van de selectielijsten op de website van het Nationaal Archief is flink verbeterd. Een team specialisten heeft hiervoor een database opgezet en alle 163 selectielijsten voorzien van meer metadata. Hierdoor is er makkelijkere en snellere toegang tot de inhoud van de selectielijsten. En zijn de lijsten beter doorzoekbaar.

Wat is er allemaal verbeterd?

Uit de vastgestelde selectielijsten hebben we extra metadata opgehaald. Hierdoor zijn de selectielijsten op veel meer gegevens en variabelen te bevragen. Het brede publiek ziet meer beschrijving waardoor inzichtelijker wordt wat er in de selectielijst staat. Daarnaast is de wijze van ontsluiting op de website aangepast. Onder de selectielijsten-pagina op de website draait nu een database. Hierin kan dwars door alle selectielijsten gezocht worden, omdat individuele selectielijsten met aanzienlijk meer informatie zijn verrijkt en van extra context zijn voorzien. Hierdoor wordt een selectielijst veel sneller gevonden, bijvoorbeeld wanneer er gezocht wordt op selectielijsten die zijn afgesloten. Dit was eerder niet mogelijk.

Veel meer metadata

Al eerder (in 2016) is een aantal verbeteringen aangebracht. De matig doorzoekbare PDF’s van de selectielijsten zijn toen beter ontsloten. Dit gebeurde via een (van het selectielijstenoverzicht afgeleide) CSV-tabel. In een CSV-bestand  worden de kaders van een tabel uit bijvoorbeeld Excel vervangen door komma’s of andere leestekens. Gegevens kunnen daardoor (als open formaat) gemakkelijk tussen verschillende programma's worden overgedragen, zonder dat bronbestanden verloren gaan of veranderen. Het resultaat van deze eerste verbeterslag waren vier kolommen aan informatie (metadata) over de selectielijsten: zorgdrager, titel, beschikking en verwijzing naar de Staatscourant.

Op dit idee is in 2019 voortgeborduurd. Door het proces van vaststelling van selectielijsten net iets anders in te richten, kon er aanzienlijk meer context en metadata worden afgeleid en toegevoegd. Na een korte verkenning bleek dat de CSV-tabel op een betrekkelijk eenvoudige manier uitgebreid kon worden van vier naar wel vierentwintig soorten metadata! Hierdoor ontstaan er bijna automatisch meer zoekresultaten wanneer er integraal door alle selectielijsten wordt gezocht.

Verdere ontwikkelingen

Op de korte termijn wordt de toegankelijkheid van de metadata van de online beschikbare selectielijsten nog verder verbeterd. Dan kan op een deel van de informatie over de selectielijsten verder geselecteerd en gesorteerd worden. Dit heeft als voordeel dat er makkelijker geclusterd kan worden op gelijksoortige selectielijsten. Nuttig voor bijvoorbeeld de gebruiker die zelf aan de slag gaat met een selectielijst. Ook de mogelijkheden van indexeren en doorzoeken van de afzonderlijke PDF’s worden onderzocht. Hierdoor komt er nog meer (meta)data beschikbaar om integraal te doorzoeken. Daarnaast bekijkt het Nationaal Archief in 2020 of ook de hotspotlijsten gekoppeld kunnen worden aan de selectielijsten. Dit om extra context toe te kunnen voegen. Met het oog op linked data is de uiteindelijke stip aan de horizon het aanbieden van de selectielijsten als XML-selectiedata.