Open data archiefinventarissen en scans van archieven

Een groot deel van de archiefinventarissen en scans van archieven zijn beschikbaar als open data. De manier waarop over dit materiaal beschikt kan worden verschilt.

Open data informatie voor archiefinventarissen
Collectiegegevens Waarde
Collectieonderdeel Archiefinventarissen
Aantal Ca. 6600
Percentage Open Data 97.2 % (van de 6800 digitale archiefinventarissen) 
Licentie CC0
Techniek OAI-PMH
Formaat

EAD/XML

 

Archiefinventarissen die niet als open data beschikbaar zijn

Een beperkt percentage van de archiefinventarissen (2.8%) is geen open data, omdat ze in het verleden door derden zijn gemaakt en het auteursrecht niet bij het Nationaal Archief ligt.

OAI-PMH (voor open data archiefinventarissen)

De html en de XML van de individuele archiefinventaris bevat een duidelijke vermelding van de CC0 licentie die van toepassing is.

Via OAI-PMH kunnen de archiefinventarissen opgevraagd worden; hierbij wordt EAD/XML teruggeleverd. De OAI-PMH werkt als volgt, de base url is:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=ListRecords&metadataPrefix=oai_ead_full

Het opvragen van de identificatie gegevens van een OAI-PMH repository werkt met het ‘verb’: Identify:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=Identify

Het opvragen van welke sets een OAI-PMH repository bevat werkt met het ‘verb’: ListSets:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=ListSets

De NA OAI-PMH repository bevat 4 sets: naa1, naa2, naa3 en naa4, corresponderend met de toegangen uit de 1.xx-serie, de 2.xx-serie, de 3.xx-serie en de 4.xx-serie

Het opvragen van de metadata formats waarin de data door een OAI-PMH repository worden aangeboden werkt met het ‘verb’: ListMetadataFormats:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=ListMetadataFormats

De NA OAI-PMH repository levert de data in 3 metadata formats aan: oai_dc (Dublin Core/XML), oai_ead (summiere EAD/XML) en oai_ead_full (volledige EAD/XML)

Het opvragen van de identifiers van de records van een set van een OAI-PMH repository werkt met het ‘verb’:ListIdentifiers, in combinatie met de set-naam en het metadata format:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=ListIdentifiers&set=naa1&metadataPrefix=oai_ead_full

Dit verzoek vraagt om de archiefinventarisnummers (identifiers) van de 4.xx-serie toegangen (set: naa4)

Het opvragen van alle records van een set van een OAI-PMH repositorye werkt met het ‘verb’: ListRecords, in combinatie met de set-naam en het metadata format:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=ListRecords&set=naa1&metadataPrefix=oai_ead

Dit verzoek vraagt om de zeer summiere EAD/XML informatie (metadata format: oai_ead) van alle 1.xx-serie toegangen (set: naa1)

Het opvragen van de inhoud van een record van een OAI-PMH repository werkt met het ‘verb’: GetRecord, in combinatie met de identifier en het metadata format:

http://www.gahetna.nl/archievenoverzicht/oai-pmh?verb=GetRecord&identifier=3.18.20&metadataPrefix=oai_ead_full

Dit verzoek vraagt om archiefinventarisnummer 3.18.20 (identifier: 3.18.20) in volledige EAD/XML weergave (metadata format: oai_ead_full)

Open data informatie voor scans van archieven
Collectiegegevens Waarde
Collectieonderdeel Scans van archieven
Aantal  
Percentage Open Data  
Licentie Publiek domein en CC0
Techniek Open Search API
Formaat
  • XML en JPEG thumb, medium- en high-res output via API
  • JPEG download, met een 300 DPI afdrukkwaliteit voor de afmeting van het origineel door bij de individuele scan gebruik te maken van de download knop 

Scans via Open Search API

Een flink aantal scans die horen bij de verschillende archiefinventarissen zijn beschikbaar via de Open Search API:

De scans die met een open data licentie beschikbaar zijn kunnen worden opgeroepen via de URL van de Open Search API. Het description document van de API geeft aan welke velden doorzocht kunnen worden.

Wanneer de scans van de Abdij van Rijnsburg (archiefinventaris 3.18.20) als voorbeeld worden genomen ziet de URL er als volgt uit.

http://www.gahetna.nl/beeldbank-api/opensearch/?q=3.18.20&count=100&startIndex=1

De API geeft per keer maximaal 100 records terug (&count=100) en start met het tonen ervan op pagina 1 (&startIndex=1). Wanneer er meer records dan 100 zijn (<opensearch:totalResults>) kan de pagina worden opgeplust tot het laatste resultaat is bereikt. Een record is in het geval van scans van archieven een inventarisnummer. Een record kan meerdere scans bevatten.
Via het veld <field name="Inventarisnummer"> kunnen de records weer gemakkelijk gekoppeld worden aan de XML van de archiefinventarissen.

Het is ook mogelijk om de scans van één individueel inventarisnummer via de API aan te roepen. Door de logische opbouw van de bestandsnaam van archiefinventaris en inventarisnummer is bijvoorbeeld het eerste inventarisnummer 1.4 uit archiefinventaris 3.18.20 te vertalen naar 3.18.20_1.4 als URL ziet er dan als volgt uit:

http://www.gahetna.nl/beeldbank-api/opensearch/?q=3.18.20_1.4&count=100&startIndex=1

Bronvermelding

Bij een Publiek domein en CC0 verklaring is de bronvermelding bij hergebruik niet verplicht. We stellen een bronvermelding wel op prijs. 

Bronvermelding open data per collectieonderdeel
Collectieonderdeel Bronvermelding
Archiefinventarissen

Nationaal Archief, Den Haag, [archiefnaam], [periode], nummer archiefinventaris [xx.xx.xx], inventarisnummer [xxx]

of verkort

NL-HaNA, [verkorte archiefnaam + periode], [nummer archiefinventaris xx.xx.xx], inv.nr. [xxx]
Scans van Archieven Nationaal Archief, Den Haag, [nummer archiefinventaris xx.xx.xx], inv.nr. [xxx]