Praktijkvoorbeeld Regionaal Archief Alkmaar

Logo Regionaal Archief Alkmaar
Alles uitklappen

In 2021 zijn twee gemeenten in de regio Alkmaar gefuseerd. Zij wilden online graag een frisse start maken door hun oude sociale-media-accounts op te doeken en te archiveren. En met één gezamenlijk account verder te gaan. Gezien de verplichting tot het archiveren van overheidsinformatie hebben zij de hulp van het Regionaal Archief Alkmaar (RAA) ingeschakeld. 

Beide gemeenten hebben via diverse sociale-mediakanalen (Facebook, Instagram, Google Drive (YouTube) en Twitter/X) contact gehad met bewoners en andere partijen. De accounts die beide gemeenten hiervoor gebruikten waren via het zakelijke e-mailadres van de medewerkers aangemaakt. Ze werden voor strikt zakelijke doeleinden ingezet. De accounts bevatten naast openbaar gedeelde informatie ook chatberichten tussen de gemeenten en bewoners.

Tijdens de fusie tussen de twee gemeenten is er contact gezocht met het RAA over het archiveren van hun sociale-media-accounts. Het RAA heeft geen inspraak gehad over de wijze van archiveren of manier van aanleveren van de accounts. 

Inventarisatie

Startpagina gearchiveerde Facebook-account
Startpagina gearchiveerde Facebook-account. Te zien wanneer de index.html wordt geopend

Het RAA kreeg de gearchiveerde sociale-media-accounts van de twee gefuseerde gemeenten op een harde schijf binnen. Adviseurs digitale informatie van het RAA hebben de ontvangen bestanden vervolgens bekeken en in kaart gebracht . Hierbij werd duidelijk dat er gebruik was gemaakt van de archiveringsfunctie van diverse platformen: Facebook, Instagram, Google Drive (platform Youtube), en Twitter (X).  RAA constateerde ook dat het om corporate accounts ging (zie Overheidsinformatie op sociale media). Deze accounts waren aangemaakt met de zakelijke e-mailadressen van individuele medewerkers. 

Plan van aanpak

Deze eerste inventarisatie leverde een plan van aanpak op. Hierin werd de context uitgelegd. En een uitgebreide analyse gedaan van de exports uit de diverse platforms. Ook zijn aandachtspunten en risico’s in kaart gebracht. De voornaamste aandachtspunten uit deze inventarisatie waren: de omgang met persoonsgegevens, diversiteit in bestandsformaten en de mappenstructuur (zie uitdagingen en complexiteit).

Verdere inventarisatie

Na het maken van een plan van aanpak is gekozen om (nog) meer informatie in te winnen over sociale-media-archivering. Het RAA heeft diverse archiefinstellingen met ervaring op dit gebied bevraagd en ook meerdere gesprekken gevoerd. Bijvoorbeeld over hoe dit materiaal goed te preserveren is. En hoe WARC en HTML zich verhouden tot elkaar. Daarnaast heeft de RAA de handreiking Voorkeursformaten van het Nationaal Archief gebruikt. En zijn diverse artikelen over het archiveren van sociale media als basis gebruikt.

Archiveren en toegang geven

Met de opgedane kennis konden de gearchiveerde accounts opgenomen worden in het informatiesysteem van het RAA. Dit is op twee manieren gedaan bij de accounts van Facebook en Instagram: 

  • In de vorm van een HTML met een voor het e-depot vereiste mappenstructuur van één maplaag. De oorspronkelijke structuur bestond uit verschillende mappen, die elk ook onderliggende mappen en bestanden konden bevatten. Deze structuur kan niet worden opgenomen in het e-depot van het RAA. En is daarom aangepast naar één maplaag. Ook was het belangrijk voor het RAA om zo dicht mogelijk bij de oorspronkelijke mappenstructuur en bestandsformaten (HTML) te blijven. 
  • In de vorm van een ZIP, waarin de export van het platform ook werd aangeboden. Bezoekers hebben daarbij de mogelijkheid om de gearchiveerde accounts te bekijken via een beveiligde computer in de studiezaal van het RAA.

Juridische vraagstukken

Mappenstructuur voorbeeld Regionaal Archief Alkmaar
Mappenstructuur na archivering van het Facebook-account

Op juridisch vlak was het archiveren van het materiaal een uitdaging. Zo bevatten de gearchiveerde accounts privé-informatie waar zorgvuldig mee om moet worden gegaan. In de gearchiveerde accounts zijn persoonsgegevens te vinden. Deze variëren van persoonsnamen tot bijzondere persoonsgegevens waarbij een medische status wordt genoemd. Om informatie in te winnen rondom dit onderwerp heeft het RAA gekeken naar wetgeving. Zoals de Archiefwet, de Algemene verordening gegevensbescherming (AVG) en het Auteursrecht. 

De opgenomen gearchiveerde accounts worden aangeboden op de website van het RAA. Het grootste deel van de HTML zal alleen niet beschikbaar zijn vanwege openbaarheidsbeperkingen. Hierin staat namelijk heel veel persoonlijke informatie. Ook is de ZIP in zijn geheel niet te openen. De accounts zijn wel toegankelijk op locatie vanaf een beveiligde computer op de studiezaal. 

Voor meer informatie: blog persoonsgegevens in een sociaal media archief op de website van het RAA.

Bestandsformaten 

De exports van het archief van de twee gefuseerde gemeenten bevat een aantal bestandsformaten. Sommige daarvan zijn niet duurzaam en staan dus ook niet op de lijst van acceptabele formaten. Het RAA heeft er echter voor gekozen om deze bestandsformaten toch op te nemen in hun e-depot, in plaats van ze te converteren. Bij converteren kan namelijk informatieverlies ontstaan. Om deze reden is de HTML (het oorspronkelijke formaat) niet omgezet naar het WARC-formaat (voorkeursformaat bij webarchiveren).

 

 

 

 

 

Het opslaan van de bestanden in één maplaag in plaats van een ZIP heeft voordelen. 

  • Wanneer je de bestanden als een ZIP opslaat, preserveer je de individuele bestanden niet, hoewel dat wel de bedoeling is. 
  • Interne verwijzingen naar de verschillende bestanden blijven behouden, zodat de informatie op de juiste manier getoond wordt wanneer je de berichten bekijkt. 
  • Bij beperking van openbaarheid op onderdelen van het sociale media archief, hoeft dat niet te betekenen dat het gehele archief niet in te zien is. Als de bestanden opgeslagen zijn in een ZIP, geldt deze beperking voor de gehele ZIP. Op deze manier is het dus mogelijk om de beperking enkel op het desbetreffende bestand toe te passen. 

Mappenstructuur

Met de downloadfunctie van de sociale-mediaplatforms krijg je een ZIP. Na het uitpakken van deze ZIP zie je een mappenstructuur met daarin de eerder beschreven diversiteit aan bestandsformaten. Binnen de combinatie van systemen bij het RAA kan er maar één map worden opgenomen. Daar mogen geen submappen in zitten.

Het RAA heeft geprobeerd  dit op te lossen. Bij het terugbrengen naar één maplaag van de mappenstructuur krijg je namelijk dubbele bestandsnamen. Tevens moet rekening gehouden worden met onderlinge verwijzingen in de diverse bestanden. Voor Facebook en Instagram is het aanpassen van de mappenstructuur gelukt. De context is zoveel mogelijk behouden door de mappenstructuur op te slaan als een boomstructuur. En door alle aanpassingen te noteren (inclusief verwijzingen) in een apart bestand. Helaas bleek deze methode niet mogelijk voor de accounts van Google Drive en Twitter. Dit wordt nader onderzocht.