Ter beschikking stelling - beheer en weergave

Handreiking sociale media archivering

In het onderdeel technieken is aangetoond dat de methode die je gebruikt van invloed is op het informatieobject dat wordt gecreëerd. En in welk bestandsformaat dat terecht komt. Dat geldt ook voor de volgende stap; het beheren en weergeven van het informatieobject. 

In onderstaande tabel wordt voornamelijk gekeken naar de uitvoerbaarheid van beheer en weergave. Het gaat er bij weergave dus niet om of het informatiebestand authentiek wordt weergegeven. Maar hoeveel vervolgstappen er nodig zijn om het te kunnen weergeven. Dit is uiteraard over het algemeen genomen. Elk informatiesysteem werkt anders. Denk vooral ook na over de eigen context in relatie tot beheer en weergave.

Met de volgende legenda voor beoordeling:

SymboolBetekenis
+Vergt weinig vervolgstappen
-Vergt meer vervolgstappen
 BeheerWeergave
Application Programming Interface  (API)++
Archiveringsfunctie platform-+
Screen capturing-+
Web scraping/harvesting/crawling+-
Alles uitklappen

Application Programming Interface (API)

Beheer

De output van de API vraagt weinig extra aandacht. De gestructureerde data kun je eenvoudig in beheer nemen.

Weergave 

Een JSON-bestand kun je in principe openen en bekijken met elk programma dat plain text kan lezen. Zoals kladblok, Notepad of zelfs Word. Een CSV bestand – eigenlijk gestructureerde data in tabelvorm – kun je in principe openen met elke spreadsheetprogramma, zoals Excel.

 

Archiveringsfunctie platform

Beheer

Specifiek in het geval van Twitter (X) is bekend dat de links en afbeeldingen in het indexbestand verwijzen naar het live sociale-mediaplatform. Wanneer het account van het live website is verwijderd, of het platform of bepaalde content offline is gehaald, werkt dat dus niet meer. Ook is er sprake van verkorte links (t.co). Bovendien zijn de afbeeldingen niet de oorspronkelijke, maar veel kleiner dan wat origineel online is gezet.

Het is mogelijk om een verwerkingsslag over je Twitter-archief te doen, om veel van bovenstaande zaken op te lossen. Voor het probleem van verwijzingen naar de live website, de verkorte links en de kleine afbeeldingen kun je online zoeken naar oplossingen, zoals een Twitter parser. Dit is echter wel een extra bewerkingsslag die je zelf moet uitvoeren.

Weergave 

Het indexbestand kun je openen en bekijken in een webbrowser. Dit toont de structuur van het platform, zoals de tijdlijn. Ook afbeeldingen, emoji’s en video’s worden weergegeven in de index. En zijn terug te vinden in afzonderlijke bestanden.

 

Screen capturing

Beheer

De output van de screen capture vraagt weinig extra aandacht om op te nemen in je informatiesysteem. Echter, context en metagegevens (denk hierbij aan geolocatie) raken vrijwel volledig verloren bij screen capturing. Het toevoegen van deze gegevens vraagt veel aandacht.

Weergave 

De output zoals video’s (bijvoorbeeld MP4), afbeeldingen (bijvoorbeeld PNG), of een PDF kun je openen en bekijken zonder bijzondere applicaties. 

 

Web scraping/harvesting/crawling

Beheer

De output van het web scraping/harvesting/crawling vraagt weinig extra aandacht. Een WARC-bestand kun je valideren met behulp van de handreiking WARC-validatie.

Weergave 

Een volledige WARC kun je alleen openen en bekijken met een speciale reader, zoals replayweb.page, Webrecorder Player of OpenWayBack. De meeste preserveringsystemen hebben een weergavefunctie ingebouwd. Het is ook mogelijk om een WARC te openen in een teksteditor. Je kunt dan de metadata en HTML bekijken. Afbeeldingen en video’s zijn echter als binaire data opgeslagen en geven dus geen authentieke weergave.