Dit onderdeel licht de meest gebruikte technieken voor het registreren van informatieobjecten uit sociale-mediaplatforms toe. Dat wordt in alfabetische volgorde gedaan. Daarbij is niet alleen aandacht voor de techniek zelf, maar ook hoe uitvoerbaar deze is en in welke vorm het informatieobject wordt opgeslagen.
Omschrijving
Een sociale-media-API is een stukje code dat het mogelijk maakt om sociale-mediaplatforms te integreren met apps en tools van anderen. In zekere zin is een API een communicatiemiddel. Verschillende programma’s gebruiken een API om met elkaar te ‘praten’ en data te delen. Een API kan ook gebruikt worden om overheidsinformatie van sociale-mediaplatforms te halen. Door te verbinden met de API van een sociaal-mediaplatform, is het mogelijk om (meta)gegevens te verzamelen die eindgebruikers niet standaard te zien krijgen. Denk hierbij aan:
- geaggregeerde aantallen actieknoppen (likes) en reposts;
- metagegevens over de locatie;
- unieke identifiers voor elke post.
Uitvoerbaarheid
Er zijn enkele aandachtspunten rondom uitvoerbaarheid.
- Sociale-mediaplatforms hebben de afgelopen jaren steeds meer de toegang tot de API gelimiteerd. Om toegang te krijgen moet je vaak betalen en een account hebben op het specifieke platform. Maar zelfs dan kan er sprake zijn van restricties.
- Sociale-mediaplatforms geven geen inzicht in welke data wel en niet worden gedeeld via de API. Dat betekent dat de uitwisseling van data niet transparant is en de volledigheid, authenticiteit en integriteit van het informatieobject niet zeker is.
- Sociale-mediaplatforms veranderen regelmatig de API. Hierdoor is steeds een nieuwe tijdsinvestering nodig om weer aan te sluiten op de meest recente versie van de API.
- De toegang tot en het gebruik van de API vraagt technische kennis.
Output
Deze techniek genereert gestructureerde, tekstuele data. Deze data is eenvoudig te analyseren en te verwerken met een computer. De gestructureerde data wordt vaak opgeslagen in bestandsformaten zoals JSON, XML, CSV of XLS(X).
Omschrijving
Sociale-mediaplatforms bieden gebruikers de mogelijkheid om de informatie van het eigen sociale-media-account te exporteren en zo te archiveren. De wijze van ter beschikking stellen kan verschillen per platform. Eerst krijgt de gebruiker de mogelijkheid om of alle soorten gegevens te downloaden of een selectie. Een afbakening in de tijd is daarentegen niet mogelijk. Na een keuze te hebben gemaakt dient de gebruiker een verzoek in bij het platform. De gebruiker kan vervolgens het ‘archief’ downloaden.
Bij het gebruik van de archiveringsfunctie komt informatie van andere gebruikers, zoals opmerkingen en gedeelde berichten, niet mee. Of wordt geanonimiseerd. Ook (het aantal) reacties (via actieknoppen) wordt bij diverse platforms niet mee geëxporteerd en gearchiveerd
Uitvoerbaarheid
Er zijn enkele aandachtspunten rondom uitvoerbaarheid.
- Het gebruik van deze archiveringsfunctie vraagt geen grote tijdsinvestering. Het verwerken van de output op correcte wijze kost echter wel tijd. Sommige preserveringssystemen kunnen de gedownloade mappenstructuur niet in zijn geheel opnemen, dus daar moet een oplossing op maat voor gemaakt worden. Zie ook het praktijkvoorbeeld van het Regionaal Archief Alkmaar.
- Het gebruik van deze archiveringsfunctie vraagt geen extra software of technische kennis.
Output
Deze techniek genereert een ZIP-bestand. Dit ZIP-bestand bevat doorgaans een HTML-bestand dat dient als index. De gebruiker kan met deze HTML de informatie bekijken in een browser. Daarnaast kan het ZIP-bestand JavaScript-bestanden, afbeeldingen (zoals JPG), video’s (zoals MP4) en zelfs gestructureerde data (zoals CSV) bevatten.
Omschrijving
Screen capturing is het opnemen van een scherm. Dit kan een statisch beeld zijn, zoals een screenshot, of een dynamische opname van activiteit op het scherm. Alles wat op het scherm te zien was tijdens het maken van de screen capture, wordt gereigstreerd. Dus als comments zijn geopend of bijbehorende (account)namen te zien zijn, komen deze ook terecht in het archief. Hoewel het uiterlijk van het platform deels behouden blijft, is het een beperkte weergave van het origineel. De interactie, zoals het openen van links of het afspelen van video’s, is met deze techniek na registratie niet meer mogelijk.
Uitvoerbaarheid
Er zijn enkele aandachtspunten rondom uitvoerbaarheid.
- Screen capturing is een tijdrovende techniek omdat deze grotendeels handmatig uitgevoerd moet worden. De gebruiker moet zelf alle functionaliteiten en inhoud selecteren. Met programmeerkennis zou dit (deels) opgelost kunnen worden.
- Output in de vorm van een video is foutgevoelig. Bij te snel scrollen tijdens het registreren kan het beeld onscherp worden. En is het niet meer leesbaar.
- Screen capturing vraagt weinig technische kennis. Het is een laagdrempelige manier om informatie vast te leggen.
Output
Deze techniek genereert een afbeelding (bijvoorbeeld een PNG- of JPEG-bestand), video (bijvoorbeeld MP4) of een PDF.
Omschrijving
Bij webarchivering worden verschillende termen – web scraping, harvesting of crawling – door elkaar gebruikt voor het systematisch scheiden van delen van het ‘World Wide Web’ (www). Tijdens dit geautomatiseerde proces wordt een software-agent, een webrobot, of een script ingezet om de interactie tussen webservers en de mens na te bootsen en zo gegevens binnen te halen. De gearchiveerde webpagina’s worden getoond in een browser en maken doorgaans gebruik van (X)HTML. Ook sociale media kun je met deze techniek archiveren. Voor deze techniek geldt dat zowel de eigen informatie als informatie van andere gebruikers, zoals comments en likes, worden meegenomen.
Uitvoerbaarheid
Er zijn diverse aandachtspunten rondom uitvoerbaarheid.
- Deze techniek kun je zowel handmatig als geautomatiseerd toepassen.
- Er zijn veel tools beschikbaar. Zowel opensource- als commerciële tools, die door een actieve community van gebruikers worden onderhouden.
- Sommige tools vergen meer technische kennis, omdat programmeerkennis vereist is. Andere tools bieden een eenvoudig te gebruiken plug-in voor de browser. Zorg ervoor dat je een keuze maakt die past bij je eigen kennisniveau.
Output
Deze techniek genereert doorgaans output in de vorm van een WARC. Dit is een open bestandsformaat voor het archiveren van websites.