Stap 3: Kenmerken van invloed op archiveringsaanpak

Handreiking e-mail archiveren

E-mail is een digitale informatiesoort met een aantal specifieke kenmerken die van invloed zijn op de archivering. Deze kenmerken roepen vraagstukken op. Deze stap helpt je om de aandachtspunten in kaart te brengen. Om zo te komen tot de voor jou passende archiveringsmogelijkheid. (Zie hiervoor Stap 4: Archiveringsmethode.) Er is tot nu toe geen archiveringsmogelijkheid die alle aandachtspunten borgt. Daar is nog verdere praktijkervaring en kennisontwikkeling voor nodig. Wanneer hier meer over bekend is, vullen we de informatie aan.

Kenmerken e-mail

Verzonden en ontvangen

E-mails worden verzonden én ontvangen. Dat houdt in dat iedere archiveringsstrategie met zowel de kant van de verzender als de ontvanger rekening moet houden.

Meerdere ontvangers

E-mails worden beantwoord, doorgestuurd en verstuurd, al dan niet in (B)CC. Het gevolg is dat e-mails veel dubbelingen bevatten.

#Threads

In tegenstelling tot bijvoorbeeld PDF-documenten staan e-mails vaak niet op zichzelf. De meeste e-mails zijn deel van een conversatie. De verschillende e-mails die in reactie op elkaar worden verstuurd vormen samen een thread: een gelinkte e-mailconversatie die herkenbaar is aan het onderwerp van de eerste e-mail waarop verschillende reacties volgen. Ook kunnen afsplitsingen ontstaan, bijvoorbeeld wanneer een e-mail naar andere ontvangers wordt doorgestuurd met een nieuwe vraag die toegevoegd wordt, en een nieuwonderwerp.

Bijlagen

E-mails kunnen allerlei soorten bijlagen bevatten die elk unieke informatieobjecten zijn. Zoals: documenten, afbeeldingen, links naar websites of naar documenten die op andere plekken zijn opgeslagen, bijv. in een document management systeem (DMS). 

Meerdere onderwerpen per e-mail

E-mail is een laagdrempelig communicatiemiddel en kan ‘vrij’ gebruikt worden, zonder inhoudelijke ordening vooraf. Dat heeft als gevolg dat e-mails verschillende deelonderwerpen kunnen beslaan. Een e-mail met het onderwerp ‘Verslag stuurgroep’ kan naast het verslag ook informatie of een vraag over een geheel ander onderwerp en ander werkproces bevatten. 

Privé en zakelijk door elkaar

Het is de praktijk bij veel organisaties dat collega’s elkaar werkgerelateerde e-mails sturen en in dezelfde mail ook vragen hoe iemands vakantie was. 
Je kunt afspraken maken over hoe e-mail gebruikt wordt binnen de organisatie om privégebruik te minimaliseren. De vermenging tussen privé en werk is echter sterk verweven geraakt door de laagdrempeligheid van e-mail als communicatiemiddel. In de praktijk is het moeilijk dit volledig uit te sluiten. (Zie voor handvatten: Openbaarheid en privacy.)

Alles uitklappen

Voor het bepalen van een archiveringsmethode voor e-mail is de opbouw van e-mails relevant. Uit welke onderdelen bestaat e-mail, en welke informatieobjecten en automatische metadata bevat e-mail.

Een afzonderlijke e-mail bestaat uit een header en uit content.
De header bevat de naam van de verzender, ontvanger, datum van versturen, en het onderwerp. Ook de CC-ontvangers van de e-mail staan in de header.

De content bevat de inhoud van de e-mail. Het is opgebouwd uit een combinatie van platte tekst en embedded styling, zoals de opmaakelementen van de tekst. Vaste inhoudelementen zoals een e-mail-handtekening of een banner zijn ook onderdeel van de content.  
 
De e-mailclient (bijvoorbeeld Outlook) slaat verzonden en ontvangen e-mails lokaal op via een e-mailserver (bijvoorbeeld Microsoft Exchange). En toont ze aan de gebruiker op basis van de opmaakelementen uit de content. De client toont een e-mail volgens de opmaakelementen. Maar dat kan enigszins verschillen per client. De meeste e-mailservers bewaren zelf voor elk e-mailaccount de ontvangen en verzonden e-mail. Ze synchroniseren met de e-mail box én met een mobiele e-mailapplicatie. 
E-mailservers kunnen ook een webclient hebben, waarbij een view direct op de server getoond wordt zonder lokale opslag.

De informatie in de header en de content bestaat uit platte tekst. De weergave wordt bepaald door de software van het e-mailaccount, zoals bijvoorbeeld Microsoft Outlook.

De standaardopbouw van e-mails bevat de volgende informatieobjecten en metadata:

  • Naam verzender
  • Naam ontvanger
  • Naam ontvanger in CC
  • Naam ontvanger in BCC
  • Datum en tijdstip versturen e-mail
  • Onderwerp (subject)
  • Content e-mail, inclusief banner en handtekening indien gebruikt
  • E-mailadres verzender
  • E-mailadres ontvanger
  • E-mailadres ontvanger in CC
  • E-mailadres ontvanger in BCC
  • Prioritering e-mail (indien gebruikt)
  • Uniek ID van de e-mail
  • Taal
  • Grootte
  • Bijlagen, wanneer die aanwezig zijn
  • Message thread

#Aandachtspunten e-mailarchivering

De specifieke kenmerken van e-mail en de technische analyse van e-mail leiden tot een aantal aandachtspunten voor e-mailarchivering. 

Alles uitklappen

Archiveren houdt altijd in dat informatie in zijn functionele context gezien wordt. 
Die context is in selectielijsten en documentmanagementsystemen (DMS’en) gebaseerd op werkprocessen. E-mails volgen echter  niet de ordening van het DMS.

Als dezelfde informatie in het werkproces op meerdere plekken voorkomt, zoals bij e-mail het geval is, treden in het archief ook dubbelingen op. Dit is met name aan de orde bij handmatige opslag.
Het is goed mogelijk dat dezelfde e-mail bij verschillende dossiers opgeslagen wordt, en dat voor de werkprocessen van die dossiers ook verschillende bewaartermijnen gelden. Daardoor is het mogelijk dat een e-mail bij werkproces X na termijn Y vernietigd wordt, en dat dezelfde e-mail blijvend bewaard wordt samen met de mailbox van een sleutelfunctie.
Dubbelingen in het archief zijn geen probleem: dezelfde e-mail kan ook in meerdere contexten (zoals werkprocessen) een rol spelen. Zolang de context maar behouden blijft en de archiefraadpleger de context van een gearchiveerde e-mail kan duiden. 

#Als de context waarbinnen een e-mailconversatie plaatsvindt niet duidelijk is, kan de waarde van de gearchiveerde e-mails nihil zijn. Die context is gekoppeld aan zowel het onderwerp van het gesprek, als aan de functies van de gesprekspartners en de datum waarop het gesprek plaatsvindt
Een aantal kenmerken van e-mail zijn van invloed op de context.

Thread

Het feit dat e-mails vaak onderdeel zijn van een thread betekent dat de meeste e-mails niet op zichzelf staan. De e-mailapplicatie linkt de verschillende e-mails in een thread via een unieke code aan elkaar. Deze code is echter vaak ‘onder water’. Bij zowel automatische als handmatige opslag wordt met het opslaan van de laatste mail in de reeks ook de rest van de e-mailconversatie veilig gesteld. Het is echter mogelijk om e-mails in de thread handmatig eruit te halen. Dit aandachtspunt word bij handmatige opslag verder toegelicht.

Subject/Onderwerp

Het subject van een e-mail wordt bepaald door de verzender en hoeft geen duidelijke weergave te zijn van het onderwerp of dossier waar de e-mail betrekking op heeft. 
De context is daarmee – op basis van het subject- niet automatisch herleidbaar voor derden die geen deel uitmaken van de oorspronkelijke e-mailconversatie.
Het subject van een e-mail kan wel bijdragen aan begrip van de context.

Dossier

Hoe borg je bij het archiveren van e-mail de samenhang tussen de inhoudelijke dossiers waar een e-mail in heeft gefunctioneerd, en de gearchiveerde e-mailberichten zelf? Zeker wanneer die e-mails in bulk worden gearchiveerd en niet volgens de ordening van het DMS bewaard worden.
Een gehele e-mailbox – met name bij de sleutelfunctiemethode- kan als het dossier gezien worden. De mailbox is dan de context van de e-mail.
Tegelijkertijd kun je – bij handmatige opslag en zaaksystemen - individuele e-mail selectief koppelen aan de dossiers van andere werkprocessen.
Kortom: het begrip dossier heeft bij e-mail een dubbele betekenis: de e-mailbox is te beschouwen als dossier op zichzelf wanneer de gehele mailbox gearchiveerd wordt. En tegelijkertijd kun je bij handmatige opslag ook individuele e-mails uit de context van de mailbox halen om bij een ander dossier te bewaren.

Bijlagen en links

Bijlagen die met een e-mail mee gestuurd – of ontvangen - zijn worden bij automatische opslag mee gearchiveerd.
Bij handmatige opslag is het afhankelijk van de keuze van de gebruiker of de bijlagen mee worden gearchiveerd:

De bijlagen horen bij het informatieobject 'e-mail'. Overheidsorganisaties moeten bepalen op welke manier ze een relatie leggen tussen de gearchiveerde e-mail en de bijlagen. Dat kan door de e-mail en de bijlage bij elkaar te houden en ze gezamenlijk op te slaan. Of het kan door de e-mail op te slaan en te linken naar de plek in het archief (DMS) waar de bijlage staat. Deze optie is vooral handig wanneer sprake is van meerdere bijlagen; de bijlagen kunnen immers in verschillende contexten een rol spelen. 

Links die verwijzen naar een document in het DMS werken: 

  • Zolang als dat het document in het DMS beschikbaar is.
  • Zolang het document en de e-mail in hetzelfde DMS opgeslagen zijn. Het is dus niet mogelijk een link te openen die naar het DMS van een andere organisatie verwijst.

Het kan voorkomen dat de link naar een document in het DMS afhankelijk is van de locatie. Wanneer het document in het DMS verplaatst wordt naar een andere locatie in het DMS, werkt de link niet langer.
In zo’n geval kan een oplossing zijn om een persistent identifier (PID) te koppelen aan de link. Deze maatregel vereist dan wel organisatiebreed beleid. Het is niet specifiek voor e-mailarchivering, maar raakt de inrichting van het DMS. Deze maatregel verhoogt de vindbaarheid voor gebruikers binnen de eigen organisatie. Een PID maakt echter geen verschil voor externe gebruikers die tientallen jaren later toegang willen tot de gearchiveerde e-mail. 

#Een e-mailbox bevat vaak ook een agenda. In deze handreiking wordt uitgegaan van de archivering van e-mails, onafhankelijk van de software van de e-mailclient. 
Agenda-uitnodigingen worden verstuurd en ontvangen als reguliere e-mails en door de software van de e-mailclient omgezet naar een representatie in de vorm van een agenda. 
De volledige agenda kan niet volledig gereconstrueerd worden uit agenda-uitnodigingen. Omdat vergaderingen bijvoorbeeld niet altijd doorgaan, en de e-mail ook maar een deel van de daadwerkelijke agenda van een ambtenaar bevat. Afspraken kunnen ook door de gebruiker van de mailbox in de agenda gezet zijn zonder dat er een e-mail verstuurd is. Deze afspraken zijn dan alleen lokaal in de client opgeslagen en kunnen nog steeds relevante informatie bevatten voor de reconstructie van de agenda. 
Ontvangen of verzonden agenda-uitnodigingen zijn te beschouwen als e-mail over de agenda. Het valt buiten de scope van deze handreiking om in te gaan op volledige reconstructie van agenda’s gekoppeld aan mailboxen.
Agenda-uitnodigingen die via e-mail worden verstuurd of ontvangen kunnen belangrijke waarde hebben wanneer ze beschouwd worden als e-mail over de agenda. Omdat er bijvoorbeeld een toelichting op de afspraak met inhoudelijk relevante informatie in de uitnodiging staat. Of omdat bijlagen zoals documenten meegestuurd zijn met de agenda-uitnodiging. De agenda-uitnodiging bevat dan wel relevante informatie voor reconstructie van een werkproces. De documenten in de bijlagen staan dan ook niet op zichzelf; ze zijn verstuurd als een e-mail. Het archiveren samen met de e-mail is dan relevante contextinformatie.  

Niet alleen de inhoud van informatie doet er toe, ook de verschijningsvorm is van belang (Artikel 17 van de Archiefregeling).  Maar de opmaak van een e-mail wordt bepaald door de e-mailclient. En elke  e-mailclient kan de opmaak van een e-mail anders interpreteren. Daarmee is nooit precies te achterhalen hoe een verzonden e-mail gezien is door de ontvanger, omdat die afhankelijk is van de e-mailclient van de ontvanger.
De opmaak van de oorspronkelijke verstuurde e-mail wordt wel opgeslagen bij archiveren. In de metagegevens wordt informatie over de opmaak meegestuurd. Zoals mime-type (mediatypes), of de e-mail in platte tekst of html was en of de html CSS bevatte.
Het is afhankelijk van de viewersoftware van het archief (e-depot) hoe de data getoond wordt aan de archiefraadpleger. In theorie kan dit tot verschillen bij de verschijningsvorm leiden. Dat hoeft geen probleem te zijn: het kan immers vergelijkbaar zijn met de verschillen die tijdens het ontvangen en versturen van e-mail ook optreden.

#Zoals hier uitgelegd is overheidsinformatie, waaronder e-mail, in principe openbaar. Soms is het nodig openbaarheid van overheidsinformatie tijdelijk te beperken. Daar zijn regels voor. De regels zijn anders voor overgebracht en niet-overgebracht archief.
Bij gearchiveerde e-mail kan het openbaarheidsregime dat geldt onder de Woo en onder de Archiefwet vragen oproepen. Juist vanwege de persoonsgegevens aanwezig in e-mail, is dit een informatiesoort waarbij in de praktijk vaak beperkingen aan de openbaarheid gesteld worden. Onder de Woo zijn hier verschillende gronden voor.
Ook onder de Archiefwet kunnen beperkingen gesteld worden aan de openbaarheid van overgebrachte informatie. Zie hier voor veelgestelde vragen over openbaarheid en overbrenging.

Openbaarheid bij sleutelfunctiemethode

Bij toepassing van de sleutelfunctiemethode wordt onderscheid gemaakt tussen e-mail van sleutelfuncties en e-mail van niet-sleutelfuncties. E-mail van sleutelfuncties wordt voor blijvende bewaring aangewezen, waarbij overbrenging na tien jaar plaatsvindt. Het is mogelijk om op grond van de Archiefwet voor een bepaalde termijn een beperking aan de openbaarheid op de e-mail van sleutelfuncties te stellen. 

E-mail van niet-sleutelfuncties wordt na tien jaar vernietigd. Dat betekent dat de e-mail van niet-sleutelfuncties nooit openbaar wordt volgens de Archiefwet, en de facto alleen op grond van de Woo opgevraagd kan worden in de tien jaar dat de e-mail bewaard wordt. De weigeringsgronden voor openbaarheid vanuit de Woo zijn in die periode van toepassing op informatieverzoeken.

Het Nationaal Archief-rapport werkgroep Openbaarheid 1 gaat uitvoerig in op alle vraagstukken en mogelijkheden rond openbaarheid bij toepassing van de sleutelfunctiemethode. 

Privacy

E-mail bevat veel persoonsgegevens. Daarom is privacy en AVG-compliance een belangrijk aandachtspunt. Het generieke advies is dan ook om een Privacy Impact Assessment (PIA) uit te voeren als onderdeel van een aanpak voor de archivering van e-mail. Omdat de risico’s voor privacy veranderen met de tijd – nieuwe wet- en regelgeving, beveiligingseisen, etc. - en e-mail langere tijd bewaard wordt, is het aan te raden om PIA’s cyclisch uit te voeren via het principe van plan-do-check-act.
De PIA(‘s) die je aan de start en tijdens de archivering van e-mail uitvoert, zijn ook te gebruiken als voorwerk. Bijvoorbeeld voor besluiten beperkingen openbaarheid (BBO’s) op het moment van overbrenging naar een archiefbewaarplaats voor e-mails die voor blijvende bewaring zijn aangewezen.  

Versleuteling

E-mail kan ook in versleutelde vorm verzonden of ontvangen worden. Dit is een middel om vertrouwelijke gegevens tijdens de informatie-uitwisseling te beschermen. Het is van belang dat e-mail onversleuteld gearchiveerd wordt. Na opslag in een DMS, RMA of e-depot worden vertrouwelijke gegevens beschermd via andere middelen: eventuele openbaarheidsbeperkingen, autorisaties en beveiliging.