Columns & opinie
071-527... Internetarcheoloog
Kees Teszelszky doet onderzoek naar webarchivering bij de Koninklijke Bibliotheek. Samen met Leidse onderzoekers spreekt hij op het symposium All I know is what’s on the internet. Het bewaren van digitale bronnen uit het post-truth tijdperk voor de toekomst.
donderdag 1 juni 2017

Wat voor digitale bronnen uit ons tijdperk worden er bewaard in de KB?

‘We maken collecties die representatief zijn voor een fenomeen uit onze tijd, die bruikbaar kunnen zijn voor onderzoekers. Later, maar ook nu al. Zo hebben we al selecties over sport, het verdwijnen van het kloosterleven, de troonswisseling, en waar het symposium over gaat: post-truth-websites.’

Welke websites zitten daarbij?

‘De lijst is onder meer gebaseerd op een linkextractie van het onderzoek naar complotdenkers van Jelle van Buuren, waarop hij vorig jaar in Leiden promoveerde. Er staan niet alleen post-truth-websites op: ook sites die daar alleen naar verwijzen, zoals van Stichting Skepsis. Verder gaan ze over UFO’s, chemtrails, de eindtijd en de Bilderbergroep. 

‘Het betreft een pilotonderzoek, maar wat me alvast verbaasde, was dat al die websites weer naar elkaar verwijzen, om hun eigen gelijk te krijgen. Van de vijfhonderd websites die we in januari verzamelden, zijn er nu trouwens alweer een hoop offline.’

Gaat dat zo snel?

‘Bepalen wat later een belangrijke bron zou kunnen zijn, moet binnen negentig dagen. Zo lang worden pagina’s door Google in cache bewaard. In de monumentenzorg kun je gerust vijftig jaar wachten en eens kijken wat er nog overeind staat. Bij websites heb je die tijd niet, die verdwijnen als ze geen betekenis meer hebben. En als er dan tóch een oeroude website bewaard is, knutselwerk van mensen uit de jaren negentig, dan zijn dus zelfs de kattenplaatjes interessant. Een van de eerste websites van Nederland, de Dutch Home Page uit de jaren negentig, bleek uiteindelijk te redden, toen iemand een oude server van zolder haalde. Het is echt internetarcheologie.’

Hoe bewaren jullie de selecties?

‘We beschrijven de collecties heel goed, en geven aan waarom we bepaalde onderdelen wel hebben opgenomen, en andere niet. We zijn trouwens nog op zoek naar een stagiair, die met een verwonderde blik naar de huidige tijd kan kijken, en de collectie verder wil selecteren. Voor een artikel, of een scriptie.

‘Er zijn in Nederland 5,73 miljoen adressen met .nl erachter. 12.000 daarvan worden er momenteel op harde schijven in de KB bewaard. Dat lijkt weinig, maar bij elkaar is het toch 23 terabyte.

‘Mogelijk is over vijftig jaar 99 procent van de websites weg: The Digital Dark Age. Met de middelen en de mensen die we hebben, doen we ons best om iets te behouden. Net als zeventiende-eeuwers die middeleeuwse manuscripten wilden bewaren, toen bijna niemand die interessant of van waarde vond.’

Hoe zorgen jullie ervoor dat huidige digitale vormen beschikbaar blijven?

‘De KB heeft daarvoor een afdeling digitale duurzame toegang, die samen met allerlei andere organisaties ervoor probeert te zorgen dat collecties over vijftig of honderd jaar nog steeds bestudeerd kunnen worden. Het leesbaar houden van cd-roms is bijvoorbeeld een uitdaging. Boeken zijn in vergelijking een stuk duurzamer. 

‘Het is een actueel probleem: in de ruimtevaart bleken de data van sommige NASA-missies uit de jaren zeventig bijvoorbeeld niet meer leesbaar.’ MVW

Mini-symposium: All I know is what’s on the Internet

Dinsdag 6 juni, 15.00 uur, KB, Den Haag

Gratis, aanmelden kan hier.