Het grootste web-archief ter wereld wordt bedreigd door procederende uitgevers, zegt oprichter

Amper twee weken was de nieuwe Amerikaanse regering in functie, toen The New York Times er achter kwam dat er 8.000 pagina’s van Amerikaanse overheidswebsites waren verdwenen. Toch kon de krant zijn online-lezers de weggehaalde pagina’s laten zien. Dankzij het Internet Archive.

Sinds 1996 heeft deze Amerikaanse organisatie zonder winstoogmerk de taak op zich genomen massaal webpagina’s te archiveren. Onder leiding van de onvermoeibare informaticus, internetondernemer en digitaal bibliothecaris Brewster Kahle.

Het internet vergeet niets? Een wijdverbreid misverstand. Kahle besefte al in de jonge jaren van het wereldwijde web hoe vluchtig het internet juist is, hoe veel er verdwijnt en wordt aangepast. En hoe belangrijk het daarom is om veel webpagina’s te archiveren – én toegankelijk te maken.

Dat laatste doet het Internet Archive sinds 2001 via de zogeheten Wayback Machine. Daarin zijn inmiddels meer dan 900 miljard verdwenen of aangepaste webpagina’s voor iedereen online te bekijken. Waaronder die pagina’s van Amerikaanse overheidswebsites, zoals ze eruit zagen voordat ze verdwenen of gezuiverd waren van door president Trump tot taboe verklaarde informatie over onder meer diversiteit, gender en klimaatverandering.

„Mensen zijn ons archief de laatste tijd een stuk meer gaan gebruiken”, zegt Kahle tevreden, tijdens een recent bezoek aan Nederland. „We doen niets anders dan wat we altijd al deden. Sinds 2008 maken we speciaal momentopnames van overheidswebsites voor en na een wisseling van de macht. Ook deze keer was er weer veel enthousiasme van vrijwilligers om mee te helpen aan onze End of Term crawl.

„Wat we zo bijeen brengen is deel van onze veel omvattende Bibliotheek van Democratieën. Daarin verzamelen we openbare overheidsstukken van over de hele wereld. Want het zal je misschien verbazen, maar wat we doorgaans ‘het publieke domein’ noemen, blijkt vaak helemaal niet zo publiekelijk toegankelijk te zijn. Daar willen wij een oplossing voor bieden.

„Voor de VS en Canada zijn we begonnen alle publicaties op het niveau van de federale overheid, de deelstaten en de gemeenten te verzamelen en blijvend beschikbaar te stellen. En het mooie is: de Amerikaanse overheid publiceert zó veel, ze is misschien wel de grootste uitgever ter wereld.”

Maar zoals we nu zien laat de Amerikaanse overheid ook informatie en complete websites verdwijnen.

„Dat zit in de aard van uitgevers, die willen altijd nieuwe dingen publiceren. Bibliotheken en archieven zijn er om de geschiedenis te bewaren. Verwacht van de overheid niet dat ze die taak overneemt.”

„Voortdurend verdwijnen er websites, en stoppen uitgevers. Daarom moeten we oude edities van sites en boeken bewaren en hebben we bibliotheken nodig, als bloeiend onderdeel van ons culturele ecosysteem. Anders belanden we in een Orwelliaanse wereld, waarin machthebbers heden en verleden naar hun hand kunnen zetten. Bibliotheken en archieven bestaan om te zorgen voor een accurate weergave van werken die de mensheid gepubliceerd heeft.”

„Iedereen die nu jonger is dan veertig jaar, is hoofdzakelijk grootgebracht met wat er op het internet staat. De boeken van de twintigste eeuw hebben we hen zo als het ware afgenomen. Het internet zou veel omvangrijker kunnen zijn dan de bibliotheken waarmee wij zijn opgegroeid, maar in veel opzichten gaat het niet erg diep. De generaties die nu opgroeien, geven we niet meer het beste dat we te bieden hebben. Daar zouden we ons zorgen over moeten maken. Met het Internet Archive proberen wij voor dat probleem een oplossing te bieden.”

Zijn jullie servers in San Francisco, waarop het hele Internet Archive staat, onder deze regering nog wel veilig?

„Je moet er nooit van uit gaan dat wat dan ook veilig is. Maar de grootste bedreiging voor het Internet Archive komt op dit moment ergens anders vandaan: van uitgevers die willen dat we licenties afsluiten en betalen voordat we iets publiekelijk beschikbaar stellen. Ze hebben twee grote rechtszaken tegen ons aangespannen.”

„Het eerste van die twee zaken tegen het Internet Archive ging uit van grote boekenuitgevers. Die verweten het Internet Archive – dat behalve websites inmiddels ook boeken, muziek en audiovisueel materiaal verzamelt – dat het zonder toestemming boeken digitaliseerde en de digitale kopieën gratis beschikbaar stelde. Ook al ging het volgens Kahle hoofdzakelijk om relatief oude boeken van halverwege de twintigste eeuw, de Amerikaanse rechter oordeelde dat het Internet Archive geen digitale boeken meer mag uitlenen als er ook exemplaren van te koop zijn. Een nederlaag, maar niet fataal.

Een proces dat de muziekindustrie tegen het Internet Archive aanspande, en dat nog loopt, baart Kahle aanzienlijk meer zorgen. „Platenmaatschappijen eisen 700 miljoen dollar vanwege de 78-toerenplaten die we hebben gedigitaliseerd en online afluisterbaar hebben gemaakt. Als we die zaak verliezen, zijn we weg.”

Met opmerkelijke gelatenheid voegt Kahle daaraan toe: „In de geschiedenis is het met bibliotheken meestal niet goed afgelopen. Vaak zijn ze kapot gemaakt door machtige instituties. Vroeger waren dat de kerk en de staat, nu zijn het regeringen en bedrijven.”

De inzet van Kahle voor zijn missie lijkt er niet onder te lijden. Hij kwam naar Nederland onder meer om met het veel kleinere Internet Archive Europe te praten over mogelijke samenwerking. Voorafgaand aan een lezing in Amsterdam laat hij op een groot touchscreen enthousiast een website zien, die lijkt te bestaan uit een tapijt van duizenden stipjes in allerlei kleuren. Als je met je vingers inzoomt worden de stipjes blokjes, en als je verder en verder inzoomt wordt duidelijk dat het afbeeldingen zijn van allemaal verschillende websites.

„Dit zijn alle 85.000 Nederlandse websites die we in het Internet Archive bijeen hebben gebracht! Is het niet geweldig? Hier zie je in één oogopslag de overweldigende rijkdom en de breedte van wat er in Nederland aan informatie, ideeën en ontwerpen wordt gedeeld. Allemaal aanklikbaar en het overgrote merendeel staat níet achter een betaalmuur. Zou het niet mooi zijn om dit soort schermen overal in bibliotheken neer te zetten, zodat iedereen kan zien wat een enorm aanbod aan informatie ons ter beschikking staat?”

Maar auteursrechtelijke obstakels verhinderen dat. De Zwitserse Nationale Bibliotheek in Bern, die de software ontwikkelde, toont het collage-scherm wel op zijn website en er kan ook op ingezoomd worden. Maar wie op de blokjes wil doorklikken naar de onderliggende websites, stuit op een mededeling dat het copyright toegang belemmert. Alleen in leeszalen van de bibliotheek in Bern kan het scherm gebruikt worden zoals bedoeld: met doorklik-mogelijkheid.

In Nederland onderzoekt de KB nationale bibliotheek, voorheen Koninklijke Bibliotheek (zie inzet), of het mogelijk is zo’n dynamische etalage van Nederlandse websites in het gebouw van de KB in Den Haag op te stellen en aan het publiek te tonen – „om te laten zien hoe belangrijke digitaal archiveren is”, zegt Sophie Ham, conservator digitale collecties.

Het optimisme van Brewster Kahle blijkt ook als hij speekt over de mogelijkheden van kunstmatige intelligentie (AI). „AI helpt ons bij het doorzoeken van data en teksten, het maken van samenvattingen en vertalingen, de optische herkenning van letters – allemaal prachtige instrumenten om onze collecties tot leven te brengen.

„Zo kunnen wij een groter publiek op nieuwe manieren toegang bieden tot boeken in het Latijn, tot samenvattingen van boeken die ze nooit in hun geheel gelezen zouden lezen. Dat kan een volkomen nieuwe golf van creativiteit losmaken.”