Welke besluiten namen de Staten-Generaal in de Gouden Eeuw? Iedereen kan dat nu online opzoeken

Het kostte 2,5 miljoen euro en vijf jaar werk door een team van vijftig professionals en meer dan vijfhonderd vrijwilligers, maar deze maandag is het zo ver: de database goetgevonden.nl staat online. Vanaf nu kan iedereen de 680.000 resoluties (besluiten) doorzoeken die de Staten-Generaal genomen hebben tussen 1576 en 1796 – de periode dus van de opstand tegen Spanje, de daaropvolgende Gouden Eeuw en de uiteindelijke teloorgang van de Republiek der Zeven Verenigde Nederlanden na de inval door de legers van de Franse Revolutie.

„De razendsnelle ontwikkeling van de techniek heeft het ons mogelijk gemaakt dingen te doen die vijf jaar geleden, toen we aan dit avontuur begonnen, nog ondenkbaar waren”, zegt projectleider Joris Oddens van het Huygens Instituut voor Nederlandse Geschiedenis en Cultuur. „Met het beschikbaar maken van deze database loopt Nederland voorop in de wereld.”

De Staten-Generaal vormden in de tijd van de Republiek het hoogste bestuurscollege van wat de Generaliteit werd genoemd, het centrale bestuursniveau. De afzonderlijke provincies stuurden afgevaardigden naar Den Haag om daar de beslissingen te nemen die het hele land aangingen. Oddens: „De ambitie om alle resoluties van de Staten-Generaal te ontsluiten, bestond al aan het begin van de vorige eeuw, maar pas toen we in 2019 een beurs kregen van onderzoeksfinancier NWO, konden we echt aan de slag.”

De naam van de database is ontleend aan de frase ‘is goetgevonden ende verstaen’, die dagelijks uit de pen vloeide van de griffier van de Staten-Generaal als hij een besluit van de vergadering noteerde. Al deze resoluties zijn ingebonden in ruim zeshonderd dikke boeken die zijn opgeslagen in het magazijn van het Nationaal Archief in Den Haag. De eerste stap van het project was het scannen van alle pagina’s uit deze banden. „Dat waren er ongeveer een miljoen”, zegt Oddens. „Hierna begon het moeilijke werk.”

2 procent leesfouten

Zijn team had te maken met twee soorten resoluties, zegt Oddens. „De besluiten uit de achttiende eeuw waren gedrukt, maar die uit de zeventiende eeuw noteerde de griffier met de hand. Van die handgeschreven resoluties dachten we in het begin dat de computer ze zou kunnen lezen met een foutmarge van 20 procent. Dan heb je er dus eigenlijk niets aan. Maar uiteindelijk zitten we nu onder de 2 procent leesfouten bij deze resoluties, en voor de gedrukte besluiten zelfs op minder dan 1 procent.”

Dat succes is mede te danken aan het werk van de vrijwilligers, zegt Oddens. „Zij hebben de eerste transcripties die de computer had gemaakt met de hand gecorrigeerd. Daar leerde het programma van, waardoor het zijn werk beter kon doen.”

Na het lezen en transcriberen was er een enorme brei letters beschikbaar. Oddens: „Als je die wilt kunnen gebruiken, zul je de tekst moeten opsplitsen in de delen waarin je geïnteresseerd bent: de afzonderlijke resoluties. Dat hebben we gedaan door samen met vrijwilligers te zoeken naar zinnen die kenmerkend waren voor het begin van zo’n genoteerd besluit. Hiermee hebben we algoritmes getraind en zo zijn we erin geslaagd zo’n 680.000 verschillende resoluties te onderscheiden.”

Hierna kon het materiaal worden verrijkt, zegt Oddens. „In de transcripties van de resoluties hebben we allerlei tekstelementen herkend. Dat deden we met een techniek die al werkte bij moderne teksten, maar nog niet bij historisch materiaal.”

Ook op dit vlak zijn de ontwikkelingen heel snel gegaan, aldus Oddens. Er is nu een large language model – een door AI gedreven programma zoals het bekende ChatGPT – dat kan werken met historisch Nederlands. „We hebben de vrijwilligers gevraagd om in een klein deel van het materiaal namen van plaatsen, personen en organisaties te taggen. Vervolgens ging het programma aan de slag om diezelfde woorden in het hele corpus te vinden. Dat is nog nergens ter wereld op deze manier gedaan.”

Twee pagina’s uit het archief die met de tekstherkenningssoftware van het Huygens Instituut zijn onderverdeeld in afzonderlijke resoluties.

Gegenereerd beeld, Huygens Instituut/Stefan Klut (Laypa/Loghi)

Kunstmatige intelligentie

Het grote probleem hierbij was dat er gedurende de ruim twee eeuwen waarin de besluiten zijn genomen, geen consistente, algemene spelling bestond, zegt Oddens. „Er waren soms tientallen manieren om een plaatsnaam te schrijven. Maar als onderzoeker wil je natuurlijk alle verwijzingen naar ‘Amsterdam’ vinden als je dat woord op het zoekscherm intypt. Normaliter gebeurt het aan elkaar koppelen van al die spellingswijzen handmatig, maar wij zijn erin geslaagd dat automatisch te doen.”

Uit deze combinatie van het handwerk van vrijwilligers en de modernste kunstmatige intelligentie is nu dus een enorme database ontstaan die via het internet voor iedereen toegankelijk is. Oddens: „Voor historici die geïnteresseerd zijn in langetermijnontwikkelingen is het nu mogelijk om onderzoek te doen dat vroeger ondenkbaar was, omdat je moeilijk al die banden bladzijde voor bladzijde kon lezen.”

Maar ook voor andere geïnteresseerde gebruikers is goetgevonden.nl wellicht een schatkamer, vindt Oddens. „Denk aan mensen die onderzoek doen naar de geschiedenis van hun familie of woonplaats. Die kunnen nu met één druk op de knop zien of daarover in de Staten-Generaal iets is gezegd.”