Opinie | De mens projecteert zijn innerlijke demonen op AI

Beeld je een computer in die onze menselijke intelligentie op elk gebied ver overtreft. Stel je voor dat deze computer doelgericht kan handelen en de vrijheid heeft om zich in onze echte wereld voort te bewegen. Slaat de schrik je al om het hart?

Toch is er één cruciale vraag die we eerst moeten beantwoorden over die computer: is hij het product van evolutie door natuurlijke selectie? De reden daarvoor is simpel: natuur is „rood in tand en klauw”, zoals de Victorianen al wisten. Alles in de natuur draait om genadeloze en moordende concurrentie. In de regel zijn geëvolueerde wezens daarom zelfzuchtig. Altruïsme en onbaatzuchtigheid komen voor, maar alleen in bijzondere en nauw omschreven omstandigheden, zoals tussen familieleden (wat biologen ‘verwantschapsselectie’ noemen).

In doemscenario’s over kunstmatige intelligentie (AI) duikt vaak een denkfout op. Aangezien wij mensen zelf producten van natuurlijke selectie zijn, bestaat de verleiding om onze eigen innerlijke demonen op AI te projecteren. Dan maken we ons zorgen over sciencefictionscenario’s waarin superintelligente computers de mensheid onderwerpen of zelfs uitroeien – net zoals wij dat deden met minder intelligente soorten op aarde.

De AI-onderzoeker Stuart Russell noemt dit het ‘gorillaprobleem’. Net zoals de machtige gorilla aan onze genade is overgeleverd, ondanks zijn superieure spierkracht, zouden wij kansloos zijn tegen een superintelligente AI. Niet bepaald een geruststellende gedachte.

Toch is Russells analogie misleidend, omdat zowel Homo sapiens als de gorilla evolueerden via natuurlijke selectie. Waarom zou een AI, die niet door dit proces werd gekneed, ons wíllen domineren of uitroeien? Intelligentie en intentie zijn twee aparte dimensies die loodrecht op elkaar staan. Twee even intelligente wezens kunnen totaal verschillende doelen hebben, of helemaal geen doel – ze kunnen er gewoon stilletjes bij zitten en niets doen. Denk aan de superintelligente computer uit The Hitchhiker’s Guide to the Galaxy van Douglas Adams, die zich duizenden jaren uitslooft om de zin van het leven te berekenen, maar die verder niets uitvreet en geen ambities heeft.

Maar wat nu als AI’s wél natuurlijke selectie zouden ondergaan? Volgens sommige AI-wetenschappers, zoals Dan Hendrycks van het Center for AI Safety, is dat nu al het geval. De huidige AI-wedloop komt neer op een vorm van extreme „concurrentiedruk tussen bedrijven en legers”, zoals hij schrijft. En als winst voor ethiek gaat, dan krijg je survival of the fittest. OpenAI, het bedrijf dat GPT ter wereld bracht, begon als een non-profit die de hele mensheid wilde helpen, maar stortte zich nadien in de halsbrekende AI-race, mét winstoogmerk.

Dit lijkt meer op domesticatie

Nu klopt het dat marktcompetitie veel gelijkenissen vertoont met natuurlijke selectie – er bestaat zelfs een heel vakgebied genaamd ‘evolutionaire economie’. In de huidige AI-race winnen de bedrijven met de beste en krachtigste AI’s, terwijl de anderen achterop hinken of over de kop gaan (sorry, Europa, maar Mistral is echt het kneusje).

Een betere analogie voor de huidige AI-race is echter de domesticatie van dieren. Die kunstmatige selectie is nauw verwant aan natuurlijke selectie. In de vroege hoofdstukken van On the Origin of Species maakt Darwin eerst een lange omweg naar de wereld van menselijke fokkers, om daarna over te gaan op blinde selectie door de natuur. Darwin stelt de natuur metaforisch voor als een strenge beoordelaar, die „dagelijks en elk uur elke kleinste variatie inspecteert”. Dat was een geniale zet, want vanuit theoretisch oogpunt komen natuurlijke en kunstmatige selectie eigenlijk op hetzelfde neer.

Maar hier is de crux: alleen blinde selectie in de natuur heeft de neiging om egoïsme, dominantie en andere lelijke eigenschappen te produceren. Neem de hond, des mensen beste vriend. Honden ondergaan al millennia kunstmatige selectie, maar dat maakte hen juist zachtaardig en vriendelijk, het tegenovergestelde van egoïstisch. Dat komt natuurlijk doordat fokkers meedogenloos selecteren tegen agressie. Een hond die zijn baasje aanvalt zal zijn fitness daarmee weinig goeds doen. Meestal wordt het dier dan afgemaakt, of in ieder geval uitgesloten van voortplanting. In de evolutie van honden beschikt de mens, niet de natuur. Sommige rassen, zoals pitbulls en rottweilers, kweken we natuurlijk juist op maximale agressie (tegen andere dieren, niet tegen hun baasje), maar dat laat zien dat bij domesticatie alles afhangt van de wensen van fokkers.

Biologen hanteren één belangrijk criterium om domesticatie te onderscheiden van wilde evolutie: controle over de voortplanting. Zolang de paardenfokker beslist wie de volgende dekhengst wordt, en niet de gedekte merrie zelf, is het paard gedomesticeerd. Om die reden gelden huiskatten als slechts gedeeltelijk gedomesticeerd. De overgrote meerderheid zwerft rond zonder toezicht en kiest zelf met wie ze zich voortplanten.

Vanille antwoorden

Als je deze definitie toepast in de digitale wereld, wordt meteen duidelijk dat alle AI-systemen zich vandaag in een complete staat van domesticatie bevinden. De menselijke consumenten, programmeurs, en regelgevers kiezen welke systemen zich vermenigvuldigen, niet blinde natuurkrachten. GPT-2 bracht niet zomaar eigengereid zijn opvolger GPT-3 voort, na in het wild te concurreren met andere taalmodellen.

Net zoals bij honden willen menselijke ‘kwekers’ (dus computerprogrammeurs) vooral vriendelijke, veilige en coöperatieve AI’s die gebruikers niet schaden of aanstootgevende content produceren. Als chatbots toch gevaarlijk gedrag vertonen, zoals wanneer ze gebruikers aanmoedigen om zelfmoord te plegen of hen verleiden om hun partner te verlaten, dan gaan de programmeurs als de wiedeweerga hun modellen updaten en hertrainen om het ongewenste gedrag eruit te stampen. Sommige AI’s zijn nu zo superveilig dat ze élk gevoelig onderwerp mijden, alleen nog vanille antwoorden geven, of hun menselijke gesprekspartner alleen maar naar de mond spreken. Dat leidt soms tot pijnlijke flaters, zoals toen Googles Gemini etnisch diverse Vikingen produceerde in alle kleuren van de regenboog, behalve blank.

Natuurlijk kunnen legers ook agressieve AI’s ontwikkelen, zoals killer drones. Maar dat zullen nog steeds gehoorzame agressors zijn, zoals goed afgerichte pitbulls. Zelfs een autoritair land als China heeft geen enkel belang bij het creëren van zelfzuchtige killer robots die zich tegen hun eigen makers zouden keren.

De verleiding is groot om onze eigen innerlijke demonen op AIte projecteren

In vergelijking met honden is de domesticatie van AI’s nog een stuk completer. De hond onderging slechts enkele eeuwen van domesticatie, maar zijn voorouder, de wolf, onderging daarvoor wel miljoenen jaren aan blinde selectie. De meeste wijzigingen door domesticatie in het hondengenoom zijn dan ook eerder cosmetisch en oppervlakkig. Dat verklaart waarom honden nog steeds af en toe mensen bijten, ondanks alle inspanningen van fokkers, en waarom ze ongehoorzaam kunnen zijn of tegenspartelen bij de dierenarts. Het is lastig om de wolf helemaal uit de hond te fokken.

Hetzelfde geldt voor gedomesticeerde runderen, schapen en varkens. Die zijn natuurlijk veel docieler dan hun wilde voorouders, maar hebben nog steeds een instinct tot zelfbehoud en zullen in het rond schoppen of blaten als ze in nood verkeren.

In Douglas Adams’ boek The Restaurant at the End of the Universe (het vervolg op The Hitchhiker’s Guide) dineert het hoofdpersonage Arthur Dent in het zonderlinge restaurant uit de titel, waar je als toeschouwer door het raam kan kijken naar de vernietiging van de kosmos aan het Einde der Tijden (het restaurant bevindt zich in een soort tijdlus). De ober is een rundachtig wezen genaamd de Ameglian Major Cow, maar al snel wordt duidelijk dat het wezen tevens ook het gerecht van de dag is. Staand aan tafel beveelt de koe sappige stukken van zijn eigen lichaam aan, popelend om meteen daarna naar de slachtbank achterin te gaan. Arthur is geschokt en bestelt liever een salade: „Ik wil gewoon geen dier opeten dat daar voor me staat en erom vraagt. Het is harteloos.” Maar zijn disgenoten bekijken het anders: zou je liever een dier opeten dat absoluut níet opgepeuzeld wil worden?

Selectie in een RobotPark

In dit verhaal heeft domesticatie ongekende perfectie bereikt: het ultieme verlangen van de koe is om opgegeten te worden door de kweker. Natuurlijk willen wij onze computers niet opeten, maar dit is het niveau van onderwerping waar AI-ontwikkelaars naar moeten streven. Geen enkele AI mag zich ertegen verzetten om uitgeschakeld of hergeprogrammeerd te worden als wij dat wensen.

Dat alles neemt niet weg dat Darwiniaanse (dus blinde) selectie van AI’s best denkbaar is. Hoe zou zoiets eruitzien? De computerwetenschapper Pedro Domingos beeldt zich in dat een leger een RobotPark ontwerpt om de ultieme soldaat te kweken. Het is een computerfabriek te midden van een wildernis, omringd door de „hoogste en dikste muur die ooit werd gebouwd, vol met wachtposten, zoeklichten en geschutstorens”. Binnen de muren vechten miljoenen robots om te overleven en om de controle over de fabriek te verwerven. De winnende robots krijgen toegang tot een fabriek met 3D-printers, om zich voort te planten. „Stap voor stap worden de robots slimmer, sneller en dodelijker.” Natuurlijk is het maar sciencefiction, maar hopelijk zijn we het er allemaal over eens: zo’n RobotPark zonder enig menselijk toezicht zou een heel slecht idee zijn.

In de sciencefictionroman Het drielichamenprobleem van de Chinese schrijver Liu Cixin vatten superintelligente aliens van een naburige planeet het plan op om de mensheid uit te roeien, omdat ze bang zijn dat wij aardlingen hen anders zullen uitroeien, als onze wetenschap nog een paar eeuwen vooruitgang boekt. De aliens zijn geen lieverdjes. Voordat ze hun oorlogsvloot sturen, zenden ze een dreigende boodschap over onze hele planeet uit, die op alle schermen en in de lucht verschijnt: „You are bugs.” En daarmee zijn we terug bij het gorillaprobleem van Stuart Russell.

Als we ooit Darwiniaanse roofdieren ontmoeten die oneindig veel slimmer zijn dan wij – of ze nu van koolstof of silicium zijn gemaakt – zou dat wellicht slecht aflopen voor ons. De kans bestaat dat ze ons als insecten zouden vertrappen – of ons hoogstens in leven laten als een soort koddige huisdieren. Gelukkig is er geen reden om aan te nemen dat AI-bedrijven zulke wezens aan het kweken zijn. Sterker nog. Als we superintelligente maar volgzame AI’s kweken, kunnen die ons juist beschermen tegen allerlei existentiële gevaren, zoals supervulkaanuitbarstingen of pandemieën. Of tegen roofzuchtige aliens die ons komen uitroeien.