Googles blunder toont de ongemakkelijke waarheid achter AI

Googles nieuwe chatbot Gemini verslikt zich in fictieve historische figuren, zoals een vrouwelijke paus en zwarte Viking. Binnen een paar weken is het probleem opgelost, denkt Google. Vergeet het maar. AI is mensenwerk, vol fouten en vooroordelen.


Animatie Roel Venderbosch

Wat een glorieuze inhaalslag had moeten zijn, werd een vernederende druk op de pauzeknop. Gemini, Googles nieuwe AI-techniek, sloeg de plank mis bij het verzinnen van plaatjes van historische figuren.

Gemini kan zulke fictieve beelden genereren, omdat het getraind is op een hoop voorbeelden. Je voert een regel tekst in en er verschijnt een bijpassend plaatje. Maar vraag je naar een Duitse soldaat uit de jaren veertig of een Amerikaanse senator uit de negentiende eeuw, dan rolt er uit Gemini een plaatje van iemand met een donkere huidskleur, of met Aziatische roots.

Klopt niet. Kan niet. Hoort ook niet, aldus wakkere anti-wokers op X. Zij beschuldigen Google ervan door te schieten in zijn streven naar diversiteit. De verontwaardiging kreeg een gezicht: een ‘foto’ van een vrouwelijke paus, verzonnen door Gemini. Dat is geschiedvervalsing, vonden critici. Google was er zelf ook niet blij mee en legde de blunderende beeldengenerator aan banden. Hoe kon het mis gaan?

Google is een pionier op het gebied van de taalmodellen die ten grondslag liggen aan slimme chatbots zoals ChatGPT, van OpenAI. Aanvankelijk was Google voorzichtig met generatieve kunstmatige intelligentie en richtte zich vooral op wetenschappelijke doelen. Eind 2022 kwam OpenAI langszij met ChatGPT. Door veel rekenkracht los te laten op massale hoeveelheden data werd de technologie rijp voor algemenere toepassingen. Zo maakte het grote publiek kennis met generatieve AI en barstte de hype los: heel Silicon Valley aast op snelle AI-chips, trainingsdata en slimmere taalmodellen.

Als nieuwkomer kon OpenAI zich de reputatieschade permitteren van een chatbot die af en toe raaskalt. Door snel verbeterde versies te introduceren steeg het vertrouwen in ChatGPT. Vorige week demonstreerde OpenAI zijn laatste hoogstandje: Sora. Dat AI-model maakt filmpjes gebaseerd op een regeltje tekst. Zo verandert de opdracht ‘twee piratenschepen in een kopje koffie’ in een realistische video.

Google kon niet achterblijven en voerde zijn eigen chatbot, Gemini, op. Het is een ‘multimodaal’ model dat beeld, tekst en video door elkaar gebruikt. Gemini kan overweg met lange, ingewikkelde vragen, die worden gemeten in ‘tokens’, stukjes tekst. De betaalde variant van Gemini kan een miljoen tokens aan, meer dan OpenAI. Je kunt een hele film uploaden, en Gemini ‘begrijpt’ vervolgens de inhoud van de scènes. Heel indrukwekkend. Maar toen verscheen de vrouwelijke paus.

Mensenwerk

De Gemini-fout bewijst dat AI niet zo kunstmatig en niet zo intelligent is als je zou denken. Het is mensenwerk, verpakt in code. Ten eerste baseren de taalmodellen zich op door mensen gecreëerde data die ze van internet halen – die zitten dus bomvol vooroordelen. Vervolgens corrigeren mensen de algoritmes: om te voorkomen dat generatieve AI-modellen beledigende, racistische of expliciete afbeeldingen verzinnen, worden ze binnen de vangrails gehouden met ‘metaprompts’. Dat zijn opdrachten die je als gebruiker niet ziet, maar wel merkt: het model weigert dan dienst. Blijkbaar had Google Gemini opgedragen om altijd gezichten uit alle windstreken te tonen en niet louter witte mensen af te beelden.

Ten slotte worden de uitkomsten door mensen geïnterpreteerd. Het zijn vooral beeldgeneratoren die tot hevige reacties leiden. Verzonnen pixels maken meer indruk dan verzonnen woorden, zeker als er fotorealistische personen worden afgebeeld. Over een verkeerd woord lees je makkelijk heen, een fout beeld etst zich in je geheugen, doet pijn aan je ogen.

Afstelbeurt

Google had te veel haast om de Gemini-instellingen goed te testen, terwijl het had kunnen leren van andere beeldgeneratoren die met dezelfde dilemma’s worstelen. Dall-E (van OpenAI) wordt verweten dat het ‘te woke’ is, en Midjourney laat zich misbruiken om racistische afbeeldingen te genereren. Of denk aan de nep-porno van zangeres Taylor Swift, gefabriekt met een beeldgenerator van Microsoft.

Gemini is nu terug naar de garage voor een afstelbeurt – de woke-knop wordt weer teruggeschroefd. Dat duurt een paar weken, is de inschatting van Googles AI-baas Demis Hassabis. Hij legde tijdens een congres in Barcelona uit dat het lastig is om een universeel mensbeeld te creëren waarin iedereen zich herkent en dat niemand tegen het zere been schopt. De subtekst: het wachten is op de volgende fout.

Amerikaanse media smullen van deze ‘cultuuroorlog’ over de door AI versterkte of onderdrukte stereotypes. Het is een probleem van de hele AI-industrie, zei Hassabis. Klopt. Maar de lat ligt voor Google hoger dan bij AI-startups. Google is al 25 jaar de belangrijkste vraagbaak ter wereld, met de missie ‘alle informatie van de wereld te organiseren’. Gebruikers verwachten van Gemini een enigszins accuraat beeld van de werkelijkheid. Een verzinmachine en zoekmachine tegelijk.

Googles traditionele zoekmachine krijgt het moeilijk. Door concurrentie van ChatGPT, maar ook omdat het web wordt overspoeld met door AI gegeneerde inhoud. Om niet te verdrinken in de AI-onzin steunt Google sites als Wikipedia en Reddit, waar echte mensen waardevolle inhoud genereren. Zonder nieuwe toevoegingen op het web ontstaat een vicieuze cirkel van door AI gecreëerde data, die als basis dient voor volgende AI-modellen. De geschiedenis vervalst zich dan vanzelf.

AI of Kamerlid

Zoals AI getraind wordt op menselijke data, zo moeten mensen getraind worden op AI in het dagelijks leven. Dat maakt de ‘AI of Kamerlid’-quiz van Arjen Lubachs Avondshow zo leerzaam. Het publiek gokt of een plaatje een echt nieuw Tweede Kamerlid is of een verzonnen figuur. Hoe simpel het spelletje ook oogt, het toont aan dat je pixels niet kunt vertrouwen – van de nieuwe Kamerleden moeten we dat nog zien.

En mocht je nog twijfelen aan de capaciteit van de beeldgeneratoren, bekijk dan de laatste demo van de Chinese techreus Alibaba. Dat AI-model tovert één foto om in een geloofwaardige film: Mona Lisa vertolkt Shakespeare, Leonardo diCaprio rapt als Eminem en Audrey Hepburn covert Ed Sheeran. Het is nu nog een onschuldige playback-act, maar zo’n deepfake-deluxe smeekt erom te worden misbruikt, voor politieke of criminele doeleinden.

Dan nog even over die vrouwelijke paus. Toch maar even gegoogeld: volgens de legende was er in de negende eeuw een pausin Johanna. Niemand had door dat de paus een vrouw was, totdat Johanna zwanger werd en tijdens een processie beviel. Of het echt gebeurd is, weet niemand.