18,5 procent Abba en 24 procent Lizzo: zo vind je de geheime formule van AI-apps

U wilt een AI-model ontwikkelen met behulp van miljoenen boeken, zonder de auteurs eerst om toestemming te vragen. Mag dat? Ja, oordeelden twee Amerikaanse rechters afgelopen week. Ze behandelden klachten van schrijvers die erachter kwamen dat AI-bedrijven hun modellen – de techniek achter bijvoorbeeld ChatGPT – ongevraagd had ‘getraind’ op hun werk. Zulke modellen halen patronen uit grote dataverzamelingen en genereren daarmee tekst als je ze erom vraagt. Of plaatjes, of muziek, of video: alles wat in digitale vorm beschikbaar is.

De eerste zaak was een klacht van drie Amerikaanse schrijvers tegen Anthropic. Dit AI-bedrijf downloadde miljoenen illegale kopieën van digitale boeken om te trainen. Dat mag niet.

Maar Anthropic bedacht zich en kocht ook een paar miljoen papieren boeken bij de ramsj, sneed de kaften eraf, voedde de losse pagina’s aan een scanner en maakte er pdf’jes om het AI-model te trainen. Dat mag wel.

De rechter maakt geen onderscheid meer tussen kunstmatige en menselijke intelligentie

Een paar dagen later stelde een andere rechter Meta in het gelijk. Dat bedrijf was door twee auteurs aangeklaagd omdat hun werk gebruikt was om AI-model ‘Llama’ te trainen. Geen probleem, vond de rechter, dat is fair use. Meta wacht wel een andere rechtszaak, omdat het Llama ook op illegale boeken liet kauwen, waaronder die van ondergetekende. Foei.

De rechter in de Anthropic-zaak beschouwt een AI-model als ‘een persoon die iets wil leren en met die kennis iets nieuws creëert’. Opmerkelijk, reageerde hoogleraar rechtsgeleerdheid Christina Frohock in The Wall Street Journal: „Deze uitspraak stelt het trainen van AI gelijk aan de manier waarop jij en ik een boek lezen om onze eigen denkbeelden te ontwikkelen.” Frohock vindt de zaak „fascinerend en verontrustend”, schrijft ze later via de mail. „De rechter maakt geen onderscheid meer tussen kunstmatige en menselijke intelligentie.”

Tegenwind tegen in Washington

Deze rechtszaken vormen de eerste jurisprudentie over de AI-revolutie die de hele creatieve sector raakt: schrijvers, journalisten, muzikanten, filmmakers en illustratoren, alles wat ademt. Maar daarmee is de kous niet af. De rechters beoordeelden alleen de input – de trainingsdata – en keken nog niet naar de output – of het AI-model auteursrechten schendt bij het genereren van antwoorden. Bijvoorbeeld door hele artikelen of boekfragmenten te citeren, of originele muzikale of grafische stijlen te reproduceren.

Die output-discussie levert nog een hele stapel nieuwe rechtszaken op. Media- en entertainmentbedrijven hebben echter de wind tegen in de VS, waar de meeste AI-ontwikkeling plaatsvindt. Trump omarmt de werkwijze van Silicon Valley – beter achteraf om vergiffenis vragen dan vooraf om toestemming – en schrapt AI-regulering. Toen het Amerikaanse Copyright Office onlangs in een kritisch rapport waarschuwde dat fair use niet altijd opgaat, ontsloeg Trump prompt de twee verantwoordelijke personen.

Nu het Copyright Office monddood is, heeft dat gevolgen voor alle makers, waarschuwt Marc Huiskamp, expert in muziekrechten. „De Europese wet voor AI-gebruik is strenger dan die in Amerika, maar die regels gelden alleen in de EU. In de VS vallen Europese teksten, liedjes en afbeeldingen ook onder fair use.”

Met andere woorden: vogelvrij.

Shitparade

De muzieksector worstelt met de onuitputtelijke output van apps als Suno en Udio, die AI-liedjes creëren met hulp van bestaand materiaal. Zulke apps produceren pareltjes als ‘Die Deutsche KI Shitparade’, pornopraat op schlagers uit de sixties. Geen artiest die zoiets over de lippen krijgt, maar AI draait er de hand niet voor om.

Muzikanten krijgen geen vergoeding voor de liedjes waarop AI-apps trainen én ze moeten de inkomsten uit streamingsdiensten delen met tienduizenden concurrerende AI-liedjes die Spotify en Deezer maandelijks overspoelen. In 2028 scheelt dit rechthebbenden 4 miljard dollar aan inkomsten per jaar, volgens een onderzoek van muziekrechtenorganisatie CISAC.

Het kan nog erger. Mureka.AI is een AI-app die je met specifieke voorbeelden kunt voeden – een YouTube-linkje volstaat – om een ‘nieuw’ liedje te genereren. Bij de referentietracks staat werk van Taylor Swift, Prince en Jimmy Buffett. Veel duidelijker kun je het auteursrecht niet overtreden. Mureka.AI vraagt intussen doodleuk 30 dollar per maand (goed voor 1.600 liedjes).

AI-apps laten zich niet terug in hun hok duwen, dus kun je er maar beter geld aan verdienen. Tussen de rechtszaken door proberen de grote platenmaatschappijen licentiedeals te sluiten met AI-bedrijven. Maar hoe doe je dat?

Adèle

In een klein kantoortje bij de Universiteit van Amsterdam denken ze de oplossing gevonden te hebben. Start-up Copyright Delta bouwt bij de UvA een netwerk dat auteursrechtenorganisaties, platenlabels en muziekuitgevers verbindt met muziekdiensten, gaming platforms en AI-apps.

Het werkt net zo ingewikkeld als het klinkt, maar muziekrechten zijn nu eenmaal ingewikkeld. Het komt erop neer dat Copyright Delta geclearde data aanbiedt aan AI-modellen die zich aan copyrightregels willen houden en inzicht geven in hun werkwijze. De artiesten hebben daarvoor toestemming (gecleard) gegeven, maar kunnen die ook intrekken.

Omdat Copyright Delta precies weet wat er in het AI-model gestopt wordt, kan het beoordelen wat er uit komt. Zeker als het nieuwste snufje af is: dan kun je precies achterhalen hoe een nieuw AI-liedje is opgebouwd, bijvoorbeeld met 18,5 procent ABBA, 24 procent Lizzo, de rest Adèle en Slayer.

Een ander algoritme analyseert het recept van de teksten (vleugje Queen, beetje van jezelf, nog wat Bon Jovi). Dan vloeit achter de schermen het geld terug naar de componisten en tekstdichters, ieder zijn of haar rechtmatig deel.

Het netwerk draait op een afgeschermde blockchain uit de bankensector, die de wijzigingen bijhoudt. „We zijn een soort Adyen voor intellectueel eigendom”, zegt oprichter Daan Archer, verwijzend naar het Nederlandse betalingsbedrijf.

Copyright Delta beschikt nu over de gegevens van tien miljoen liedjes, die beheerd worden door meerdere rechthebbenden en hun vertegenwoordigers in onder meer de VS, het VK en Europa. Dat zijn lang niet alle liedjes ter wereld, maar de AI-bedrijven hebben per muziekgenre genoeg aan tienduizend nummers, hooguit een half miljoen.

Archer ziet een nieuwe economie van micropayments gloren, minuscule betalingen tussen AI-partijen. De muziekindustrie is weer de ‘kanarie in de kolenmijn’: een sector die erg gevoelig is voor veranderende technologie, maar vaak als eerste nieuwe verdienmodellen ontwikkelt. Ook mediabedrijven overwegen micropayments in te zetten om AI-bedrijven te laten betalen voor wat ze bij elkaar schrapen, als alternatief voor allesomvattende licenties.

Er is één maar: AI-bedrijven moeten bereid zijn hun lerende machines te ‘ontleren’ en opnieuw te trainen met eerlijk geoogste data. Technisch is het mogelijk: geen mysterieuze blackbox meer, maar verantwoorde kunstmatige intelligentie waarop je kunt rekenen, en waarbij je ook kunt afrekenen.

Dat is pas fair use.