Vis? Koffie? Dennengeur? Kunstmatige intelligentie voorspelt welke geur een molecuul heeft

Neurowetenschap Moleculen die op elkaar lijken kunnen toch totaal verschillend ruiken. Kunstmatige intelligentie helpt om een geur te voorspellen.

Foto’s Getty Images

Kleuren zijn uit te drukken in de golflengte van het licht, toonhoogte is te omschrijven in frequentie. Maar hoe beschrijf je de fysieke eigenschappen van een geur? Onderzoekers van Google en geuronderzoeksinstituut Monell Chemical Senses Centre in de Verenigde Staten hebben een kaart ontwikkeld waarop de molecuulstructuur van een geurstof in relatie te zien is tot de perceptie van de geur. Ze presenteerden hun model vrijdag in het wetenschappelijke tijdschriftScience. Met de kaart zijn gelijkenissen tussen geuren te voorspellen en nieuwe geuren in kaart te brengen.

Geur vangen in een kaart is niet eenvoudig. Waar toonhoogte zeer gelijkmatig stijgt, is de relatie tussen de chemische structuurformule van een stof en perceptie van de geur grillig. Molecuulstructuren die op elkaar lijken, ruiken dikwijls totaal verschillend. Dat maakt veelgebruikte representaties van moleculen, die enkel nadruk leggen op gelijkenissen in de structuren, ontoereikend om geur in uit te drukken.

Neuraal netwerk

Om tot een nuttige weergave te komen hebben de onderzoekers een zogenoemd ‘message passing neural network’ gebruikt, een specifieke variant van een grafisch neuraal netwerk, een vorm van kunstmatige intelligentie. Hierbij krijgt elk molecuul zo veel mogelijk informatie mee, onder meer over het maximaal aantal bindingen dat het kan aangaan, de formele lading, in welke hoek bindingen staan en de aromaticiteit – dat zegt iets over de stabiliteit van aromatische verbindingen.

De crux van dit neurale netwerk is dat het nadruk legt op de geurspecifieke onderdelen, in plaats van een gelijk gewicht toe te kennen aan alle informatie over de structuur zoals eerder gebruikte vingerafdrukmethodes doen. Het model is getraind met 5.000 geuren, afkomstig uit bestaande geurdatabases waarin al labels aan de geuren zijn gehangen (zoals grassig, romig, etc).

In de 2D-kaart die uit het model rolt zijn relatieve afstanden van verschillende geuren tot elkaar te zien (twee moleculen die naar jasmijn ruiken liggen dichter bij elkaar dan een molecuul dat naar vlees ruikt), en is hiërarchie te onderscheiden (jasmijngeur en lavendel zijn subtypes van de bloemenfamilie).

Individuele geurervaring

Maar zijn met het model ook de geureigenschappen van nieuwe geuren te voorspellen? Daarvoor heeft het model het opgenomen tegen menselijke ‘neuzen’. Panels van getrainde mensen zijn de standaard voor geurcategorisering en hoewel elke individuele geurervaring verschilt, zijn groepsgemiddelden stabiel. Een betrouwbare instrumentele methode voor het meten van geurperceptie is er niet – daar moet deze kaart juist uitkomst in bieden.

Zowel het model als de menselijke neuzen moesten 400 dingen ruiken, en de stoffen omschrijven in een geurlexicon van 55 woorden. Met die 55 woorden kon breed en specifiek omschreven worden, zowel ‘fruitig’ als ‘appel’ zit erin, net als ‘aards’, ‘vanille’ en ‘medicinaal’.

Het model werkt vooral goed bij geuren als ‘knoflook’ en ‘vis’

Het model zat in 53 procent van de gevallen dichter bij het gemiddelde van de menselijke neuzen dan de mediaan van de individuele neuzen. Een ouder model, gebaseerd op de vingerafdrukmethode, kwam niet verder dan 41 procent. Het nieuwe model bleek vooral goed in het voorspellen van geuren waarvoor duidelijke aanwijzingen in de molecuulstructuur zitten (zwavelhoudend voor knoflook, aminen voor vis).

Het slechtst presteerde het voor het label ‘muskus’, dat ten minste vijf verschillende klassen van molecuulstructuren bevat, al wordt het model daar beter in na meer training met complexe structuren.

Er zijn meer verbeteringen mogelijk: geurervaringen in de echte wereld komen doorgaans voort uit meer dan één soort moleculen tegelijk. Daarom willen de onderzoekers hun model in de toekomst graag uitbreiden naar mengsels.

Er is genoeg werk voorhanden voor een model als dit. De onderzoekers stelden een lijst samen van 500.000 mogelijke geurstoffen die nog nooit zijn gesynthetiseerd en waarvan het model eenvoudig een geurindruk kan geven. Een mens zou voor 500.000 stoffen 70 jaar ruiken nodig hebben.