AI verslaat radiologen bij diagnose prostaatkanker

Een kunstmatige intelligent algoritme herkent prostaatkanker vaker dan radiologen op een MRI-beeld en slaat veel minder vaak vals alarm. Dat blijkt uit een eerste grote internationale studie naar de prestaties van kunstmatige intelligentie (AI) vergeleken met die van radiologen en met het beloop van patiënten in de jaren na de scans. De studie onder leiding van wetenschappers van het Radboudumc in Nijmegen verscheen dinsdag in het wetenschappelijk tijdschrift The Lancet Oncology

Bij mannen met een verhoogd risico op prostaatkanker maken artsen sinds 2020 standaard een MRI-scan van de prostaat. Daarop is te zien of er een kwaadaardige tumor is en hoe groot die is. Op basis van de uitslag bepaalt een arts of er een biopt moet worden genomen. De MRI-beelden goed interpreteren is lastig en vereist veel expertise van radiologen, en er is een tekort aan ervaren radiologen. Kunstmatige intelligentie zou daarbij een grote hulp kunnen zijn. Daarom werken wetenschappers al jaren aan zulke algoritmes.


Lees ook

De software die slimmer is dan de dokter

De software die slimmer is dan de dokter

Wedstrijd

Een groot probleem bij het ontwikkelen van AI-algoritmen is de zogeheten validatie. Een algoritme dat in een bepaalde groep mensen een bepaald kankertype kan herkennen, moet dat ook kunnen doen bij een andere groep – uit een ander land, of een ander ziekenhuis. In de nieuwe studie wierpen de onderzoekers het net daarom breder uit. Radioloog Maarten den Rooij van het Radboudumc en Henkjan Huisman, hoogleraar Medisch beeldvorming AI in het Norwegian University of Science and Technology, schreven met een internationaal team een wedstijd uit tussen AI-ontwikkelaars en radiologen. Wereldwijd konden AI-ontwikkelaars een algoritme bouwen en trainen op basis van 1500 MRI-scans van de prostaat van patiënten die de onderzoekers beschikbaar hadden gesteld. Er zijn vijf gradaties van prostaatkanker, zogeheten Gleason grades. De algoritmes moesten prostaatkanker van gradatie twee of hoger herkennen.

Uit bijna driehonderd inzendingen kozen de onderzoekers de vijf best presterende algoritmes, en creeërden daarmee een ultiem algoritme. Dat trainden ze opnieuw, met meer dan 10.000 MRI-scans van ruim 9000 patiënten, van drie Nederlandse ziekenhuizen met in totaal elf locaties. Voor het testen waren er duizend scans van andere patiënten van die locaties én van het universiteitsziekenhuis in Trondheim, Noorwegen. Bij de diagnoses werd ook meegenomen hoe het de patiënten later verging, zij werden minimaal drie jaar.

Verdachte plek

Parallel aan deze exercitie beoordeelden 62 radiologen van 45 ziekenhuizen in twintig landen online vierhonderd MRI-beelden uit dezelfde collectie. Zij hadden gemiddeld zeven jaar ervaring in het beoordelen van zulke MRI-beelden.

Het algoritme spoorde 7 procent meer patiënten met prostaatkanker op dan de radiologen, en stelde 50 procent minder vaak een fout-positieve diagnose, waarbij een verdachte plek na bestudering van een biopt toch geen kanker blijkt te zijn. Dat zou betekenen dat met deze AI het aantal biopten kan halveren.

Maar de superioriteit van de AI bleef niet overeind bij een vergelijking met de zorg in de praktijk: met de diagnoses die radiologen in de praktijk hadden gegeven aan deze patiënten. In de echte wereld hebben radiologen ook toegang tot de medische geschiedenis van de patiënten en ze kunnen overleggen met collega’s. Dan presteerde het algoritme vergelijkbaar. De AI moet dus nog verder ontwikkeld en gevalideerd worden voordat het systeem in de praktijk kan worden gebruikt.


Lees ook

AI moet de medische zorg gaan verbeteren, maar is allang tot de medische praktijk doorgedrongen

AI moet alles in de medische zorg gaan verbeteren, maar is intussen allang tot in de medische praktijk doorgedrongen