Hoe kun je zekerheid krijgen over dingen die maar eens in de tienduizend jaar gebeuren?

John Einmahl: „Zo slim mogelijk gebruikmaken van de data die je hebt. Dat is mijn vak.”

John Einmahl: „Zo slim mogelijk gebruikmaken van de data die je hebt. Dat is mijn vak.”

Foto Andreas Terlaak

Interview

John Einmahl | hoogleraar statistiek Mensen willen zekerheid hebben over zeldzame gebeurtenissen, zoals aardbevingen en overstromingen. „Het is lastig maar het kan.”

Hoe groot is de kans op een uitzonderlijk zware overstroming, aardbeving, beurskrach of een andere extreme gebeurtenis? Die lastig te beantwoorden vraag is het vakgebied van John Einmahl, hoogleraar statistiek in Tilburg en specialist in extreme-waardentheorie. Op 8 september hield hij zijn afscheidsrede: A beautiful theorem needs no application, over de statistiek van het uitzonderlijke, van atletiekrecords tot aardbevingen.

Hoe kun je iets met zekerheid zeggen over zaken die per definitie heel zeldzaam zijn?

„Het is lastig maar het kan: het is eigenlijk een vorm van extrapolatie, op basis van gebeurtenissen die uitzonderlijk zijn, maar niet extreem uitzonderlijk. Denk bijvoorbeeld aan waterstanden, waarin je geïnteresseerd bent als je een dijk wilt bouwen: hoe hoog moet die dijk worden om een waterstand te overleven die eens in de tienduizend jaar voorkomt?

„Dan begin je met de hoogste waterstanden over honderd jaar. Die zijn wel uitzonderlijk, maar je hebt behoorlijk wat gegevens. En dat probeer je door te trekken naar de extremere waterstanden, de eens-in-de-tienduizend-jaarrampen dus.

„Het mooie van statistiek is dat je diezelfde methodes op allerlei situaties kunt toepassen: op andere rampen, zoals aardbevingen of overstromingen, maar ook op financiële schommelingen, of bijvoorbeeld op sportrecords.

„In de statistiek wil je altijd de variabiliteit reduceren. In gewonemensentaal: je wilt zo veel mogelijk zekerheid hebben en zo weinig mogelijk onzekerheid.

„Dat kun je bijvoorbeeld doen door zo veel mogelijk data te verzamelen. Als ik een keer een muntje opgooi, weet ik niet of ik kop gooi of munt. Maar als ik het een miljoen keer doe, dan weet ik heel zeker dat ik ongeveer bij de helft van de worpen kop gooi. Dat is de wet van de grote aantallen.

„Maar het is niet altijd mogelijk om heel veel gegevens te verzamelen, zeker niet bij zeldzame gebeurtenissen. Dus de andere tactiek is zo slim mogelijk gebruikmaken van de data die je hebt. Dat is mijn vak.”

Er zijn fysieke grenzen aan spierkracht, paslengte, enzovoort: niemand gaat ooit 75 kilometer per uur lopen

‘Het venijn zit in de staart’, las ik in een paper over dit vakgebied.

„Bij extreme waarden gaat het om de ‘staart’ van een kansverdeling. Kijk, als dit een kansverdeling is [hij loopt naar een whiteboard en tekent een grafiek van een berg die naar rechts glooiend afloopt]. Dit is wat er heel vaak gebeurt [wijst op de top], dit zijn de gebeurtenissen die een beetje minder vaak voorkomen [wijst op de helling], maar het gaat ons om deze waarden [wijst op de voet van de berg]. Dat zijn de extreme, zeldzame gebeurtenissen: hoge waterstanden, zware aardbevingen, catastrofale beursverliezen. Dat noemen we de ‘staart’.

„Er zijn dikke en dunne staarten. Een voorbeeld van een dunne staart heb je bij de 100 meter sprint, waaraan we gerekend hebben. In 2009 liep Usain Bolt het wereldrecord op de 100 meter, 9,58 seconden. Iemand gaat dat record vast een keer breken, maar er zijn fysieke grenzen aan spierkracht, paslengte, enzovoort: niemand gaat ooit 75 kilometer per uur lopen.

„Bij processen waarbij er zo’n intrinsieke grens is, een soort muur, krijg je een ‘dunne’ staart: de helling loopt relatief snel af. Dat zie je bijvoorbeeld ook bij de maximale leeftijd van mensen, waar we in 2019 onderzoek naar deden. Mensen worden niet veel ouder dan 115 jaar.

„Zo’n staart vertaalt zich in wat we de extreme-waardenindex noemen. Dat is een getal dat je kunt schatten. Niet door alleen naar de wereldrecords te kijken, wat mensen vaak naïef doen. Dan heb je maar een handjevol datapunten.

„Wij hebben van topatleten ruim duizend persoonlijke records op de 100 meter op een rij gezet. Daaruit kwam een extreme-waardenindex die negatief is. Dat betekent dat je een dunne staart hebt, en dus een fysieke grens. Die grens schatten wij op ongeveer 9,36. Natuurlijk zit ook in dat getal weer onzekerheid, maar in de nabije toekomst zal niemand heel erg veel sneller sprinten.”

En een dikke staart?

„Kijk je bijvoorbeeld naar aardbevingen, dan zeggen geofysici: eigenlijk weten we heel slecht hoe het werkt. Aan de energie van aardbevingen lijkt geen inherente grens te zitten. Dan hebben we het over een dikke staart, die je ook ziet bij bijvoorbeeld schades bij brand- of stormverzekeringen.

„Dus stel dat je 100 miljard schade hebt bij een extreme storm- of aardbevingsramp, dan kan de volgende net zo goed 200 miljard schade opleveren. De frequentie van extremere gebeurtenissen neemt maar heel langzaam af.”

Wat hebben wij, of bijvoorbeeld verzekeraars, aan zulke berekeningen?

„Dat is heel nuttig voor verzekeraars, en belangrijk bij risicoanalyse en premieberekening. Al zouden wij perfect de kansverdeling kunnen vastleggen, er blijft toch een onzekerheid: de natuurlijke variatie kunnen we niet veranderen, alleen maar kwantificeren.”

In het begin voel je je als iemand die in de woestijn staat. Waar je ook om je heen kijkt, er is alleen maar zand

Uw publicaties over sportrecords en de maximale leeftijd van mensen hebben veel aandacht gekregen, maar trots bent u vooral op de mathematisch-statistische publicaties.

„Dat zijn mijn artikelen over methoden om tot schattingen te komen en om de eigenschappen van die methodes te bepalen. Om uit te leggen wat je daarin doet, is heel lastig. Het komt erop neer dat je bepaalde aannamen doet, en dan probeer je op grond daarvan iets wiskundig te bewijzen.

„In het begin voel je je als iemand die in de woestijn staat. Waar je ook om je heen kijkt, er is alleen maar zand. Geen idee waar je naartoe moet. Maar dan langzaamaan begint er toch iets te dagen, en dan zie je toch licht aan het eind van de tunnel – dat is weer een andere beeldspraak.

„Dat blijkt dan misschien een fata morgana, maar je begrijpt wel dat je andere aannamen moet doen, en zo begin je opnieuw, en doemt er toch een landschap op.

„Dat spel tussen aannames en wat je op grond daarvan kunt bewijzen, dat doe ik heel graag. Soms loop je tegen een muur op. En soms valt je ineens iets in als je naar huis fietst, of ’s avonds in je bed ligt.”

Een flauwe vraag, maar wat vindt u ervan dat u met deze achternaam in de theorie van de zeldzame gebeurtenissen terecht bent gekomen?

„Ha, over mijn naam heb ik mijn hele leven al grappen gehoord. Het is trouwens geen Duits: ‘einmal’ is zonder ‘h’. Het is een Limburgse achternaam die vermoedelijk te maken heeft met het plaatsje Emael in België, vlak bij Maastricht.

„Het verband met mijn vakgebied heb ik me, geloof het of niet, nooit zo gerealiseerd. Totdat iemand een keer een naamkaartje gemaakt had: ‘Professor Einmahl, uitzonderingsstatisticus’. Toen pas viel het me op.”