Ian Graham werkte als postdoctoraal onderzoeker in de fysica aan de universiteit van Cambridge toen een kennis een vacature naar hem doorstuurde die zijn leven zou veranderen – en het voetbal. Een bedrijf zocht een datawetenschapper om met voetbalclubs samen te werken. Graham was altijd al voetbalfan geweest en regelmatig twijfelde hij aan een lange carrière in de wetenschap. Maar hij was er nooit op gekomen om z’n kennis van complexe wiskundige modellen ook op de sport toe te passen.
Twintig jaar later is Graham een grootheid in een wereld die voor supporters en media vaak onzichtbaar blijft. In het voetbal krijgen trainers en spelers de meeste aandacht. Maar op de achtergrond, in achterafzaaltjes op trainingscomplexen en op zolderkamers, zijn mensen opgekomen die grote hoeveelheden data over voetballers en wedstrijd analyseren, en die daarmee clubs helpen slimmere beslissingen te nemen – of om fouten te voorkomen.
De data-afdeling die Graham bij Liverpool opzette – en leidde – wordt in het voetbal gezien als één van de beste, zo niet dé beste (inmiddels werkt hij als consultant). Het boek dat hij deze zomer publiceerde over zijn werk in het voetbal, How to win the Premier League, wordt dan ook gretig gelezen binnen clubs.
Graham kent de kritieken. Data zouden de romantiek uit het spel halen, schrijft hij in zijn boek, data-analisten zouden te machtig zijn. Data, zegt oud-topvoetballer Rafael van der Vaart geregeld aan talkshowtafels, maken „het voetbal kapot”. Maar Graham gelooft iets anders, vertelt hij tijdens een gesprek in de bibliotheek van Manchester: de datarevolutie in het voetbal gaat eigenlijk nog niet ver genoeg.
Revolutionaire ontdekking
Als Graham in 2005 bij de Engelse club Tottenham Hotspur terecht komt heeft hij één groot probleem: er zijn heel weinig data.
En het Engelse voetbal heeft nog een probleem: Charles Reep. Hij had in de jaren vijftig het aantal passes en aanvallen geturfd. De uitkomsten extrapoleerde hij naar een ogenschijnlijk revolutionaire ontdekking: de meeste doelpunten zouden na amper twee á drie passes gescoord worden. De meest effectieve manier om te scoren, concludeerde hij, was dus om de lange bal naar voren te spelen.
Reep maakte een rekenfout, schrijft journalist Jonathan Wilson in tactiek-bijbel Inverting the Pyramid, maar wel een met grote gevolgen. Engelse teams begonnen massaal de bal zo snel mogelijk naar voren te schieten: kick and rush. Dat zette het Engelse voetbal in de jaren zeventig op grote achterstand van het Europese positiespel. „Het voetbal was verschrikkelijk”, zegt Graham. „Dus veel trainers dachten: we hebben data al eens geprobeerd en het werkte niet.”
Maar rond de eeuwwisseling verandert het Engelse voetbal snel. Buitenlandse trainers, zoals de Fransman Arsène Wenger bij Arsenal, brengen innovaties mee, zoals het analyseren van videobeelden van wedstrijden. En de jonge Franse directeur Damien Comolli van de Spurs ziet in data wél nut en huurt het bedrijf waar Graham werkt in. Een jaar later begint databedrijf Opta grote hoeveelheden data van wedstrijden uit de grootste Europese competities te verkopen. Graham kan beginnen met rekenen.
Voetbal is een dynamische sport: spelers bewegen continu over het veld en elke wedstrijd worden honderden passes gegeven. Wedstrijden hebben al gauw een paar duizend ‘events’ die geanalyseerd kunnen worden, zoals passes, tackles en doelpunten. Wie ook de bewegingen van spelers meeneemt, komt op 3,5 miljoen datapunten per wedstrijd. Dat maakt het spel veel complexer dan een ‘statische’ sport als honkbal, waarin data al langer veel gebruikt worden.
Het betekent ook dat Graham met een enorme rijkdom aan cijfers kan werken. Hij is wetenschapper, dus hij bedenkt hypothesen, theorieën en onderzoeksvragen. Eén vraag boeit hem in het begin het meest, omdat die op zoek gaat naar de essentie van voetballers – en omdat het antwoord zijn club kan helpen betere spelers te kopen: hoeveel draagt een speler bij aan de scoringskansen van zijn team?
Hij bouwt een model dat alle acties van spelers weegt en daarmee precies díe vraag beantwoordt, ‘possession value’. Van elke pass wordt berekend of de scoringskansen van een team toe- of afnemen. Als Graham zijn model in het najaar van 2007 aan Comolli presenteert, is die snel overtuigd. Alle topspelers van die tijd staan bovenin: blijkbaar doet het model iets goed.
Wederopstanding van Liverpool
Grahams model zal eerst Spurs helpen om betere spelers te halen, onder wie Van der Vaart. En vanaf 2012 staat Graham mede aan de voet van de wederopstanding van Liverpool. Bij die gevallen grootmacht werkt hij opnieuw met Comolli. Hij leert er een belangrijke les: data-gedreven werken leidt alleen tot succes als de héle organisatie meewerkt.
Trainer Brendan Rodgers heeft weinig op met de analyses van Grahams team. De club haalt op zijn aandringen een aantal spelers die, precies zoals Graham voorspelde, niet in het team passen. Maar zijn opvolger Jürgen Klopp is er wél ontvankelijk voor. Als de data-analisten een speler aandragen, is hij bereid om te luisteren en om overtuigd te worden. Hij wilde zijn landgenoten Mario Götze en Julian Brandt halen, de data-analisten stelden Sadio Mané en Mo Salah voor. Die laatste twee werden moderne clublegendes.
Als je hem ernaar vraagt zal Graham direct toegeven dat Liverpool uniek was. Of ja, er zijn misschien nog twee andere clubs die even datagedreven zijn: Brighton en Brentford. Alle drie hebben ze een eigenaar die van bovenaf het belang van data in de organisatie heeft doorgevoerd, zegt hij. En bij alle drie de clubs „werken alle afdelingen mee”. De clubs worden geprezen om hun transferbeleid.
Hoe invloedrijk zijn data in het voetbal werkelijk? Critici als Van der Vaart hekelen een totale dominantie van cijfertjes. Maar in een veelbesproken artikel op The Athletic concludeert voetbaljournalist Michael Cox afgelopen zomer, na het lezen van een tiental boeken over de ‘data-revolutie’, dat data het voetbal amper hebben veranderd. De grootste veranderingen in het spel zouden komen door trainers als Pep Guardiola, niet door data.
Graham ziet ook dat veel clubs data niet écht omarmen. Ze doen alsof. „Elke club in de Premier League heeft tegenwoordig data-analisten. Maar het is voor clubs heel makkelijk om te zeggen: we nemen twee promovendi aan, stoppen ze ergens in een hok en zeggen dat we aan data-analyse doen. Het is vooral iets om af te vinken.”
Maar het succes van clubs als Liverpool, Brighton en Brentford maakt het volgens hem moeilijker om níet aan te haken. „Data goed gebruiken leidt tot betere resultaten. Als clubs dat doorhebben, moeten ze wel mee.” Hij vergelijkt de weerstand met hoe bankmanagers ooit naar de introductie van kredietscores keken. „Ze zeiden dat ze aan iemands ogen wel konden zien of die een lening zou afbetalen. Tegenwoordig is dat een achterlijk argument.”
Bovendien veranderen data voetbal wel degelijk, denkt hij. Zij het vooral indirect. Nog los van hoe clubs datamodellen gebruiken om mogelijke aanwinsten te beoordelen, helpen data ook om te onderscheiden welke speelstijlen efficiënt zijn en welke niet, zegt hij, welke spelers daarin goed passen en welke niet, en welke trainers daarom succesvol zijn of niet.
Zo pikte Liverpool in 2015 Klopp op na een teleurstellend jaar bij Borussia Dortmund. Media twijfelden. Maar volgens de onderliggende data had Borussia vooral pech gehad en verdienden ze het om veel hoger te staan. Klopp en de aanwinsten die Grahams team aandroegen brachten Liverpool de eerste titel in dertig jaar.
Toekomst
In de komende tien jaar zullen data nog veel invloedrijker worden, voorspelt Graham, vooral door tactieken te analyseren. „Een paar jaar geleden vond ik dat nog tijdverspilling. Maar de kwaliteit van de data en de modellen is zó verbeterd, dat dit echt de next frontier is.” De vervolgstap: die inzichten real time toepassen tijdens wedstrijden. Trainers die dat kunnen, hebben een „voorsprong”.
Zulke diepgaande analyses leveren ook weer geen metafysische waarheden op over wat objectief het beste voetbal is. Voetbal is een spel van permanente verandering, „van kat en muis”. Wat een team vandaag een voordeel oplevert, kan morgen door tegenstanders gesnapt worden en overmorgen daardoor een zwakte vormen. „Er is geen goede of slechte manier van voetballen. Het gaat erom wie in het huidige klimaat het beste is.”
Weet je, zegt hij, het begin van exponentiële groei is behoorlijk zacht. „Dat het lijkt alsof data weinig veranderd heeft, is omdat we nog maar aan het begin van de groeicurve staan.”