England vant den andre testen mot Sør-Afrika komfortabelt nok, men det var en frustrerende spell før te på den første dagen som Kagiso Rabada og Anrich Nortje la til 35 for den niende wicket. Etter å ha bowlet relativt fullt tidligere på dagen, byttet England til et kort angrep uten stor effekt. Spesielt var det en full ball fra Ollie Robinson etter te som leverte gjennombruddet da Nortje var lbw.
Så hvorfor hadde England endret tilnærming? Kanskje de hadde blitt påvirket av testen mot India på Lord’s da de hadde spratt ut halen, eller kanskje det var en reaksjon på naturen til denne sesongens Dukes cricketballer som har mistet trusselen raskere enn vanlig, og krever noe annet enn bowleren. Men det var også, tilsynelatende, data om at den sørafrikanske halen var mottakelig for bowling med kort bane. Problemet er at hvis hver ball er kort, kommer slagerne til å forvente det og kan sette seg mot det; langt farligere er den overraskende korte ballen.
Som CricViz-analytikeren Ben Jones sa det: “Du kan ikke bare se på oppsigelser” – Jimmy Anderson-innsvingeren er desto farligere for å følge en serie outswingere. CricViz sin forventede wickets-modell viser at gode baller har en tendens til å ta wickets uansett, men Jones erkjenner at konteksten er viktig og ser at det var et av områdene der bruken av data i sport må forbedres.
Eller ta yorkeren, som ingen tviler på er den mest effektive ballen i endagscricket. Problemet er at det er en liten margin for feil: for full og det er et lavt fullkast, for kort og det er en halvvolley, begge veldig finnbare. En batter som venter på en yorker kan avansere eller trekke seg tilbake for å endre lengden.
Som Tim Wigmore og Freddie Wilde påpeker i Cricket 2.0det var at, alliert med mistanken om at Ben Stokes ville prøve å få ham til å slå til den lengre bensidegrensen, som gjorde at Carlos Brathwaite kunne slå de fire påfølgende sekserne for å vinne 2016 T20 verdenscupfinale. Chris Jordan over til Jimmy Neesham som gikk for 23 i 2021-turneringen, var også resultatet av at yorkeren ble spådd.
Lignende problemer har forfulgt dataanalyse i fotball nesten helt fra starten. Charles Hughes, teknisk direktør for FA hvis bok fra 1990 Vinnerformelen bekreftet direkte fotball som offisiell doktrine, trakk sine konklusjoner fra bevisene fra 109 kamper som involverte “vellykkede sider” – Liverpool, England U16 og U21, og VM- eller EM-kamper som involverer Argentina, Brasil, England, Nederland, Italia og Vest-Tyskland – mellom 1966 og 1986. Han fokuserte nesten utelukkende på de 202 målene som ble scoret i disse kampene – akkurat som cricketanalyse har en tendens til å fokusere på utvisninger – og 87 % kom fra trekk på fem pasninger eller færre. Derfor, konkluderte han, bør lagene prøve å begrense trekk til fem pasninger eller færre.
Selv om man ser bort fra den oppsiktsvekkende lave prøvestørrelsen og dataenes selektive natur, er det et fravær av nyanser. Kan det ikke være slik at det som fungerer for England U-16 i en treningskamp i gjørme og kulde på en britisk vinter, ikke nødvendigvis er passende for Brasil midt i varmen og høyden til et verdensmesterskap i Mexico?
Hughes bemerket til og med at Brasil var det laget som mest sannsynlig scoret etter en lang rekke pasninger, 32 % av målene kom fra trekk på seks pasninger eller mer, med Vest-Tyskland neste på 25 %. Gitt at de hadde vunnet seks av de 13 verdenscupene som har blitt spilt, ser den åpenbare konklusjonen ut til å være at ballbesittelse er bra for deg, men Hughes forfulgte det ikke.
Det gjorde han heller ikke, eller Charles Reep, amatørstatistikeren hvis ideer Hughes utviklet, mener at direkteballer kan være mer effektive hvis de brukes sparsomt. Akkurat som en batter kan sette seg for vedvarende short-pitching bowling, eller gjøre seg klar for en rekke yorkers, slik kan et forsvar falle dypt og forberede seg på et luftbombardement.
Akkurat som faren for en og annen sprett kan økes av overraskelsesfaktoren, ved at en batter som prøver å komme seg fremover må justere seg, slik kan trusselen for en lang ball være større hvis et forsvar har blitt trukket ut av et lag som har besittelse. (Og fordi nesten ingenting i sport er absolutt, er det anledninger når en batter blir så skremt av bowling med kort bane eller et forsvar så raslet av en rekke lange baller, når den mest effektive taktikken er det kvelende trykket fra en vedvarende bom. .)
Hughes og Reep var, for å bruke et høfligst mulig uttrykk, pionerer og har omtrent like mye med moderne dataanalyse å gjøre som Plinius den eldste gjør med moderne medisin. Men spørsmålet om kontekst er et spørsmål som statistikken fortsetter å slite med.
En trener på et Premier League-lag fortalte meg en historie om at manageren hans ble overbevist av dataavdelingen deres om å drive en høylinje mot et lag med en spesielt rask forward, til tross for at en førstevalgs midtstopper måtte erstattes av en veteran som var akkurat på vei tilbake fra skade og hadde ikke vært rask på turn selv i pompøsiteten.
De slapp inn tre innen 30 minutter og tapte 3-0, men analytikerne begrunnet rådene sine med å påpeke at laget deres hadde vunnet xG. Men det var fordi, som treneren sint svarte, etter å ha scoret med tre tidlige sjanser, hadde det andre laget ikke behov for å angripe. De satte seg tilbake, sparte energi og var ikke mye plaget om de slapp inn et par halvsjanser: spillet var over med en time igjen. Det er ikke å si at xG ikke er et veldig nyttig verktøy – det er det – bare at det ikke alltid gir hele bildet.
CricVizs Jones er tydelig på at dataanalyse ikke er nok; det gir mening bare når det brukes sammen med videoanalyse av de som forstår grensene for hva statistikk kan fortelle deg. Det er få absolutte rettigheter og få absolutte feil, og meningen med alt er delvis bestemt av forholdet til alt annet. Kontekst er avgjørende; spillere er mennesker. Sport er ikke en algoritme.