Running on Data 2022 
De Marathon van Eindhoven

Tim Hanssen, oktober 2022

Afgelopen zondag, 9 oktober, was de Marathon van Eindhoven. Het was een prachtige dag. Met 19 graden was het wel wat te warm voor de lopers maar voor het publiek was de temperatuur heerlijk. Publiek was dan ook volop aanwezig om alle lopers aan te moedigen. Deze editie had een recordaantal deelnemers en diverse persoonlijke records zijn verbroken.

Met Running on Data hebben wij ook meegedaan. Voor het eerst liepen er twee kinderen mee met de kids-run. Wegens praktische en fysieke omstandigheden bij enkele Running on Data-deelnemers kon niet iedereen meedoen, maar voor de lopers die wel meegedaan hebben was het een groot succes! Bij dezen willen we de deelnemers bedanken voor hun enthousiasme en deelname.

Ook hebben we gezien dat diverse oud-Running on Data-deelnemers hebben meegedaan. Daarbij willen we vooral Imme (3e dame), Joris (voor het eerst binnen 1:30u) en Pim (voor het eerst binnen 1:45u) feliciteren met hun prestaties!

Evaluatie

Bij Running on Data hoort natuurlijk een evaluatie aan de hand van data. Als eerste is het leuk om te kijken hoe onze lopers het gedaan hebben ten opzichte van wat er voor iedereen voorspeld was. In de onderstaande afbeelding kun je voor de deelnemers aan de halve marathon zien welke tijd ze gelopen hebben en wat er voorspeld was.

Het is interessant om te kijken naar de dikte van de gestreepte lijn om de staaf van de voorspelling: hoe dikker de lijn, hoe meer data beschikbaar was om de voorspelling te doen. Leon en Tim hadden veel representatieve data verzameld in de afgelopen maanden waardoor de voorspelling dicht in de buurt van de werkelijke eindtijd is. Bij Erik (voornamelijk oudere data), Maarten (vriendin hazen) en Stefan (weinig recente data) was om diverse redenen het gat tussen de voorspelling en de werkelijkheid iets groter.

Vervolgens kunnen we kijken hoe de Running on Data lopers het gedaan hebben ten opzichte van alle andere deelnemers. Een verdeling van alle eindtijden op de halve marathon zie je in de onderstaande grafiek.

Het is mooi om te zien dat elke Running on Data-deelnemer sneller was dan de gemiddelde eindtijd. Gemiddeld was de RoD deelnemers zelfs ruim een kwartier sneller dan het gemiddelde. Ook is in de grafiek heel duidelijk te zien wat de streeftijden van alle lopers zijn: er zijn kleine pieken net vóór 1:30u, 1:40u, 1:50u en 2.00u terwijl je zou verwachten dat de data verdeeld zou zijn.

Als laatste hebben we geprobeerd te analyseren of er een verschil is tussen “voorbereid met data” en “voorbereid zonder data” aan de start te staan aan de hand van het verval van elke loper. Het verval wordt berekend aan de hand van onderstaande formule:

 

Als de twee waarden gelijk zijn aan elkaar dan is de snelheid constant geweest en is er dus geen verval.
Bij een verval boven de 1 is het tweede deel sneller gelopen dan het eerste deel.
Bij een verval onder de 1 is het tweede deel langzamer gelopen dan het eerste deel.
In de afbeelding hieronder is het verval van elke deelnemer te zien.

Gemiddeld rent een loper in het tweede deel dus 94,6% van de snelheid in het eerste deel. Bij de deelnemers van Running on Data is het verval in het tweede deel minder groot geweest dan het gemiddelde van alle deelnemers. Twee RoD lopers (Leon en Maarten) behoren zelfs tot het kleine groepje mensen (14,9% van de deelnemers) dat in het tweede deel sneller heeft gelopen dan in het eerste deel. Verder is aan de solide zwarte lijn te zien dat vooral bij langzamere lopers veel verval plaatsvindt en dat bij de allersnelste lopers geen loper sneller loopt in het tweede deel; de snelste lopers lopen zo’n 2 á 3 procent langzamer in het tweede deel dan in het eerste deel.

Er zijn natuurlijk nog veel meer vragen die je kunt beantwoorden op basis van data . Daarom zullen we ook volgend jaar weer een editie van Running on Data organiseren. Mocht je vragen hebben of enthousiast hiervan worden, neem dan contact met ons op!