Na deze interessante vlog hebben we in teams voorspeld hoe lang elke deelnemer zal gaan doen over zijn race op 11 oktober. Daar zat natuurlijk een wedstrijdelement in; welk team voorspelt het best?
Sommige teams namen de Pete Riegel-formule als vertrekpunt en hebben daarin elk hun finesses aangebracht, door bijvoorbeeld:
- De dataset tactisch te filteren
- Rekening te houden met bepaalde bijzonderheden van het rondje dat we gaan lopen
- Rekening te houden met de verwachte temperatuur
Enkele teams bouwden een model, waarin zowel fysische hardloopgegevens als data over het weer werden meegenomen. Het model leert de verbanden tussen deze gegevens én de gelopen tijd te herkennen, om zo een te verwachten eindtijd te berekenen, gebaseerd op nieuwe data.
Een andere toevoeging is het inbrengen van wegingsfactoren, door bijvoorbeeld recentere hardlooptrainingen zwaarder te laten meewegen in de berekening dan trainingen van lang geleden.
Het was interessant om te doen en ook erg motiverend: een team is nog twee uur na de hackathon doorgegaan. Ook kregen we het verzoek het Databricks-cluster een paar dagen later nog eens aan te zetten, zodat de deelnemers hun voorspelling konden finetunen. Zondag zal blijken wie het best heeft voorspeld…en wie het hardst rent. We houden je op de hoogte.