Guided-Data-Science-app

Ricardo Jacobs, Januari 2023

Onze collega’s Mayke en Ruben hebben afgelopen maanden gewerkt aan de Guided-Data-Science-app. Deze app laat de gebruiker op een eenvoudige manier kennis maken met datascience technieken. Door de app aan te sluiten op bron van de klant, en de gebruiker tekstueel te begeleiden, worden onze klanten zelfstandiger.
Usecase

Bedrijven hebben veel data en zijn al gevorderd in het maken van rapportages, maar ze willen graag kijken of ze ook voorspellingen kunnen maken. Er is een aantal zaken dat ze hierin tegenhoudt:

  1. Er zijn geen collega’s die kunnen programmeren in python/R.
  2. Licenties voor programma’s die gebruikt kunnen worden om voorspelmodellen te maken, (denk aan SAS enterprise miner / SPSS), zijn duur.
  3. Er zijn wel collega’s die iets weten van datascience maar niet het fijne, dus ze hebben hier nog wat hulp bij nodig.

Om onze klanten daarbij te helpen zijn we met het idee gekomen om een webapplicatie te maken die gekoppeld kan worden aan bijvoorbeeld een Azure-storageaccount van de klant of aan een database waar je de data hebt staan die je wil gebruiken.

Voorbeeld

De innovatie-afdeling heeft veel gelezen en gehoord over datascience, artificial intelligence en machinelearning. Ze zijn daarom in gesprek gegaan met de BI-analist binnen het bedrijf maar deze persoon heeft daar helaas geen ervaring mee. Ze besluiten zelf te willen kijken of ze deze technieken toe kunnen passen. Ook zij lopen er tegenaan dat ze niet zo goed weten hoe ze moeten beginnen. Welke training ga je volgen? Kies je voor een dure drag-and-drop-tool of ga je gebruik maken van opensourcepackages. En welke packages kun je dan het beste gebruiken?

De oplossing

De Guided-Data-Science-app! De app bestaat uit verschillende pagina’s:

  • Een homepage waarin je kan vinden hoe de webapplicatie werkt en welke informatie je op welke pagina kan vinden.
  • Een demopagina waar je kan zien hoe je bijvoorbeeld een voorspelmodel kan maken.
  • Een explanationpagina waar je uitleg kan vinden over datascience technieken en hoe je resultaten kan interpreteren.
  • Een quick pagina waar je snel een voorspelling kan maken.
  • Een advancedpagina waar je wat meer opties hebt dan op de quickpagina. Denk aan het opslaan en hergebruiken van een voorspelmodel, maar ook het toepassen van zogenaamde unsupervised data science technieken.

We noemen het Guided-Data-Science omdat je tekstueel begeleid wordt door de verschillende keuzes die komen kijken bij een voorspelling:

In de afbeelding hierboven wordt de welbekende Titanic dataset gebruikt. Je wilt hier voorspellen wie de Titanic ramp overleefd heeft en je verwacht dat leeftijd, geslacht, aantal broers/zussen en klasse invloed hebben. Als je op “Submit” drukt, wordt er een voorspelmodel gemaakt en wordt het model ook toegepast op de data van passagiers waarvan je niet weet of ze het overleefd hebben. Je krijgt ook meteen te zien hoe goed je model is en je krijgt natuurlijk de voorspelling die je ook meteen kan exporteren. 

Daarnaast krijg je mooie visuals die bij het model horen:

Mocht je geen idee hebben wat accuracy of recall is en heb je geen idee hoe je de confusionmatrix moet interpreteren, geen probleem want dit wordt uitgebreid uitgelegd op de explanationpagina.

Outro

De Guided-Data-Science-app maakt datascience toegankelijker voor meer gebruikers. Zo kunnen onze klanten zelfstandiger werken met hun eigen data. De webapp stelt onze klanten in staat zelf een eerste verkenning te doen en potentiële waarde in hun eigen data te onderzoeken. Ben je nieuwsgierig geworden en wil jij ook aan de slag met deze unieke Guided-Data-Science-app? Neem dan vooral contact met ons op.