DATA VOLWASSENHEID
Verzamelaar
WAT VINDT DE ONDERNEMER?
4.5/5
SECTOR
WieBetaaltWat is een bekende applicatie om gezamelijke kosten toe te voegen zodat deze aan het einde van een periode verrekend kunnen worden en iedereen uiteindelijk evenveel heeft betaald. De gebruikers vullen zelf in waar de kosten voor zijn gemaakt, waardoor het lastig is om in één oogopslag te zien wat voor soort kosten het zijn. Denk hierbij aan het verschil tussen Albert Heijn, Appie, AH, boodschappen, etc. voor eenzelfde categorie worden veel termen gebruikt. Zodra WieBetaaltWat meer inzicht krijgt in deze kosten, kunnen ze hun gebruikers hier ook beter over informeren en daarnaast ook benchmarken met vergelijkbare gebruikers. Bijvoorbeeld, jullie weekboodschappen vallen gemiddeld hoger uit dan de rest van de gebruikers. Wij zijn aan de slag gegaan met een model welke de verschillende kosten probeert te classificeren in bepaalde categorieën. Met deze inzichten kunnen de gebruikers beter anticiperen op hun kosten, maar het biedt ook de kans voor WieBetaaltWat om gericht te kunnen adverteren.
De meeste mensen hebben anno 2022 wel eens gehoord van de applicatie WieBetaaltWat. Het is een veelgebruikte app voor studentenhuizen, vrienden die een weekend of week samen weg gaan, maar ook voor stelletjes die nog geen gezamenlijke rekening hebben. De app maakt het mogelijk om de uitgaves in te voeren en vervolgens te verdelen onder degene waarvoor je de kosten hebt gemaakt. Aan het einde van een vakantie of tussendoor kun je een afrekening maken en wordt aangegeven aan wie je nog wat moet betalen of van wie je nog geld terug krijgt.
Het invoeren van de kostenomschrijving gebeurt nu handmatig, waardoor voor alleen boodschappen al veel verschillende termen worden gebruikt. Hierdoor is het voor WieBetaaltWat lastig om in een oogopslag te zien waar het meeste aan wordt uitgegeven. Zodra het wel mogelijk is om meer inzicht te krijgen in de uitgaves kunnen ze hun gebruikers benchmarken met de andere gebruikers en bijvoorbeeld aangeven wanneer er relatief veel of weinig wordt uitgegeven. Door deze inzichten terug te koppelen, worden de gebruikers zich meer bewust van hun uitgaves en gaan ze mogelijk op een meer verantwoorde manier om met hun geld. Uiteindelijk kan het classificeren van de kosten en de verschillende lijsten zorgen voor een verbeterde gebruikerservaring.
DATA VOLWASSENHEID
WAT VINDT DE ONDERNEMER?
Uiteindelijk hebben we voor WieBetaaltWat twee verschillende modellen als proof of concept uitgewerkt. Een waarbij is gefocust op het classificeren van de kostenomschrijvingen, en een ander welke gefocust is op het classificeren van verschillende lijsten. Voor ieder model is één project nodig geweest. Beide modellen zijn ontwikkeld in Python en doordat er intern ook Python kennis in huis is bij WieBetaaltWat kunnen zij de modellen verder ontwikkelen en implementeren in de bestaande applicatie.
Voor dit project is een statische dataset gebruikt met gegevens van het afgelopen jaar. Na analyse van de data is besloten te beginnen met het definieren van de verschillende (sub)categorieën. Het eerste niveau is meer algemeen (bijv. huishouden), en het tweede niveau is specifieker (bijv.boodschappen). Daarna is voor deze categorieën een taxonomie opgesteld, oftewel woorden die passen bij die categorie. Deze woorden zijn gevonden door de meest voorkomende uit de dataset te gebruiken en door externe bronnen te raadplegen.
Nadat de taxonomie is opgesteld, zijn de bestaande uitgaves geclassificeerd. Oftewel het plaatsen van een uitgave in een bepaalde categorie. Hier zijn drie stappen voor nodig geweest:
Deze stappen zijn wel iteratief waardoor dit process een aantal keer is doorlopen om tot het uiteindelijke model te komen. Het model heeft uiteindelijk op deze manier 80% van de historische kosten kunnen classificeren.
Alle uitgaves zijn onderdeel van een lijst, welke verschillende doeleinden kan hebben. Bijvoorbeeld een vakantie, studentenhuis, relatie, etc. Tijdens het tweede project zijn de verschillende lijsten geanalyseerd en is getracht om deze ook te categoriseren. Hiervoor zijn de volgende stappen doorlopen:
Uiteindelijk heeft het model 80% van de lijsten kunnen classificeren. WieBetaaltWat gaat er nu mee aan de slag om dit model in de applicatie toe te voegen en het doel van de lijst te suggereren aan de gebruiker. Zij kunnen deze vervolgens aanpassen naar een andere categorie indien nodig. Op die manier wordt de dataset automatisch verrijkt en kunnen ze in de toekomst deze informatie inzetten om inzichten te creeëren en de gebruiksvriendelijkheid te verhogen.
Tijdens dit project is Martijn, de CTO, betrokken geweest. Het helpt om tijdens het traject iemand te betrekken die weet hoe de interne data infrastructuur is ingericht. Op die manier is er intern kennis over de werking van het ontwikkelde script, en kan deze persoon ervoor zorgen dat het uiteindelijk geimplementeerd wordt. Ook kan er in het geval van wijzigingen in de data of het script intern een oplossing worden gevonden.
Super leuk dat je bij ons lustrum aanwezig bent!
De inloop is vanaf 15:00 en om 15:30 zullen we beginnen met het programma.