Over de toegevoegde waarde van Data Science bij Evides
En toen was het moment opeens daar. Ik begon met twee collega trainees aan onze eerste werkdag bij Evides in Rotterdam. Een waterbedrijf. Ik hoor je denken: ‘Een waterbedrijf? Wat voor Data Science gerelateerde vraagstukken liggen er nou weer bij een waterbedrijf?’
Begrijp me niet verkeerd. Toen ik mijn contract bij Trainee.nl tekende was een waterbedrijf wel de laatste plek waar ik dacht mijn kennis van statistiek en liefde voor onderzoek te uiten. Sterker nog, ik had mij nooit eerder voorgesteld wat er zich precies bij een waterbedrijf afspeelt. Toen ik bij Evides op sollicitatiegesprek mocht, realiseerde ik me pas wat er aan vooraf gaat om met een simpele draai aan de knop mijn douche of kraan te laten lopen. Dat was ook gelijk het moment waarop ik echt nieuwsgierig werd naar de vraag: Hoe kan Data Science bijdragen aan het leveren van schoon drinkwater? Nu, ongeveer twee maanden na mijn start bij Evides, wil ik jou graag aan de hand van deze blog laten zien wat mijn werkzaamheden als trainee Business Analytics & Data Science zijn.
Data management
Om data te analyseren moet men beschikken over accurate data. Vervuilde of incomplete data analyseren, levert een groot risico op onbruikbare resultaten. Het onderhouden, actualiseren, beheren en beveiligen van data is daarom eerder noodzaak dan bijzaak. Data management heeft als doel de data compleet, betrouwbaar en op tijd beschikbaar te maken. Als Business Analytics & Data Science trainee leveren mijn collega trainees en ik een bijdrage aan dit proces bij Evides.
Over wat voor soort data gaat het dan? Evides verzamelt heel veel data. Denk hierbij aan data omtrent de kwaliteit van het water, watertransport (assetdata) en natuurlijk klantdata. Veel van deze data wordt bewaard in databases die vervolgens weer in een datawarehouse staan opgeslagen. Wanneer binnen Evides wordt opgemerkt dat de data in deze databases onvolledig of incorrect is, kan deze data handmatig worden gecorrigeerd of aangevuld. Echter, soms gaat dit om grote hoeveelheden data waarbij het dagen werk kan kosten om deze velden handmatig te vullen. That’s where we step in. Als data-team schrijven wij dan queries in SQL om de data automatisch in de velden te vullen. Hier is niet alleen kennis van de programmeertaal van belang maar ook een stukje creativiteit. Je moet namelijk weten waar de juiste informatie te vinden is om de velden te vullen en methodes verzinnen om dit automatisch en foutloos te doen.
Data analyse
Naast het managen van data worden wij als trainee data scientists natuurlijk ook uitgedaagd tot het beantwoorden van analyse vraagstukken. Zo houd ik mij momenteel onder andere bezig met analyses omtrent slimme douchemeters en engineeringsuren van gerealiseerde industriewaterprojecten.
Slimme douchemeters
Energiebesparende maatregelen zijn hip. Zonnepanelen, elektrische fietsen en slimme thermostaten zijn in steeds meer huishoudens te vinden. Ook bij Evides snappen wij dat het milieu heel belangrijk is. Daarom streven wij ernaar om in 2025 klimaatneutraal te zijn. Hiervoor zal de CO2-uitstoot flink omlaag moeten. Omdat wij dit niet enkel door verandering in onze eigen processen kunnen realiseren, zijn wij sinds kort een pilot studie gestart met de leverancier van slimme douchemeters. Uit onderzoek is gebleken dat het verschaffen van inzichten in energieverbruik, consumenten kan aanzetten minder energie te consumeren. Het idee is om deze meters beschikbaar te stellen voor klanten waardoor warm water (en daarmee energie) kan worden bespaard.
Om te testen of de meters inderdaad leiden tot minder warm water verbruik, hebben meer dan 200 medewerkers van Evides zo’n slimme douchemeter mee naar huis gekregen. Het verbruik in liters, kwh, stroomsnelheid en temperatuur per douchebeurt is van deze medewerkers vastgelegd. Mijn collega’s en ik hebben toegang gekregen tot deze data en zijn met statistiekprogramma R studio aan de slag gegaan om de data te analyseren. Wat blijkt? De gemiddelde gebruiker van de douchemeter gebruikt aanzienlijk minder water dat de gemiddelde Nederlander.
Engineeringsuren gerealiseerde projecten
Binnen de afdeling Projects & Operation Support ben ik momenteel bezig met een geheel ander project. Ik help hier de cost engineer bij het verbeteren van de kostenraming voor de industriewater projecten. Alle nacalculaties van de uitgevoerde projecten worden bijgehouden en zijn verwerkt tot kerngetallen. Deze kerngetallen kunnen vervolgens weer worden gebruikt voor het opstellen van begrotingen voor nieuwe projecten.
Mijn taak binnen dit geheel is om op basis van deze data, nieuwe relaties zichtbaar te maken. Hiermee wordt vooral gekeken naar de fase waarin een project zich bevindt en de disciplines die binnen deze fase kosten maken. Op basis van deze gegevens, worden nieuwe projecten gerichter begroot. worden hoeveel een project per fase en per discipline ongeveer zal gaan kosten.
De toekomst van Data Science bij Evides
Natuurlijk zijn bovengenoemde voorbeelden slechts een greep uit de werkzaamheden die door mij en mijn collega’s bij Evides worden uitgevoerd. Mijn collega trainees zijn momenteel ook bezig met zeer interessante projecten zoals het analyseren van klantcontact data en het realiseren van data flow diagrammen.
De verwachting is dat data management steeds meer plaats zal maken voor data analyse. Het achterliggende idee is dat wanneer de data automatisch op de juist manier wordt gevuld en de oude vervuilde data is opgeschoond, het data management gedeelte steeds minder werk oplevert.