Veel bedrijven, instellingen en instanties willen iets met data. Maar wat is dit iets nu precies en waar begin je als organisatie? Datagedreven werken zorgt ervoor dat een organisatie betere beslissingen kan nemen op basis van gegevens. Door datagedreven te werken ontstaat er concurrentievoordeel op het gebied van verkoop, inkoop, voorraadbeheer en procesoptimalisatie. Dit artikel neemt de lezer mee in de globale opzet van datagedreven werken.
Visie
Alvorens een organisatie gaat beginnen met datagedreven werken dient er een visie te zijn op/over het doel en het waarom. Waarom is datagedreven werken voor onze organisatie van essentieel belang en welk doel streeft de organisatie na met de nieuwe manier van werken? Zodra een organisatie dit helder heeft, kan in kaart worden gebracht welke kennis en competenties benodigd zijn.
Technische mogelijkheden van datagedreven werken
Om met data aan de slag te gaan, is het verzamelen en opslaan van informatie essentieel. Organisaties kunnen ervoor kiezen om een datawarehouse te bouwen, zodat data verzameld en opgeslagen wordt op één centraal punt. Voordelen van een goed datawarehouse zijn: consistentie, het besparen van tijd, het kunnen bijdragen aan de datakwaliteit en een hoge return on investment (Datawarehouseinfo.com, N.D.). Deze voordelen zijn enkel van toepassing bij het correct bouwen en inrichten van het datawarehouse. Het nadeel van het opzetten van een datawarehouse zijn de initiële kosten.
Het is een organisatie namelijk aan te raden om met een gespecialiseerde partij in zee te gaan bij het bouwen en inrichten van een datawarehouse. Het proces is relatief technisch en er zijn tal van randzaken waar organisaties veel aandacht aan dienen te besteden. Een voorbeeld is het opslaan van (persoons)gegevens in de cloud. Staan deze gegevens dan op een server in Nederland, Europa, daarbuiten of een combinatie van locaties?
Een alternatief voor een datawarehouse is een Data lake. Het voordeel hiervan is dat allerlei soorten data redelijk eenvoudig opgeslagen kunnen worden. Een Data lake maakt echter geen gebruik van relaties in tegenstelling tot een datawarehouse.
Kortom, een organisatie dient goed na te denken over een datawarehouse en alle bijkomende aspecten.
Analyse mogelijkheden
Zodra een organisatie data verzameld heeft en opgeslagen, kan het analyseren beginnen. Het is voor een analist van essentieel belang om het doel van de analyse helder te hebben. Het doel bepaalt namelijk de verdere aanpak van de analyse. Een goed doel is specifiek, meetbaar, acceptabel, realistisch en tijdsgebonden. Nadat het doel helder is bij alle betrokkenen van de analyse, begint de zoektocht naar data. Data kan zowel in de eigen organisatie te vinden zijn, opensource zijn en/of betaald beschikbaar zijn. Het doel bepaalt welke data het meest geschikt is en in welke vorm. Een combinatie van het doel en de beschikbare data bepalen de analysetool. Bekende analysetools zijn Excel, Python, R en Microsoft SQL.
Het voordeel van zowel R als Python is dat beide open source zijn. Iedere computer met een internetverbinding kan deze softwareprogramma’s downloaden. Daartegenover staat dat beide een relatief steile leercurve hebben ten opzichte van Microsoft SQL. Het is een goed idee om analyses veelal zelf uit te voeren. Het voordeel hiervan is dat er geen blackbox ontstaat bij het uitvoeren van de analyse. Tot slot is het belangrijk om gemaakte keuzes binnen de analyse en de gevolgen daarvan voor de uitkomst helder te hebben.
Vertaalmogelijkheden bij datagedreven werken
Na het uitvoeren van de analyse komt het moeilijkste gedeelte van datagedreven werken. De uitkomsten van de analyse dienen vertaald te worden naar concrete acties. Daarbij komt ook nog dat deze concrete acties moeten passen binnen het beleid en de strategie van de organisatie. Afhankelijk van het gestelde doel komt er een gewenst eindproduct. Neem als voorbeeld een model dat voorspelt wat er geconsumeerd wordt in een vliegtuig op een vlucht van A naar B. Op basis van het model wordt berekend welke voorraad (voornamelijk eten) aan boord van het vliegtuig komt.
Een model heeft een bepaalde nauwkeurigheid, waardoor de mogelijk bestaat dat er nee-verkoop plaats zal vinden. Dit is ten eerste gemiste omzet/winst en ten tweede heeft het een negatieve invloed op de tevredenheid van de passagier. Om het model te vertalen naar beleid dient er een afweging gemaakt te worden tussen te veel voorraad en nee-verkoop. Hier ontstaat het snijvlak tussen de data-analyse en de business strategie/visie van de organisatie.
Juridische en ethische aspecten
Elke organisatie dient zich af te vragen welke juridische en ethische aspecten van toepassing zijn. In het model dat bepaalt welke voorraad aan boord komt van het vliegtuig zijn honderden variabelen meegenomen. Er bestaat een aanzienlijke kans dat nationaliteit er een van is. Bij een model voor de luchtvaartmaatschappij is dit geen enkel probleem. Bij het model van de Belastingdienst waar potentiële fraude wordt voorspeld is dit echter wel een probleem. De Belastingdienst kan deze variabele niet gebruiken omwille van juridische en ethische redenen. Er dient binnen de organisatie in kaart gebracht te zijn welke juridische en ethische aspecten van toepassing zijn.
Kortom is het proces van datagedreven werken uitdagend. Het is een groot leerproces, waarbij ongetwijfeld fouten gemaakt gaan worden. Het maken van fouten is niet erg, en de voordelen van datagedreven werken wegen hier tegenop. Alle vier de componenten zijn van essentieel belang en dienen op elkaar afgestemd te zijn.