Google Trends kan voorspellen wanneer er een griepuitbraak is. Uber zorgt ervoor dat de dichtstbijzijnde taxi binnen een paar minuten voor je op de stoep staat. Netflix geeft vrij accurate suggesties over welke series jij nog meer leuk zal vinden. Zomaar een paar voorbeelden van data-gedreven organisaties die data laten leiden in de bedrijfsvoering. Veel organisaties streven ernaar om op deze manier data-gedreven keuzes te maken. In de praktijk blijken veel organisaties echter nog lang niet zo ver te zijn. Welke stappen zijn er nodig om die stip op de horizon te bereiken?
Van standaard rapportages naar voorschrijvende analyses
De weg naar geavanceerde analyses en data science kan onderverdeeld worden in vier soorten analyseniveaus. In Figuur 1 is te zien dat naarmate de analyses geavanceerder worden, er des te meer waarde uit data gehaald kan worden. Aan de linkerkant staan de beschrijvende en diagnostisch analyse. Deze vorm van analyses kijken naar het verleden en geven daarmee inzicht in wat er gebeurd is en waarom. Veel organisaties zijn al lange tijd bekend met deze vorm van analyse. Vaak bestaat dit uit rapportages die gemaakt worden in spreadsheets of waarbij er gebruik wordt gemaakt van een visualisatie tool. Aan de rechterkant, en meest waardevolle voor een organisatie, zijn de voorspellende en voorschrijvende analyse. Met deze vorm van analyses wordt er gekeken naar de toekomst, om zodoende verschillende uitkomsten te vergelijken en uiteindelijk te kiezen voor de beste uitkomst met maximale winst.
Voorspellende en voorschrijvende modellen
Maar hoe komt een organisatie van ’spreadsheet rapportages’ naar baanbrekende voorschrijvende en voorspellende modellen? Hiervoor zijn drie veranderingen binnen de organisatie noodzakelijk:
1) een data-gedreven mindset binnen de hele organisatie
2) data beschikbaar en op orde
3) de juiste tools voor de juiste mensen beschikbaar stellen.
Veel organisaties zijn zich er sterk van bewust dat voordat er geavanceerde analyses gedaan kunnen worden, de data eerst op orde moet zijn. Ook moeten er tools komen. Vaak ondernemen organisaties al allerlei stappen om dit voor elkaar te krijgen (denk hierbij aan het inrichten van een datawarehouse of data lake, data opschonen en spelregels opstellen voor het gebruik van de data). Het eerste punt, de mindset, wordt echter vaak onderschat of er wordt weinig aandacht aan besteedt.
Figuur 1. De verschillende soorten analyses. Als randvoorwaarden om dergelijke analyse uit te kunnen voeren is er toegang nodig tot de databronnen (datawarehouse of data lake) en moeten er spelregels zijn opgesteld over het gebruik van de data (data governance).
Mindset data-gedreven organisatie
Zodra organisaties de keuze hebben gemaakt om meer data-gedreven te worden, zijn de meeste organisaties geneigd om zo snel mogelijk een data scientist in te huren of een data science team op te richten. Deze persoon of team krijgt vervolgens de opdracht om uit een brei van data, antwoord te geven op vraagstukken vanuit de business afdelingen. Deze aanpak is begrijpelijk, en lijkt op het eerste oogpunt een efficiënte manier om snel met interessante inzichten te komen. Echter, deze aanpak heeft een aantal nadelen.
Nadelen
Ten eerste bevindt de kennis zich bij een persoon of team. Hierdoor wordt er al snel een ‘blackbox’ situatie gecreëerd: de business afdeling komt met een vraag, het team laat er allerlei analyses op los en komt terug met (al dan niet teleurstellende) resultaten. De business neemt dit vervolgens als waarheid aan zonder dat zij weten wat er precies met de data gebeurd is. Op deze manier geeft het team antwoord op een specifiek vraagstuk, maar dit draagt niet bij aan het doel om de gehele organisatie data-gedreven te maken.
Ten tweede, is de data scientist zelf vaak niet tevreden. De business is geneigd om in dergelijke situatie elke datavraag door te spelen naar het data science team. Omdat het bedrijf vaak nog in de eerste of tweede fase van data-analyse zit (beschrijvende/diagnostische analyse) komen zij vaak met relatief eenvoudige vragen, zoals bijvoorbeeld het opstellen van een rapportage. Hierdoor blijft er voor de data scientist weinig tijd over om daadwerkelijk bezig te zijn met geavanceerde analyses.
Tot slot is deze manier van aanpak ook nadelig voor de business. Vanuit verschillende afdelingen komen er vragen aan het data science team, waardoor de lijst met opdrachten steeds groeit. Dit verhoogt de doorlooptijd van een aanvraag aanzienlijk. Daarnaast is het voor data scientists in het team erg lastig in te schatten welke items van de ene afdeling voorrang hebben op items van een andere afdeling.
Mindset veranderen
Deze nadelen kunnen opgelost worden door het veranderen van de mindset binnen de gehele organisatie. Het streven is dat iedereen binnen de organisatie een beetje kennis krijgt over hoe data gebruikt kan worden. Hierdoor wordt de ‘blackbox’ situatie tegen gegaan. Het is daarbij sterk aan te raden om binnen elke afdeling iemand te hebben die zich kan buigen over de vraagstukken uit de eerste en tweede fase van data-analyse uit Figuur 1. Deze spreiding van kennis wordt vergemakkelijkt door het feit dat er dezer dagen veel tools beschikbaar zijn waarbij weinig tot geen kennis nodig is van programmeren. Hiermee blijft het gros van de vraagstukken binnen de specifieke afdeling, en blijft er voor data scientists meer ruimte over voor geavanceerde analyses.
Data scientist binnen een beginnende data-gedreven organisatie
Wanneer een organisatie zich nog in de beginnende fase bevindt wat betreft data-gedreven bedrijfsvoering, zal het voor een data scientist vaker regel zijn dan uitzondering dat het niet mogelijk is om geavanceerde data science projecten uit te voeren. Vaak is de data niet beschikbaar, verspreid over allerlei systemen of er zijn geen duidelijk spelregels over het gebruik van de data opgesteld. Dit betekent echter allerminst dat een data scientist overbodig is in deze beginnende fase. In tegenstelling, een data scientist kan een cruciale rol spelen in het verwezenlijken van data-gedreven mindset binnen de organisatie.
Allereerst kunnen de data scientisten binnen een organisatie de rol van educator nemen in het realiseren van meer kennis omtrent data binnen de organisatie. Hij/zij kan in alle lagen van de organisatie uitleg geven over data-analyse en data science om zodoende openheid en duidelijkheid te creëren en het blackbox-effect te verkleinen. Dit heeft ook als voordeel dat er vanuit de business afdelingen eerder aanvragen zullen komen die verder gaan dan uitsluitend beschrijvende en diagnostische vraagstukken. Daarnaast is het aan te raden om als data scientist, waar mogelijk, al zoveel mogelijk geavanceerde analyses te gaan doen. Dit zorgt niet alleen voor de eerste belangrijke inzichten waar de organisatie bedrijfsvorming op kan aanpassen, maar zorgt er ook voor dat een meer draagvlak gecreëerd wordt om te streven naar een data-gedreven organisatie.
Concluderend, het streven naar een data-gedreven mindset brengt die stip op de horizon steeds dichterbij.
Wil je ook aan de slag met data science? Bekijk onze vacatures voor het traineeship Business Analytics en Data Science!