Hoe goed datamanagement problemen voorkomt

Door Fabian van Leijden | 16 juni 2017
Datagedreven

De meeste organisaties beschikken anno 2017 over enorme hoeveelheden data. Dat is in potentie heel waardevol, maar wanneer er niet zorgvuldig mee wordt omgegaan, is het moeilijk om beschikbare data om te zetten naar waardevolle informatie. Zo zie je binnen veel bedrijven discussies ontstaan over de cijfers, bijvoorbeeld over wie de juiste cijfers heeft, waar de cijfers vandaan komen en dat de realiteit niet overeenkomt met de cijfers. Maar het gesprek zou eigenlijk moeten gaan over conclusies die je aan de cijfers kan verbinden. Daarnaast wordt er bij bedrijven die iets verder zijn, en zich bezighouden met ‘Big Data’, soms zoveel data verzameld dat niemand meer weet welke data er is of wat het betekent. Om zulke problemen te voorkomen, is datamanagement nodig: een ietwat saaie term, maar cruciaal voor iedere organisatie die met data werkt.

De juiste data

Waar data scientist ooit tot ‘sexiest job in the 21st century’ werd uitgeroepen, wordt datamanager misschien wel als minst sexy beschouwd. Toch zijn deze twee rollen onlosmakelijk met elkaar verbonden. Een data scientist kan pas effectief en efficiënt werken als hij beschikt over kwalitatief goede datasets. De datamanager zorgt ervoor dat de beschikbare data in een organisatie bekend, beveiligd en van kwalitatief hoogstaand niveau is. Zonder datamanagement zou de data scientist zich eerst bezig moeten houden met het vinden van de data, om vervolgens de betekenis ervan te achterhalen en de kwaliteit te controleren en verbeteren.

Mobilee’s data-expert Fabian van Leijden weet dit als geen ander: “Datagedreven werken wordt steeds belangrijker. Als je op basis van cijfers besluiten gaat nemen, dan wil je goed zicht hebben op de kwaliteit van de cijfers. Of als er processen op basis van algoritmes automatisch worden aangestuurd, dan moet de data die in de algoritmes wordt gebruikt van hoge kwaliteit zijn. Datamanagement draait om het verzamelen van de juiste data op de juiste plek in het juiste moment.”

“Datamanagement draait om het verzamelen van de juiste data op de juiste plek in het juiste moment.”

Discussie over de cijfers

Zonder datamanagement kan er flink wat discussie ontstaan over de cijfers, zoals recent bleek bij een project voor een grote gemeente, waarbij Fabian betrokken was. “Hier hanteerden verschillende medewerkers hun eigen, van elkaar afwijkende, Excel-lijsten. Als je bijvoorbeeld praat over het aantal mensen dat je aan een baan geholpen hebt, moet daar één cijfer voor zijn. Iedereen moet het erover eens zijn welk cijfer het is, uit welk systeem het verkregen wordt en hoe het wordt berekend.”

Om data waardevol te maken, begin je in ieder geval met het definiëren van de naar boven te halen data. Fabian legt uit: “Een van de meest ingewikkelde aspecten hierbij is dat je met taal bezig bent. Je probeert samen tot dezelfde definities te komen. Mensen denken al snel dat ze elkaar begrijpen, maar taal is vaak dubbelzinnig. Wat is bijvoorbeeld de definitie van iemand die ‘aan een baan geholpen’ is? Reken je dan onder andere ook de mensen mee die gaan studeren? Nadat deze discussie in breed verband werd beslecht, concludeerden we dat er geen eenduidige data uit het systeem gehaald kon worden die voldeed aan deze definitie. Toen werd duidelijk dat het datamanagement nog onvoldoende was ingericht.”

Hoe pak je datamanagement aan?

Dan volgt automatisch de vraag: hoe pak je datamanagement aan? “Dat is voor iedere organisatie anders”, aldus Fabian, “want iedere organisatie heeft een ander startpunt en doel. Door gebruik te maken van een datamanagement framework, zoals het DAMA-DMBOK (Data Management Body of Knowledge), kunnen we organisaties helpen om de juiste stappen te bepalen die op dat moment nodig zijn in de organisatie.” “Een veelvoorkomend probleem in dit project was dat het registreren van de beëindiging van de uitkering vaak mis ging. Medewerkers werden op dat moment gevraagd om in het systeem een keuze te maken uit een aantal opties waarom de uitkering werd beëindigd. Soms stond de juiste keuze er niet tussen of koos men standaard voor ‘Overig’. De keuzelijsten in het systeem moesten dus worden aangepast, zodat we wel de juiste informatie uit het systeem konden halen. Omdat dezelfde data ook voor andere doeleinden gebruikt werd, moesten er duidelijke procesafspraken komen over hoe deze referentiedata beheerd werd en wie er bevoegd was om aanpassingen te doen. Dit beheren van referentiedata is één van de processen van datamanagement.”

Zodra je weet welke data je gaat gebruiken, komt de kwaliteit ervan aan bod. Hiermee wordt onder andere bedoeld hoe compleet en accuraat de data is. Fabian: “Bij deze gemeente gingen we nog een stap verder dan kijken naar de volledigheid van de data. Wij gingen ook op zoek naar gevallen met een status die volgens het werkproces niet konden bestaan. Denk bijvoorbeeld aan een klant die wel een uitkering heeft, maar geen actief traject richting werk of participatie. In zo’n geval is er iets fout gegaan in het proces. De uitkering zou dan ofwel beëindigd moeten worden, omdat de klant een baan heeft gevonden of de klant zou een werktraject moeten volgen. Door dit soort gevallen zichtbaar te maken, werd de kwaliteit van de data inzichtelijk en kon er actief gestuurd worden op verder ontwikkeling ervan. Actief sturen op de kwaliteit van je data is een belangrijk proces in een datagedreven organisatie.”

“Actief sturen op de kwaliteit van je data is een belangrijk proces in een datagedreven organisatie.”

Direct resultaat

Om de juiste cijfers naar boven te halen, is het dus noodzakelijk om verschillende onderdelen van datamanagement goed in te richten. In het geval van de gemeente leidde dit ook direct tot resultaten: “Aan de ene kant stopte de discussie over cijfers: iedereen was het eens over wat en hoe er werd gemeten. Daardoor kon het gesprek weer gaan over hoe de cijfers geïnterpreteerd moesten worden en wat dit betekent voor de bedrijfsvoering. Aan de andere kant konden leidinggevenden nu met hun medewerkers praten over het belang van goede registratie. De medewerkers bleken bijvoorbeeld veel tijd te besteden aan registratie van informatie die nooit gebruikt werd en bleken essentiële informatie juist slecht in te voeren. Door het gesprek hierover aan te gaan, werd dit proces opgemerkt en konden administratieve lasten direct worden verlaagd.”

Wanneer je als organisatie aan de slag wil met datagedreven werken, is het dus ontzettend belangrijk om je data op orde te hebben. Je bent echter niet zomaar klaar met het inschakelen van een data-expert, want ook daarna moeten gegevens op orde blijven. Fabian: “We nemen het bedrijf aan de hand mee om de juiste datamanagement-processen in te richten die passen bij de organisatie, zodat het effect blijvend is.” Goed datamanagement is onmisbaar als je orde in data-chaos wil scheppen. Misschien dus niet zo sexy, maar wel cruciaal.