11/05/2016 /big data, data-driven, smart data, stupid data

Data #1: De échte revolutie van data-driven werken is de stap van ‘stupid data’ naar ‘smart data’

Smart data is de koppeling van harde registratie-data aan zachte sense-data. We noemen het kortweg: de hard-zacht-koppeling. Big data gaat alleen om registratie-data en dat zijn ‘stupid data’.

Er is niets slims aan registratie-data, omdat in de registratie van al het menselijke handelen de intentie verloren gaat.

Je kunt niet meer aan de registratie van een handeling aflezen waarom mensen tot die handeling kwamen. Het is het grote struikelblok in datamarketing: de betekenis van het ontbreken van intentionaliteit is namelijk dat je geen voorspelbaarheid kunt ontlenen aan big data.

Smart data vraagt erom dat de hard-zacht-koppeling bij de meting zelf al wordt gemaakt. Als je deze koppeling alleen achteraf kan maken, heb je niet alleen statistisch een groot validatieprobleem, maar je krijgt als opbrengst alleen macro-perspectieven waar je op microniveau – en daar gaat alles om – niets mee kan doen.

Smart data is met andere woorden een fundamentele stap in denken en meten.
Op het moment dat de stap van big ‘stupid’ data naar ‘smart’ data wordt gemaakt – en dus de hard-zacht-koppeling – wordt data een tweedimensionaal begrip:

Smart data = {Y ; X} = { Sense data – de intenties ; Registratiedata – de feiten }.

Het is voor de mensen die vooral in de feitelijkheid verblijven vaak onmogelijk om je iets voor te stellen bij dit duale karakter dat een feit altijd heeft. Altijd is er een ‘schaduwkant’ die we niet zien en er toch is. Een feit is niet meer dan de belichte voorkant van de maan, de achterkant van de maan zijn de ‘senses’.

Hoe lastig ook om je een voorstelling te vormen van zo’n duale (bi-polaire) informatie-eenheid, het is toch vooral een kwestie van wennen aan een ander output-format. Dat wennen gaat daarom snel.

De fundamentele stap in hoe het werkt:

Registratiedata vormen de filters: met filters selecteer je contexten. Een context is bijvoorbeeld: ongetrouwde mannen met modaal inkomen boven de dertig in een wijk in Utrecht. Die contexten zijn verbonden met patronen in de sense-data.

In de sense-data zie je de intenties die in die geselecteerde context liggen opgesloten. Je kunt die intenties op veel manieren kwantitatief verbeelden en gedrag en cultuur in al z’n schakeringen blootleggen: houdingen, gedrag en denken, emoties en gevoelens, operationele besluitvaardigheid, sociale vaardigheid, tactisch en strategisch denken, etc. Grafische lay-out doet de rest.

Elke context heeft zijn eigen specifieke ‘duimafdruk’: een voorspelbaar patroon waarop je bijvoorbeeld als marketeer, bestuurder of auditer kunt inspelen. Nu pas heb je ‘de klant’ in beeld: niet meer alleen in wat hij doet, maar ook in waarom.

In vakmatige zin gaat de stap om veel meer dan technologie alleen. Het is een multidisciplinaire optocht van theoretische natuurkunde, psychologie, neurobiologie, sociologie, antropologie, fenomenologie, die zich voegen bij bedrijfskennis, wiskunde, statistiek, ICT.

De stap waar we het hier over hebben, is voor iedereen een grote stap. Bijvoorbeeld voor theoretisch natuurkundigen. De vraag naar de betekenis van wat gemeten wordt – het beroemde meetprobleem waar namen als Einstein, Bohr, Heisenberg, Bohm mee verbonden zijn – komt in het begin van de theorievorming wel aan bod in de natuurkundestudie, maar daarna wordt overgegaan tot de orde van de dag. Een dagelijkse orde waarin de natuurkundigen hun gelijk halen als verbanden ‘waar’ worden bevonden en er aan toepassingen gedacht kan worden. Denk maar aan de recente opwinding dat zwaartekrachtgolven bestaan. De vraag naar de betekenis van deze verbanden en toepassingen hiervan is in deze flow secundair. Je hoeft geen statisticus te vragen naar betekenis, die stelt slechts vast dat iets correleert. Business-gedreven denk je vervolgens aan toepassingen. Of die toepassingen betekenisvol zijn voor de samenleving, is niet een vraag die dan (direct) opkomt.

In het beginstadium van ontwikkeling en exploitatie van smart data is het een illusie om te denken dat je alle benodigde expertise in de eigen organisatie zelf tot ontwikkeling kunt brengen. Later in de evolutie van deze technologie is dat weer wel waarschijnlijk. Vergelijk dat met de ontwikkeling in het energie-landschap: energielevering begint als iets dat je levert vanuit grote centrales en het eindigt met kleine energie-fabriekjes in elk huis, oftewel: er ontstaan eerst centrales van smart data en later in de ontwikkeling heeft elke organisatie z’n eigen smart data capaciteit.

Dat is een breuk met de ontwikkeling die we nu zien: in bijna alle organisaties van enige omvang zijn big-data-afdelingen opgericht. Wat al die nieuw opgerichte afdelingen gaan merken: dat er geen betekenis zit in die big data, omdat het registratie-data zijn. Weggegooid geld? Vermoedelijk wel. Tegelijk kun je zeggen: het is leergeld dat je betaalt.

Voorspelling: big data afdelingen gaan niet succesvol worden

Big data afdelingen zijn geld verslindende afdelingen met te weinig rendement, zolang die afdelingen blijven proberen om betekenis uit big data te halen, die er niet in zit.

Je clustert expertise en management aandacht, omdat je denkt dat je er grote stappen mee vooruit kan zetten. Met die intentie is niets mis. Met de uitvoering is van alles mis, omdat organisaties doodeenvoudig niet over de vakkennis beschikken die nodig is om betekenissen uit smart data te halen. Dat is een totaal ander vak dan correlaties vaststellen die in big (stupid) data zitten.

Written by

Berend Jansen

Data #1: De échte revolutie van data-driven werken is de stap van ‘stupid data’ naar ‘smart data’

Voorspelling: big data afdelingen gaan niet succesvol worden

Leave a Reply Cancel

Bedrijfsgegevens