artikel

Objectiviteit met big data is een illusie

Strategie

De gedachte dat op cijfers gebaseerde beslissingen – ‘evidence based decisions’ – per definitie beter zijn dan op intuïtie of associëren gestoelde berust op de illusie dat data objectief zijn. Het past in de opvatting van organisaties als systemen. Data worden dan opgevat als een grootheid die in en voor zichzelf bestaat, het is een ‘ding’. En vandaaruit worden ‘spannende’ aannames gedaan. Daaronder ligt de algemene aanname dat de cijfers altijd juist zijn.

Objectiviteit met big data is een illusie

Intuïtie heeft te maken met eigen ervaring, waarden en sociale conditionering; zij is dus subjectief. Bij het interpreteren van analyses speelt juist dat een grote rol. Een analyse van ook grote hoeveelheden data is daarmee altijd subjectief. Beperkingen en vooringenomenheid bij het werken met data zijn dus alom aanwezig. De gedachte dat alle data verzameld kunnen worden en dat vooringenomenheid bij het samenstellen van datasets kan worden uitgebannen, is daarom een illusie.

Zelfs als menselijk ingrijpen kan worden omzeild, blijft de uitputtend lijkende hoeveelheid data een uitsnede van de potentieel beschikbare data. Je kunt immers alleen verzamelen wat digitaal beschikbaar is, wat door de beschikbare technologie wordt bijeengebracht.

Die technologie ‘bekijkt’ de wereld vanuit een bepaald oogpunt. De systemen die de data verzamelen, doen dat met een, door ons, vooropgezet doel en dat is doorgaans een ander doel dan waarvoor we big-data-analyses uitvoeren. In plaats van een volstrekt coherent en consistent ‘wereldbeeld’ levert de technologie ons dus een verzameling losstaande beelden.

Een andere beperking is dat we de neiging hebben om data te gebruiken die in een model past. Grote hoeveelheden data lenen zich namelijk prima voor modellering. De gebruikte data beschrijven dan niet de wereld om ons heen, maar alleen dat gedeelte dat we met het model beschrijven. Het gevolg is dat de context verwijderd wordt waarbinnen data verzameld wordt of is. Daardoor verliezen de gegevens betekenis. Het managen van die context is dus een van onze grootste uitdagingen.

Dit probleem wordt nijpender wanneer we inderdaad correlaties laten prevaleren boven causale verbanden. Je weet dan immers niet wat er achter de correlatie zit, en dus ook niet waardoor die eventueel teniet gedaan zou kunnen worden.

Volgens Anderson (2008) worden we met de komst van big data gedwongen om data wiskundig te benaderen. Door de omvang ervan geven de patronen en relaties betekenis aan data. Om dezelfde reden verschaft het inzicht in complexe fenomenen. De geconstateerde samenhangen maken het zoeken naar causale verbanden overbodig. De zo verguisde intuïtie wordt gemechaniseerd. Daarna kunnen we er een context bij zoeken.

Hierbij wordt echter over het hoofd gezien, dat data binnen een bepaalde context ontstaan. Ze kunnen niet binnen die context verzameld en daarbuiten geanalyseerd worden. Wij maken bovendien zelf deel uit van die context, met bijvoorbeeld onze referentiekaders, ervaringen, waarden en opvattingen. Die nemen we mee in het opstellen van algoritmes en we nemen ze mee in het interpreteren van de uitkomsten van analyses.

Door: Jan Postema

Bron: Management Executive

Reageer op dit artikel
Lees voordat u gaat reageren de spelregels