artikel

Big data: wat bedrijven tegenhoudt bij het delven van het goud

Strategie

Big data zijn in de ogen van velen even waardevol als goud en olie. Maar ook al zitten organisaties boven op een goudmijn of oliebron, ze weten die vaak niet te ontginnen.

Big data: wat bedrijven tegenhoudt bij het delven van het goud
Big data als het nieuwe goud

Het volume aan data in de wereld heeft onvoorstelbare proporties aangenomen. Het wordt inmiddels gemeten in zettabytes: 1 ZB = 1.000.000.000.000.000.000.000 bytes = 1021 bytes = 1 biljoen GB = de opslagcapaciteit van ongeveer 250 miljard dvd’s. In 2009 bevatte alleen het internet 0,5 ZB. In 2011 bedroeg het totale volume aan digitale data in de wereld 1,8 ZB, en de verwachting is dat het groeit naar 90 ZB in 2020. 90% van alle digitale data is in de afgelopen twee jaar gecreëerd. Het gaat dus ook in dit opzicht om BIG data.

Het strategisch belang van big data is al even BIG: het is een gigantische bron van concurrentievoordeel. Tegelijkertijd lukt het de meeste organisaties niet om goed te profiteren van de goudmijn waarop ze zitten. Er zijn vijf barrières, zeggen Abdulkhaliq Alharti (Abu Dhabi University), Vlad Krotov en Michael Bowman (beiden Murray State University).

Barrières voor big data

De infrastructuur is er niet klaar voor. Het vergt grote investeringen in hard- en software om een IT-infrastructuur voor big data te ontwikkelen, en de meeste bestande technologieën zijn niet ontworpen op big-data-analyse. Vaak is de hoop gevestigd op architecturen voor cloudcomputing en heterogene computing. Maar die schieten meestal tekort in technisch en economisch opzicht (veel te duur). Oplossing: commodity-hardware voor het versterken van de verwerkingsvermogen en opslagcapaciteit.

Datacomplexiteit. Drie dingen spelen hier een rol. De hoeveelheid data groeit onvoorstelbaar snel, iets waar organisaties niet op zijn berekend. De data komen uit talrijke bronnen die data op verschillende manieren georganiseerd en gedefinieerd hebben. Daardoor ontstaan er semantische conflicten (de term earnings betekent bijvoorbeeld de ene keer ‘winst’ en de andere keer ‘inkomsten’ of ‘omzet’). Bovendien hebben de data allerlei formats, zowel gestructureerd (relationele databases) als ongestructureerd (tekstdocumenten, sms’jes, beelden, video’s, e-mails enzovoort). Dat maakt ze nagenoeg onhandelbaar en moeilijk te analyseren. Oplossing: gespecialiseerde softwaretools en algoritmes als MapReduce en Hadoop.

Gebrek aan vaardigheden. Er zijn weinig of geen medewerkers met de vereiste vaardigheden op het vlak van big-data-analytics of algemene analytics. Alleen al in de VS is er in 2018 een tekort van 120.00 tot 190.000 big-datadeskundigen. Oplossing: samenwerken met opleidingsinstituten.

Privacy. Zorgen over de privacy verhinderen vaak dat organisaties aan big-data-analytics gaan doen. Bij big-data-analytics gaat het immers vaak over persoonlijke data die met een geheel ander doel verzameld zijn. De wettelijke en ethische risico’s zijn groot. Oplossing: betere, gerichte wetgeving en toepassing van best practices voor de verwerking van gevoelige klantendata.

Culturele barrières. Sommige organisaties begrijpen gewoon te weinig van big data om de waarde ervan in te zien. Dat kan resulteren in weerstanden. Oplossing: een heldere organisatievisie op big data.

Big data boekentip:

Bron: Business Horizons

Door: Eduard Kerkman

 

Reageer op dit artikel