Big Data, hoe dan?

Per maand wordt er zo’n 10.000 keer op ‘Big Data’ gegoogled en mijn tijdlijn op Linkedin en Facebook staat vol met Big Data whitepapers. Je kunt er niet meer omheen, data is ‘hot’.

De voorbeelden van data-driven cases zijn talrijk, makkelijk te begrijpen en heel erg inspirerend. Geen wonder dat ieder bedrijf dat zichzelf serieus neemt ‘data’ op zijn roadmap heeft staan. Maar hoe begin je dan?

Ongestructureerde data vs. gestructureerde data

Laten we beginnen bij de term Big Data. Hoe verschilt dit dan van ‘gewone’ data. Dat heeft met een aantal factoren te maken:

  1. Volume
  2. Velocity
  3. Variety

Kort gezegd, het is heeeeeel veeel data, ook nog eens heel erg gevarieerd (tekst, video, foto etc.) en het verandert ontzettend snel, want er komt steeds nieuwe data bij.

Een makkelijk voorbeeld: Facebook. Er wordt van alles gepost, foto’s, video’s, tekst, producten etc. Het verandert constant en ja het is ontzettend veel data. Maar je kunt ook denken aan sensordata van machines die allemaal wat anders meten. Of transacties bij een bank waar je tegenwoordig ook foto’s bij kunt zetten.

Als data gestructureerd is zoals in een database, CRM systeem, boekhoudsysteem, dan is het geen Big data. Want alle data die daarin zit heeft een ‘label’ gekregen en betekent iets. Ook al is het heeeeeel veel data. Dan is het een grote database. 

Waarom wordt Big data zoveel gezocht?

Omdat onze computerkracht is toegenomen, is het makkelijker geworden om big data te analyseren. Daarom willen ook steeds meer bedrijven ermee aan de slag, voorheen kon dat gewoon niet en nu door allerlei technologische vooruitgang wel.

Wat kan ik morgen doen met (big) data?

Het liefste krijg je een uitgekristalliseerd dashboard voor je neus met de beste inzichten die het nemen van beslissingen makkelijker maakt. Dat is vaak het einddoel. Om daar te komen moet je je realiseren dat je zowel technische, wiskundige als business kennis moet combineren. Nog even los van het inrichten van een datawarehouse of data ecosysteem.

Maar dat betekent niet dat je moet wachten. Je moet toch gaan beginnen en het makkelijkste is om te beginnen met je eigen data die je al hebt. Precies, de gestructureerde data die je toch al binnen je organisatie hebt. Door daarmee aan de slag te gaan leer je al een heleboel en het allerbelangrijkste, je leert jezelf beslissingen en data te combineren. Waardoor je steeds meer gewend raakt aan het raadplegen van data en het een belangrijk onderdeel van je bedrijfsvoering wordt. 

Kortom, begin bij het begin, pak data die je al hebt en zorg dat je hier goede inzichten uit haalt.

Ps. Vergeet niet om je data in context te zetten!