Er BIG DATA som Keops pyramiden?

I kategorien Indlæg af efficiens

Keopspyramiden er det ældste og det eneste overlevende af verdens syv underværker, bygget omkring 2560 f. Kr.og ligger i Giza i nærheden af Kairo. Der findes en lang række teorier om hvordan pyramiden er blevet bygget. Endnu er der ingen der fundet ud hvad der egentligt skete, og hvordan det var muligt at bygge et sådan storslået bygningsværk med de daværende tilgængelig ressourcer.  Er der en lighed i forhold til anvendelse i af BIG DATA? Vil vi i fremtiden blive vant til at se en sammenhæng uden af forstå den?

Inden det blev moderne med ”BIG DATA”, opstillede man typisk en række hypoteser, der udmøntede sig i en række undersøgelsesspørgsmål. Herefter blev data indsamlet og analyseret. Dette var så grundlaget for,  om hypoteser kunne bekræftes eller afkræftes. For derefter at igangsætte handlinger baseret på dette. Tidsforløbet var typisk langt.

Med BIG DATA kan tilgangen flytte fokus fra,  at søge sammenhænge til at proaktiv at eksponere sammenhænge.

 

Med BIG DATA indsamles og analyseres data løbendes fra en række forskellige kilder, der kan være tale om både struktureret data og ustruktureret data.  De fundne sammenhænge eksponeres og korrelationer findes. Indsigt eksponeres via dashboards og der foretages handlinger baseret på disse. Tidsforløbet er typisk kort, måske endda realtid.

Men faren er så om vi forstår hvorfor sammenhængen er som den er? Altså analogt til Keops. Vi kan se den er er der, men har ikke forstået hvordan den er kommet der! I BIG DATA regi er jo centralt at kende denne, hvis vi arbejder efter at skulle anvende BIG DATA til at skabe gensidig værdi for kunde/borger og virksomhed samfund.

Et eksempel – Da orkanen ”Frances” var på mod USA´s kyster besluttede supermarkeds kæden Mal-Mart sig for at analysere salgsdata fra tidligere orkaner. Det var ingen overraskelse af fx. salget af lommelygter steg eksponentielt, ligesom salget af øl steg enormt. Det kom derimod som en stor overraskelse, at salget af jordbær Pop-Tarts blev syvdoblet. Desuden var der et afledt salg af brødristere til at varme disse Pop-tats på. Denne information var med til at sikre forsyninger og dermed at optimere salget hos Val-Mart. Den eneste udfordring var så at finde en forklaring på dette fænomen.

Der var ingen som umiddelbart kunne forstå dette og de har stadig ikke fundet et svar. Det er måske en farerne ved en ensidig teknologisk og automatiseret anvendelse af BIG DATA? Hvis man forstår sammenhængen er man vel endnu bedre til at udvikle og fastholde en gensidig værdiskabelse?