Online05.04.2013

De Waarde Van Data


de-waarde-van-data.jpg
de-waarde-van-data.jpg

Big data is overhyped en kan nu al bijna niet meer voldoen aan het verwachtingspatroon dat gecreëerd is door leveranciers en consultants. Maar wat is nu echt de waarde van (big) data? Hieronder een aantal voorbeelden waarin verschillende interpretaties van de waarde van data de hoofdrol spelen.

Apple – Goeie data, slecht resultaat. Afgelopen jaar kwam Apple op het idee zijn eigen Apple Maps te maken. Goed idee maar slechte uitvoering zo bleek. De kaartweergave leek op een aardbeving in San Francisco. Nadat eerst met het vingertje werd gewezen naar de data van Tom Tom, bleek dat de app gewoon niet deugde. Gevaarlijk, want de Australische politie had handen vol werk om in de woestijn verdwaalde reizigers te redden die op weg naar de stad waren.

Big Bang  – Signaal of ruis? Radio astronomen Wilson en Penzias waren maanden bezig met het kalibreren van hun radiotelescoop maar slaagden er niet in van een vreemde statische ruis af te komen en dachten aanvankelijk dat de apparatuur niet goed werkte. Uiteindelijk kwamen ze er achter dat de ruis een signaal uit het verleden was: de overblijfselen van de oerknal. Met big data krijgen we zowel meer ruis als signaal en het is niet altijd zonneklaar wat signaal en wat ruis is.

Chris Anderson – Data is alles. In tegenstelling tot 20ste eeuwse wetenschapsfilosoof Karl Popper vindt Chris Anderson, voormalig hoofdredacteur van Wired magazine, dat wetenschap overbodig is. Door de overvloed aan data zouden we meer tijd en moeite moeten besteden aan het bestuderen van data i.p.v. theorievorming. Of, zoals hij het in zijn artikel “The End of Theory” beschreef: “Correlation supersedes causation, and science can advance even without coherent models, unified theories, or really any mechanistic explanation at all.” Brute kracht wint van intellect en kan de wetenschap een enorme boost geven juist omdat data geen mening heeft.

Diederik Stapel – Data is ondergeschikt aan de uitkomst. Diederik Stapel geloofde als wetenschapper heel sterk in de kracht van data om maatschappelijke verschijnselen te verklaren. Zo onderbouwde hij de stelling dat vleeseters hufteriger zijn dan vegetariërs met onderzoeksdata. Om deze bewering te bewijzen verzon en masseerde hij onderzoeksdata net zo lang tot dat hij het gewenste resultaat had. Data en feiten zijn niet hetzelfde.

Jacko – Zonder data kan je toch winnen. Gorilla Jacko wist 12 jaar lang de beursprofessionals te verslaan. Pas in 2012 ging hij onderuit. Ook het clownsduo Franky en Milco kenden soortgelijke successen met stockpicking. De vraag dringt zich op of meer data en complexere modellen betere resultaten geven. Op de beurs win je door het beter te doen dan het gemiddelde. Als iedereen meer middelen er tegen aan gooit, zullen er toch altijd beurshandelaren zijn die verliezen. Hebben we het hier over een ‘race to the bottom’?

ICCP – Correlatie versus causaliteit. De mens is bijzonder goed in het herkennen van patronen. Probleem is dat men bij correlerende verschijnselen bijna automatische probeert een causaal verband te leggen. Klimatologen verbonden aan het ICCP probeerden het verband te leggen tussen de opwarming van de aarde en de groeiende impact van het menselijk handelen. Hoewel broeikasgassen als CO2 en methaan de eigenschap hebben warmte in de atmosfeer vast te houden en dus bijdragen aan de opwarming van de aarde is het vrijwel onmogelijk om een direct causaal verband te leggen met de toenemende intensiteit van menselijk gedrag in relatie tot de aarde. Juist de neiging naar een oorzakelijk verband toe te redeneren, zorgde voor zoveel commotie dat er ernstig getwijfeld werd aan de objectiviteit van de ICCP wetenschappers. Het gevolg was dat het debat over de opwarming van de aarde meteen aan relevantie en urgentie verloor.

Minority Report – Data is overbodig, de toekomst staat vast. In de film Minority Report, naar het gelijknamige verhaal van Philip K. Dick wordt er van uitgegaan dat de toekomst vastligt. De pre-cogs (waarzeggers) kunnen misdaad en dader voorspellen. Data was niet meer nodig. Uiteindelijk waren twee van de drie pre-cogs nep, zegde slechts één waarzegger waar en was het geheel een op angst gebaseerde methode om misdaad te onderdrukken. Wat ze in de film wel nodig hadden was heel veel data om uit te vinden waar de toekomstige crimineel zich bevond; dat wisten de pre-cogs schijnbaar niet.

Blue CRUSH – Data vertelt nooit het volledige verhaal. Het door de politie van Memphis Tennessee in gebruik genomen Blue CRUSH-systeem ( Crime Reduction Utilizing Statistical History) is een doorslaand succes. Althans zo werd door de politie naar de pers gecommuniceerd. Door misdaad in al zijn facetten te vast te leggen en met allerlei omgevingsinformatie te integreren en analyseren, weet men waar en wanneer en onder welke omstandigheden de kans op misdaad het grootste is. Vervolgens is het laten rijden van een extra patrouille wagen voldoende om de misdaad te voorkomen. Probleem is dat voor het plegen van een misdaad er meestal sprake is van motief, gelegenheid en middel. Alleen de gelegenheid tijdelijk wegnemen zal geen blijvende werking hebben. Het zal hooguit het tijdstip, de omstandigheden of plaats veranderen. Buiten dat werd er niet over online criminaliteit gerept. Als misdaad het geld volgt en 90% daarvan ergens online is, dan ligt groei van door geld gedreven criminaliteit via het internet voor de hand. Lastiger wordt het voor de Memphis Police Department om een patrouilleauto naar Oost Europa te sturen.

Robbert Dijkgraaf – Random data maakt toekomst onvoorspelbaar. Gedurende het college van Robbert Dijkgraaf over de kleinste bouwstenen van het universum was er een vraag uit het publiek die luidde: als we van de allerkleinste bouwstenen van ons universum weten wat de richting en snelheid is en we zouden hier krachtige algoritmen en computers op loslaten, kunnen we dan de toekomst voorspellen? Nee, zei Dijkgraaf en liet aan de hand van een geigerteller zien dat hoewel hij met zekerheid kon zeggen dat deze zou uitslaan als hij het boven de radonwijzerplaat van een oud horloge hield, hij toch niet kon voorspellen wat het patroon zou zijn. Dat blijft random. De toekomst ligt dus niet vast zo concludeerde hij.

Data is de nieuwe heilige graal. Het is niet moeilijk je voor te stellen dat het combineren van grotere, meer diverse en sneller verversende datasets een enorme potentie waarde vertegenwoordigt. Met de huidige rekenkracht en software kunnen we alles, hoe ongerijmd dan ook, analyseren en daarmee de waarde van data ontsluiten. Maar in tegenstelling tot het geloof in de mogelijkheden van data staat de data-wetenschap nog in de kinderschoenen en is het onnauwkeurig omgaan met data en het verkeerd interpreteren van data een typisch menselijke eigenschap. Daarnaast lijkt het nieuwe data-denken te verordonneren dat alles met data kan worden verklaard mits je over voldoende relevante data beschikt. Maar ja, “voldoende” en “relevant” zijn geen objectieve kwalificaties. Data mag dan de nieuwe pijler zijn van de wetenschap maar Popper kan nog niet worden afgevoerd. Integendeel, we zullen harder moeten nadenken dan ooit te voren.

Deze blogpost is geschreven door Marcel Warmerdam, principal analyst bij The METISfiles.

...

Verder lezen over Big Data

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Metadatamanagement is de sleutel tot het ontsluiten van de waarde van data. Air France-KLM bouwde met behulp van het Data Intelligence Platform van SAP-partner Collibra een ‘data catalog’. Hiermee kunnen gebruikers snel achterhalen welke data beschikbaar zijn, waar deze te vinden zijn en wie verantwoordelijk is voor de kwaliteit.

Technology28.10.2024

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Last van datacenters? Dan bouwen we ze gewoon in zee

Er is veel spanning als het om datacenters gaat. Is het in de zee laten zakken van de cloud een optie?

Technology12.09.2024

Last van datacenters? Dan bouwen we ze gewoon in zee

Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud

Als een van de eerste overheidsorganisaties heeft de provincie Noord-Brabant SAP S/4HANA naar de cloud gemigreerd met behulp van RISE with SAP en SAP-partner Ctac. Deze stap maakt informatie nog sneller beschikbaar voor het uitvoeren van kerntaken, waardoor de provincie efficiënter en sneller antwoorden kan vinden op cruciale vragen.

Technology04.07.2024

Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud

Informatie nog sneller beschikbaar
Zo denken Nederlandse datacenters energie te kunnen besparen

Vertegenwoordigers van de datacenters in Nederland hebben de koppen bij elkaar gestoken om energie te besparen.

Nieuws27.06.2024

Zo denken Nederlandse datacenters energie te kunnen besparen

Nieuwe versie van de Technologie Kieswijzer staat online

Het zal niemand ontgaan dat we met zijn allen opnieuw naar de stembus moeten gaan. De vervroegde Tweede Kamerverkiezing vindt plaats op 22 november 2023. De laatste Tweede Kamerverkiezing vond plaats op 17 maart 2021. To...

Technology25.10.2023

Nieuwe versie van de Technologie Kieswijzer staat online

KNMI moderniseert datastrategie met AWS

Het KNMI heeft een nieuwe, moderne datastrategie geïmplementeerd met behulp van Amazon Web Services (AWS). Daarmee past het meteorologische instituut de mindset en processen van een datagedreven organisatie toe. Behalve...

Technology11.05.2023

KNMI moderniseert datastrategie met AWS

Voor betere detectie en classificatie van seismische activiteit
Wikidata bereikt grens van 100 miljoen data items

Wikipedia kennen we allemaal. Wikidata is wat minder bekend. Dit 'zusje' van Wikipedia heeft afgelopen week de mijlpaal van 100 miljoen items bereikt. Tien jaar geleden begon Wikidata als centrale opslagplaats voor gest...

Online21.10.2022

Wikidata bereikt grens van 100 miljoen data items

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

De Big Data Expo is helaas afgelopen, maar je kunt nu alvast 13 en 14 september 2023 in je agenda noteren. Dan vindt in de Jaarbeurs namelijk de Big Data Expo 2023 plaats. Nieuwsgierig wat je daar zoal kunt verwachten? D...

Marketing20.09.2022

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

Verder lezen over Data

Dit is de innovatieve Control Room van Team Visma | Lease a Bike

Team Visma | Lease a Bike, een van 's werelds beste wielerploegen, zet een grote stap in technologische innovatie met de lancering van hun gloednieuwe Control Room. Deze hypermoderne mobiele unit, uitgerust met de nieuwste technologieën en apparatuur, maakt zijn debuut tijdens de Tour de France, die zaterdag 29 juni in Florence van start gaat.

Technology27.06.2024

Dit is de innovatieve Control Room van Team Visma | Lease a Bike

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

De behoefte aan gezondheidszorg neemt wereldwijd toe. Dit gaat gepaard met een groeiende behoefte aan moderne technologie ter ondersteuning van de patiëntenzorg. Uit nieuw onderzoek van SOTI blijkt dat 78% van Nederlandse zorgverleners vindt dat organisaties moeten investeren in nieuwe technologie.

Cybercrime27.06.2024

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

​Zoveel datacenters: wat zijn de voors en tegens?

In Noord-Holland is Middenmeer een soort ultra-datacenterlocatie. Het is ook vaak uit die plaats dat er berichten komen over wat omwonenden ervan vinden (spoiler: het is niet positief), maar nu zelfs arbeiders die demons...

Online31.10.2023

​Zoveel datacenters: wat zijn de voors en tegens?

Doek valt definitief voor een datacenter in Zeewolde

Het was door alle commotie, bezwaren en andere randzaken al hoogst onwaarschijnlijk geworden dat het mega datacenter dat Meta wilde gaan bouwen in Zeewolde nog door zou gaan. Welnu, vandaag is het doek definitief gevalle...

Technology20.09.2023

Doek valt definitief voor een datacenter in Zeewolde

Er komen beperkingen op de cloudopslag van Dropbox

Terwijl WhatsApp het steeds makkelijker maakt om grote foto’s te versturen, besluit Dropbox niet om zijn diensten aantrekkelijker te maken, maar legt het ze juist aan banden. Dropbox, dat altijd een ongelimiteerde opti...

Online25.08.2023

Er komen beperkingen op de cloudopslag van Dropbox

Europa en Amerika gaan datadelen weer toestaan

Vroeger was er tussen Europa en de Verenigde Staten het Privacy Shield: een overeenkomst waardoor de data van Europese burgers in de Verenigde Staten kon worden opgeslagen, zonder dat het daarbij in handen kwam van de VS...

Online11.07.2023

Europa en Amerika gaan datadelen weer toestaan

Komt Threads dan nu wel naar Europa?
Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

Datalekken in de zorgsector in Nederland blijven toenemen. De Autoriteit Persoonsgegevens (AP) heeft recentelijk aangegeven dat Nederlandse burgers ervan uit moeten gaan dat hun persoonlijke gegevens waarschijnlijk al ge...

Cybercrime28.06.2023

Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

41% van de gezondheidszorgorganisaties sinds 2021 te maken heeft gehad met een datalek
Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla

Naar aanleiding van een tip van haar Duitse collega’s in Brandenburg is de Autoriteit Persoonsgegevens (AP) een onderzoek gestart naar een mogelijk datalek bij Tesla. Daarbij zouden, dat meldt de Duitse krant Handelsbl...

Cybercrime26.05.2023

Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla