Alweer de 4e editie van de Big Data Expo in de Jaarbeurs in Utrecht. Het evenement wordt elkaar jaar bezocht door meer dan 5.000 bezoekers, en er staan 85 exposanten op de beurs. Ook zijn er meer dan 100 lezingen verdeeld over 2 dagen tijd. Hierbij een selectie van de lezingen.
Booking.com was aanwezig met twee mensen. Deze lezing werd verzorgd door Jorden Lentze (Product Owner E-Commerce) en Anne Zuiker (Data Scientist). Bij booking zijn klantbehoeftes een belangrijke onderwerp. Toen Booking.com nog klein was, kwamen ze er achter dat er vaak vakanties werden gezocht naar de wintersportplaats Winterberg, echter hadden ze hier nog helemaal geen hotels die bij hun waren aangesloten. Ze hebben toen een team naar Winterberg gestuurd om hotels te overtuigen om zich bij Booking.com aan te sluiten. De week erna waren alle hotels in Winterberg uitverkocht door Booking.com.
Data is the fuel of hypothese, daar geloven ze in bij Booking.com. Om een hypothese te stellen heb je data nodig. Daarom heeft iedereen bij Booking.com ook toegang tot data, om zo voor hun eigen project ook zelf een hypothese te kunnen maken. Daarnaast wordt alles op atoomniveau getest en ontwikkeld. Dit wil zeggen dat alle veranderingen aan de website apart getest worden, en niet meerdere tegelijk, want anders kunnen de veranderingen elkaar beïnvloeden bij de resultaten.
Ook maakt het niet uit als een project faalt, ‘Embrace failure’. 9 van de 10 projecten zijn niet succesvol, maar daar gaat het ook niet om, het gaat erom wat je geleerd heb van de gefaalde projecten. Ze maken soms ook gebruik van de ‘Fail fast’ methode, waarbij ze wijzingen van de website voor een x-aantal minuten voor 100% van het verkeer aanzetten, waarbij ze dus al snel kunnen zien of het werkt of niet.
Een ander lezing was die van Jean Paul van Schoonhoven, partner bij Legal2Practice, een bedrijf wat zich onder andere specialiseert in het bewaren en het gebruik van Big Data, en daar ook trainingen over geeft.
Schoonhoven vertelde dat we digitale predestinatie moeten voorkomen. Dit wil zeggen dat we mensen niet moeten gaan profileren op basis van gegevens uit big data. Een voorbeeld wat gegeven werd is dat mensen die ongezond leven, meer moeten betalen voor hun zorgverzekering.
Legal2Practice is voorstander van het principe: ‘Privacy by Design’:
Denk vooraf na welke data je gaat opslaan, waarom je deze gaat gebruiken, en hoe je dit veilig kan doen.
De diensten/producten die geleverd worden, moeten direct veilig zijn.
Tijdens de ontwikkeling van een product of dienst staat privacy centraal.
Privacy en beveiliging moeten hand in hand samenwerken, het een moet niet ten koste gaan van het ander.
Privacy wordt gedurdende de volledige product-lifecycle gewaardborgd, vanaf het opslaan tot het vernietigen ervan.
Transparantie wekt vertrouwen op bij de klant, en laat zien dat privacy ook voor jouw belangrijk is.
De gebruiker/klant staat in de spotlight, en zij weten wat er met hun data gebeurd.
IBM was de afgelopen jaren aanwezig op het Roskilde Festival in Denemarken, waar ze vanuit de organisatie de vraag hadden gekregen of ze met behulp van data nieuwe inzichten konden verkrijgen. Deze data hebben ze onder andere geanalyseerd:
Het voorspellen van de menigte gebeurde via de app die beschikbaar was tijdens het Roskilde Festival. Bijna 45.000 unieke gebruikers werden getracked tijdens het festival, om zo een goed beeld te krijgen hoe de festivalgangers zich over het terrein bewegen. Deze informatie was handig voor de organisatie zodat ze snel konden ingrijpen als er bepaalde plekken ’te vol’ dreigde te raken.
Ook heeft IBM gekeken naar de populariteit van artiesten. Ze hebben niet gekeken naar de hele grote acts, maar de kleinere acts waarbij het soms lastig in te schatten is welke grootte ze nodig hebben qua stage. Dit hebben ze onder andere gedaan door data van Spotify te scrapen, maar ook door middel van de GPS data van de app van de jaren daarvoor. Zo hebben ze de organisatie toch enkele keren kunnen adviseren om bepaalde bands groter of kleiner te laten spelen.
Als laatste hebben ze ook het WC gebruik geanalyseerd. Dit hebben ze gedaan door middel van 4 weegschalen onder een aantal Wc’s te monteren, verspreid over alle area’s van het festival. Door middel van de weegschalen konden ze dus zien hoe druk het was bij de Wc’s gedurende de dag, maar ook of ze al waren schoongemaakt of niet. Zo zagen ze bijvoorbeeld dat een WC in Area 1 steeds zwaarder werd, en dat er geen bezoekers meer naar die WC’s gingen. Dit hebben ze gemeld bij de organisatie, en wat bleek, door een fout in het schoonmaakschema waren ze die complete area vergeten schoon te maken.
Gerard Schouten, lector “Big Data” bij Fontys Hogeschool ICT en geeft naast onderwijs applied data science onderzoek vorm hield een lezing over AI en Big Data.
Er is een explosie van toepassingen van Neural Nets en Deep learning. Wat kunnen deze wel en wat kunnen ze niet. Elke organisatie beschikt tegenwoordig over steeds meer data. Dit roept de vraag op hoe uit deze data waarde voor de organisatie gecreëerd kan worden. Steeds meer bedrijven omarmen daarom AI en deep learning (neurale netwerken). Deep learning is erg “data hungry” en kan complexe taken die typisch menselijk handelen en denken vereisen (deels) uitvoeren. Hiermee kunnen patronen in data ontdekt worden. Bijvoorbeeld om gezichten en zelfs emoties te herkennen, fraude in administratie te detecteren of te voorspellen wanneer je proactief onderhoud zou moeten plegen.
In zijn lezing vroeg hij hoe een machine verschil tussen tussen zalm en zeebaars kan zien. TNO heeft een systeem ontwikkeld dat gebruik maakt van een speciale sonar aan boord om vissoorten te onderscheiden. Sonar zendt korte geluidspulsen uit en luistert naar de signalen die terugkomen. Hoewel de verschillen klein zijn, heeft elke vissoort zijn eigen akoestische eigenschappen.
Daarnaast ziet Gerard Schouten binnen afstudeer- en minoropdrachten dat er steeds meer vraag van bedrijven komen aan software engineers en business analisten die AI vorm geven.
Deze blogpost is geschreven samen met Melvin Achterhuis.