De redactie van Dutchcowboys is te bereiken via redactie@dutchcowboys.nl
Big Data Expo is een platform waar mensen en kennis samenkomen. Tijdens de 5de editie van de Big Data Expo op 18 en 19 september komen specialisten uit verschillende big data-disciplines en domeinen, samen in Jaarbeurs Utrecht. Met 5000 bezoekers, 120 lezingen en meer dan 85 exposanten is de Big Data Expo hét event als het gaat om data en analytics.
De thema’s die aankomende editie aanbod komen zijn; Analytics, AI, BI, Data Science, Digital Innovation, Ethiek, GDPR, IoT of Text Mining. In dit artikel besteden we aandacht aan de thema’s Text Mining en Data Science.
Text Mining
Voor het eerst een opzichzelfstaand thema tijdens de Big Data Expo. Zelfs relatief kleine organisaties genereren dagelijks grote hoeveelheden tekst die waarde creëren. Maar het is niet eenvoudig om die waarde eruit te halen gezien de enorme diversiteit en het volume van de gemaakte documenten. Het opkomende gebied van text mining is in staat om nieuw inzicht te verwerven, voorspellingen te maken en data om te zetten in bruikbare resultaten.
Tekst komt voor in een enorme variëteit aan systemen en documenten, ieder met een eigen structuur. Nog altijd is het zo dat het merendeel van alle data niet geanalyseerd wordt. En van alle nieuwe data die gecreëerd wordt is naar schatting 80% ongestructureerd. Dit gegeven, gecombineerd met de omvang en complexiteit vereist een aanzienlijke verwerkingskracht om inzicht en waarde op te leveren.
De uitdagingen met tekst, in tegenstelling tot meer gestructureerde gegevensbronnen is bijvoorbeeld het ontbreken van een consistente structuur. Het vakgebied text mining richt zich op het ontwikkelen van diverse geavanceerde wiskundige-, statistische-, taalkundige- en patroonherkenning technieken waarmee het mogelijk is om ongestructureerde informatie automatisch te analyseren alsmede om hoge kwaliteit en relevante gegevens te extraheren en de tekst in zijn geheel beter doorzoekbaar te maken.
Data Science
Data Science, letterlijk ook wel data wetenschappen genoemd, is de wetenschap die zich bezig houdt om kennis en inzichten te vergaren op basis van gestructureerde en ongestructureerde data middels verschillende methoden, processen en systemen. Deze inzichten kunnen descriptief zijn (wat is er gebeurd), verklarend (waarom is dat gebeurd), voorspellend (wat gaat er gebeuren) of actie georiënteerd zijn (wat kan ik doen). Hier komen Domeinkennis, Computer Science en Wiskunde & Statistiek samen. Maar wat betekenen deze begrippen eigenlijk, wat is de relatie daartussen en welke specialisten heb je hier voor nodig?
Domeinkennis
Domein gaat om de kennis van het vakgebied of project waar je data science gaat toepassen. Wanneer je bijvoorbeeld gaat werken voor een reisorganisatie is het belangrijk om kennis te hebben van het domein toerisme en de dynamiek in deze markt en business goed begrijpt. Pas wanneer je de materie goed begrijpt wordt het waardevol om data science in te zetten om de processen en besluitvorming te optimaliseren.
Specialist; data translator, dit is degene die zowel kennis heeft van de business als van de statistiek en kan de koppeling maken om deze op waardevolle wijze aan elkaar te koppelen.
Computer Science
Programmeren, het cleanen en prepareren van de ongestructureerde en gestructureerde data (data die klaar is om het model in te gaan) en het bouwen van een solide infrastructuur. Op het moment dat je weet welke data wel en niet het model in mag gaan kan je dit gaan automatiseren.
Specialist; data engineer, deze zorgt voor een goede infrastructuur om de modellen op te laten draaien.
Wiskunde & Statistiek
Om waarde uit je data te halen heb je kennis nodig van statistiek en wiskunde. Op basis van statistische modellen kunnen verbanden worden gelegd in grote hoeveelheden data. Door het herkennen van verbanden en patronen in het verleden kunnen voorspellingen worden gedaan over de toekomst en kan op basis hiervan de besluitvorming worden geoptimaliseerd.
Specialist; data scientist, dit is degene die met zijn uitgebreide kennis van wiskunde en statistiek de voorspellende modellen maakt.
Het inzichtelijk maken van data kan helpen bij het maken van beslissingen die waardevol zijn voor het bedrijf. Daarnaast kunnen deze inzichten ook nieuwe kansen creëren zoals bijvoorbeeld het optimaliseren van de customer journey.
Bezoek de Big Data Expo
Benieuwd naar meer? Kom dan op 18 en/of 19 september naar Big Data Expo waar onze experts je graag meer vertellen. Meld je gratis aan!
[Fotocredits © monsitj – Adobe Stock]
Verder lezen over Big Data
Technology28.10.2024
Air France-KLM legt fundament voor AI met sterk metadatamanagement
Technology12.09.2024
Last van datacenters? Dan bouwen we ze gewoon in zee
Technology04.07.2024
Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud
Informatie nog sneller beschikbaarNieuws27.06.2024
Zo denken Nederlandse datacenters energie te kunnen besparen
Technology25.10.2023
Nieuwe versie van de Technologie Kieswijzer staat online
Technology11.05.2023
KNMI moderniseert datastrategie met AWS
Voor betere detectie en classificatie van seismische activiteitOnline21.10.2022
Wikidata bereikt grens van 100 miljoen data items
Marketing20.09.2022
8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten
Verder lezen over Data
Technology27.06.2024
Dit is de innovatieve Control Room van Team Visma | Lease a Bike
Cybercrime27.06.2024
Veel zorginstellingen hebben last van DDoS-ransomware aanvallen
Online31.10.2023
Zoveel datacenters: wat zijn de voors en tegens?
Technology20.09.2023
Doek valt definitief voor een datacenter in Zeewolde
Online25.08.2023
Er komen beperkingen op de cloudopslag van Dropbox
Online11.07.2023
Europa en Amerika gaan datadelen weer toestaan
Komt Threads dan nu wel naar Europa?Cybercrime28.06.2023
Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe
41% van de gezondheidszorgorganisaties sinds 2021 te maken heeft gehad met een datalekCybercrime26.05.2023
Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla
Verder lezen over Nederland
Nieuws20.11.2024
Je zorgverzekering voor 2025 kiezen: hier moet je op letten
Technology18.11.2024
Onderzoek: Mkb heeft behoefte aan ondersteuning bij digitalisering
gebrek aan kennis en expertiseNieuws14.11.2024
Wolven die niet worden bejaagd, worden steeds brutaler!
Jaarlijks wolvenafschot dringend noodzakelijkEvents06.11.2024
10e editie WFFR: met een ode aan natuurliefhebbers en vertoningen in de wijk
Nieuws05.11.2024
5 dingen die we zullen missen van Blokker
Nieuws08.10.2024
Den Haag ontvangt EU missie label voor duurzaamheid
Online02.08.2024
WeTransfer is geen Nederlands bedrijf meer: wordt overgenomen
Media02.07.2024