Marketing12.08.2019

​Data Science en Text Mining tijdens de 5de editie van de Big Data Expo


Big Data Expo is een platform waar mensen en kennis samenkomen. Tijdens de 5de editie van de Big Data Expo op 18 en 19 september komen specialisten uit verschillende big data-disciplines en domeinen, samen in Jaarbeurs Utrecht. Met 5000 bezoekers, 120 lezingen en meer dan 85 exposanten is de Big Data Expo hét event als het gaat om data en analytics.

De thema’s die aankomende editie aanbod komen zijn; Analytics, AI, BI, Data Science, Digital Innovation, Ethiek, GDPR, IoT of Text Mining. In dit artikel besteden we aandacht aan de thema’s Text Mining en Data Science.

Text Mining

Voor het eerst een opzichzelfstaand thema tijdens de Big Data Expo. Zelfs relatief kleine organisaties genereren dagelijks grote hoeveelheden tekst die waarde creëren. Maar het is niet eenvoudig om die waarde eruit te halen gezien de enorme diversiteit en het volume van de gemaakte documenten. Het opkomende gebied van text mining is in staat om nieuw inzicht te verwerven, voorspellingen te maken en data om te zetten in bruikbare resultaten.

Tekst komt voor in een enorme variëteit aan systemen en documenten, ieder met een eigen structuur. Nog altijd is het zo dat het merendeel van alle data niet geanalyseerd wordt. En van alle nieuwe data die gecreëerd wordt is naar schatting 80% ongestructureerd. Dit gegeven, gecombineerd met de omvang en complexiteit vereist een aanzienlijke verwerkingskracht om inzicht en waarde op te leveren.

De uitdagingen met tekst, in tegenstelling tot meer gestructureerde gegevensbronnen is bijvoorbeeld het ontbreken van een consistente structuur. Het vakgebied text mining richt zich op het ontwikkelen van diverse geavanceerde wiskundige-, statistische-, taalkundige- en patroonherkenning technieken waarmee het mogelijk is om ongestructureerde informatie automatisch te analyseren alsmede om hoge kwaliteit en relevante gegevens te extraheren en de tekst in zijn geheel beter doorzoekbaar te maken.

Data Science

Data Science, letterlijk ook wel data wetenschappen genoemd, is de wetenschap die zich bezig houdt om kennis en inzichten te vergaren op basis van gestructureerde en ongestructureerde data middels verschillende methoden, processen en systemen. Deze inzichten kunnen descriptief zijn (wat is er gebeurd), verklarend (waarom is dat gebeurd), voorspellend (wat gaat er gebeuren) of actie georiënteerd zijn (wat kan ik doen). Hier komen Domeinkennis, Computer Science en Wiskunde & Statistiek samen. Maar wat betekenen deze begrippen eigenlijk, wat is de relatie daartussen en welke specialisten heb je hier voor nodig?

Domeinkennis

Domein gaat om de kennis van het vakgebied of project waar je data science gaat toepassen. Wanneer je bijvoorbeeld gaat werken voor een reisorganisatie is het belangrijk om kennis te hebben van het domein toerisme en de dynamiek in deze markt en business goed begrijpt. Pas wanneer je de materie goed begrijpt wordt het waardevol om data science in te zetten om de processen en besluitvorming te optimaliseren.

Specialist; data translator, dit is degene die zowel kennis heeft van de business als van de statistiek en kan de koppeling maken om deze op waardevolle wijze aan elkaar te koppelen.

Computer Science

Programmeren, het cleanen en prepareren van de ongestructureerde en gestructureerde data (data die klaar is om het model in te gaan) en het bouwen van een solide infrastructuur. Op het moment dat je weet welke data wel en niet het model in mag gaan kan je dit gaan automatiseren.

Specialist; data engineer, deze zorgt voor een goede infrastructuur om de modellen op te laten draaien.

Wiskunde & Statistiek

Om waarde uit je data te halen heb je kennis nodig van statistiek en wiskunde. Op basis van statistische modellen kunnen verbanden worden gelegd in grote hoeveelheden data. Door het herkennen van verbanden en patronen in het verleden kunnen voorspellingen worden gedaan over de toekomst en kan op basis hiervan de besluitvorming worden geoptimaliseerd.

Specialist; data scientist, dit is degene die met zijn uitgebreide kennis van wiskunde en statistiek de voorspellende modellen maakt.

Het inzichtelijk maken van data kan helpen bij het maken van beslissingen die waardevol zijn voor het bedrijf. Daarnaast kunnen deze inzichten ook nieuwe kansen creëren zoals bijvoorbeeld het optimaliseren van de customer journey.

Bezoek de Big Data Expo

Benieuwd naar meer? Kom dan op 18 en/of 19 september naar Big Data Expo waar onze experts je graag meer vertellen. Meld je gratis aan!

[Fotocredits © monsitj – Adobe Stock]

...

Verder lezen over Big Data

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Metadatamanagement is de sleutel tot het ontsluiten van de waarde van data. Air France-KLM bouwde met behulp van het Data Intelligence Platform van SAP-partner Collibra een ‘data catalog’. Hiermee kunnen gebruikers snel achterhalen welke data beschikbaar zijn, waar deze te vinden zijn en wie verantwoordelijk is voor de kwaliteit.

Technology28.10.2024

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Last van datacenters? Dan bouwen we ze gewoon in zee

Er is veel spanning als het om datacenters gaat. Is het in de zee laten zakken van de cloud een optie?

Technology12.09.2024

Last van datacenters? Dan bouwen we ze gewoon in zee

Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud

Als een van de eerste overheidsorganisaties heeft de provincie Noord-Brabant SAP S/4HANA naar de cloud gemigreerd met behulp van RISE with SAP en SAP-partner Ctac. Deze stap maakt informatie nog sneller beschikbaar voor het uitvoeren van kerntaken, waardoor de provincie efficiënter en sneller antwoorden kan vinden op cruciale vragen.

Technology04.07.2024

Provincie Noord-Brabant migreert SAP S/4HANA naar de cloud

Informatie nog sneller beschikbaar
Zo denken Nederlandse datacenters energie te kunnen besparen

Vertegenwoordigers van de datacenters in Nederland hebben de koppen bij elkaar gestoken om energie te besparen.

Nieuws27.06.2024

Zo denken Nederlandse datacenters energie te kunnen besparen

Nieuwe versie van de Technologie Kieswijzer staat online

Het zal niemand ontgaan dat we met zijn allen opnieuw naar de stembus moeten gaan. De vervroegde Tweede Kamerverkiezing vindt plaats op 22 november 2023. De laatste Tweede Kamerverkiezing vond plaats op 17 maart 2021. To...

Technology25.10.2023

Nieuwe versie van de Technologie Kieswijzer staat online

KNMI moderniseert datastrategie met AWS

Het KNMI heeft een nieuwe, moderne datastrategie geïmplementeerd met behulp van Amazon Web Services (AWS). Daarmee past het meteorologische instituut de mindset en processen van een datagedreven organisatie toe. Behalve...

Technology11.05.2023

KNMI moderniseert datastrategie met AWS

Voor betere detectie en classificatie van seismische activiteit
Wikidata bereikt grens van 100 miljoen data items

Wikipedia kennen we allemaal. Wikidata is wat minder bekend. Dit 'zusje' van Wikipedia heeft afgelopen week de mijlpaal van 100 miljoen items bereikt. Tien jaar geleden begon Wikidata als centrale opslagplaats voor gest...

Online21.10.2022

Wikidata bereikt grens van 100 miljoen data items

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

De Big Data Expo is helaas afgelopen, maar je kunt nu alvast 13 en 14 september 2023 in je agenda noteren. Dan vindt in de Jaarbeurs namelijk de Big Data Expo 2023 plaats. Nieuwsgierig wat je daar zoal kunt verwachten? D...

Marketing20.09.2022

8 tweets om de Big Data Expo van 2023 vast in je agenda te zetten

Verder lezen over Data

Dit is de innovatieve Control Room van Team Visma | Lease a Bike

Team Visma | Lease a Bike, een van 's werelds beste wielerploegen, zet een grote stap in technologische innovatie met de lancering van hun gloednieuwe Control Room. Deze hypermoderne mobiele unit, uitgerust met de nieuwste technologieën en apparatuur, maakt zijn debuut tijdens de Tour de France, die zaterdag 29 juni in Florence van start gaat.

Technology27.06.2024

Dit is de innovatieve Control Room van Team Visma | Lease a Bike

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

De behoefte aan gezondheidszorg neemt wereldwijd toe. Dit gaat gepaard met een groeiende behoefte aan moderne technologie ter ondersteuning van de patiëntenzorg. Uit nieuw onderzoek van SOTI blijkt dat 78% van Nederlandse zorgverleners vindt dat organisaties moeten investeren in nieuwe technologie.

Cybercrime27.06.2024

Veel zorginstellingen hebben last van DDoS-ransomware aanvallen

​Zoveel datacenters: wat zijn de voors en tegens?

In Noord-Holland is Middenmeer een soort ultra-datacenterlocatie. Het is ook vaak uit die plaats dat er berichten komen over wat omwonenden ervan vinden (spoiler: het is niet positief), maar nu zelfs arbeiders die demons...

Online31.10.2023

​Zoveel datacenters: wat zijn de voors en tegens?

Doek valt definitief voor een datacenter in Zeewolde

Het was door alle commotie, bezwaren en andere randzaken al hoogst onwaarschijnlijk geworden dat het mega datacenter dat Meta wilde gaan bouwen in Zeewolde nog door zou gaan. Welnu, vandaag is het doek definitief gevalle...

Technology20.09.2023

Doek valt definitief voor een datacenter in Zeewolde

Er komen beperkingen op de cloudopslag van Dropbox

Terwijl WhatsApp het steeds makkelijker maakt om grote foto’s te versturen, besluit Dropbox niet om zijn diensten aantrekkelijker te maken, maar legt het ze juist aan banden. Dropbox, dat altijd een ongelimiteerde opti...

Online25.08.2023

Er komen beperkingen op de cloudopslag van Dropbox

Europa en Amerika gaan datadelen weer toestaan

Vroeger was er tussen Europa en de Verenigde Staten het Privacy Shield: een overeenkomst waardoor de data van Europese burgers in de Verenigde Staten kon worden opgeslagen, zonder dat het daarbij in handen kwam van de VS...

Online11.07.2023

Europa en Amerika gaan datadelen weer toestaan

Komt Threads dan nu wel naar Europa?
Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

Datalekken in de zorgsector in Nederland blijven toenemen. De Autoriteit Persoonsgegevens (AP) heeft recentelijk aangegeven dat Nederlandse burgers ervan uit moeten gaan dat hun persoonlijke gegevens waarschijnlijk al ge...

Cybercrime28.06.2023

Nieuw onderzoek: datalekken in de zorgsector nemen nog steeds toe

41% van de gezondheidszorgorganisaties sinds 2021 te maken heeft gehad met een datalek
Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla

Naar aanleiding van een tip van haar Duitse collega’s in Brandenburg is de Autoriteit Persoonsgegevens (AP) een onderzoek gestart naar een mogelijk datalek bij Tesla. Daarbij zouden, dat meldt de Duitse krant Handelsbl...

Cybercrime26.05.2023

Autoriteit Persoonsgegevens onderzoekt mogelijk datalek bij Tesla

Verder lezen over Nederland

Je zorgverzekering voor 2025 kiezen: hier moet je op letten

Je wil aan het einde van het jaar bezig zijn met je kerstboom optuigen, maar je zal je toch ook over je zorgverzekering moeten buigen.

Nieuws20.11.2024

Je zorgverzekering voor 2025 kiezen: hier moet je op letten

Onderzoek: Mkb heeft behoefte aan ondersteuning bij digitalisering

Het kabinet heeft voor 2025 plannen voorgesteld om de regeldruk voor mkb-bedrijven te verlagen. Doel is dat ondernemers meer tijd hebben voor het ondernemerschap, innovatie en digitale ontwikkeling. Deze tijd is hard nodig voor de digitale ontwikkeling van ondernemers en hun bedrijven.

Technology18.11.2024

Onderzoek: Mkb heeft behoefte aan ondersteuning bij digitalisering

gebrek aan kennis en expertise
Wolven die niet worden bejaagd, worden steeds brutaler!

Biologen en wolvenexperts hebben het ons jarenlang verzekerd. Wolven zouden mensen mijden en van nature schuw zijn. Het tegendeel lijkt inmiddels echter waar te zijn. Wolven wandelden al meermaals onverschrokken door dorpen of wijken en mijden ook in de vrije natuur mensen bepaald niet. Als gevolg hiervan neemt de lijst van confrontaties met wolven alsmaar in omvang toe.

Nieuws14.11.2024

Wolven die niet worden bejaagd, worden steeds brutaler!

Jaarlijks wolvenafschot dringend noodzakelijk
10e editie WFFR: met een ode aan natuurliefhebbers en vertoningen in de wijk

Deze week is alweer de tiende editie van het Wildlife Film Festival Rotterdam (WFFR) van start gegaan! Deze feestelijke jubileumeditie opende met de wereldpremière van De Verwonderaars van de Rotterdamse filmmaker Rik van der Linden. Ook zijn er veel films van eigen bodem, thema- en shortprogramma’s en een filmtournee door de stad.

Events06.11.2024

10e editie WFFR: met een ode aan natuurliefhebbers en vertoningen in de wijk

5 dingen die we zullen missen van Blokker

Blokker gaat mogelijk failliet. Het is een Nederlands icoon dat verdwijnt. En daarmee ook veel Blokker-nostalgie, want die is er volop.

Nieuws05.11.2024

5 dingen die we zullen missen van Blokker

Den Haag ontvangt EU missie label voor duurzaamheid

Op 8 oktober ontving de gemeente Den Haag als eerste en enige Nederlandse stad het EU missie label ‘100 klimaat neutrale en slimme steden in 2030’. Ze krijgen deze erkenning omdat de gemeente Den Haag in Europa koploper is met haar innovatieve klimaatactiviteiten en -ambities. Deze erkenning is een steun in de rug voor de Haagse inwoners, ondernemers en met name de ondertekenaars van he Haags Klimaatakkoord.

Nieuws08.10.2024

Den Haag ontvangt EU missie label voor duurzaamheid

WeTransfer is geen Nederlands bedrijf meer: wordt overgenomen

De handige app WeTransfer, om bestanden te versturen, is uitgevonden in Nederland en altijd gerund vanuit ons land, maar dat is nu voorbij.

Online02.08.2024

WeTransfer is geen Nederlands bedrijf meer: wordt overgenomen

Ook het EK 2028 zie je bij de NOS

Het EK 2024 is nog in volle gang. Toch maakt de NOS nu al bekend dat het ook de rechten voor UEFA Euro 2028 heeft verworven. Ze hebben hierover een akkoord bereikt met de Europese voetbalbond. Daarnaast gaat de NOS de komende vier jaar ook alle wedstrijden van het Nederlands elftal en de finales van de UEFA Nations League tot medio 2028 uitzenden.

Media02.07.2024

Ook het EK 2028 zie je bij de NOS