Online21.04.2023

​Chatbots komen slim over door deze verrassende sites


We weten dat ChatGPT niet helemaal van zichzelf zo slim is: het moet zijn informatie ook ergens vandaan halen. Daar is maker OpenAI dan weer wat minder open over, maar dat wil niet zeggen dat het niet toch enigszins te achterhalen valt, zo blijkt uit informatie van de Washington Post.

Dataset van AI

Er wordt vaak gedacht dat chatbots denken als mensen, maar dat is niet helemaal waar. Ze kunnen vooral informatie verwerken en dingen nabootsen. Dat merk je ook aan ChatGPT, want als je iets aan hem vraagt, dan weet je dat hij het niet zelf bedenkt: hij haalt het uit allerlei bronnen op het internet. De krant heeft de dataset van Google C4 bestudeerd en kon daardoor inkijk krijgen in de ongeveer 15 miljoen websites die er werden gebruikt om de Engelstalige AI alleen al te helpen aan zijn informatie. Welke dataset OpenAI gebruikt is echter onbekend.

Eenderde van de websites van de dataset van C4 blijkt niet meer online te zijn, maar de overige 10 miljoen wel. Het zijn journalistieke websites, websites over software-ontwikkeling, de medische wereld, entertainment en contentcreatie. De grootste websites zijn patent.google.com, wikipedia.org (ja, echt) en scribd.com. Andere hooggerankte websites zijn onder andere een pagina over piraterij, World of Warcraft en burnouts.

Wikipedia en WordPress

Nu is dat nog niet eens tot daaraan toe: er staan meer dan 200 miljoen meldingen van websites binnen C4 waarin een copyright-symbool op de pagina staat. Oftewel; dat mag je niet kopiëren en dus ook niet voor een dataset gebruiken. Er zitten in de dataset ook heel veel persoonlijke blogs: maar liefst een half miljoen, waaronder WordPress-sites, Tumblr, Blogspot en Live Journal.

Er is ook een bloklijst bij Google, zodat er niet allemaal scheldwoorden doorheen komen en discriminatie zoveel mogelijk wordt geëlimineerd. Hetzelfde geldt voor pornografie en hakenkruizen. Dat is natuurlijk alleen de dataset van Google: andere bedrijven hebben weer andere regels. Die van OpenAI GPT-3, de ChatGPT-taal voor de huidige, was 40 keer zo groot en maakte ook onder andere gebruik van Wikipedia.

Open over AI

Mocht je het trouwens flauw vinden dat OpenAI hier verder niet zo open over is: veel bedrijven willen hun trainingsdata niet vrijgeven omdat het wil voorkomen dat persoonlijke data op straat komt te liggen, of uiteraard content die wordt gebruikt zonder dat hiervoor toestemming wordt gevraagd, iets wat veelal voorkomt.

Het zal nog lange tijd een vage wereld blijven, die van de datasets van AI-chatbots. Tenzij de overheid komt met wet- en regelgeving hieromtrent, wat op zich op de loer ligt nu steeds meer mensen (waaronder kunstenaars) rechtszaken aanspannen tegen het onrechtmatig gebruik van hun creaties voor het trainen van deze slimme hulpjes.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

...

Verder lezen over ChatGPT

ClimateGPT: De volgende stap in klimaatonderzoek?

Op woensdag 13 november 2024 kwamen ambtenaren en beleidsmakers samen voor de AI en Overheid conferentie, georganiseerd door iBestuur, het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties, LEF future center, Rijkswaterstaat en de Nederlandse AI Coalitie. Tijdens deze bijeenkomst presenteerde Daniel Erasmus ClimateGPT, een innovatief AI-model dat is ontworpen om beleidsmakers te ondersteunen in de strijd tegen klimaatverandering. Naast Erasmus kreeg ook ik de kans om te spreken en mijn inzichten te delen over de toepassing van AI binnen de overheid.

Technology20.11.2024

ClimateGPT: De volgende stap in klimaatonderzoek?

Komt er een moment waarop AI niet meer kan verbeteren?

Zo zou de verandering van het huidige top-AI-model van OpenAI naar het volgende een vrij kleine sprong zijn. 

Online19.11.2024

Komt er een moment waarop AI niet meer kan verbeteren?

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Een journalist van de Wall Street Journal nam de proef op de som en trok 24 uur de bossen in om te ontdekken of Gemini van Google, Meta AI van Meta, OpenAI van ChatGPT en Copilot van Microsoft een beetje behulpzaam waren.

Online13.11.2024

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

Enerzijds omdat jongeren bijvoorbeeld al vaker zoeken via social media zoals TikTok en Instagram, maar binnenkort ook omdat AI-bonzen zich er nu mee gaan bemoeien.

Search01.11.2024

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

OpenAI is van plan om ChatGPT steeds duurder te maken

Voor het einde van het jaar zou de prijs van ChatGPT met 2 dollar worden opgehoogd, zo blijkt uit een investeringsrapport. In 5 jaar tijd wordt dat 44 dollar per maand.

Artificial Intelligence01.10.2024

OpenAI is van plan om ChatGPT steeds duurder te maken

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

Jony Ive werkte sinds 1992 voor Apple, werd in 2015 Chief Design Officer en doet nu zijn eigen ding. En dat doet hij met OpenAI.

Artificial Intelligence23.09.2024

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

OpenAI wil overigens niet dat het model wordt gezien als ‘meer menselijk denkend’, maar toch zal het model wel dingen zeggen als ‘Even denken’ of ‘Ik vraag me af..’

Artificial Intelligence13.09.2024

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Verder lezen over Google

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Van alle nieuwe code die momenteel bij Google wordt gemaakt schijnt een kwart te zijn gemaakt door computers, in plaats van mensen.

Artificial Intelligence30.10.2024

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Google Flights laat je straks goedkopere vluchten vinden

Wil je echt de ultiem goedkoopste vlucht boeken, waarbij je misschien wel drie keer moet overstappen om in Australië neer te strijken, dan kun je daar nu een nieuwe knop voor aantikken in Google Flights.

Online17.10.2024

Google Flights laat je straks goedkopere vluchten vinden

AI wint nu ook nog de Nobelprijs: twee zelfs

DeepMind, Google’s lab waarin volop met kunstmatige intelligentie wordt geexperimenteerd, is in de prijzen gevallen.

Artificial Intelligence09.10.2024

AI wint nu ook nog de Nobelprijs: twee zelfs

Epic krijgt gelijk: Google houdt Android te dicht

De rechter heeft nu bepaald dat Google de Google Play appwinkel drie jaar lang open moet stellen voor de concurrentie.

Mobile08.10.2024

Epic krijgt gelijk: Google houdt Android te dicht

Google komt met hulp voor als je telefoon wordt gestolen

Shit, telefoon gestolen. Google introduceert nu drie nieuwe opties om te zorgen dat de dief niet bij je data kan.

Mobile07.10.2024

Google komt met hulp voor als je telefoon wordt gestolen

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Google Gemini Live was al beschikbaar, ook voor Nederlanders, maar nog niet officieel in het Nederlands. Daar komt in de komende weken dus verandering in.

Artificial Intelligence03.10.2024

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Epic had Google vier jaar geleden al aangeklaagd voor het runnen van een monopolie op de appwinkel, maar nu komt daar een nieuwe rechtszaak bij. 

Mobile01.10.2024

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Google introduceert een speelse doodle met popcorn

Search25.09.2024

Google introduceert een speelse doodle met popcorn

Verder lezen over Kunstmatige Intelligentie

ClimateGPT: De volgende stap in klimaatonderzoek?

Op woensdag 13 november 2024 kwamen ambtenaren en beleidsmakers samen voor de AI en Overheid conferentie, georganiseerd door iBestuur, het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties, LEF future center, Rijkswaterstaat en de Nederlandse AI Coalitie. Tijdens deze bijeenkomst presenteerde Daniel Erasmus ClimateGPT, een innovatief AI-model dat is ontworpen om beleidsmakers te ondersteunen in de strijd tegen klimaatverandering. Naast Erasmus kreeg ook ik de kans om te spreken en mijn inzichten te delen over de toepassing van AI binnen de overheid.

Technology20.11.2024

ClimateGPT: De volgende stap in klimaatonderzoek?

Wortell opent nieuw next-gen Cyber Defense Center

Op donderdag 14 november heeft Wortell samen met relaties en partners de feestelijke opening van haar nieuwe next-gen Cyber Defense Center (CDC) gevierd. Dit innovatieve centrum biedt organisaties wereldwijd een geavanceerde oplossing voor 24/7 proactieve beveiliging, detectie en herstel van IT-landschappen. Het CDC speelt in op de groeiende dreiging van cyberaanvallen door bedrijven te helpen hun digitale weerbaarheid te versterken en altijd een stap voor te blijven op potentiële aanvallen.

Cybercrime20.11.2024

Wortell opent nieuw next-gen Cyber Defense Center

Je Pokémon Go-data wordt nu gebruikt om AI te trainen

Niantic was zo’n vijf jaar geleden enorm bekend door zijn game Pokémon Go. Het spelletje waarin je fysiek naar locaties moet gaan. Nu gebruikt Niantic die locatie-foto's.

Mobile20.11.2024

Je Pokémon Go-data wordt nu gebruikt om AI te trainen

Je kunt straks een andere taal spreken in Microsoft Teams

Het idee is dat je hardop tegen je computer of telefoon praat en vervolgens zorgt de AI voor een nabootsing van wat je zegt in een andere taal. In jouw stemgeluid.

Online19.11.2024

Je kunt straks een andere taal spreken in Microsoft Teams

Komt er een moment waarop AI niet meer kan verbeteren?

Zo zou de verandering van het huidige top-AI-model van OpenAI naar het volgende een vrij kleine sprong zijn. 

Online19.11.2024

Komt er een moment waarop AI niet meer kan verbeteren?

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Een journalist van de Wall Street Journal nam de proef op de som en trok 24 uur de bossen in om te ontdekken of Gemini van Google, Meta AI van Meta, OpenAI van ChatGPT en Copilot van Microsoft een beetje behulpzaam waren.

Online13.11.2024

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Huawei Connect Paris: AI en de digitale, groene transformatie van Europa

Huawei Connect 2024 in Parijs staat volledig in het teken van het thema ‘Amplify Digital and Green Transformation en richt zich op de snelle ontwikkelingen van kunstmatige intelligentie en de digitale en groene transformatie in Europa.

Tech in Asia13.11.2024

Huawei Connect Paris: AI en de digitale, groene transformatie van Europa

YouTube wordt een deejay en gaat muziek aan elkaar mixen

Wat als je een vette remix wil maken voor in je YouTube Shorts? Dat kan straks met AI. Al moet je er wel wat voor doen.

Video13.11.2024

YouTube wordt een deejay en gaat muziek aan elkaar mixen

Verder lezen over Onderzoek

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Helemaal in de gezondheidszorg blijken grote zorgen te zijn: daar zou 40 procent onvoldoende zijn voorbereid.

Cybercrime29.10.2024

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Is het jou ook weleens opgevallen dat er door sommige eiland- en vulkaanketens op de kaart een duidelijke gebogen lijn of curve kan worden getrokken? Binnen de geologie noemen we een dergelijk verschijnsel eilandbogen of vulkaanbogen.

Online28.10.2024

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Online marketingcampagnes vooral effectief voor nieuwe klanten

Online marketingcampagnes zorgen voor aanzienlijk meer nieuwe klanten, zonder dat de bestaande klanten worden geactiveerd. Uit onderzoek blijkt dat campagnes op bijvoorbeeld social media zorgen voor 170 procent nieuwe klanten.

Marketing01.10.2024

Online marketingcampagnes vooral effectief voor nieuwe klanten

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

Elke zichzelf respecterende data-wetenschapper weet dat je niet zonder meer verschillende datasets uit verschillende onderzoeken met elkaar kunt vergelijken. Op dergelijke verschillende datasets kunnen namelijk onvergelijkbare omstandigheden van toepassing zijn die onderlinge vergelijkingen een uiterst heikele zaak maken.

Nieuws17.09.2024

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

Denk je echt dat je in één dag rijk kan worden door wat domme trucjes van een of andere zelfverklaarde influencer? Ze beloven gouden bergen, maar hoe zit het nu echt? In deze nieuwe achtdelige televisieserie ‘Trap er Niet Influencer’ onderzoeken presentatoren Filemon Wesselink, Mark Baanders, Vera Verzijl en Sarah Bakker verschillende trends en invloeden van social media met een kritische en humoristische blik.

Social Media04.09.2024

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

De stollingsgesteenten cyclus op aarde

De meeste mensen kunnen zich wel voorstellen dat onze planeet van binnen naar buiten is opgebouwd overeenkomstig een aflopend dichtheidsprofiel. Met van binnen naar buiten een nikkelijzeren vaste binnenkern, een nikkelijzeren vloeibare buitenkern, een vaste ondermantel van silicaatarmere gesteenten, een vaste bovenmantel van silicaatrijkere gesteenten en 'last but not least' onze geliefde aardkorst.

Nieuws21.08.2024

De stollingsgesteenten cyclus op aarde

Heeft AI-chatbot ChatGPT onze levens echt veranderd?

Er wordt steeds vaker gesproken over een AI-bubbel, zeker nu de aandelen van techbedrijven enorme dips tonen. Barst die bubbel straks echt? Het is niet zo dat AI-chatbots ons niets hebben gebracht. Zo is er onderzoek gedaan naar of ChatGPT onze levens echt heeft veranderd en daar komt positief nieuws uit.

Artificial Intelligence14.08.2024

Heeft AI-chatbot ChatGPT onze levens echt veranderd?

Stratovulkanen, schildvulkanen en supervulkanen

Binnen dit en binnen een vervolgartikel ga ik nader in op de beschrijving van enkele typen van vulkanen. Daarbij beperk ik mij hoofdzakelijk tot de typische vulkanen die ontstaan als gevolg van de subductie van tektonische aardplaten of als gevolg van mantelpluimen (hotspots). Dit betreffen voornamelijk stratovulkanen, schildvulkanen en supervulkanen. 

Nieuws12.08.2024

Stratovulkanen, schildvulkanen en supervulkanen