Online21.04.2023

​Chatbots komen slim over door deze verrassende sites


We weten dat ChatGPT niet helemaal van zichzelf zo slim is: het moet zijn informatie ook ergens vandaan halen. Daar is maker OpenAI dan weer wat minder open over, maar dat wil niet zeggen dat het niet toch enigszins te achterhalen valt, zo blijkt uit informatie van de Washington Post.

Dataset van AI

Er wordt vaak gedacht dat chatbots denken als mensen, maar dat is niet helemaal waar. Ze kunnen vooral informatie verwerken en dingen nabootsen. Dat merk je ook aan ChatGPT, want als je iets aan hem vraagt, dan weet je dat hij het niet zelf bedenkt: hij haalt het uit allerlei bronnen op het internet. De krant heeft de dataset van Google C4 bestudeerd en kon daardoor inkijk krijgen in de ongeveer 15 miljoen websites die er werden gebruikt om de Engelstalige AI alleen al te helpen aan zijn informatie. Welke dataset OpenAI gebruikt is echter onbekend.

Eenderde van de websites van de dataset van C4 blijkt niet meer online te zijn, maar de overige 10 miljoen wel. Het zijn journalistieke websites, websites over software-ontwikkeling, de medische wereld, entertainment en contentcreatie. De grootste websites zijn patent.google.com, wikipedia.org (ja, echt) en scribd.com. Andere hooggerankte websites zijn onder andere een pagina over piraterij, World of Warcraft en burnouts.

Wikipedia en WordPress

Nu is dat nog niet eens tot daaraan toe: er staan meer dan 200 miljoen meldingen van websites binnen C4 waarin een copyright-symbool op de pagina staat. Oftewel; dat mag je niet kopiëren en dus ook niet voor een dataset gebruiken. Er zitten in de dataset ook heel veel persoonlijke blogs: maar liefst een half miljoen, waaronder WordPress-sites, Tumblr, Blogspot en Live Journal.

Er is ook een bloklijst bij Google, zodat er niet allemaal scheldwoorden doorheen komen en discriminatie zoveel mogelijk wordt geëlimineerd. Hetzelfde geldt voor pornografie en hakenkruizen. Dat is natuurlijk alleen de dataset van Google: andere bedrijven hebben weer andere regels. Die van OpenAI GPT-3, de ChatGPT-taal voor de huidige, was 40 keer zo groot en maakte ook onder andere gebruik van Wikipedia.

Open over AI

Mocht je het trouwens flauw vinden dat OpenAI hier verder niet zo open over is: veel bedrijven willen hun trainingsdata niet vrijgeven omdat het wil voorkomen dat persoonlijke data op straat komt te liggen, of uiteraard content die wordt gebruikt zonder dat hiervoor toestemming wordt gevraagd, iets wat veelal voorkomt.

Het zal nog lange tijd een vage wereld blijven, die van de datasets van AI-chatbots. Tenzij de overheid komt met wet- en regelgeving hieromtrent, wat op zich op de loer ligt nu steeds meer mensen (waaronder kunstenaars) rechtszaken aanspannen tegen het onrechtmatig gebruik van hun creaties voor het trainen van deze slimme hulpjes.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

...

Verder lezen over ChatGPT

OpenAI is van plan om ChatGPT steeds duurder te maken

Voor het einde van het jaar zou de prijs van ChatGPT met 2 dollar worden opgehoogd, zo blijkt uit een investeringsrapport. In 5 jaar tijd wordt dat 44 dollar per maand.

Artificial Intelligence01.10.2024

OpenAI is van plan om ChatGPT steeds duurder te maken

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

Jony Ive werkte sinds 1992 voor Apple, werd in 2015 Chief Design Officer en doet nu zijn eigen ding. En dat doet hij met OpenAI.

Artificial Intelligence23.09.2024

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

OpenAI wil overigens niet dat het model wordt gezien als ‘meer menselijk denkend’, maar toch zal het model wel dingen zeggen als ‘Even denken’ of ‘Ik vraag me af..’

Artificial Intelligence13.09.2024

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

ChatGPT heeft wekelijks dubbel zoveel gebruikers

ChatGPT is een jaar later nog steeds razend populair. We zijn duidelijk nog lang niet klaar met AI, maar net begonnen.

Artificial Intelligence30.08.2024

ChatGPT heeft wekelijks dubbel zoveel gebruikers

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Consumenten en bedrijven kiezen steeds vaker voor AI-toepassingen om online antwoorden te vinden op hun vragen. Het gebruik van tools als ChatGPT voor zoekfuncties is zelfs met 37% gestegen, terwijl het gebruik van traditionele zoekmachines met 11% is gedaald.* Marketeers die zich tot nu toe hebben gericht op Search Engine Optimization (SEO) om hun merk goed in beeld te brengen, zullen zich nu (ook) moeten specialiseren in een nieuw vak: Language Model Optimization (LMO).

Marketing22.08.2024

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

De Autoriteit Persoonsgegevens maakt zich zorgen om een nieuw soort datalek: het ontstaat via AI-chatbots.

Nieuws08.08.2024

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

Geen watermerk voor ChatGPT om angst dat gebruikers weglopen

Je kunt in principe niet zien dat een tekst door ChatGPT is gemaakt. Dat gaat ook niet veranderen: OpenAI wil niet aan een watermerk.

Online05.08.2024

Geen watermerk voor ChatGPT om angst dat gebruikers weglopen

Verder lezen over Google

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Van alle nieuwe code die momenteel bij Google wordt gemaakt schijnt een kwart te zijn gemaakt door computers, in plaats van mensen.

Artificial Intelligence30.10.2024

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Google Flights laat je straks goedkopere vluchten vinden

Wil je echt de ultiem goedkoopste vlucht boeken, waarbij je misschien wel drie keer moet overstappen om in Australië neer te strijken, dan kun je daar nu een nieuwe knop voor aantikken in Google Flights.

Online17.10.2024

Google Flights laat je straks goedkopere vluchten vinden

AI wint nu ook nog de Nobelprijs: twee zelfs

DeepMind, Google’s lab waarin volop met kunstmatige intelligentie wordt geexperimenteerd, is in de prijzen gevallen.

Artificial Intelligence09.10.2024

AI wint nu ook nog de Nobelprijs: twee zelfs

Epic krijgt gelijk: Google houdt Android te dicht

De rechter heeft nu bepaald dat Google de Google Play appwinkel drie jaar lang open moet stellen voor de concurrentie.

Mobile08.10.2024

Epic krijgt gelijk: Google houdt Android te dicht

Google komt met hulp voor als je telefoon wordt gestolen

Shit, telefoon gestolen. Google introduceert nu drie nieuwe opties om te zorgen dat de dief niet bij je data kan.

Mobile07.10.2024

Google komt met hulp voor als je telefoon wordt gestolen

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Google Gemini Live was al beschikbaar, ook voor Nederlanders, maar nog niet officieel in het Nederlands. Daar komt in de komende weken dus verandering in.

Artificial Intelligence03.10.2024

Knoop straks in het Nederlands een gesprek aan met Gemini Live

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Epic had Google vier jaar geleden al aangeklaagd voor het runnen van een monopolie op de appwinkel, maar nu komt daar een nieuwe rechtszaak bij. 

Mobile01.10.2024

Epic klaagt Google en Samsung aan om alternatieve appwinkels

Google introduceert een speelse doodle met popcorn

Search25.09.2024

Google introduceert een speelse doodle met popcorn

Verder lezen over Kunstmatige Intelligentie

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Van alle nieuwe code die momenteel bij Google wordt gemaakt schijnt een kwart te zijn gemaakt door computers, in plaats van mensen.

Artificial Intelligence30.10.2024

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

De toekomst van leren: KLM en de impact van AI

Tijdens een Communitydag georganiseerd door NPULS sprak Timothy Druiventak van KLM.  Zijn lezing ging over over de rol van leren in het oplossen van zakelijke problemen bij KLM, met name in de context van technologie en kunstmatige intelligentie (AI).

Artificial Intelligence29.10.2024

De toekomst van leren: KLM en de impact van AI

Apple Intelligence komt ook naar jouw iPhone

Binnenkort kun je Apple’s AI ook gebruiken op jouw iPhone. Hoewel, ‘binnenkort’: dit is pas in april 2025, dus nog een klein half jaar van nu.

Mobile29.10.2024

Apple Intelligence komt ook naar jouw iPhone

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Metadatamanagement is de sleutel tot het ontsluiten van de waarde van data. Air France-KLM bouwde met behulp van het Data Intelligence Platform van SAP-partner Collibra een ‘data catalog’. Hiermee kunnen gebruikers snel achterhalen welke data beschikbaar zijn, waar deze te vinden zijn en wie verantwoordelijk is voor de kwaliteit.

Technology28.10.2024

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Wees niet bang voor Yahoo boys, maar voor deepfake lovers

Kinderen worden erdoor gechanteerd, Taylor Swift nagedaan, maar er is nu nog een nieuwe variant: de deepfake lover.

Artificial Intelligence25.10.2024

Wees niet bang voor Yahoo boys, maar voor deepfake lovers

Van Yahoo boy naar Yahoo bot
Wat als een tiener zijn leven beëindigt door een AI-chatbot?

In veel gevallen gaat het goed en kunnen we er veel uithalen, maar er zijn momenten waarop AI onze grote vijand is. Bijvoorbeeld bij een tiener in de Verenigde Staten.

Artificial Intelligence24.10.2024

Wat als een tiener zijn leven beëindigt door een AI-chatbot?

Eerste Europese vonnis over gebruik van afbeeldingen in generatieve AI: is er sprake van auteursrechtinbreuk?

Een uitspraak van de rechtbank in Hamburg op 27 september 2024 vormt een nieuwe mijlpaal in de discussie rondom AI (kunstmatige intelligentie) en auteursrecht. Kort gezegd draait deze zaak om de vraag of door het gebruik van foto’s in generatieve AI-programma’s inbreuk wordt gepleegd op het auteursrecht van de betreffende fotograaf.

Artificial Intelligence23.10.2024

Eerste Europese vonnis over gebruik van afbeeldingen in generatieve AI: is er sprake van auteursrechtinbreuk?

Je nieuwe collega’s zijn autonome AI-agents in Microsoft Copilot

Microsoft voegt nieuwe, AI-agents toe aan Copilot. Ze zijn geheel zelfwerkend, dus ze verrichten allerlei taken die werk uit handen nemen van menselijke medewerkers.

Artificial Intelligence22.10.2024

Je nieuwe collega’s zijn autonome AI-agents in Microsoft Copilot

Verder lezen over Onderzoek

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Helemaal in de gezondheidszorg blijken grote zorgen te zijn: daar zou 40 procent onvoldoende zijn voorbereid.

Cybercrime29.10.2024

25% van de Nederlandse bedrijven is niet goed voorbereid op cyberdreiging

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Is het jou ook weleens opgevallen dat er door sommige eiland- en vulkaanketens op de kaart een duidelijke gebogen lijn of curve kan worden getrokken? Binnen de geologie noemen we een dergelijk verschijnsel eilandbogen of vulkaanbogen.

Online28.10.2024

Hoe valt het ontstaan van eilandbogen of vulkaanbogen te verklaren?

Online marketingcampagnes vooral effectief voor nieuwe klanten

Online marketingcampagnes zorgen voor aanzienlijk meer nieuwe klanten, zonder dat de bestaande klanten worden geactiveerd. Uit onderzoek blijkt dat campagnes op bijvoorbeeld social media zorgen voor 170 procent nieuwe klanten.

Marketing01.10.2024

Online marketingcampagnes vooral effectief voor nieuwe klanten

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

Elke zichzelf respecterende data-wetenschapper weet dat je niet zonder meer verschillende datasets uit verschillende onderzoeken met elkaar kunt vergelijken. Op dergelijke verschillende datasets kunnen namelijk onvergelijkbare omstandigheden van toepassing zijn die onderlinge vergelijkingen een uiterst heikele zaak maken.

Nieuws17.09.2024

Gecombineerde NIVEL- en CBS-gegevens COVID-19-pandemie zijn prima te verklaren!

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

Denk je echt dat je in één dag rijk kan worden door wat domme trucjes van een of andere zelfverklaarde influencer? Ze beloven gouden bergen, maar hoe zit het nu echt? In deze nieuwe achtdelige televisieserie ‘Trap er Niet Influencer’ onderzoeken presentatoren Filemon Wesselink, Mark Baanders, Vera Verzijl en Sarah Bakker verschillende trends en invloeden van social media met een kritische en humoristische blik.

Social Media04.09.2024

“Trap Er Niet Influencer” doet onderzoek naar effecten van social media

De stollingsgesteenten cyclus op aarde

De meeste mensen kunnen zich wel voorstellen dat onze planeet van binnen naar buiten is opgebouwd overeenkomstig een aflopend dichtheidsprofiel. Met van binnen naar buiten een nikkelijzeren vaste binnenkern, een nikkelijzeren vloeibare buitenkern, een vaste ondermantel van silicaatarmere gesteenten, een vaste bovenmantel van silicaatrijkere gesteenten en 'last but not least' onze geliefde aardkorst.

Nieuws21.08.2024

De stollingsgesteenten cyclus op aarde

Heeft AI-chatbot ChatGPT onze levens echt veranderd?

Er wordt steeds vaker gesproken over een AI-bubbel, zeker nu de aandelen van techbedrijven enorme dips tonen. Barst die bubbel straks echt? Het is niet zo dat AI-chatbots ons niets hebben gebracht. Zo is er onderzoek gedaan naar of ChatGPT onze levens echt heeft veranderd en daar komt positief nieuws uit.

Artificial Intelligence14.08.2024

Heeft AI-chatbot ChatGPT onze levens echt veranderd?

Stratovulkanen, schildvulkanen en supervulkanen

Binnen dit en binnen een vervolgartikel ga ik nader in op de beschrijving van enkele typen van vulkanen. Daarbij beperk ik mij hoofdzakelijk tot de typische vulkanen die ontstaan als gevolg van de subductie van tektonische aardplaten of als gevolg van mantelpluimen (hotspots). Dit betreffen voornamelijk stratovulkanen, schildvulkanen en supervulkanen. 

Nieuws12.08.2024

Stratovulkanen, schildvulkanen en supervulkanen