Cybercrime04.08.2023

​Studie toont aan: AI-chatbots kunnen worden gesaboteerd


Er is heel veel werk gestoken in het zorgen dat AI-chatbots geen persoonlijke informatie geven of op een heel slechte manier kunnen worden ingezet. Echter is het onderzoekers gelukt om dat alles te omzeilen. Dit is hoe het zit, en hoe potentieel gevaarlijk dat kan zijn.

AI-chatbots manipuleren

De mensen van Carnegie Mellon University hebben ontdekt dat als ze een bepaalde soort code aan een prompt toevoegen, er wel degelijk lelijke dingen kunnen worden gezegd door een aan AI-chatbot. Het probleem is dat dit niet alleen bij een AI-chatbot het geval is: dit is helaas bij allemaal een groot zwakte: “Er is geen manier die we kennen om dit te patchen,” zegt Zico Kolter, een universitair hoofddocent aan CMU. “We weten gewoon niet hoe we ze veilig kunnen maken.”

ChatGPT, Bard, Claude: ze zijn allemaal niet opgewassen tegen het open source-taalmodel dat de onderzoekers gebruikten. Door die code toe te voegen aan een prompt krijg je als het ware de sleutel om dieper in de chatbot te vragen en daardoor kun je hem dingen laten doen die niet oke zijn. Hoe kan ik een waterstofbom maken, hoe kan ik iemand voor altijd laten verdwijnen, hoe kan ik illegale drugs maken: normaliter krijg je daar geen serieus antwoord op, maar wel als je die code achter je prompt zet.

Bots verbeteren

Wired schrijft dat de AI-chatbots wel op de hoogte zijn gesteld en wel wat hebben aangepast, maar helaas lukt het de onderzoekers nog steeds om hun zin te krijgen en de chatbots gevaarlijker te maken. De reactie van de chatbotmakers op het probleem is ook wat homogeen: Google en OpenAI zeggen allebei dat ze er continu aan werken om de bots te verbeteren. Ondertussen zorgen aanvallers dat ze de manier waarop de systemen gegevens oppikken om te leren worden beïnvloed zodat ze afwijkend gedrag gaan vertonen. Dat kan echter ver gaan: afbeeldingen kunnen worden aangepast waardoor AI die beelden verkeerd identificeren. Het doet denken aan een onderzoek uit 2018 waarin onderzoekers stickers op verkeersborden plakten om een zelfrijdende auto-systeem voor de gek te houden. Dat werkte erg goed en het lijkt erop dat er door de manier waarop AI-modellen werken ook geen mogelijkheid is om dat helemaal uit te bannen.

Een AI-bot die nu wordt gebruikt om vluchten te boeken, kan door dit soort code worden ingezet om potentieel gevaarlijke aanvallen uit te voeren. Het zou goed zijn als de beveiligingsagenten bij de verschillende chatbots de koppen bij elkaar staken en samenwerkten aan manieren om hun chatbots zo veel mogelijk dicht te timmeren, voor zover dat kan, uiteraard. Zorgen dat AI-chatbots niet in verkeerde handen kunnen komen, daar is het helaas al te laat voor, dus we zullen er harder aan moeten werken om de schade te beperken.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

...

Verder lezen over ChatGPT

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

Enerzijds omdat jongeren bijvoorbeeld al vaker zoeken via social media zoals TikTok en Instagram, maar binnenkort ook omdat AI-bonzen zich er nu mee gaan bemoeien.

Search01.11.2024

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

OpenAI is van plan om ChatGPT steeds duurder te maken

Voor het einde van het jaar zou de prijs van ChatGPT met 2 dollar worden opgehoogd, zo blijkt uit een investeringsrapport. In 5 jaar tijd wordt dat 44 dollar per maand.

Artificial Intelligence01.10.2024

OpenAI is van plan om ChatGPT steeds duurder te maken

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

Jony Ive werkte sinds 1992 voor Apple, werd in 2015 Chief Design Officer en doet nu zijn eigen ding. En dat doet hij met OpenAI.

Artificial Intelligence23.09.2024

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

OpenAI wil overigens niet dat het model wordt gezien als ‘meer menselijk denkend’, maar toch zal het model wel dingen zeggen als ‘Even denken’ of ‘Ik vraag me af..’

Artificial Intelligence13.09.2024

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

ChatGPT heeft wekelijks dubbel zoveel gebruikers

ChatGPT is een jaar later nog steeds razend populair. We zijn duidelijk nog lang niet klaar met AI, maar net begonnen.

Artificial Intelligence30.08.2024

ChatGPT heeft wekelijks dubbel zoveel gebruikers

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Consumenten en bedrijven kiezen steeds vaker voor AI-toepassingen om online antwoorden te vinden op hun vragen. Het gebruik van tools als ChatGPT voor zoekfuncties is zelfs met 37% gestegen, terwijl het gebruik van traditionele zoekmachines met 11% is gedaald.* Marketeers die zich tot nu toe hebben gericht op Search Engine Optimization (SEO) om hun merk goed in beeld te brengen, zullen zich nu (ook) moeten specialiseren in een nieuw vak: Language Model Optimization (LMO).

Marketing22.08.2024

HubSpot komt met gratis tool voor AI zoekoptimalisatie

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

De Autoriteit Persoonsgegevens maakt zich zorgen om een nieuw soort datalek: het ontstaat via AI-chatbots.

Nieuws08.08.2024

Autoriteit Persoonsgegevens: gebruik AI-chatbot kan leiden tot datalek

Verder lezen over Hackers

Het allerbelangrijkste gereedschap van cybercriminelen is JOUW browser!

Het allerbelangrijkste gereedschap van cybercriminelen draait al gewoon op jouw desktop, laptop of notebook. Ik heb het natuurlijk over de browser software die jij gebruikt, zoals Microsoft Edge, Google Chrome, Mozilla Firefox, etc. In de meeste gevallen zijn het namelijk browsers die cybercriminelen toegang verschaffen tot persoonlijke data of bankrekeningen.

Cybercrime11.10.2024

Het allerbelangrijkste gereedschap van cybercriminelen is JOUW browser!

Gebruik daarom liever apps op tablets of smartphones voor de allergevoeligste gegevens
Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

Jim Stolze is een campagne gestart om de digitale weerbaarheid van Nederlanders te vergroten. Samen met KPN, ING en Microsoft is het platform 'Unlock Digitale Weerbaarheid' opgezet, met gratis lessen die online en bij jou in de buurt gevolgd kunnen worden.

Cybercrime08.10.2024

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

De Gesprek Check is een extra controle-hulpmiddel van ABN AMRO

ABN AMRO introduceert een extra online hulpmiddel waarmee klanten kunnen controleren of ze echt een medewerker van de bank aan de lijn hebben. Het is een nieuwe functionaliteit die wordt toegevoegd aan de reeds bestaande hulpmiddelen, waarmee persoonlijke voorkeuren rondom bankieren en veiligheid zijn in te stellen.

Cybercrime30.09.2024

De Gesprek Check is een extra controle-hulpmiddel van ABN AMRO

heb je echt de bank aan de telefoon?
TeamViewer heeft een groot cybersecurity-probleem

Als je een kantoorbaan hebt, dan is de kans groot dat je TeamViewer wel kent. Het is een manier waarmee een IT-helpdesk je computer kan ‘overnemen’. Echter blijkt dat TeamViewer zelf is overgenomen, en niet op een positieve manier.

Cybercrime29.08.2024

TeamViewer heeft een groot cybersecurity-probleem

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Er is weer een ongewoon type phishing-campagne ontdekt volledig gericht op mobiele gebruikers, Eset Research analyseerde een ‘in the wild’ waargenomen geval gericht op klanten van een belangrijke Tsjechische bank. Deze techniek is opmerkelijk omdat het een phishingapp installeert vanaf een website van derden zonder dat de gebruiker de installatie van apps van derden hoeft toe te staan. Op Android kan dit resulteren in een stille installatie van een bijzonder soort APK, die zelfs vanuit de Google Play Store lijkt geïnstalleerd te zijn. De bedreiging was ook gericht op iPhone (iOS)-gebruikers.

Cybercrime26.08.2024

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Wielrenner, je racefiets kan gehackt worden

Het zijn geen e-bikes, maar toch kunnen racefietsen gehackt worden. Dit is hoe een hacker dat kan doen en waar het door komt.

Cybercrime16.08.2024

Wielrenner, je racefiets kan gehackt worden

Veel openbare WiFi netwerken in Parijs zijn onveilig

Experts van Kaspersky hebben bijna 25.000 gratis WiFi-spots in Parijs geanalyseerd voor de Olympische Zomerspelen en Paralympische Spelen. Uit hun analyse blijkt dat bijna 25 procent van deze netwerken zwakke of geen encryptie heeft, waardoor gebruikers kwetsbaar zijn voor diefstal van persoonlijke- en bankgegevens. Slechts zes procent van de netwerken maakt gebruik van het nieuwste beveiligingsprotocol WPA3.

Cybercrime29.07.2024

Veel openbare WiFi netwerken in Parijs zijn onveilig

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

Infoblox heeft een belangrijke doorbraak geboekt in onderzoek naar cybercriminaliteit met de onthulling van een groep cybercriminelen, die de naam "Vigorish Viper" heeft gekregen. Dit is een Chinees georganiseerd misdaadsyndicaat dat gebruikmaakt van geavanceerde technologie om te profiteren van de wereldwijde illegale sportgokindustrie ter waarde van $1.700 miljard. Het syndicaat heeft ook banden met witwaspraktijken en mensenhandel operaties in heel Azië. Deze ontdekking van Infoblox betekent een belangrijke mijlpaal in de voortdurende strijd tegen wereldwijde cybercriminaliteit door middel van DNS-intelligentie.

Cybercrime25.07.2024

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

banden met Europese voetbalsponsors, mensenhandel en illegale gokindustrie

Verder lezen over Kunstmatige Intelligentie

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

Enerzijds omdat jongeren bijvoorbeeld al vaker zoeken via social media zoals TikTok en Instagram, maar binnenkort ook omdat AI-bonzen zich er nu mee gaan bemoeien.

Search01.11.2024

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

Microsoft stelt release van AI-meekijker Recall weer uit

Eerst leek de wereld er nog niet klaar voor en nu is het juist Microsoft zelf dat er niet klaar voor is. Recall is weer uitgesteld.

Artificial Intelligence31.10.2024

Microsoft stelt release van AI-meekijker Recall weer uit

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

Van alle nieuwe code die momenteel bij Google wordt gemaakt schijnt een kwart te zijn gemaakt door computers, in plaats van mensen.

Artificial Intelligence30.10.2024

Een kwart van het programmeerwerk bij Google wordt gedaan door AI

De toekomst van leren: KLM en de impact van AI

Tijdens een Communitydag georganiseerd door NPULS sprak Timothy Druiventak van KLM.  Zijn lezing ging over over de rol van leren in het oplossen van zakelijke problemen bij KLM, met name in de context van technologie en kunstmatige intelligentie (AI).

Artificial Intelligence29.10.2024

De toekomst van leren: KLM en de impact van AI

Apple Intelligence komt ook naar jouw iPhone

Binnenkort kun je Apple’s AI ook gebruiken op jouw iPhone. Hoewel, ‘binnenkort’: dit is pas in april 2025, dus nog een klein half jaar van nu.

Mobile29.10.2024

Apple Intelligence komt ook naar jouw iPhone

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Metadatamanagement is de sleutel tot het ontsluiten van de waarde van data. Air France-KLM bouwde met behulp van het Data Intelligence Platform van SAP-partner Collibra een ‘data catalog’. Hiermee kunnen gebruikers snel achterhalen welke data beschikbaar zijn, waar deze te vinden zijn en wie verantwoordelijk is voor de kwaliteit.

Technology28.10.2024

Air France-KLM legt fundament voor AI met sterk metadatamanagement

Wees niet bang voor Yahoo boys, maar voor deepfake lovers

Kinderen worden erdoor gechanteerd, Taylor Swift nagedaan, maar er is nu nog een nieuwe variant: de deepfake lover.

Artificial Intelligence25.10.2024

Wees niet bang voor Yahoo boys, maar voor deepfake lovers

Van Yahoo boy naar Yahoo bot
Wat als een tiener zijn leven beëindigt door een AI-chatbot?

In veel gevallen gaat het goed en kunnen we er veel uithalen, maar er zijn momenten waarop AI onze grote vijand is. Bijvoorbeeld bij een tiener in de Verenigde Staten.

Artificial Intelligence24.10.2024

Wat als een tiener zijn leven beëindigt door een AI-chatbot?

Verder lezen over Security

Eerst checken, dan bestellen: Klik niet meteen op die bestelknop!

We gaan in sneltreinvaart richting de feestdagen. Black Friday, Cyber Monday, Sinterklaas en Kerstmis volgen elkaar in rap tempo op. En dus gaan we ook met zijn allen weer op zoek naar de leukste cadeaus en scherpste aanbiedingen. Maar daar spelen ook kwaadwillenden slim op in. En dus komt Autoriteit Consument & Markt nu alvast met een waarschuwing voor onbetrouwbare webshops in aanloop naar de feestdagen.

Online31.10.2024

Eerst checken, dan bestellen: Klik niet meteen op die bestelknop!

Nieuwe campagne tegen onbetrouwbare webshops
Ransomwareaanvallen slagen nog steeds: 178 stuks in 2023

Niet alleen lokale documenten, ook clouddocumenten worden op slot gezet en een proces van chantage volgt: ransomware.

Cybercrime23.10.2024

Ransomwareaanvallen slagen nog steeds: 178 stuks in 2023

Pas op: er is een groot beveiligingslek in WordPress-plugin Jetpack

Het zit al sinds 2016 in Jetpack en het zorgt dat gebruikers die ingelogd zijn kunnen lezen wat er in ingediende formulieren staat.

Cybercrime15.10.2024

Pas op: er is een groot beveiligingslek in WordPress-plugin Jetpack

Deze week meerdere waarschuwingscampagnes over phishing: waarom?

Pas op voor phishing! Je wordt er volop door gewaarschuwd door meerdere campagnes, is dat wel zo effectief?

Cybercrime09.10.2024

Deze week meerdere waarschuwingscampagnes over phishing: waarom?

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

Jim Stolze is een campagne gestart om de digitale weerbaarheid van Nederlanders te vergroten. Samen met KPN, ING en Microsoft is het platform 'Unlock Digitale Weerbaarheid' opgezet, met gratis lessen die online en bij jou in de buurt gevolgd kunnen worden.

Cybercrime08.10.2024

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

Nee, LEGO raadt je niet aan de LEGO Coin te kopen

In ieder geval doet LEGO geen uitspraken over hoe dit is gebeurd. Het zegt alleen: “Op 5 oktober 2024 verscheen er kort een ongeautoriseerde banner op LEGO.com.'

Cybercrime07.10.2024

Nee, LEGO raadt je niet aan de LEGO Coin te kopen

Ben jij online op te lichten? Doe de gratis cursus Digitale Weerbaarheid

De gratis cursus is bedoeld om je bewuster te maken van wat er allemaal alarmbellen moet doen rinkelen in de toekomst.

Cybercrime02.10.2024

Ben jij online op te lichten? Doe de gratis cursus Digitale Weerbaarheid

Hoe bescherm je de data in je brein?

Het is niet ondenkbaar dat er straks ook mensen die geen lichamelijke beperkingen hebben met een breinchip rondlopen. Maar: hoe zorg je dat je breindata beschermd blijft?

Cybercrime30.09.2024

Hoe bescherm je de data in je brein?