Cybercrime04.08.2023

​Studie toont aan: AI-chatbots kunnen worden gesaboteerd


Er is heel veel werk gestoken in het zorgen dat AI-chatbots geen persoonlijke informatie geven of op een heel slechte manier kunnen worden ingezet. Echter is het onderzoekers gelukt om dat alles te omzeilen. Dit is hoe het zit, en hoe potentieel gevaarlijk dat kan zijn.

AI-chatbots manipuleren

De mensen van Carnegie Mellon University hebben ontdekt dat als ze een bepaalde soort code aan een prompt toevoegen, er wel degelijk lelijke dingen kunnen worden gezegd door een aan AI-chatbot. Het probleem is dat dit niet alleen bij een AI-chatbot het geval is: dit is helaas bij allemaal een groot zwakte: “Er is geen manier die we kennen om dit te patchen,” zegt Zico Kolter, een universitair hoofddocent aan CMU. “We weten gewoon niet hoe we ze veilig kunnen maken.”

ChatGPT, Bard, Claude: ze zijn allemaal niet opgewassen tegen het open source-taalmodel dat de onderzoekers gebruikten. Door die code toe te voegen aan een prompt krijg je als het ware de sleutel om dieper in de chatbot te vragen en daardoor kun je hem dingen laten doen die niet oke zijn. Hoe kan ik een waterstofbom maken, hoe kan ik iemand voor altijd laten verdwijnen, hoe kan ik illegale drugs maken: normaliter krijg je daar geen serieus antwoord op, maar wel als je die code achter je prompt zet.

Bots verbeteren

Wired schrijft dat de AI-chatbots wel op de hoogte zijn gesteld en wel wat hebben aangepast, maar helaas lukt het de onderzoekers nog steeds om hun zin te krijgen en de chatbots gevaarlijker te maken. De reactie van de chatbotmakers op het probleem is ook wat homogeen: Google en OpenAI zeggen allebei dat ze er continu aan werken om de bots te verbeteren. Ondertussen zorgen aanvallers dat ze de manier waarop de systemen gegevens oppikken om te leren worden beïnvloed zodat ze afwijkend gedrag gaan vertonen. Dat kan echter ver gaan: afbeeldingen kunnen worden aangepast waardoor AI die beelden verkeerd identificeren. Het doet denken aan een onderzoek uit 2018 waarin onderzoekers stickers op verkeersborden plakten om een zelfrijdende auto-systeem voor de gek te houden. Dat werkte erg goed en het lijkt erop dat er door de manier waarop AI-modellen werken ook geen mogelijkheid is om dat helemaal uit te bannen.

Een AI-bot die nu wordt gebruikt om vluchten te boeken, kan door dit soort code worden ingezet om potentieel gevaarlijke aanvallen uit te voeren. Het zou goed zijn als de beveiligingsagenten bij de verschillende chatbots de koppen bij elkaar staken en samenwerkten aan manieren om hun chatbots zo veel mogelijk dicht te timmeren, voor zover dat kan, uiteraard. Zorgen dat AI-chatbots niet in verkeerde handen kunnen komen, daar is het helaas al te laat voor, dus we zullen er harder aan moeten werken om de schade te beperken.

Laura Jenny
Laura Jenny

Is ze niet aan het tikken, dan reist ze rond in de wondere wereld van entertainment of op een toffe plek in de echte wereld. Mario is de man van haar leven, Belle is haar beste vriendin en haar laptop is nooit ver weg.

...

Verder lezen over ChatGPT

ClimateGPT: De volgende stap in klimaatonderzoek?

Op woensdag 13 november 2024 kwamen ambtenaren en beleidsmakers samen voor de AI en Overheid conferentie, georganiseerd door iBestuur, het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties, LEF future center, Rijkswaterstaat en de Nederlandse AI Coalitie. Tijdens deze bijeenkomst presenteerde Daniel Erasmus ClimateGPT, een innovatief AI-model dat is ontworpen om beleidsmakers te ondersteunen in de strijd tegen klimaatverandering. Naast Erasmus kreeg ook ik de kans om te spreken en mijn inzichten te delen over de toepassing van AI binnen de overheid.

Technology20.11.2024

ClimateGPT: De volgende stap in klimaatonderzoek?

Komt er een moment waarop AI niet meer kan verbeteren?

Zo zou de verandering van het huidige top-AI-model van OpenAI naar het volgende een vrij kleine sprong zijn. 

Online19.11.2024

Komt er een moment waarop AI niet meer kan verbeteren?

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Een journalist van de Wall Street Journal nam de proef op de som en trok 24 uur de bossen in om te ontdekken of Gemini van Google, Meta AI van Meta, OpenAI van ChatGPT en Copilot van Microsoft een beetje behulpzaam waren.

Online13.11.2024

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

Enerzijds omdat jongeren bijvoorbeeld al vaker zoeken via social media zoals TikTok en Instagram, maar binnenkort ook omdat AI-bonzen zich er nu mee gaan bemoeien.

Search01.11.2024

ChatGPT gaat strijd aan met Google: start eigen zoekmachine

OpenAI is van plan om ChatGPT steeds duurder te maken

Voor het einde van het jaar zou de prijs van ChatGPT met 2 dollar worden opgehoogd, zo blijkt uit een investeringsrapport. In 5 jaar tijd wordt dat 44 dollar per maand.

Artificial Intelligence01.10.2024

OpenAI is van plan om ChatGPT steeds duurder te maken

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

Jony Ive werkte sinds 1992 voor Apple, werd in 2015 Chief Design Officer en doet nu zijn eigen ding. En dat doet hij met OpenAI.

Artificial Intelligence23.09.2024

iPhone-designer Jony Ive werkt met OpenAI aan nieuwe gadget

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

OpenAI wil overigens niet dat het model wordt gezien als ‘meer menselijk denkend’, maar toch zal het model wel dingen zeggen als ‘Even denken’ of ‘Ik vraag me af..’

Artificial Intelligence13.09.2024

OpenAI lanceert zijn nieuwe software o1 die kan beredeneren

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Oprah presenteert een tv-special om te vertellen hoe AI het dagelijks leven beïnvloedt en er zitten bekende mensen uit de tech-industrie bij om dat verhaal te doen.

Artificial Intelligence04.09.2024

Oprah leidt een panel met belangrijke mensen in AI: de wereld is verbaasd

Verder lezen over Hackers

Het allerbelangrijkste gereedschap van cybercriminelen is JOUW browser!

Het allerbelangrijkste gereedschap van cybercriminelen draait al gewoon op jouw desktop, laptop of notebook. Ik heb het natuurlijk over de browser software die jij gebruikt, zoals Microsoft Edge, Google Chrome, Mozilla Firefox, etc. In de meeste gevallen zijn het namelijk browsers die cybercriminelen toegang verschaffen tot persoonlijke data of bankrekeningen.

Cybercrime11.10.2024

Het allerbelangrijkste gereedschap van cybercriminelen is JOUW browser!

Gebruik daarom liever apps op tablets of smartphones voor de allergevoeligste gegevens
Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

Jim Stolze is een campagne gestart om de digitale weerbaarheid van Nederlanders te vergroten. Samen met KPN, ING en Microsoft is het platform 'Unlock Digitale Weerbaarheid' opgezet, met gratis lessen die online en bij jou in de buurt gevolgd kunnen worden.

Cybercrime08.10.2024

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

De Gesprek Check is een extra controle-hulpmiddel van ABN AMRO

ABN AMRO introduceert een extra online hulpmiddel waarmee klanten kunnen controleren of ze echt een medewerker van de bank aan de lijn hebben. Het is een nieuwe functionaliteit die wordt toegevoegd aan de reeds bestaande hulpmiddelen, waarmee persoonlijke voorkeuren rondom bankieren en veiligheid zijn in te stellen.

Cybercrime30.09.2024

De Gesprek Check is een extra controle-hulpmiddel van ABN AMRO

heb je echt de bank aan de telefoon?
TeamViewer heeft een groot cybersecurity-probleem

Als je een kantoorbaan hebt, dan is de kans groot dat je TeamViewer wel kent. Het is een manier waarmee een IT-helpdesk je computer kan ‘overnemen’. Echter blijkt dat TeamViewer zelf is overgenomen, en niet op een positieve manier.

Cybercrime29.08.2024

TeamViewer heeft een groot cybersecurity-probleem

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Er is weer een ongewoon type phishing-campagne ontdekt volledig gericht op mobiele gebruikers, Eset Research analyseerde een ‘in the wild’ waargenomen geval gericht op klanten van een belangrijke Tsjechische bank. Deze techniek is opmerkelijk omdat het een phishingapp installeert vanaf een website van derden zonder dat de gebruiker de installatie van apps van derden hoeft toe te staan. Op Android kan dit resulteren in een stille installatie van een bijzonder soort APK, die zelfs vanuit de Google Play Store lijkt geïnstalleerd te zijn. De bedreiging was ook gericht op iPhone (iOS)-gebruikers.

Cybercrime26.08.2024

Financiële fraude met phishingmethode specifiek gericht op Android & iOS

Wielrenner, je racefiets kan gehackt worden

Het zijn geen e-bikes, maar toch kunnen racefietsen gehackt worden. Dit is hoe een hacker dat kan doen en waar het door komt.

Cybercrime16.08.2024

Wielrenner, je racefiets kan gehackt worden

Veel openbare WiFi netwerken in Parijs zijn onveilig

Experts van Kaspersky hebben bijna 25.000 gratis WiFi-spots in Parijs geanalyseerd voor de Olympische Zomerspelen en Paralympische Spelen. Uit hun analyse blijkt dat bijna 25 procent van deze netwerken zwakke of geen encryptie heeft, waardoor gebruikers kwetsbaar zijn voor diefstal van persoonlijke- en bankgegevens. Slechts zes procent van de netwerken maakt gebruik van het nieuwste beveiligingsprotocol WPA3.

Cybercrime29.07.2024

Veel openbare WiFi netwerken in Parijs zijn onveilig

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

Infoblox heeft een belangrijke doorbraak geboekt in onderzoek naar cybercriminaliteit met de onthulling van een groep cybercriminelen, die de naam "Vigorish Viper" heeft gekregen. Dit is een Chinees georganiseerd misdaadsyndicaat dat gebruikmaakt van geavanceerde technologie om te profiteren van de wereldwijde illegale sportgokindustrie ter waarde van $1.700 miljard. Het syndicaat heeft ook banden met witwaspraktijken en mensenhandel operaties in heel Azië. Deze ontdekking van Infoblox betekent een belangrijke mijlpaal in de voortdurende strijd tegen wereldwijde cybercriminaliteit door middel van DNS-intelligentie.

Cybercrime25.07.2024

Vigorish Viper: een Chinees cybercrimesyndicaat ontdekt door Infoblox

banden met Europese voetbalsponsors, mensenhandel en illegale gokindustrie

Verder lezen over Kunstmatige Intelligentie

ClimateGPT: De volgende stap in klimaatonderzoek?

Op woensdag 13 november 2024 kwamen ambtenaren en beleidsmakers samen voor de AI en Overheid conferentie, georganiseerd door iBestuur, het Ministerie van Binnenlandse Zaken en Koninkrijksrelaties, LEF future center, Rijkswaterstaat en de Nederlandse AI Coalitie. Tijdens deze bijeenkomst presenteerde Daniel Erasmus ClimateGPT, een innovatief AI-model dat is ontworpen om beleidsmakers te ondersteunen in de strijd tegen klimaatverandering. Naast Erasmus kreeg ook ik de kans om te spreken en mijn inzichten te delen over de toepassing van AI binnen de overheid.

Technology20.11.2024

ClimateGPT: De volgende stap in klimaatonderzoek?

Wortell opent nieuw next-gen Cyber Defense Center

Op donderdag 14 november heeft Wortell samen met relaties en partners de feestelijke opening van haar nieuwe next-gen Cyber Defense Center (CDC) gevierd. Dit innovatieve centrum biedt organisaties wereldwijd een geavanceerde oplossing voor 24/7 proactieve beveiliging, detectie en herstel van IT-landschappen. Het CDC speelt in op de groeiende dreiging van cyberaanvallen door bedrijven te helpen hun digitale weerbaarheid te versterken en altijd een stap voor te blijven op potentiële aanvallen.

Cybercrime20.11.2024

Wortell opent nieuw next-gen Cyber Defense Center

Je Pokémon Go-data wordt nu gebruikt om AI te trainen

Niantic was zo’n vijf jaar geleden enorm bekend door zijn game Pokémon Go. Het spelletje waarin je fysiek naar locaties moet gaan. Nu gebruikt Niantic die locatie-foto's.

Mobile20.11.2024

Je Pokémon Go-data wordt nu gebruikt om AI te trainen

Je kunt straks een andere taal spreken in Microsoft Teams

Het idee is dat je hardop tegen je computer of telefoon praat en vervolgens zorgt de AI voor een nabootsing van wat je zegt in een andere taal. In jouw stemgeluid.

Online19.11.2024

Je kunt straks een andere taal spreken in Microsoft Teams

Komt er een moment waarop AI niet meer kan verbeteren?

Zo zou de verandering van het huidige top-AI-model van OpenAI naar het volgende een vrij kleine sprong zijn. 

Online19.11.2024

Komt er een moment waarop AI niet meer kan verbeteren?

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Een journalist van de Wall Street Journal nam de proef op de som en trok 24 uur de bossen in om te ontdekken of Gemini van Google, Meta AI van Meta, OpenAI van ChatGPT en Copilot van Microsoft een beetje behulpzaam waren.

Online13.11.2024

Dit gebeurt er als je 24 uur alleen bent met AI-chatbots

Huawei Connect Paris: AI en de digitale, groene transformatie van Europa

Huawei Connect 2024 in Parijs staat volledig in het teken van het thema ‘Amplify Digital and Green Transformation en richt zich op de snelle ontwikkelingen van kunstmatige intelligentie en de digitale en groene transformatie in Europa.

Tech in Asia13.11.2024

Huawei Connect Paris: AI en de digitale, groene transformatie van Europa

YouTube wordt een deejay en gaat muziek aan elkaar mixen

Wat als je een vette remix wil maken voor in je YouTube Shorts? Dat kan straks met AI. Al moet je er wel wat voor doen.

Video13.11.2024

YouTube wordt een deejay en gaat muziek aan elkaar mixen

Verder lezen over Security

Wortell opent nieuw next-gen Cyber Defense Center

Op donderdag 14 november heeft Wortell samen met relaties en partners de feestelijke opening van haar nieuwe next-gen Cyber Defense Center (CDC) gevierd. Dit innovatieve centrum biedt organisaties wereldwijd een geavanceerde oplossing voor 24/7 proactieve beveiliging, detectie en herstel van IT-landschappen. Het CDC speelt in op de groeiende dreiging van cyberaanvallen door bedrijven te helpen hun digitale weerbaarheid te versterken en altijd een stap voor te blijven op potentiële aanvallen.

Cybercrime20.11.2024

Wortell opent nieuw next-gen Cyber Defense Center

Dit zijn de huidige trends binnen cybersecurity en hoe je jezelf beschermt

Het jaar is bijna voorbij en daarom kijken we naar de trends die we momenteel zien op het gebied van cybersecurity. Waar moet je nou echt voor oppassen dit jaar?

Cybercrime11.11.2024

Dit zijn de huidige trends binnen cybersecurity en hoe je jezelf beschermt

Veel computer-influencers zijn weinig meer dan pseudo-experts

Misschien is het je weleens opgevallen? Tips, trucs en tutorials over hoe je jouw computer beter kunt beschermen tegen de gevaren van het internet. Met name Youtube grossiert in video's van computer-influencers die jou wel even fijntjes uit de doeken doen hoe je jouw computer beter kunt beschermen tegen malware of hackers.

Online06.11.2024

Veel computer-influencers zijn weinig meer dan pseudo-experts

Eerst checken, dan bestellen: Klik niet meteen op die bestelknop!

We gaan in sneltreinvaart richting de feestdagen. Black Friday, Cyber Monday, Sinterklaas en Kerstmis volgen elkaar in rap tempo op. En dus gaan we ook met zijn allen weer op zoek naar de leukste cadeaus en scherpste aanbiedingen. Maar daar spelen ook kwaadwillenden slim op in. En dus komt Autoriteit Consument & Markt nu alvast met een waarschuwing voor onbetrouwbare webshops in aanloop naar de feestdagen.

Online31.10.2024

Eerst checken, dan bestellen: Klik niet meteen op die bestelknop!

Nieuwe campagne tegen onbetrouwbare webshops
Ransomwareaanvallen slagen nog steeds: 178 stuks in 2023

Niet alleen lokale documenten, ook clouddocumenten worden op slot gezet en een proces van chantage volgt: ransomware.

Cybercrime23.10.2024

Ransomwareaanvallen slagen nog steeds: 178 stuks in 2023

Pas op: er is een groot beveiligingslek in WordPress-plugin Jetpack

Het zit al sinds 2016 in Jetpack en het zorgt dat gebruikers die ingelogd zijn kunnen lezen wat er in ingediende formulieren staat.

Cybercrime15.10.2024

Pas op: er is een groot beveiligingslek in WordPress-plugin Jetpack

Deze week meerdere waarschuwingscampagnes over phishing: waarom?

Pas op voor phishing! Je wordt er volop door gewaarschuwd door meerdere campagnes, is dat wel zo effectief?

Cybercrime09.10.2024

Deze week meerdere waarschuwingscampagnes over phishing: waarom?

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen

Jim Stolze is een campagne gestart om de digitale weerbaarheid van Nederlanders te vergroten. Samen met KPN, ING en Microsoft is het platform 'Unlock Digitale Weerbaarheid' opgezet, met gratis lessen die online en bij jou in de buurt gevolgd kunnen worden.

Cybercrime08.10.2024

Unlock Digitale Weerbaarheid: leer online gevaren te herkennen