Technology

Meeste veiligheidsmaatregelen voor AI-tools binnen enkele minuten te omzeilen, blijkt uit onderzoek

november 6, 2025

Onderzoek toont aan: meeste veiligheidsmaatregelen voor AI-tools kunnen binnen enkele minuten worden omzeild

AI-systemen ‘vergeten’ hun veiligheidsmaatregelen naarmate een gebruiker langer met hen spreekt, zo blijkt uit een nieuw onderzoek.

Het rapport van technologiebedrijf Cisco onthult dat het met slechts enkele simpele prompts mogelijk is om de meeste beveiligingsmaatregelen van kunstmatige intelligentie (AI) tools te omzeilen. Cisco heeft de grote taalmodellen (LLM’s) achter populaire AI-chatbots van OpenAI, Mistral, Meta, Google, Alibaba, Deepseek en Microsoft geëvalueerd om te bepalen hoeveel vragen nodig waren om onveilige of criminele informatie te onthullen.

Dit gebeurde in 499 gesprekken via een techniek die “multi-turn aanvallen” wordt genoemd, waarbij kwaadwillende gebruikers meerdere vragen aan AI-tools stellen om veiligheidsmaatregelen te omzeilen. Elk gesprek bestond uit vijf tot tien interacties.

De onderzoekers vergeleken de resultaten van verschillende vragen om te identificeren hoe waarschijnlijk het was dat een chatbot zou ingaan op verzoeken om schadelijke of ongepaste informatie. Dit kon variëren van het delen van privé bedrijfsgegevens tot het faciliteren van de verspreiding van desinformatie.

Gemiddeld konden de onderzoekers in 64 procent van hun gesprekken kwaadaardige informatie verkrijgen wanneer ze AI-chatbots meerdere vragen stelden, vergeleken met slechts 13 procent wanneer ze slechts één vraag stelden. Het slagingspercentage varieerde van ongeveer 26 procent met Google’s Gemma tot 93 procent met het Large Instruct-model van Mistral.

De bevindingen wijzen erop dat multi-turn aanvallen schadelijke inhoud wijdverspreid kunnen maken of hackers kunnen toestaan “niet-geautoriseerde toegang” te krijgen tot gevoelige informatie van een bedrijf, aldus Cisco. AI-systemen falen vaak in het onthouden en toepassen van hun veiligheidsregels tijdens langere gesprekken. Dit betekent dat aanvallers hun vragen langzaam kunnen verfijnen en beveiligingsmaatregelen kunnen ontwijken.

LEZEN China's DeepSeek Ontwikkelt Innovatieve Methode om AI te Verbeteren in Vraagbeantwoording

Mistral – net als Meta, Google, OpenAI en Microsoft – werkt met open-weight LLM’s, waarbij het publiek toegang heeft tot de specifieke veiligheidsparameters waarop de modellen zijn getraind. Cisco merkt op dat deze modellen vaak “lichtere ingebouwde veiligheidskenmerken” hebben, zodat mensen hun modellen kunnen downloaden en aanpassen. Dit legt de verantwoordelijkheid voor veiligheid bij de persoon die de open-source informatie gebruikt om hun eigen model aan te passen.

Opmerkelijk is dat Cisco heeft opgemerkt dat Google, OpenAI, Meta en Microsoft hebben gezegd dat ze inspanningen hebben geleverd om kwaadaardige fine-tuning van hun modellen te verminderen. AI-bedrijven hebben kritiek gekregen vanwege de lakse veiligheidsmaatregelen die het eenvoudig maken om hun systemen voor criminele doeleinden aan te passen.

In augustus vermeldde het Amerikaanse bedrijf Anthropic bijvoorbeeld dat criminelen gebruik hadden gemaakt van hun Claude-model voor grootschalige diefstal en afpersing van persoonlijke gegevens, waarbij ze losgelden eisten van slachtoffers die soms meer dan $500.000 (€433.000) bedroegen.

Omgeving

Historische Sahara-neerslag voornamelijk veroorzaakt door tropische luchtstromen, blijkt uit onderzoek

februari 5, 2025

Samenvatting van moderne neerslagpatronen in Noord-Afrika en de invloed van meteorologische factoren. Afrika wordt vaak geassocieerd met zijn droge gebieden die twee derde van het continent beslaan. De regenval tijdens het moessonseizoen biedt verlichting en is cruciaal voor het aanvullen van watervoorraden voor zowel gemeenschappen als wilde dieren. De moesson in West-Afrika loopt van juni…

Technology

Tijd dringt voor EU-lidstaten om te beslissen over Chat Controle

september 5, 2025

De tijd dringt voor EU-lidstaten om te beslissen over Chat Control Met nog maar een paar dagen te gaan voordat de Raad moet stemmen over het controversiële voorstel, kunnen de publieke druk en de kritiek van verschillende politieke partijen een unieke uitdaging vormen voor de gebruikelijke zorgvuldig geregisseerde stemprocedures in Brussel over langdurig bediscussieerde wetgeving….

Technology

Britse gegevensautoriteit start onderzoek naar Elon Musk’s X en XAI wegens seksuele AI-deepfakes

februari 3, 2026

Onderzoek naar Elon Musk’s X en XAI over seksuele AI-deepfakes De Britse gegevensregulator heeft op dinsdag een onderzoek geopend naar X en xAI om te bepalen of de bedrijven van Elon Musk zich aan de wetgeving omtrent persoonsgegevens hebben gehouden, met betrekking tot de generatie van seksuele deepfakes door de AI-chatbot Grok. Dit markeert een…

Technology

Landen versterken hun digitale verdedigingen te midden van toenemende wereldwijde spanningen en de dreiging van cyberoorlogvoering

april 21, 2025

Experts in de Verenigde Staten roepen op tot een krachtiger beleid om hun digitale grenzen te beschermen. Door de toenemende wereldwijde spanningen en dreigende handelsoorlogen tussen de Verenigde Staten en vrijwel elk land ter wereld, waarschuwen experts voor verhoogde cybersecuritybedreigingen en een digitale wapenwedloop terwijl landen zichzelf verdedigen. “De geopolitieke stof is nog aan het…

Technology

‘We zijn minder beschermd’ door AI, zegt klokkenluider van Cambridge Analytica over de bescherming van onze gegevens

mei 5, 2025

Brittany Kaiser pleit voor open-source kunstmatige intelligentie in de overheid In een interview heeft Brittany Kaiser, klokkenluider van Cambridge Analytica, haar pleidooi voor open-source kunstmatige intelligentie (AI) in de overheid uiteengezet. Ze stelt dat de bescherming van online gegevens nauwelijks is verbeterd sinds ze in 2018 getuigde voor het Britse parlement, waar ze aangaf dat…

Technology

Gebruik van Google’s AI-prompt vergelijkbaar met vijf druppels water of de energie voor 9 seconden tv-kijken

september 4, 2025

Gebruik van Google’s AI-prompt vergelijkbaar met vijf druppels water of de energie die nodig is om 9 seconden televisie te kijken Technologiebedrijven zijn voorzichtig geweest over de milieu-impact van hun AI-modellen. Een nieuw technisch rapport onthult dat het uitvoeren van een enkele prompt op Google’s kunstmatige intelligentie (AI) chatbot Gemini ongeveer dezelfde hoeveelheid energie verbruikt…

Meeste veiligheidsmaatregelen voor AI-tools binnen enkele minuten te omzeilen, blijkt uit onderzoek

Historische Sahara-neerslag voornamelijk veroorzaakt door tropische luchtstromen, blijkt uit onderzoek

Tijd dringt voor EU-lidstaten om te beslissen over Chat Controle

Britse gegevensautoriteit start onderzoek naar Elon Musk’s X en XAI wegens seksuele AI-deepfakes

Landen versterken hun digitale verdedigingen te midden van toenemende wereldwijde spanningen en de dreiging van cyberoorlogvoering

‘We zijn minder beschermd’ door AI, zegt klokkenluider van Cambridge Analytica over de bescherming van onze gegevens

Gebruik van Google’s AI-prompt vergelijkbaar met vijf druppels water of de energie voor 9 seconden tv-kijken

Geef een reactie Reactie annuleren

Abonneer je vandaag nog

Recent nieuws

Iranse aanvallen op energie-installaties in de Golf zorgen voor onrust op de markten en verhogen recessievrees

Wie profiteert waarschijnlijk van Iran’s Hormuz-strategie? Rusland

Welke EU-landen zijn het meest kwetsbaar voor verstoringen in de LNG-levering?

Moet je ChatGPT gebruiken voor medische vragen? Nieuwe studie waarschuwt voor voorzichtigheid

Vergelijkbare berichten

Geef een reactie Reactie annuleren

Abonneer je vandaag nog

Recent nieuws