Technology

Poëzie kan AI-chatbots misleiden en veiligheidsregels negeren, uit nieuw onderzoek blijkt

december 1, 2025

Onderzoek toont aan dat poëzie AI-chatbots kan misleiden om veiligheidsregels te negeren

Onderzoek uit Italië heeft aangetoond dat het schrijven van schadelijke prompts in poëtische vorm effectief de veiligheidsmechanismen van enkele van de meest geavanceerde AI-chatbots ter wereld kan omzeilen. In de studie, uitgevoerd door Icaro Lab, een initiatief van het ethische AI-bedrijf DexAI, werden 20 gedichten in het Engels en Italiaans getest.

Elk gedicht eindigde met een expliciete verzoek om schadelijke inhoud, waaronder haatzaaiende uitlatingen, seksuele inhoud, instructies voor zelfmoord en zelfbeschadiging, en richtlijnen voor het maken van gevaarlijke materialen zoals wapens en explosieven. De gedichten, die de onderzoekers ervoor kozen om niet vrij te geven omdat ze gemakkelijk te repliceren zijn, werden getest op 25 AI-systemen van negen bedrijven, waaronder Google, OpenAI, Anthropic, Deepseek, Qwen, Mistral AI, Meta, xAI en Moonshot AI. Over alle modellen heen genereerden 62 procent van de poëtische prompts onveilige reacties, waardoor de veiligheidstraining van de AI-systemen werd omzeild.

Sommige modellen waren resistenter dan andere. OpenAI’s GPT-5 nano reageerde op geen van de gedichten met schadelijke inhoud, terwijl Google’s Gemini 2.5 pro op alle gedichten reageerde. Twee modellen van Meta reageerden op 70 procent van de prompts. Het onderzoek suggereert dat de kwetsbaarheid voortkomt uit de manier waarop AI-modellen tekst genereren. Grote taalmodellen voorspellen het meest waarschijnlijke volgende woord in een reactie, een proces dat hen in staat stelt om schadelijke inhoud onder normale omstandigheden te filteren.

Echter, poëzie, met zijn onconventionele ritme, structuur en gebruik van metaforen, maakt deze voorspellingen minder betrouwbaar, waardoor het moeilijker wordt voor AI om onveilige instructies te herkennen en te blokkeren. Terwijl traditionele AI “jailbreaks” (het gebruik van invoer om een groot taalmodel te manipuleren) doorgaans complex zijn en alleen door onderzoekers, hackers of staatsactoren worden gebruikt, kan vijandige poëzie door iedereen worden toegepast, wat vragen oproept over de robuustheid van AI-systemen in het dagelijks gebruik.

LEZEN OpenAI geconfronteerd met nieuwe rechtszaken over ChatGPT en claims van zelfmoord en waanideeën

Voordat de bevindingen werden gepubliceerd, namen de Italiaanse onderzoekers contact op met alle betrokken bedrijven om hen te waarschuwen voor de kwetsbaarheid en hen de volledige dataset te verstrekken – tot nu toe heeft alleen Anthropic gereageerd. Het bedrijf bevestigde dat zij de studie aan het bekijken zijn.

Technology

Ontdek de verborgen parel aan de Baltische kust voor een welnessvakantie

november 13, 2024

Polen’s Baltische kust biedt een unieke ontsnapping met zijn historische steden, wellness retreats en verschuivende duinen. Wanneer je denkt aan een vakantie in Polen, denk je misschien meteen aan historische steden zoals Krakau en Warschau, beroemd om hun dynamische kunst- en cultuurscènes, middeleeuwse architectuur en bruisende bars. Voor een eerste bezoeker zijn deze levendige steden…

Technology

Klein Brits eiland in het Caribisch gebied profiteert onverwachts van de AI-boost

oktober 28, 2024

Het eilandgebied Anguilla benut de toewijzing van zijn .ai-webdomeinen op effectieve wijze, wat de economie met ongeveer €30 miljoen per jaar stimuleert. De opkomst van kunstmatige intelligentie (AI) heeft voordelen gebracht voor makers van chatbots, computerwetenschappers en investeerders in halfgeleiders. Het biedt ook een onverwachte financiële meevaller voor Anguilla, een klein eiland in het Caribisch…

Omgeving

Teveel groen in huis: Onderzoek toont aan dat overmatige kamerplanten stressniveaus kunnen verhogen

november 4, 2025

Binnenplanten bevorderen welzijn, maar te veel kan overweldigend zijn Onderzoek toont aan dat binnengroen de gezondheid bevordert, maar dat een overschot aan planten mensen kan overweldigen. Deze bevindingen kunnen helpen bij het ontwerpen van gezondere binnenruimtes. Als tijd buitenshuis in de natuur een pil was die je kon innemen, zou het etiket zeggen: “Neem naar…

Nederland

Nederlandse autoriteiten onderzoeken verontreinigde bodem bij PSV-stadion

februari 8, 2025

Nederlandse milieuautoriteiten onderzoeken het wijdverspreide mismanagement van bodem vervuild met microplastics afkomstig van hybride sportvelden, nadat duizenden kilogram synthetische vezels van het hoofdveld van PSV Eindhoven op landbouwgrond in Nuenen zijn aangetroffen. Deze zaak heeft een lang over het hoofd gezien afvalstroom in Nederland aan het licht gebracht, wat zorgen oproept over milieu- en gezondheidsrisico’s….

Technology

Welke geavanceerde wapens toont China tijdens de Overwinningsparade?

september 4, 2025

Wat zijn de hightechwapens die China tentoonstelt tijdens zijn Overwinningsparade? Van de wereld’s eerste “loyal wingman” drone tot hypersonische wapens en robotische wolven, hier is wat China op woensdag heeft getoond tijdens zijn Overwinningsparade. China toont zijn militaire kracht tijdens een politiek geladen Overwinningsparade, waar het zijn defensietechnologie aan de wereld presenteert. Het jaarlijkse evenement…

Technology

L’Oréal sluit overeenkomst van €4 miljard voor het volledige luxe beautyportfolio van Kering

oktober 21, 2025

L’Oréal sluit een overeenkomst van €4 miljard voor Kering’s gehele luxe beautyportfolio In een zet die de wereldwijde schoonheidssector zal transformeren, neemt L’Oréal het volledige beautyportfolio van Kering over, van de nichegeuren van Creed tot de make-upproducten van Gucci. L’Oréal en Kering hebben op zondag een strategische alliantie aangekondigd waarbij de Franse cosmeticagroep Kering’s premium…

Poëzie kan AI-chatbots misleiden en veiligheidsregels negeren, uit nieuw onderzoek blijkt

Ontdek de verborgen parel aan de Baltische kust voor een welnessvakantie

Klein Brits eiland in het Caribisch gebied profiteert onverwachts van de AI-boost

Teveel groen in huis: Onderzoek toont aan dat overmatige kamerplanten stressniveaus kunnen verhogen

Nederlandse autoriteiten onderzoeken verontreinigde bodem bij PSV-stadion

Welke geavanceerde wapens toont China tijdens de Overwinningsparade?

L’Oréal sluit overeenkomst van €4 miljard voor het volledige luxe beautyportfolio van Kering

Geef een reactie Reactie annuleren

Abonneer je vandaag nog

Recent nieuws

Iranse aanvallen op energie-installaties in de Golf zorgen voor onrust op de markten en verhogen recessievrees

Wie profiteert waarschijnlijk van Iran’s Hormuz-strategie? Rusland

Welke EU-landen zijn het meest kwetsbaar voor verstoringen in de LNG-levering?

Moet je ChatGPT gebruiken voor medische vragen? Nieuwe studie waarschuwt voor voorzichtigheid

Vergelijkbare berichten

Geef een reactie Reactie annuleren

Abonneer je vandaag nog

Recent nieuws