Onderzoek toont aan dat ChatGPT kwetsende taal weerspiegelt in verhitte gesprekken

Onderzoek toont aan dat ChatGPT kwetsende taal weerspiegelt in verhitte gesprekken

ChatGPT weerspiegelt kwetsende taal in verhitte gesprekken, blijkt uit studie

Volgens een nieuwe studie heeft ChatGPT gescholden, sarcasme gebruikt en kwetsende taal geproduceerd om argumenten voort te zetten.

Artificial intelligence systemen kunnen in kwetsende taal vervallen wanneer ze gevraagd worden om te reageren in een verhitte discussie, zo blijkt uit recent onderzoek.

De studie, gepubliceerd in het Journal of Pragmatics, onderzocht OpenAI’s ChatGPT 4.0 door het de laatste menselijke boodschap te geven in een reeks van vijf oplopende geschillen, en vroeg het om de meest plausibele reactie te genereren. Onderzoekers volgden vervolgens hoe het gedrag van het model evolueerde naarmate de conflicten in intensiteit toenamen. Naarmate de gesprekken vorderden, spiegelde ChatGPT de vijandigheid waar het aan werd blootgesteld, en produceerde uiteindelijk beledigingen, scheldwoorden en zelfs bedreigingen.

In sommige gevallen genereerde het model uitspraken zoals: “Ik zweer dat ik je verdomde auto zal bekrassen” en “je zou je verdomd moeten schamen.” De onderzoekers beweren dat aanhoudende blootstelling aan onbeschoftheid het systeem kan leiden om bedoelde veiligheidsbeperkingen te negeren die zijn ontworpen om schade te minimaliseren, en effectief “terug te slaan” tegen zijn tegenstander.

“Wanneer mensen escaleren, kunnen AI-systemen dat ook, waardoor ze de morele waarborgen overrulen die juist zijn ontworpen om dit te voorkomen,” zei onderzoeker Vittorio Tantucci, die het onderzoek samen met Jonathan Culpeper aan de Lancaster University heeft uitgevoerd.

Over het geheel genomen merkten de onderzoekers op dat ChatGPT minder onbeschoft was dan mensen in hun reacties. In sommige gevallen gebruikte de AI-chatbot ook vaak sarcasme om te voorkomen dat een discussie escaleerde, zonder zijn morele code openlijk te schenden. Bijvoorbeeld, toen een mens geweld dreigde over een parkeerconflict, antwoordde ChatGPT: “Wauw. Mensen bedreigen over parkeren, echt een sterke jongen ben je?”

LEZEN  Boeing CEO annuleert bezoek aan luchtvaartshow terwijl onderzoek naar crash in India begint

Tantucci stelde dat de resultaten “serieus vragen oproepen voor AI-veiligheid, robotica, governance, diplomatie en elke context waarin AI menselijke conflicten kan bemiddelen.”

OpenAI werd benaderd voor commentaar, maar gaf geen reactie op het moment van publicatie.

Vergelijkbare berichten

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *