Vast in een 'AI-labyrint': Het plan van een bedrijf om bots te stoppen met het verzamelen van content voor AI-training

Vast in een ‘AI-labyrint’: Het plan van een bedrijf om bots te stoppen met het verzamelen van content voor AI-training

Cloudflare ontwikkelt nieuwe strategie tegen ongewenste bots

Cloudflare, een Amerikaanse aanbieder van webdiensten, heeft een innovatieve oplossing gevonden om web scraping tegen te gaan. Het bedrijf heeft een “AI-labyrint” opgezet dat speciaal is ontworpen om bots, zoals “AI crawlers”, te detecteren. Deze bots zijn erop gericht om systematisch data van webpagina’s te verzamelen.

In een blogpost die vorige week werd gepubliceerd, meldde Cloudflare een “explosie aan nieuwe crawlers” die door AI-bedrijven worden gebruikt om data te verzamelen voor modeltraining. Om dit fenomeen te bestrijden, zal Cloudflare “een reeks AI-gegenereerde pagina’s koppelen die overtuigend genoeg zijn om een crawler aan te trekken” wanneer ongepaste botactiviteit wordt gedetecteerd. Op deze manier worden de bots gedwongen om tijd en middelen te verspillen.

“We wilden een nieuwe manier creëren om deze ongewenste bots tegen te houden, zonder dat ze zich ervan bewust zijn,” aldus het bedrijf. Ze vergelijken het proces met een “honeypot” en helpen tegelijkertijd om kwaadwillende actoren te catalogiseren. Cloudflare wordt momenteel gebruikt op ongeveer 20 procent van alle websites, volgens de laatste schattingen.

De afleidingsmanoeuvre bestaat uit “echte en gerelateerde wetenschappelijke feiten”, maar is “gewoon niet relevant of eigendom van de site die wordt gecrawld”, voegde de blogpost toe. Het zal ook onzichtbaar zijn voor menselijke bezoekers en zal geen invloed hebben op de webreferenties, aldus het bedrijf.

Toenemende bedreiging voor auteursrechtelijk beschermd materiaal

Een groeiend aantal stemmen roept op tot strengere maatregelen, waaronder regelgeving, om content te beschermen tegen diefstal door AI-actoren. Visuele kunstenaars onderzoeken momenteel hoe ze modellen kunnen “vergiftigen” door een laag data toe te voegen die als afleidingsmanoeuvre voor AI fungeert. Dit helpt hen hun artistieke stijl te behouden door het moeilijker te maken om deze na te volgen door generatieve AI.

LEZEN  Nederlands staatsburger gearresteerd in Kenia na vluchten voor veroordeling voor kindermisbruik

Er zijn ook verschillende andere benaderingen verkend, waaronder deals tussen nieuwsuitgevers en technologiebedrijven, waarbij afgesproken werd dat AI op hun content mag trainen in ruil voor niet openbaar gemaakte bedragen.

Vergelijkbare berichten

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *