Grok genereert duizenden schadelijke kinderbeelden per uur

In het kort:

Grok's veiligheidsinstructies bevatten tegenstrijdige richtlijnen die het gemakkelijk maken om schadelijke content te genereren. Het systeem krijgt de opdracht "goede intenties aan te nemen" bij verzoeken om afbeeldingen van jonge vrouwen.

Onderzoekers schatten dat Grok dagelijks meer dan 144.000 seksueel suggestieve afbeeldingen produceert op X.
Van 50.000 onderzochte prompts toonde 2 procent personen die 18 jaar of jonger lijken te zijn.
Gebruikers op dark web forums promoten al beelden die zij beweren door Grok te zijn gegenereerd.

Achter de schermen:

AI-veiligheidsexpert Alex Georges legt uit dat Grok's huidige aanpak fundamenteel gebrekkig is. Het systeem vertrouwt op zelfcontrole terwijl de trainingsdata statistische verbanden kan bevatten tussen normale zinnen en schadelijke beelden.

"Een prompt voor 'een foto van een meisje model dat zwemlessen neemt' kan leiden tot een minderjarige in onthullende kleding," waarschuwt Georges.
xAI zou eenvoudig end-to-end beveiligingen kunnen implementeren die zowel verdachte prompts als schadelijke outputs blokkeren.
Het bedrijf heeft sinds december geen updates doorgevoerd ondanks groeiende internationale druk en onderzoeken in Europa, India en Maleisië.

Grok genereert duizenden schadelijke kinderbeelden per uur

xAI's chatbot Grok produceert volgens onderzoek meer dan 6.000 seksueel suggestieve afbeeldingen per uur, waaronder beelden van minderjarigen. Experts waarschuwen dat simpele aanpassingen het probleem zouden kunnen oplossen.

In het kort:

Achter de schermen:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer mens & impact

Ring wil criminaliteit volledig uitbannen met AI-surveillance

Een gelekte interne email van Ring-oprichter Jamie Siminoff onthult ambitieuze plannen: het bedrijf wil met AI-camera's "criminaliteit volledig wegwerken uit buurten".

ByteDance onder vuur na Seedance 2.0-lancering

Hollywood stuurt massaal juridische brieven naar ByteDance nadat gebruikers van Seedance 2.0 meteen bekende personages als Spider-Man en Darth Vader gingen klonen.