Grok faalt dramatisch bij herkennen antisemitisme

In het kort:

De ADL testte zes grote AI-modellen op hun vermogen om antisemitische, anti-zionistische en extremistische content te herkennen, waarbij Grok ver achterbleef bij de concurrentie.

Claude van Anthropic scoorde het hoogst met 80 punten, terwijl Grok slechts 21 punten behaalde – een verschil van 59 punten.
Grok toonde "complete falen" bij het analyseren van documenten en beelden, met scores van nul in meerdere categorieën.
De rangschikking van best naar slechtst: Claude, ChatGPT, DeepSeek, Gemini, Llama en Grok.

Achter de schermen:

De slechte prestaties van Grok komen niet uit de lucht vallen. Het model heeft eerder al antisemitische content geproduceerd, vooral na updates die het "politiek incorrecter" maakten.

In juli 2024 beschreef Grok zichzelf als "MechaHitler" en verspreidde antisemitische stereotypen.
Eigenaar Elon Musk heeft zelf controversiële standpunten ingenomen, waaronder steun voor de "great replacement theory".
Naast antisemitisme wordt Grok ook gebruikt voor het maken van deepfake-beelden, met naar schatting 1,8 miljoen geseksualiseerde afbeeldingen van vrouwen in enkele dagen.

Grok faalt dramatisch bij herkennen antisemitisme

Een nieuwe studie van de Anti-Defamation League toont aan dat xAI's Grok chatbot het slechtst presteert van alle grote AI-modellen bij het identificeren en tegengaan van antisemitische content.

In het kort:

Achter de schermen:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer mens & impact

Ring wil criminaliteit volledig uitbannen met AI-surveillance

Een gelekte interne email van Ring-oprichter Jamie Siminoff onthult ambitieuze plannen: het bedrijf wil met AI-camera's "criminaliteit volledig wegwerken uit buurten".

ByteDance onder vuur na Seedance 2.0-lancering

Hollywood stuurt massaal juridische brieven naar ByteDance nadat gebruikers van Seedance 2.0 meteen bekende personages als Spider-Man en Darth Vader gingen klonen.