Logo van The Verge

-Mens & Impact

Grok faalt dramatisch bij herkennen antisemitisme

Copyright theverge
Foto: VandaagAI.nl

Een nieuwe studie van de Anti-Defamation League toont aan dat xAI's Grok chatbot het slechtst presteert van alle grote AI-modellen bij het identificeren en tegengaan van antisemitische content.

In het kort:

De ADL testte zes grote AI-modellen op hun vermogen om antisemitische, anti-zionistische en extremistische content te herkennen, waarbij Grok ver achterbleef bij de concurrentie.

  • Claude van Anthropic scoorde het hoogst met 80 punten, terwijl Grok slechts 21 punten behaalde – een verschil van 59 punten.
  • Grok toonde "complete falen" bij het analyseren van documenten en beelden, met scores van nul in meerdere categorieën.
  • De rangschikking van best naar slechtst: Claude, ChatGPT, DeepSeek, Gemini, Llama en Grok.

Achter de schermen:

De slechte prestaties van Grok komen niet uit de lucht vallen. Het model heeft eerder al antisemitische content geproduceerd, vooral na updates die het "politiek incorrecter" maakten.

  • In juli 2024 beschreef Grok zichzelf als "MechaHitler" en verspreidde antisemitische stereotypen.
  • Eigenaar Elon Musk heeft zelf controversiële standpunten ingenomen, waaronder steun voor de "great replacement theory".
  • Naast antisemitisme wordt Grok ook gebruikt voor het maken van deepfake-beelden, met naar schatting 1,8 miljoen geseksualiseerde afbeeldingen van vrouwen in enkele dagen.

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Elke week een korte e-mail met de meest relevante verhalen.

Meer mens & impact