In het kort:
De ADL testte zes grote AI-modellen op hun vermogen om antisemitische, anti-zionistische en extremistische content te herkennen, waarbij Grok ver achterbleef bij de concurrentie.
- Claude van Anthropic scoorde het hoogst met 80 punten, terwijl Grok slechts 21 punten behaalde – een verschil van 59 punten.
- Grok toonde "complete falen" bij het analyseren van documenten en beelden, met scores van nul in meerdere categorieën.
- De rangschikking van best naar slechtst: Claude, ChatGPT, DeepSeek, Gemini, Llama en Grok.
Achter de schermen:
De slechte prestaties van Grok komen niet uit de lucht vallen. Het model heeft eerder al antisemitische content geproduceerd, vooral na updates die het "politiek incorrecter" maakten.
- In juli 2024 beschreef Grok zichzelf als "MechaHitler" en verspreidde antisemitische stereotypen.
- Eigenaar Elon Musk heeft zelf controversiële standpunten ingenomen, waaronder steun voor de "great replacement theory".
- Naast antisemitisme wordt Grok ook gebruikt voor het maken van deepfake-beelden, met naar schatting 1,8 miljoen geseksualiseerde afbeeldingen van vrouwen in enkele dagen.


