Logo van Ars Technica

-Tools

Gemini verslaat ChatGPT in nieuwe AI-vergelijkingstest

Copyright arstechnica
Foto: VandaagAI.nl

Google's gratis Gemini-model presteert beter dan OpenAI's ChatGPT in een directe vergelijking, wat Apple's keuze voor een Siri-partnerschap met Google rechtvaardigt.

In het kort:

Ars Technica testte beide gratis AI-modellen op acht verschillende taken en Gemini won op vier punten tegen drie voor ChatGPT. De resultaten tonen aan waarom Apple voor Google koos als nieuwe Siri-partner.

  • ChatGPT scoorde beter op creatieve taken zoals het schrijven van verhalen, maar maakte significante feitelijke fouten bij informatieve vragen.
  • Gemini leverde nauwkeurigere antwoorden zonder hallucinaties, vooral bij biografische informatie en technische berekeningen.
  • Bij complexe problemen zoals Super Mario Bros-strategieën gaf Gemini bruikbare oplossingen terwijl ChatGPT verwarrende adviezen gaf.

Het grote plaatje:

Google heeft sinds 2023 aanzienlijk terrein gewonnen op OpenAI in de AI-race. Waar ChatGPT nog steeds charme toont in creatief schrijven, blijkt Gemini betrouwbaarder voor feitelijke informatie.

  • Gemini bood bij technische vragen zoals Windows-berekeningen duidelijkere uitleg en consistente eenheden, terwijl ChatGPT verward raakte in zijn eigen berekeningen.
  • Voor praktische hulp zoals e-mailsjablonen gaf Gemini meer opties met uitleg over wanneer elke variant te gebruiken.
  • ChatGPT's neiging tot hallucinaties bij biografische informatie ondergraaft het vertrouwen in het model voor informatieve taken.

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Elke week een korte e-mail met de meest relevante verhalen.

Meer tools