In het kort:
Gemini 2.5 Deep Think markeert een belangrijke mijlpaal in AI-ontwikkeling door gebruik te maken van meerdere AI-agents die parallel samenwerken aan complexe vraagstukken.
- Het model scoort 34,8% op Humanity's Last Exam, significant hoger dan concurrenten Grok 4 (25,4%) en OpenAI's o3 (20,3%).
- Een speciale versie van het model won een gouden medaille bij de Internationale Wiskunde Olympiade.
- Het systeem blinkt uit in programmeren met een score van 87,6% op LiveCodeBench6, ver boven de concurrentie.
Het grote plaatje:
De industrie beweegt collectief richting multi-agent systemen, met vergelijkbare ontwikkelingen bij xAI, OpenAI en Anthropic. Deze aanpak vraagt meer rekenkracht maar levert betere resultaten.
- Google stelt een speciale IMO-versie beschikbaar aan wiskundigen voor onderzoeksdoeleinden.
- Het model kan uren besteden aan het doorgronden van complexe problemen, in tegenstelling tot de gebruikelijke responstijd van seconden.
- De technologie is voorlopig alleen toegankelijk via het Ultra-abonnement van $250 per maand.
Vooruitkijkend:
Google plant een beperkte release via de Gemini API om te onderzoeken hoe ontwikkelaars en bedrijven het systeem kunnen inzetten voor praktische toepassingen.