Google's Gemini 2.5 Deep Think zet nieuwe standaard in AI-redenering

In het kort:

Gemini 2.5 Deep Think markeert een belangrijke mijlpaal in AI-ontwikkeling door gebruik te maken van meerdere AI-agents die parallel samenwerken aan complexe vraagstukken.

Het model scoort 34,8% op Humanity's Last Exam, significant hoger dan concurrenten Grok 4 (25,4%) en OpenAI's o3 (20,3%).
Een speciale versie van het model won een gouden medaille bij de Internationale Wiskunde Olympiade.
Het systeem blinkt uit in programmeren met een score van 87,6% op LiveCodeBench6, ver boven de concurrentie.

Het grote plaatje:

De industrie beweegt collectief richting multi-agent systemen, met vergelijkbare ontwikkelingen bij xAI, OpenAI en Anthropic. Deze aanpak vraagt meer rekenkracht maar levert betere resultaten.

Google stelt een speciale IMO-versie beschikbaar aan wiskundigen voor onderzoeksdoeleinden.
Het model kan uren besteden aan het doorgronden van complexe problemen, in tegenstelling tot de gebruikelijke responstijd van seconden.
De technologie is voorlopig alleen toegankelijk via het Ultra-abonnement van $250 per maand.

Vooruitkijkend:

Google plant een beperkte release via de Gemini API om te onderzoeken hoe ontwikkelaars en bedrijven het systeem kunnen inzetten voor praktische toepassingen.

Google's Gemini 2.5 Deep Think zet nieuwe standaard in AI-redenering

Google DeepMind lanceert een baanbrekend multi-agent AI-systeem dat complexe problemen oplost door meerdere denkpaden tegelijk te verkennen. Het model is vanaf vrijdag beschikbaar voor Ultra-abonnees.

In het kort:

Het grote plaatje:

Vooruitkijkend:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer business

Google's Gemini 3.1 Pro verslaat ChatGPT en Claude

Google's nieuwste denkmodel Gemini 3.1 Pro overtreft ChatGPT en Claude op cruciale benchmarks, waaronder de beruchte 'Humanity's Last Exam' die menselijke intelligentie test.

OpenAI brengt AI-zoeken naar Indiase streamingdienst

OpenAI slaat de handen ineen met Reliance om JioHotstar uit te rusten met slimme zoekfuncties die werken met spraak en tekst in meerdere talen.