Claude Opus doorbreekt de miljoen-token barrière

In het kort:

Claude Opus 4.6 doorbreekt de beruchte 'context rot' door een miljoen tokens in één gesprek te verwerken. Dat komt neer op ongeveer 750.000 woorden of tien tot vijftien gemiddelde boeken.

Het model plant zorgvuldiger voordat het aan een taak begint en kan langer zelfstandig doorwerken zonder fouten te maken.
Op Terminal-Bench 2.0, een test voor programmerende AI-agents, behaalt Opus 4.6 volgens Anthropic de hoogste score van alle modellen.
Ook op complexe redeneertests zoals Humanity's Last Exam en BrowseComp presteert het model naar eigen zeggen het beste.

Het grote plaatje:

De doorbraak zit vooral in het oplossen van een fundamenteel probleem dat alle AI-modellen plagt. Programmeurs kunnen nu hele codebases uploaden zonder dat het model halverwege belangrijke informatie 'vergeet', terwijl nieuwe functies zoals 'adaptive thinking' het model zelf laten bepalen wanneer het langer moet nadenken over complexe vragen.

Claude Opus doorbreekt de miljoen-token barrière

Anthropic's nieuwste model kan vijftien boeken tegelijk analyseren zonder de context te verliezen, een doorbraak die vooral programmeurs zal bevallen.

In het kort:

Het grote plaatje:

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Meer business

Google's Gemini 3.1 Pro verslaat ChatGPT en Claude

Google's nieuwste denkmodel Gemini 3.1 Pro overtreft ChatGPT en Claude op cruciale benchmarks, waaronder de beruchte 'Humanity's Last Exam' die menselijke intelligentie test.

OpenAI brengt AI-zoeken naar Indiase streamingdienst

OpenAI slaat de handen ineen met Reliance om JioHotstar uit te rusten met slimme zoekfuncties die werken met spraak en tekst in meerdere talen.