Logo van Ars Technica

-Onderzoek

Google's AlphaProof behaalt zilver op wiskundeolympiade

Copyright arstechnica
Foto: VandaagAI.nl

DeepMind's AlphaProof scoorde slechts één punt onder goud bij de meest prestigieuze wiskundewedstrijd ter wereld. Dit markeert een doorbraak waarbij AI eindelijk logisch redeneren beheerst, niet alleen rekenen.

In het kort:

AlphaProof presteerde op het niveau van zilveren medaillewinnaars bij de International Mathematical Olympiad 2024, wat een mijlpaal betekent voor AI-redenering.

  • Het systeem behaalde 28 van de 42 punten door samen te werken met AlphaGeometry 2 voor geometrieproblemen.
  • Voor het eerst kan AI complexe wiskundige bewijzen opstellen die absolute zekerheid vereisen, niet alleen statistische gissingen.
  • Van de zes olympiadeproblemen loste AlphaProof er vijf op, inclusief het beruchte zesde probleem dat slechts zes menselijke deelnemers oplosten.

Achter de schermen:

Het geheim ligt in een revolutionaire aanpak die wiskundige bewijzen behandelt als een spel dat te winnen valt. DeepMind gebruikte de Lean-programmeertaal om 80 miljoen wiskundige stellingen te formaliseren, waarna AlphaProof leerde door trial-and-error zoals AlphaZero deed bij schaak en Go.

De andere kant:

AlphaProof's prestatie komt met belangrijke kanttekeningen die de echte impact relativeren. Op zichzelf scoorde het systeem slechts 21 punten - technisch gezien brons - en had dagen nodig waar menselijke deelnemers 4,5 uur per sessie kregen, met kosten van honderden TPU-dagen per probleem.

Bronnen

Het belangrijkste nieuws gratis in je mailbox

Elke week een korte e-mail met de meest relevante verhalen.

Meer onderzoek