Google DeepMind: Kan AI nu vinde matematik-olympiader?
På torsdag hævdede Google DeepMind noget spektakulært: Deres AI-systemer, AlphaProof og AlphaGeometry 2, har løst fire ud af seks problemer ved årets Internationale Matematik-olympiade (IMO). Det svarer til en sølvmedalje! Men før vi bliver for begejstrede, er der selvfølgelig nogle forbehold.
AI-systemer vs. teenagematematikgenier
IMO er ingen lille konkurrence. Siden 1959 har den udfordret unge matematikgenier fra hele verden med knudrede problemer inden for algebra, kombinatorik, geometri og talteori. At løse IMO-problemer er en formidabel målestok for AI’s matematiske evner.
AlphaProof formåede at cracke to algebra-problemer og en talteori-opgave, mens AlphaGeometry 2 klarede sig igennem geometriproblemet. Kombinatorik? Not so much. De tog sig en lang pause der. I følge Google, løste AI’erne én opgave på få minutter og havde brug for op til tre dage for andre.
Hastighed er ikke alles stærke side
Matematikeren Sir Timothy Gowers tilbød et mere jordnært perspektiv. Ifølge ham tog det AI-systemerne over 60 timer at løse nogle af opgaverne. “Hvis de menneskelige deltagere havde haft den slags tid, ville de utvivlsomt have scoret højere,” skrev Gowers.
Der er også den detalje, at problemerne først skulle oversættes til formelt matematisk sprog (Lean) før AI’en kunne begynde. Og hvem stod for det? Jep, menneskerne. Gowers bemærkede: “Autoformaliseringsdelen blev udført af mennesker.”
Er matematikere snart arbejdsløse?
Selvom systemerne løste nogle vilde problemer, spekulerede Gowers om AI’en kunne erstatte matematikere. “Vi er stadig et par gennembrud fra at gøre matematikerne overflødige,” skrev han. Men han erkendte også, at der er noget spændende i gang med AI’en.
Så hvad nu? AlphaGeometry 2’s succesrate er steget fra 53% til 83% af historiske IMO-opgaver, og det tog kun 19 sekunder at løse dette års geometriproblem. Selvom vi måske ikke er klar til at sige farvel til de kloge hoveder endnu, kan disse AI-modeller blive uvurderlige forskningsværktøjer.
Sådan går det, når teknik møder tal. Hvem ved, hvad der er næste skridt for Google DeepMind? Måske en AI, der kan forhandle weekendens indkøb?