Wie won goud op de meest prestigieuze wiskundecompetitie: Google DeepMind of OpenAI?

Wie won goud op de meest prestigieuze wiskundecompetitie: Google DeepMind of OpenAI?

Wie won goud op de meest prestigieuze wiskundewedstrijd ter wereld?

Afgelopen weekend werden kunstmatige intelligentie (AI) modellen getest om te bepalen wie de beste zogenaamde ‘mathlete’ is op de Internationale Wiskunde Olympiade (IMO) in Australië. Google’s DeepMind en OpenAI, de ontwikkelaar van ChatGPT, beweren beide een prestatie op goudniveau te hebben geleverd tijdens de competitie, hoewel alleen Google daadwerkelijk aan de wedstrijd meedeed.

De IMO bevestigde de resultaten van DeepMind, terwijl OpenAI zijn model evalueerde op de problemen van de IMO 2025 en de resultaten zelf publiceerde voordat deze officieel werden geverifieerd. Alex Wei, een onderzoeker bij OpenAI die werkt aan grote taalmodellen (LLM’s) en redeneren, kondigde de resultaten aan op zijn X-account.

Een geavanceerde versie van DeepMind’s Gemini Deep Think loste vijf van de zes IMO-problemen perfect op, wat resulteerde in 35 punten en een prestatie op goudniveau. Het model van OpenAI loste ook vijf van de zes problemen op en behaalde dezelfde score.

Beide modellen tonen aan hoe ver AI is gekomen sinds de technologie een sprongetje maakte met de lancering van ChatGPT in november 2022. De wiskundetest is zelf erg moeilijk en slechts ongeveer 10 procent van de 630 deelnemers ontving dit jaar een gouden medaille. Deelnemers uit meer dan 100 landen namen deel aan de competitie, die gericht is op elite middelbare scholieren. Deelnemers onder de 20 jaar kunnen zich inschrijven.

“Toen we met OpenAI begonnen, was dit een droom, maar niet een die we als realistisch beschouwden; het is een belangrijke mijlpaal voor hoe ver AI in het afgelopen decennium is gekomen,” schreef OpenAI CEO Sam Altman op X in verband met de wiskundewedstrijd. Hij voegde eraan toe dat het bedrijf “binnenkort” een nieuwe versie, GPT-5, zal uitbrengen, maar dat het niet van plan is “een model met IMO-goudniveau capaciteiten binnen enkele maanden uit te brengen.”

LEZEN  Italiaanse privacytoezichthouder legt OpenAI boete van €15 miljoen op na onderzoek naar gegevensverzameling door ChatGPT

Intussen schreef Google in een blogpost: “Het is een belangrijke mijlpaal voor hoe ver AI is gekomen in het afgelopen decennium.” Het bedrijf nam vorig jaar deel aan de competitie en won een zilveren medaille. “Onze sprongetje van zilver naar goud in slechts één jaar toont een opmerkelijk tempo van vooruitgang in AI,” aldus Google.

Beide bedrijven vierden echter de menselijke deelnemers en vermeden het kaderen van de competitie als een uitdaging tussen mens en machine. Wei noemde hen “enkele van de slimste jonge geesten van de toekomst” en merkte op dat OpenAI enkele voormalige IMO-deelnemers in dienst heeft.

Vergelijkbare berichten

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *