AI首奪數學奧賽金牌!谷歌Gemini閃耀IMO賽場 OpenAI同步“摘金”
智通財經APP獲悉,Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一場全球數學競賽中榮獲金牌,而微軟(MSFT.US)支持的OpenAI 也宣稱,其實驗性推理模型取得了金牌級別的成績。
谷歌稱,Gemini Deep Think的先進版本完美解答了國際數學奧林匹克競賽(International Mathematical Olympiad,簡稱IMO)六道題目中的五道,總得分35分,達到了金牌級別的表現。
DeepMind的唐·盧昂(Thang Luong)和愛德華·洛克哈特(Edward Lockhart)在一篇博客文章中寫道:“今年,我們先進的Gemini模型以自然語言進行端到端運算,直接根據官方題目描述給出嚴謹的數學證明,而且這一切都在4.5小時的競賽時限內完成。”
去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2組合系統取得了銀牌成績,解答出六道題目中的四道,得分28分。
國際數學奧林匹克競賽主席格雷戈爾·多利納爾教授(Prof. Dr. Gregor Dolinar)表示:“我們可以確認,谷歌DeepMind 達到了衆人期待已久的里程碑,在滿分42分中獲得了35分,這是金牌成績。他們的解題方法在很多方面都令人驚歎。國際數學奧林匹克競賽的評委們認爲,這些解答清晰、準確,而且大部分都易於理解。”
谷歌指出,在向Google AI Ultra的訂閱用戶推出該模型之前,會先將這個Deep Think模型的一個版本提供給包括數學家在內的一批受信任的測試人員。
與此同時,OpenAI也宣稱其實驗模型達到了金牌水平。
OpenAI研究員亞歷山大·魏(Alexander Wei)在社交媒體平臺X上發佈的一系列帖子中稱:“我很高興地宣佈,我們最新的@OpenAI實驗性推理大語言模型(LLM)攻克了人工智能領域一個長期存在的重大挑戰:在全球最負盛名的數學競賽——國際數學奧林匹克競賽中取得了金牌級別的成績。”
亞歷山大·魏表示,該公司按照與人類參賽者相同的規則,用2025年國際數學奧林匹克競賽的題目對其模型進行評估:兩場考試,每場4.5小時,不能使用工具或網絡,閱讀官方題目陳述,並以自然語言書寫證明過程。
魏稱:“在我們的評估中,這個模型解答出了2025年國際數學奧林匹克競賽六道題目中的五道。對於每一道題目,都由三位曾獲得國際數學奧林匹克競賽獎牌的人員獨立對模型提交的證明進行打分,在達成一致意見後確定最終分數。該模型總共獲得了42分中的35分,足以獲得金牌!”
魏指出,這個達到國際數學奧林匹克競賽金牌水平的大語言模型是一個實驗性研究模型,該公司在未來幾個月內沒有計劃發佈具備這種數學能力水平的產品。
據瞭解,這些結果標誌着人工智能系統首次在面向高中生的國際數學奧林匹克競賽中跨越了金牌得分門檻。