OpenAI三人團隊兩月內實現AI斬獲IMO金牌

8月9日,OpenAI的IMO金牌核心團隊成員Alexander Wei、Noam Brown與Sheryl Hsu在紅杉Training Data播客中分享了他們如何在短短兩個月內讓AI達到IMO金牌水平。

團隊透露,儘管OpenAI內部對模型能否獲勝存在爭議,甚至有研究員曾想以2:1的賠率打賭模型不會贏,但最終他們成功了。爲了驗證AI的解題能力,他們聘請了外部的IMO獎牌獲得者對AI生成的證明進行評分,每份證明由三位獎牌獲得者審覈,最終一致認爲AI有能力獲得IMO金牌。

此次突破的關鍵在於AI推理時間的顯著延長,從幾秒擴展到幾小時,使模型能夠更深入地思考複雜問題。此外,新模型還展現出自我意識,主動承認無法解答第六題,減少了“幻覺”問題,提高了AI的可靠性。

團隊還介紹了他們的獨特方法:使用多智能體系統,讓多個AI“助手”分工協作,從而在短時間內解決複雜問題。這種方法不僅適用於數學競賽,還將在未來擴展到其他領域,如物理奧林匹克競賽等。

儘管AI在IMO中取得了突破,但距離解決千禧難題等更復雜的數學問題仍有很長的路要走。團隊表示,他們將繼續努力,讓AI不僅能夠解題,還能提出新的數學問題。