AI模型取得國際奧數競賽金牌級成績
據英國《新科學家》雜誌網站22日報道,谷歌旗下深度思維公司和美國OpenAI公司相繼宣稱,其AI模型在近日舉行的國際數學奧林匹克競賽(IMO)中,首次取得金牌級成績。
IMO一直被研究人員視爲AI系統數學推理能力的試金石。去年,深度思維公司宣佈,其開發的數學推理AI模型“阿爾法證明”和幾何求解AI模型“阿爾法幾何”攜手取得銀牌級成績。
19日,OpenAI宣佈其新型AI系統在4.5小時內正確解答6道國際奧數競賽題中的5道;兩天後,深度思維的“雙子座深度思考”系統交出了同樣的成績。IMO主席格雷戈爾·多利納爾證實,成績經由競賽官方閱卷人嚴格評定。
與“阿爾法證明”和“阿爾法幾何”系統都專爲IMO打造,且使用名爲“精益”的計算機編程語言編寫問題和答案不同,今年兩大團隊的模型均採用自然語言處理技術。
“雙子座深度思考”開發人員解釋稱,強化學習是機器學習的一個分支,旨在讓智能體在環境中通過試錯來學習如何實現特定目標。這種方法是谷歌此前在“阿爾法零”等AI遊戲上取得成功的關鍵。
OpenAI則僅透露運用了強化學習與“實驗性方法”,技術細節仍籠罩在迷霧中。
菲爾茲獎得主、美國加州大學洛杉磯分校數學家陶哲軒評價道,這一進展令人振奮,但需要可復現的研究數據支撐。IMO金牌得主約瑟夫·梅耶指出,自然語言證明雖具可讀性優勢,但冗長論證可能帶來驗證困難。