2025世界人工智能大會:數學家丘成桐出題 四個大模型當場做題

中國青年報客戶端訊(中青報·中青網記者 王燁捷)7月26日至28日,2025世界人工智能大會在上海舉辦。在由上海市普陀區人民政府與菲數中國主辦的“人工智能的數學邊界與基礎重構”的高端論壇上,頂尖數學家們扎堆出現。

人工智能與數學有着密不可分的關係,在中外大學校園裡,數學系的學生與人工智能專業的學生往往可以互轉專業,交叉學習。一方面,當大模型參數突破萬億,傳統基於經驗的調參方法陷入瓶頸,模型的泛化能力、安全性、能耗控制等核心問題,亟待數學理論的系統性支撐;另一方面,AI對數學的反哺效應愈發顯著,AlphaGeometry在證明歐幾里得平面幾何定理方面甚至可以超越IMO(國際數學奧林匹克競賽)參賽者平均水平,其核心正是將幾何問題轉化爲AI擅長的符號推理任務,這種"AI for Math"的模式正在改寫數學研究範式。

今年,兩位菲爾茲獎得主這次深度參與了世界人工智能大會。美國數學家、普林斯頓大學的查爾斯·費夫曼(Charles Fefferman)教授帶領觀衆回溯數學與計算的發展歷程,從早期機械驗證到如今AI賦能的協同演進,爲全球研究者指明攻堅方向。

菲爾茲獎首位華人得主、數學家丘成桐教授爲論壇特別選題命題,題目由其團隊聯合歐洲、日本數學家精心遴選,聚焦幾何與代數的交叉難題,直接考驗AI的深層推理能力,由機器模型現場作答,屏幕實時展示AI推理過程。這種“人類出題—機器作答”的模式,既是對AI能力的檢驗,也是人機協同的一次生動演示,旨在通過頂尖數學家的“問題嗅覺”,引導AI聚焦真正具有突破性的核心難點,避免技術算力的無效消耗。

丘成桐的命題引發“人機對抗”看點。上海人工智能實驗室、商湯科技、階躍星辰、MiniMax四家機構的基礎大模型現場解題,現場左側的屏幕實時展示AI推理過程。其中,上海人工智能實驗室的Intern-IMO系統成功破解2025年國際數學奧林匹克競賽首題,通過自然語言推理完成幾何構型分析與歸納證明,獲IMO官方打分員認可,該模型數學直覺比較出色。

商湯科技“日日新”大模型更通過圖文混合輸入,分別以座標計算與輔助線構造兩種方法求解平面幾何題,展現多路徑推理能力,對於第一問,它巧妙地運用三項遞推關係,通過數學歸納法清晰地證明了多項式的階數;第二問的證明,通過引入精妙的變量代換,將看似複雜的恆等式兩端化歸爲統一的三角形式;而在第三問證明時,將多項式的內積問題轉換回三角函數的求和。整個解答邏輯清晰,層層遞進,不僅解決了問題,更揭示了問題背後的數學結構之美。

階躍星辰模型則在不等式證明中展現“工具調用”能力,當自身代數計算出錯時,主動藉助外部工具驗證並修正思路,最終完成形式化驗證。其中,流程中的Step3能正確理解數學中“芽”的概念,並且成功構造出題目所要求的素理想,並且嚴格驗證其滿足素性。此外,Step3能通過構造非平凡的函數例子來證明,構造出的素理想非平凡素理想。這也體現了Step3已經具備了理解和運用專業數學知識,並進行成熟的數學邏輯推理的潛力。

MiniMax的M1正確地解答本來的問題之後,還正確地回答了“條件減弱後,結論是否成立”的問題。

圓桌論壇上,數學家與大模型團隊展開深度交鋒。西班牙國家研究委員會研究員鄭凡與上海人工智能實驗室專家合作,展示AI對複雜幾何題的分步拆解,模型通過分類討論排除不可能情況,最終鎖定陽光線數量規律;復旦大學印佳教授與商湯糰隊則呈現AI對學生錯誤解答的批改過程,模型不僅指出角度計算失誤,還追溯邏輯漏洞源頭。

來源:中國青年報客戶端