斯坦福揭秘o1-preview軟肋:數學競賽題稍作修改,準確率驟降30%

斯坦福大學最近的一項研究發現,儘管 o1-preview 在數學、代碼等領域能力逆天,但只要對數學競賽的題目稍修改,模型解答的準確率竟會立刻下降30%。

本文源自:金融界AI電報