阿里雲迴應李飛飛團隊50美元訓練出AI模型

觀點網訊:2月6日消息,美國斯坦福大學和華盛頓大學研究人員李飛飛團隊宣佈,以低於50美元的雲計算成本訓練出人工智能推理模型s1-32B。

該模型在數學及編碼測試中表現與OpenAI的o1、DeepSeek的R1等尖端模型相當,引發行業關注。

據媒體報道,s1-32B實爲基於阿里雲通義千問Qwen2.5-32B-Instruct開源模型的微調產物。

報道稱,阿里雲證實,該團隊以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座,在16塊H100GPU上監督微調26分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-preview高出27%。

免責聲明:本文內容與數據由觀點根據公開信息整理,不構成投資建議,使用前請覈實。