阿里雲迴應李飛飛團隊“50美元”訓練出AI模型:基於Qwen2.5-32B-Instruc

三言科技 2月7日消息,據報道,李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用,成功訓練出了一個名爲s1的人工智能推理模型。

對此,阿里雲證實,該團隊以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座,在16塊H100GPU上監督微調26分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-preview高出27%。