李飛飛團隊50美元復刻DeepSeek:基於阿里通義千問模型監督微調

三言科技2月7日消息,據報道,李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用,成功訓練出了一個名爲s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

不過,據《科創板日記》報道,s1模型的訓練並非從零開始,而是基於阿里雲通義千問(Qwen)模型進行監督微調。s1模型的“低成本”特性是建立在已具備強大能力的開源基礎模型之上。