獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相:基於阿里雲Qwen模型監督微調而成

《科創板日報》6日訊,今日有報道稱李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用,成功訓練出了一個名爲s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現,據稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。《科創板日報》記者調查後發現,s1模型的訓練並非從零開始,其基座模型爲阿里通義千問(Qwen)模型。s1用50美元訓練出新的具有推理能力的模型,實際上只是用從谷歌模型中提煉出來的1000個樣本,然後對千問模型進行微調而成。(記者毛明江 黃心怡)