☰

獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相：基於阿里雲Qwen模型監督微調而成

《科創板日報》6日訊，今日有報道稱李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用，成功訓練出了一個名爲s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現，據稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。《科創板日報》記者調查後發現，s1模型的訓練並非從零開始，其基座模型爲阿里通義千問（Qwen）模型。s1用50美元訓練出新的具有推理能力的模型，實際上只是用從谷歌模型中提煉出來的1000個樣本，然後對千問模型進行微調而成。（記者毛明江黃心怡）

相關資訊

▣ 李飛飛團隊最新s1模型，基於阿里雲Qwen基模監督微調而成
▣ 李飛飛團隊50美元復刻DeepSeek：基於阿里通義千問模型監督微調
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型：基於Qwen2.5-32B-Instruc
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
▣ 阿里雲迴應李飛飛團隊50美元訓練出AI模型
▣ 別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型？？
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 李飛飛團隊“50美元”復刻DeepSeek，一文讀透背後邏輯
▣ 雲天勵飛：DeepEdge10已完成DeepSeek R1系列模型適配
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型；谷歌計劃5年內發佈商業量子計算應用「美股盤前」
▣ 阿里雲DataWorks正式接入DeepSeek-R1(671B)模型
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型；國產AI生態夥伴火速適配DeepSeek；ChatGPT搜索功能免註冊開放|科技一週
▣ 長城證券成功上線大模型DeepSeek與阿里Qwen
▣ 阿里雲副總裁談DeepSeek開源周，李飛飛稱大模型預訓練將走向寡頭化
▣ 雲天勵飛：近期公司聯合華爲基於昇騰服務器實現DeepSeek-R1全尺寸模型的本地化部署
▣ 阿里Qwen團隊發佈新推模型QwQ 會展示完整的思維鏈
▣ 阿里Qwen猛追DeepSeek
▣ 阿里雲百鍊qwen-max系列模型官宣降價
▣ 阿里雲：支持雲上一鍵部署DeepSeek-V3、DeepSeek-R1
▣ 阿里開源千問3模型成本僅需DeepSeek-R1三分之一
▣ 阿里推出全新推理模型僅1/21參數媲美DeepSeek R1
▣ 阿里雲通義千問最新模型Qwen-Image亮相可生成吉卜力風格圖片
▣ 中物聯發佈基於Deepseek-R1大模型的中物靈境應用
▣ 雲天勵飛：近期公司聯合華爲實現DeepSeek-R1全尺寸模型的本土化部署
▣ 阿里雲宣佈支持雲上一鍵部署DeepSeek-V3、DeepSeek-R1
▣ 幻方量化旗下DeepSeek發佈開源模型，超越阿里Qwen、Meta Llama
▣ 阿里開源WebSailor，檢索性能超DeepSeek R1、Grok-3等模型
阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
▣ 李飛飛團隊年度報告揭底大模型成本：Gemini Ultra是GPT-4的2.5倍

DMCA | PRIVACY | s@bg3.co