☰

李飛飛團隊最新s1模型，基於阿里雲Qwen基模監督微調而成

近日，李飛飛團隊提出了一種模型訓練新方法引發熱議，他們以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座，在16塊H100 GPU上監督微調26分鐘，訓練出新模型s1-32B，取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比 o1-preview 高出27%。

更早之前，DeepSeek官方曾透露，將DeepSeek-R1的推理能力蒸餾6個模型開源給社區，其中4個模型來自Qwen：基於Qwen-32B蒸餾的模型，在多項能力上實現了對標OpenAI o1-mini的效果。

相關資訊

▣ 獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相：基於阿里雲Qwen模型監督微調而成
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 李飛飛團隊50美元復刻DeepSeek：基於阿里通義千問模型監督微調
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型：基於Qwen2.5-32B-Instruc
▣ 阿里雲迴應李飛飛團隊50美元訓練出AI模型
▣ 阿里Qwen團隊發佈新推模型QwQ 會展示完整的思維鏈
▣ 阿里雲百鍊qwen-max系列模型官宣降價
▣ 阿里雲通義千問最新模型Qwen-Image亮相可生成吉卜力風格圖片
▣ 阿里雲開源視頻基礎模型
▣ 啓明星辰：泰合安全大模型與阿里通義Qwen大模型適配實現多基座模型部署
▣ 阿里通義千問推出多模態模型Qwen VLo
▣ 阿里巴巴漲近5% 阿里雲百鍊qwen-max系列模型官宣降價
▣ AI科學家李飛飛最新發聲：中美頂級模型差距已基本抹平
▣ 長城證券成功上線大模型DeepSeek與阿里Qwen
▣ 阿里雲副總裁談DeepSeek開源周，李飛飛稱大模型預訓練將走向寡頭化
▣ 李飛飛團隊實現“隔空建模”，透過遮擋物還原完整3D人體模型
▣ 李飛飛團隊年度報告揭底大模型成本：Gemini Ultra是GPT-4的2.5倍
▣ 李飛飛團隊456頁報告：中美AI模型性能近乎持平
▣ ReKep——李飛飛團隊提出的讓機器人具備空間智能：基於視覺語言模型GPT-4o和關係關鍵點約束（下）
▣ ReKep——李飛飛團隊提出的讓機器人具備空間智能：基於視覺語言模型GPT-4o和關係關鍵點約束（上）
▣ 基於阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首
▣ 基於豆包大模型，火山引擎“飛連”首發大模型IT賦能平臺
▣ 阿里雲副總裁李飛飛：AI下半場打“系統戰” 大模型預訓練將走向“寡頭化”
▣ 大模型上終端，阿里雲找“隊友”
▣ 阿里推出多模態生成模型Qwen VLo，支持精準P圖與多語言指令
▣ 李飛飛團隊發佈“具身智能”成果：機器人接入大模型直接聽懂人話
▣ AI早知道｜Qwen團隊發佈Qwen3-Coder代碼模型；阿里巴巴推出首款自研AI眼鏡
▣ 阿里即將推出基於Qwen2.5-MAX的深度推理模型
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型；國產AI生態夥伴火速適配DeepSeek；ChatGPT搜索功能免註冊開放|科技一週

DMCA | PRIVACY | s@bg3.co