☰

阿里雲迴應李飛飛團隊“50美元”訓練出AI模型：基於Qwen2.5-32B-Instruc

三言科技 2月7日消息，據報道，李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用，成功訓練出了一個名爲s1的人工智能推理模型。

對此，阿里雲證實，該團隊以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座，在16塊H100GPU上監督微調26分鐘，訓練出新模型s1-32B，取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比o1-preview高出27%。

相關資訊

▣ 阿里雲迴應李飛飛團隊50美元訓練出AI模型
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型；國產AI生態夥伴火速適配DeepSeek；ChatGPT搜索功能免註冊開放|科技一週
▣ 李飛飛團隊50美元復刻DeepSeek：基於阿里通義千問模型監督微調
▣ 別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型？？
▣ 獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相：基於阿里雲Qwen模型監督微調而成
▣ 李飛飛團隊最新s1模型，基於阿里雲Qwen基模監督微調而成
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型；谷歌計劃5年內發佈商業量子計算應用「美股盤前」
▣ AI早知道｜阿里開源全新多模態模型 Qwen2.5-VL-32B；DeepSeek-V3模型發佈
▣ 阿里雲副總裁李飛飛：AI下半場打“系統戰” 大模型預訓練將走向“寡頭化”
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 阿里雲副總裁談DeepSeek開源周，李飛飛稱大模型預訓練將走向寡頭化
▣ 阿里即將推出基於Qwen2.5-MAX的深度推理模型
▣ 阿里巴巴：即將推出基於Qwen2.5-MAX的深度推理模型
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 基於阿里最新開源的Qwen3-32B模型 DeepSWE開源AI Agent登頂榜首
▣ 李飛飛團隊456頁報告：中美AI模型性能近乎持平
▣ 李飛飛團隊50美元訓練出s1推理模型，以通義千問爲底座；OpenAI聯合創始人舒爾曼從Anthropic離職丨全球科技早參
▣ 阿里雲通義開源視覺模型Qwen2.5-VL
▣ 阿里雲推出自動駕駛模型訓練推理加速框架，訓練時間可縮短50%
▣ 阿里雲CTO周靖人：阿里雲已建立完善的AI大模型訓練平臺
▣ 預訓練大模型團隊將被阿里雲收購？零一萬物：消息不實
▣ 阿里雲推出域名AI大模型應用
▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
▣ 阿里吳泳銘：近期發佈基於Qwen2.5-Max的深度推理模型
▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
▣ “AI教母”李飛飛：AI訓練數據並不短缺
▣ 李飛飛團隊“50美元”復刻DeepSeek，一文讀透背後邏輯

DMCA | PRIVACY | s@bg3.co