阿里雲迴應李飛飛團隊“50美元”訓練出AI模型:基於Qwen2.5-32B-Instruc
三言科技 2月7日消息,據報道,李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用,成功訓練出了一個名爲s1的人工智能推理模型。
對此,阿里雲證實,該團隊以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座,在16塊H100GPU上監督微調26分鐘,訓練出新模型s1-32B,取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果,甚至在競賽數學問題上的表現比o1-preview高出27%。
相關資訊
- ▣ 阿里雲迴應李飛飛團隊50美元訓練出AI模型
- ▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
- ▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型;國產AI生態夥伴火速適配DeepSeek;ChatGPT搜索功能免註冊開放|科技一週
- ▣ 李飛飛團隊50美元復刻DeepSeek:基於阿里通義千問模型監督微調
- ▣ 別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型??
- ▣ 獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相:基於阿里雲Qwen模型監督微調而成
- ▣ 李飛飛團隊最新s1模型,基於阿里雲Qwen基模監督微調而成
- ▣ AI早知道|阿里開源全新多模態模型 Qwen2.5-VL-32B;DeepSeek-V3模型發佈
- ▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型;谷歌計劃5年內發佈商業量子計算應用「美股盤前」
- ▣ 阿里雲副總裁李飛飛:AI下半場打“系統戰” 大模型預訓練將走向“寡頭化”
- ▣ 阿里巴巴漲超7%!李飛飛團隊推出低成本模型s1,基座爲阿里通義千問(Qwen)模型
- ▣ 阿里雲副總裁談DeepSeek開源周,李飛飛稱大模型預訓練將走向寡頭化
- ▣ 阿里即將推出基於Qwen2.5-MAX的深度推理模型
- ▣ 阿里巴巴:即將推出基於Qwen2.5-MAX的深度推理模型
- ▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
- ▣ 李飛飛團隊456頁報告:中美AI模型性能近乎持平
- ▣ 李飛飛團隊50美元訓練出s1推理模型,以通義千問爲底座;OpenAI聯合創始人舒爾曼從Anthropic離職丨全球科技早參
- ▣ 阿里雲通義開源視覺模型Qwen2.5-VL
- ▣ 阿里雲推出自動駕駛模型訓練推理加速框架,訓練時間可縮短50%
- ▣ 阿里雲CTO周靖人:阿里雲已建立完善的AI大模型訓練平臺
- ▣ 阿里雲推出域名AI大模型應用
- ▣ 預訓練大模型團隊將被阿里雲收購?零一萬物:消息不實
- ▣ 阿里雲通義開源視覺理解模型Qwen2.5-VL
- ▣ 阿里吳泳銘:近期發佈基於Qwen2.5-Max的深度推理模型
- ▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
- ▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
- ▣ “AI教母”李飛飛:AI訓練數據並不短缺
- ▣ 李飛飛團隊“50美元”復刻DeepSeek,一文讀透背後邏輯
- ▣ AI早知道|阿里開源大模型QwQ-32B;Grok免費開放語音模式