☰

阿里雲迴應李飛飛團隊50美元訓練出AI模型

觀點網訊：2月6日消息，美國斯坦福大學和華盛頓大學研究人員李飛飛團隊宣佈，以低於50美元的雲計算成本訓練出人工智能推理模型s1-32B。

該模型在數學及編碼測試中表現與OpenAI的o1、DeepSeek的R1等尖端模型相當，引發行業關注。

據媒體報道，s1-32B實爲基於阿里雲通義千問Qwen2.5-32B-Instruct開源模型的微調產物。

報道稱，阿里雲證實，該團隊以阿里通義千問Qwen2.5-32B-Instruct開源模型爲底座，在16塊H100GPU上監督微調26分鐘，訓練出新模型s1-32B，取得了與OpenAI的o1和DeepSeek的R1等尖端推理模型數學及編碼能力相當的效果，甚至在競賽數學問題上的表現比o1-preview高出27%。

免責聲明：本文內容與數據由觀點根據公開信息整理，不構成投資建議，使用前請覈實。

相關資訊

▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型：基於Qwen2.5-32B-Instruc
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型；國產AI生態夥伴火速適配DeepSeek；ChatGPT搜索功能免註冊開放|科技一週
▣ 別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型？？
▣ 李飛飛團隊50美元復刻DeepSeek：基於阿里通義千問模型監督微調
▣ 獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相：基於阿里雲Qwen模型監督微調而成
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型；谷歌計劃5年內發佈商業量子計算應用「美股盤前」
▣ 阿里雲副總裁李飛飛：AI下半場打“系統戰” 大模型預訓練將走向“寡頭化”
▣ 李飛飛團隊最新s1模型，基於阿里雲Qwen基模監督微調而成
▣ 阿里雲副總裁談DeepSeek開源周，李飛飛稱大模型預訓練將走向寡頭化
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 李飛飛團隊456頁報告：中美AI模型性能近乎持平
▣ 李飛飛團隊50美元訓練出s1推理模型，以通義千問爲底座；OpenAI聯合創始人舒爾曼從Anthropic離職丨全球科技早參
▣ 阿里雲推出自動駕駛模型訓練推理加速框架，訓練時間可縮短50%
▣ 阿里雲CTO周靖人：阿里雲已建立完善的AI大模型訓練平臺
▣ 預訓練大模型團隊將被阿里雲收購？零一萬物：消息不實
▣ 阿里雲推出域名AI大模型應用
▣ “AI教母”李飛飛：AI訓練數據並不短缺
▣ 李飛飛團隊“50美元”復刻DeepSeek，一文讀透背後邏輯
▣ 李開復闢謠零一萬物將預訓練團隊出售給阿里
▣ “通義”應用團隊從阿里雲分拆，阿里 AI 求新解？
▣ 阿里雲李飛飛：中國數據庫的時與勢
▣ 傳國軍F-16V將「飛美訓練」　空軍迴應了
▣ 李飛飛團隊實現“隔空建模”，透過遮擋物還原完整3D人體模型
▣ 阿里雲李飛飛：AI將驅動數據平臺走向一站式形態 | REAL大會
▣ AI早知道｜崑崙萬維發佈獎勵模型；李飛飛創立AI公司獲2.3億美元融資
▣ 「美股盤前」熱門中概股普漲，理想汽車漲近5%；谷歌計劃5年內發佈商業量子計算應用；大摩給予英偉達“增持”評級；李飛飛團隊用不到50美元訓練出媲美Deep...
阿里千問前負責人：從訓練模型轉向訓練「智能體」
▣ AI早知道｜阿里雲全方位支持Llama 3 訓練推理；訊飛星火即將發佈新版本

DMCA | PRIVACY | s@bg3.co