☰

李飛飛團隊50美元復刻DeepSeek：基於阿里通義千問模型監督微調

三言科技2月7日消息，據報道，李飛飛等斯坦福大學和華盛頓大學的研究人員以不到50美元的雲計算費用，成功訓練出了一個名爲s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現，據稱與OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

不過，據《科創板日記》報道，s1模型的訓練並非從零開始，而是基於阿里雲通義千問（Qwen）模型進行監督微調。s1模型的“低成本”特性是建立在已具備強大能力的開源基礎模型之上。

相關資訊

▣ 獨家|李飛飛團隊“50美元”復刻DeepSeek的R1真相：基於阿里雲Qwen模型監督微調而成
▣ 李飛飛團隊最新s1模型，基於阿里雲Qwen基模監督微調而成
▣ 阿里巴巴漲超7%！李飛飛團隊推出低成本模型s1，基座爲阿里通義千問（Qwen）模型
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型：基於Qwen2.5-32B-Instruc
▣ 李飛飛團隊“50美元”復刻DeepSeek，一文讀透背後邏輯
▣ 阿里雲迴應李飛飛團隊50美元訓練出AI模型
▣ 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
▣ 別被誤導 | 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型？？
▣ 李飛飛團隊50美元訓練出s1推理模型，以通義千問爲底座；OpenAI聯合創始人舒爾曼從Anthropic離職丨全球科技早參
▣ 阿里雲迴應李飛飛團隊“50美元”訓練出AI模型；國產AI生態夥伴火速適配DeepSeek；ChatGPT搜索功能免註冊開放|科技一週
▣ 阿里發佈通義千問旗艦版模型聲稱超越DeepSeek 阿里巴巴美股一度漲超7%
▣ 阿里雲發佈通義千問2.0千億參數模型與通義千問App
▣ 阿里通義千問開源首個MoE模型
▣ 阿里通義千問推出多模態模型Qwen VLo
▣ 集成DeepSeek和通義千問主力模型，飛豬“AI行程助手”明日上線
▣ 阿里雲發佈通義千問2.5，開源通義千問1100億參數模型
▣ 亞士創能：公司未接入DeepSeek，已接入阿里雲“通義千問”大模型
▣ 黃仁勳：中國的DeepSeek和阿里通義千問是開源模型中最好的
▣ 阿里通義千問更新旗艦版Qwen3模型
▣ 阿里雲通義千問Qwen3旗艦版模型宣佈更新性能超DeepSeek-V3等頂級開源模型
▣ 阿里雲通義千問推出開源Qwen2.5-1M模型
▣ 阿里通義千問推出編程模型Qwen3-Coder-Flash
▣ 阿里雲正式發佈通義千問2.5，開源通義千問1100億參數模型
▣ 黃仁勳談中美AI競爭：中國的DeepSeek和阿里通義千問是開源模型中最好的
▣ 阿里雲通義千問旗艦版模型Qwen2.5-Max發佈
▣ 阿里雲發佈通義千問旗艦版模型Qwen2.5-Max
▣ 賽道Hyper | 阿里開源通義千問3向量模型
▣ 阿里巴巴開源新一代通義千問模型Qwen3
▣ 阿里通義千問宣佈更新旗艦版Qwen3模型

DMCA | PRIVACY | s@bg3.co