☰

MiniMax發佈推理模型對標DeepSeek 算力成本僅約53萬美元

財聯社6月17日電，MiniMax6月17日宣佈將連續五天發佈重要更新。今天第一彈是開源首個推理模型MiniMax-M1。根據官方的報告，MiniMax-M1多項基準測試比肩DeepSeek-R1、Qwen3等開源模型，接近海外的最領先模型。官方博客還提到，基於兩大技術創新，MiniMax-M1訓練過程高效得“超出預期”，只用了3周時間、512塊H800 GPU就完成強化學習訓練階段，算力租賃成本僅53.47萬美元。這比一開始的預期少了一個數量級。

相關資訊

▣ MiniMax發佈abab大模型：6.51秒內可處理近3萬字文本
▣ MiniMax發佈萬億MoE模型abab 6.5
▣ MiniMax發佈新模型M1
▣ 月活超3600萬人 Kimi發佈數學推理模型，能力可對標OpenAI o1系列
▣ DeepSeek發佈R1模型，性能對標OpenAI o1正式版
▣ Kimi發佈新一代推理模型，數學能力對標OpenAI o1系列
▣ DeepSeek發佈中國版o1推理模型，海外量子計算密集突破
阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
▣ MiniMax開源首個推理模型M1
▣ 針鋒相對！Kimi和DeepSeek同日發佈新模型，對標 OpenAI o1！
▣ 阿里推出全新推理模型僅1/21參數媲美DeepSeek R1
▣ Deepseek發佈新模型訓練成本降低10倍
▣ 騰訊發佈新一代大模型“混元Turbo” 推理成本降低50%
▣ DeepSeek首次公佈模型推理系統優化細節估成本利潤率達545％
▣ 成都華微：全力推進DeepSeek R1推理模型在端側推理芯片部署
▣ 上海AI獨角獸MiniMax發佈視頻生成模型Hailuo 02
▣ 百度回擊！正式發佈文心大模型4.5及X1，對標DeepSeek-R1
▣ 月之暗面發佈k1.5多模態思考模型，緊隨DeepSeek對標o1正式版
▣ 當虹龍智發佈“DeepSeek+虹小智”政務大模型算力一體機
▣ MiniMax低調發布首款文生視頻模型
陸DeepSeek巨獸又來了！發佈最新R1推理模型升級版
▣ 行業觀察：DeepSeek加速推理成本優化；模速空間構建算力生態超市
▣ MiniMax開源推理模型M1：支持最高百萬上下文輸入，訓練成本爲R1的十分之一
▣ “標王”科大訊飛發佈推理模型！算力全國產，數學能力國內第一，驚豔一線教師
號稱匹敵GPT-4o　陸AI模型DeepSeek-V3訓練僅花558萬美元
▣ 大模型初創企業MiniMax將發佈國內首個MoE大模型
▣ 科大訊飛：星火大模型在國產算力平臺上實現訓練與推理，訓練成本與DeepSeek V3相當
▣ 豆包大模型推理算力需求測算
▣ MiniMax發佈並開源新一代01系列模型

DMCA | PRIVACY | s@bg3.co