MiniMax發佈推理模型對標DeepSeek 算力成本僅約53萬美元
財聯社6月17日電,MiniMax6月17日宣佈將連續五天發佈重要更新。今天第一彈是開源首個推理模型MiniMax-M1。根據官方的報告,MiniMax-M1多項基準測試比肩DeepSeek-R1、Qwen3等開源模型,接近海外的最領先模型。官方博客還提到,基於兩大技術創新,MiniMax-M1訓練過程高效得“超出預期”,只用了3周時間、512塊H800 GPU就完成強化學習訓練階段,算力租賃成本僅53.47萬美元。這比一開始的預期少了一個數量級。
相關資訊
- ▣ MiniMax發佈abab大模型:6.51秒內可處理近3萬字文本
- ▣ MiniMax發佈萬億MoE模型abab 6.5
- ▣ MiniMax發佈新模型M1
- ▣ 月活超3600萬人 Kimi發佈數學推理模型,能力可對標OpenAI o1系列
- ▣ DeepSeek發佈中國版o1推理模型,海外量子計算密集突破
- ▣ Kimi發佈新一代推理模型,數學能力對標OpenAI o1系列
- ▣ DeepSeek發佈R1模型,性能對標OpenAI o1正式版
- ▣ MiniMax開源首個推理模型M1
- 阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
- ▣ 阿里推出全新推理模型 僅1/21參數媲美DeepSeek R1
- ▣ 針鋒相對!Kimi和DeepSeek同日發佈新模型,對標 OpenAI o1!
- ▣ Deepseek發佈新模型 訓練成本降低10倍
- ▣ 騰訊發佈新一代大模型“混元Turbo” 推理成本降低50%
- ▣ DeepSeek首次公佈模型推理系統優化細節 估成本利潤率達545%
- ▣ 成都華微:全力推進DeepSeek R1推理模型在端側推理芯片部署
- ▣ MiniMax低調發布首款文生視頻模型
- ▣ 當虹龍智發佈“DeepSeek+虹小智”政務大模型算力一體機
- ▣ 百度回擊!正式發佈文心大模型4.5及X1,對標DeepSeek-R1
- ▣ 月之暗面發佈k1.5多模態思考模型,緊隨DeepSeek對標o1正式版
- ▣ 行業觀察:DeepSeek加速推理成本優化;模速空間構建算力生態超市
- ▣ MiniMax開源推理模型M1:支持最高百萬上下文輸入,訓練成本爲R1的十分之一
- ▣ “標王”科大訊飛發佈推理模型!算力全國產,數學能力國內第一,驚豔一線教師
- ▣ 大模型初創企業MiniMax將發佈國內首個MoE大模型
- ▣ MiniMax發佈並開源新一代01系列模型
- ▣ MiniMax公佈首個AI高清視頻生成模型
- ▣ 豆包大模型推理算力需求測算
- ▣ 科大訊飛:星火大模型在國產算力平臺上實現訓練與推理,訓練成本與DeepSeek V3相當
- 號稱匹敵GPT-4o 陸AI模型DeepSeek-V3訓練僅花558萬美元
- ▣ 科技早報|MiniMax發佈首款視頻生成大模型;蘋果新...