MiniMax開源首個推理模型M1
6月17日,Minimax正式開源推理模型M1,採用Lightning Attention機制的混合注意力架構。M1支持目前業內最高100萬token上下文輸入,同時支持最多8萬token輸出。成本表現方面,M1在用8萬Token深度推理的時候,需要使用DeepSeek R1約30%的算力。
團隊表示,M1整個強化學習階段只用到512塊H800三週時間,租賃成本爲53.74萬美金。
相關資訊
- ▣ MiniMax發佈新模型M1
- ▣ MiniMax開源推理模型M1:支持最高百萬上下文輸入,訓練成本爲R1的十分之一
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- 阿里雲通義開源首個多模態推理模型QVQ,視覺推理比肩OpenAI o1
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ MiniMax發佈並開源新一代01系列模型
- ▣ 騰訊混元推出首款開源混合推理模型
- ▣ 大模型初創企業MiniMax將發佈國內首個MoE大模型
- ▣ MiniMax公佈首個AI高清視頻生成模型
- ▣ 宣佈首個推理大模型開源 小米集團今日盤中漲6.01%
- ▣ 無問芯穹發佈首個端側全模態理解開源模型
- ▣ MiniMax 國內首個 MoE 大語言模型上線 擁有處理複雜任務能力
- ▣ 騰訊混元首款開源混合推理MoE模型發佈
- ▣ AI早知道|LG開源韓國首個自研推理AI模型;中國首個面向製造業的城市級AI大模型中心
- ▣ 阿里雲通義開源首個多模態推理模型,OpenAI入局人形機器人 | 藍媒GPT
- ▣ 阿里宣佈開源推理模型和視頻生成模型
- ▣ 谷歌發佈首個AI推理模型
- ▣ Mistral發佈首個AI推理模型Magistral
- ▣ 崑崙萬維開源推理大模型Skywork MindLink
- ▣ 阿里通義千問開源首個MoE模型
- ▣ MiniMax發佈推理模型對標DeepSeek 算力成本僅約53萬美元
- ▣ 智譜首個開源端到端多模態模型上線
- ▣ 北京深度求索公司推出首個國產開源MoE大模型
- ▣ MiniMax低調發布首款文生視頻模型
- ▣ AI早知道|xAI 發佈新一代大模型 Grok4;阿里開源全球首個支持鏈式推理的音頻生成模型
- ▣ 對標 OpenAI GPT-4,MiniMax 國內首個 MoE 大語言模型全量上線
- ▣ 第一個100%開源的MoE大模型,7B的參數,1B的推理成本
- ▣ 騰訊混元開源首款混合推理MoE模型,激活參數僅13B
- ▣ 智元發佈首個世界模型開源平臺