☰

MiniMax開源首個推理模型M1

6月17日，Minimax正式開源推理模型M1，採用Lightning Attention機制的混合注意力架構。M1支持目前業內最高100萬token上下文輸入，同時支持最多8萬token輸出。成本表現方面，M1在用8萬Token深度推理的時候，需要使用DeepSeek R1約30%的算力。

團隊表示，M1整個強化學習階段只用到512塊H800三週時間，租賃成本爲53.74萬美金。

相關資訊

▣ MiniMax發佈新模型M1
▣ MiniMax開源推理模型M1：支持最高百萬上下文輸入，訓練成本爲R1的十分之一
▣ 阿里雲通義開源首個多模態推理模型QVQ
阿里雲通義開源首個多模態推理模型QVQ，視覺推理比肩OpenAI o1
▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
▣ MiniMax發佈並開源新一代01系列模型
▣ 騰訊混元推出首款開源混合推理模型
▣ 大模型初創企業MiniMax將發佈國內首個MoE大模型
▣ MiniMax公佈首個AI高清視頻生成模型
▣ 宣佈首個推理大模型開源小米集團今日盤中漲6.01%
大陸又一開源模型爆紅！　MiniMax性能「超越DeepSeek」
▣ 無問芯穹發佈首個端側全模態理解開源模型
▣ MiniMax 國內首個 MoE 大語言模型上線擁有處理複雜任務能力
▣ AI早知道｜LG開源韓國首個自研推理AI模型；中國首個面向製造業的城市級AI大模型中心
▣ 騰訊混元首款開源混合推理MoE模型發佈
▣ 阿里雲通義開源首個多模態推理模型，OpenAI入局人形機器人 | 藍媒GPT
▣ 阿里宣佈開源推理模型和視頻生成模型
▣ 谷歌發佈首個AI推理模型
▣ Mistral發佈首個AI推理模型Magistral
▣ 崑崙萬維開源推理大模型Skywork MindLink
▣ 阿里通義千問開源首個MoE模型
▣ MiniMax發佈推理模型對標DeepSeek 算力成本僅約53萬美元
▣ 智譜首個開源端到端多模態模型上線
▣ 北京深度求索公司推出首個國產開源MoE大模型
▣ AI早知道｜xAI 發佈新一代大模型 Grok4；阿里開源全球首個支持鏈式推理的音頻生成模型
▣ MiniMax低調發布首款文生視頻模型
▣ 對標 OpenAI GPT-4，MiniMax 國內首個 MoE 大語言模型全量上線
▣ 第一個100%開源的MoE大模型，7B的參數，1B的推理成本
▣ 智元發佈首個世界模型開源平臺

DMCA | PRIVACY | s@bg3.co