MiniMax開源首個推理模型M1
6月17日,Minimax正式開源推理模型M1,採用Lightning Attention機制的混合注意力架構。M1支持目前業內最高100萬token上下文輸入,同時支持最多8萬token輸出。成本表現方面,M1在用8萬Token深度推理的時候,需要使用DeepSeek R1約30%的算力。
團隊表示,M1整個強化學習階段只用到512塊H800三週時間,租賃成本爲53.74萬美金。
相關資訊
- ▣ MiniMax發佈新模型M1
- ▣ MiniMax開源推理模型M1:支持最高百萬上下文輸入,訓練成本爲R1的十分之一
- ▣ 阿里雲通義開源首個多模態推理模型QVQ
- 阿里雲通義開源首個多模態推理模型QVQ,視覺推理比肩OpenAI o1
- ▣ MiniMax發佈並開源新一代01系列模型
- ▣ 阿里雲通義千問發佈業界首個開源多模態推理模型
- ▣ 大模型初創企業MiniMax將發佈國內首個MoE大模型
- ▣ MiniMax公佈首個AI高清視頻生成模型
- ▣ 宣佈首個推理大模型開源 小米集團今日盤中漲6.01%
- ▣ 無問芯穹發佈首個端側全模態理解開源模型
- ▣ MiniMax 國內首個 MoE 大語言模型上線 擁有處理複雜任務能力
- ▣ AI早知道|LG開源韓國首個自研推理AI模型;中國首個面向製造業的城市級AI大模型中心
- ▣ 阿里雲通義開源首個多模態推理模型,OpenAI入局人形機器人 | 藍媒GPT
- ▣ 阿里宣佈開源推理模型和視頻生成模型
- ▣ 谷歌發佈首個AI推理模型
- ▣ Mistral發佈首個AI推理模型Magistral
- ▣ MiniMax發佈推理模型對標DeepSeek 算力成本僅約53萬美元
- ▣ MiniMax低調發布首款文生視頻模型
- ▣ 阿里通義千問開源首個MoE模型
- ▣ 對標 OpenAI GPT-4,MiniMax 國內首個 MoE 大語言模型全量上線
- ▣ 智譜首個開源端到端多模態模型上線
- ▣ 北京深度求索公司推出首個國產開源MoE大模型
- ▣ 第一個100%開源的MoE大模型,7B的參數,1B的推理成本
- ▣ 百度李彥宏:開源模型是智商稅,閉源模型更強大、推理成本更低
- ▣ AI早知道|ChatGPT AI搜索免費開放;全球首個端側全模態理解開源AI模型
- ▣ MiniMax 視頻生成模型首秀!閆俊傑:大模型的研發核心是“快”
- ▣ AI早知道|豆包大模型1.5 Pro正式發佈;網易發佈並開源國內首個輸出分步式講解的推理模型
- ▣ AI早知道|騰訊推全球首個語音指揮FPS AI ;摩爾線程開源音頻理解大模型
- ▣ 鴻海富士康推出旗下首個AI 推理大模型 FoxBrain