MiniMax開源首個推理模型M1

6月17日,Minimax正式開源推理模型M1,採用Lightning Attention機制的混合注意力架構。M1支持目前業內最高100萬token上下文輸入,同時支持最多8萬token輸出。成本表現方面,M1在用8萬Token深度推理的時候,需要使用DeepSeek R1約30%的算力。

團隊表示,M1整個強化學習階段只用到512塊H800三週時間,租賃成本爲53.74萬美金。