稀宇科技推出萬億MoE模型abab 6.5

4月17日，稀宇科技MiniMax正式推出abab 6.5系列模型。abab 6.5系列包含兩個模型：abab 6.5和abab 6.5s。據介紹，abab 6.5包含萬億參數，支持200k tokens的上下文長度；abab 6.5s跟abab 6.5使用了同樣的訓練技術和數據，但是更高效，支持200k tokens的上下文長度，可以1秒內處理近3萬字的文本。在各類核心能力測試中，abab 6.5開始接近GPT-4、Claude-3、Gemini-1.5等大語言模型。

稀宇科技推出萬億MoE模型abab 6.5

相關資訊