月之暗面開源Kimi-Dev-72B模型,超越DeepSeek R1登頂全球第一

據悉,月之暗面推出針對軟件工程任務的全新開源代碼大模型Kimi-Dev-72B。該模型在SWE-bench Verified編程基準測試中取得全球最高開源模型水平,以72B的參數量超越了參數量達671B的新版DeepSeek-R1。Kimi-Dev-72B通過大規模強化學習優化,能夠自主修補Docker中的真實存儲庫,並確保解決方案的正確性和穩健性。其設計理念包括BugFixer和TestWriter的組合、中期訓練、強化學習和測試時自我博弈。目前,該模型已在Hugging Face和GitHub上提供下載和部署。