月之暗面開源Kimi-Dev-72B模型,超越DeepSeek R1登頂全球第一
據悉,月之暗面推出針對軟件工程任務的全新開源代碼大模型Kimi-Dev-72B。該模型在SWE-bench Verified編程基準測試中取得全球最高開源模型水平,以72B的參數量超越了參數量達671B的新版DeepSeek-R1。Kimi-Dev-72B通過大規模強化學習優化,能夠自主修補Docker中的真實存儲庫,並確保解決方案的正確性和穩健性。其設計理念包括BugFixer和TestWriter的組合、中期訓練、強化學習和測試時自我博弈。目前,該模型已在Hugging Face和GitHub上提供下載和部署。
相關資訊
- ▣ 月之暗面發佈最新開源模型Kimi-Dev:72B,刷新開源SOTA
- ▣ 月之暗面 Kimi 開源 Moonlight
- ▣ Kimi新模型拿下代碼開源SOTA,僅僅72B,發佈即開源
- ▣ 超越OpenAI o1! DeepSeek-R1升至全球風格控制類第一,“中國模型”震動華爾街
- ▣ 阿里開源千問3模型 成本僅需DeepSeek-R1三分之一
- ▣ 國產AI大模型DeepSeek全球走紅,超越ChatGPT登頂應用商店
- 贏麻了!DeepSeek超越150萬模型:成全球最受歡迎開源大模型
- 阿里發佈最新開源模型Qwen3 成本僅爲DeepSeek-R1三分之一
- ▣ 媲美OpenAI o3,DeepSeek深夜開源新版R1模型
- 號稱「全面超越DeepSeek」 阿里巴巴新一代AI模型登場
- 月之暗面創始人楊植麟:kimi數學模型來了
- ▣ DeepSeek開源新版R1模型,同類規模第一的人工智能ETF(159819)助力佈局AI全產業鏈
- ▣ DeepSeek-R1 模型全面上線亞馬遜雲科技
- ▣ 月之暗面Kimi首個Agent——Kimi-Researcher開啓內測
- ▣ Alibaba 新開源模型 QwQ-32B:以更小算力匹敵 DeepSeek-R1
- ▣ 百度雲千帆模型及文小言全面接入DeepSeek R1最新模型
- ▣ Kimi 模型,硬核開源...
- ▣ 大砍投放預算 DeepSeek衝擊之下月之暗面Kimi暫緩“燒錢”
- ▣ 小米超級小愛接入DeepSeek-R1模型
- ▣ DeepSeek開源新版R1,媲美OpenAI o3模型;英偉達Q1營收441億美元,超預期 丨全球科技早參
- ▣ 月之暗面Kimi首個Agent開啓內測
- ▣ 月之暗面推出 Kimi-Researcher
- DeepSeek推新版R1 稱表現直逼美國頂尖模型
- ▣ 月之暗面宣佈推出新模型 Kimi Latest:始終使用最新模型,名稱保持不變
- ▣ 月之暗面發佈 Kimi k1.5 多模態思考模型,實現 SOTA 級多模態推理能力
- ▣ 中國AI公司DeepSeek R1模型引發硅谷震動,開源模式成焦點
- ▣ 大中礦業:公司目前與月之暗面Kimi大模型無業務合作
- ▣ 一汽紅旗新能源攜億咖通科技接入DeepSeek-R1模型
- ▣ Kimi爆了 月之暗面“亮”了