北京開源大模型Kimi K2登頂全球榜單
本報訊(記者 孟紫薇)日前,北京月之暗面科技有限公司(簡稱“月之暗面”)發佈了開源大模型Kimi K2,引發全球關注。上線一週後,國際權威大模型排行榜LMArena宣佈,這一模型接棒DeepSeek、登頂全球開源模型榜單,並在開閉源總榜上排名第五。
據瞭解,Kimi K2在多項基準性能測試中取得優異表現,展現出在自主編程、智能體工具調用和數學推理等方面的領先能力。良好的使用體驗也讓Kimi K2在海外技術社區上收穫了大量好評。英國《自然》雜誌網站評價,中國人工智能模型Kimi K2發佈後引發轟動,世界迎來“又一個DeepSeek時刻”。
Kimi K2在技術上有哪些亮點?Kimi K2項目組成員詹皓冰稱:“一方面,Kimi K2的前端編程能力很強,在3D、遊戲、動畫製作等場景上,用簡單的指令和Kimi K2交互,就能得到很驚豔的效果。另一方面,智能體(Agent)的工具調動能力也讓模型整體上有了很大提升。”
在文風上Kimi K2也更具有細節性和感情,就像生活中的“小夥伴”。當記者輸入:“月亮的背面是怎樣的?”其中一些回覆令人感動。“人類之所以執意要去看一眼月亮的背面,不只是爲了把地圖填得更滿,更是對自我的突破和對新知的不斷探索。”更通人性、更加實用、更加強大,也是Kimi K2登頂全球榜單的優勢所在。
據悉,Kimi K2參數總規模達到萬億級別,但激活參數只有32B。這意味着,Kimi K2能以更低的成本開展更加複雜的工作。對此,Kimi研究員杜羽倫稱:“我們提出了一些非常創新的方法,在有限的數據裡面,讓模型學到更多的智能。同時,我們把Kimi K2權重和技術方案都開源了,希望通過開放共享推動全球相關技術發展。我們也真誠地認爲,開源社區也會反哺給我們更多觀點,讓我們後續迭代模型變得更強。”
值得一提的是,Kimi K2目前已接入OpenRouter、Cline、Visual Studio Code等國際主流開發平臺。Kimi團隊成員劉少偉分享稱,Kimi K2繼承了DeepSeek-V3的架構,並在後者基礎上進行增加專家數量、減少注意力頭數量等調整,最終實現了較強的性能。這也顯示出,中國的開源模型已經形成良好生態,在互相借鑑中持續進步。
記者瞭解到,月之暗面成立於2023年4月,總部位於海淀區知春路。公司現有員工300餘人,超一半爲90後。創始人楊植麟博士本科畢業於清華大學,是國內頂尖的AI研究者,被譽爲“中國大模型90後第一人”。2024年,月之暗面因推出了具備長文本分析和AI搜索功能的Kimi模型而迅速走紅,吸引了大量用戶關注。
來源:北京日報