Kimi和DeepSeek又又又撞車?

摘要:

據鳳凰網科技瞭解,今年楊植麟的關注重心早已發生改變。2月底,Kimi內部在重點推進模型表現的提升,“楊植麟親自帶隊”。近期,Kimi則專注垂直領域,核心都是提升模型能力上限。

幾個大模型初創企業裡,Kimi當下最爲安靜。

“(Kimi)最核心的任務就是提升留存,或者把留存作爲一個重要的衡量指標” 去年11月,在Kimi上線一週年之際,創始人兼CEO楊植麟曾在一場小型溝通會中亮相併提出了這一觀點。

“有一輪大廠的錢進來後,投資人確實會要求看數據,楊植麟作爲創始人肯定要在這方面用心”,接近Kimi的人士告訴鳳凰網科技,根據披露,那時Kimi的月活用戶突破了3600萬,躋身國內AI原生應用TOP3的席位。

據鳳凰網科技瞭解,今年楊植麟的關注重心早已發生改變。

2月底,Kimi內部專注模型能力的提升,最直觀的體現就是榜單,“楊植麟親自帶隊”,接近Kimi的人士表示。參與打榜的模型爲K1.6,其結果顯示,在全球動態基準測試平臺 LiveCodeBench,K1.6超過了 GPT o3mini、o1 等模型,在代碼生成測試中實現登頂。不過,K1.6和坊間傳聞的K2至今沒有發佈。

與打榜同期進行的,是招聘法律相關的數據專家。5月,Kimi被傳進軍醫療賽道,實際上同樣是招聘醫療領域的相關數據專家,目標是爲了提升醫療內容的信息檢索質量。

近日,Kimi又悄悄上線了學術搜索。

“很明顯,Kimi在加強垂直領域的能力”,另一行業人士對鳳凰網科技表示。

“Kimi作爲閉源模型,想要去證明自己的能力,打榜是一個很重要的途徑,這也是爲什麼之前楊植麟會帶隊上場”,多位行業人士對鳳凰網科技表示,“早就聽說Kimi迴歸基模了”。而入局垂類賽道,同樣不失爲一種提升模型能力,減少幻覺的有效手段之一。

在新的對壘格局下,Kimi仍在努力留在牌桌上。

再度撞車DeepSeek

頗爲巧合的是,DeepSeek5月在招聘的新數據百曉生,便是以醫學方向爲主。

所謂百曉生,主要做的是文本語料標註工作,並與AI工程師進行合作提升大模型的能力和反饋質量。

通過加強專業內容的索引,可以有效的減少模型的幻覺率。有行業人士對鳳凰網科技表示,“大量專業用戶,在財經、醫療、法律、代碼等領域對模型的專業和可靠存在需求”。

更早之前,DeepSeek與Kimi都瞄準了法律賽道。

今年2月,Kimi開放了AI數據專家法律方向的招聘,職位要求應聘者具備2年以上法律相關垂類場景工作的經驗,有對相關垂類場景較好的專業功底和知識儲備,並能理解在法律相關垂類場景中用戶的訴求。

據前述行業人士分享,Kimi在2024年曾有相當長的時間保持Web端用戶量的第一,擁有大量專業用戶,也在外界心中形成了AI可以被當作生產力工具的認知。

崑崙萬維CEO方漢在發佈新agent產品時也曾對鳳凰網科技表示,AI在生產力場景下有着廣闊的商業化前景。但現階段,很多模型在垂類領域的表現只能打60到70分,可用性還不夠強。

這也恰恰是當前基座大模型企業發展垂直領域的難點,“想把垂直領域做好了,還是非常考驗模型能力的。同時還得做好專業數據的深度挖掘,這是Kimi當前面臨的考驗”,前述行業人士對鳳凰網科技表示。

同樣是在4月,Kimi宣佈與財新傳媒正式達成內容合作。在Kimi提問財經相關內容時,Kimi將結合財新傳媒旗下報道內容,通過模型生成答案,意圖是提高真實性,降低幻覺。

目標依舊是AGI

今年以來,國內月活Top3的AI原生應用座次,從豆包、Kimi和文心一言,搖身一變成了DeepSeek、豆包和騰訊元寶。Kimi落到了第四的位置。

與此同時,Kimi暫停了此前的投流營銷策略。有接近Kimi的人士對鳳凰網科技表示,“Kimi今年更關注自然增長和用戶留存”,另有多位博主表示,春節後就沒再接到過Kimi的需求。

該行業人士認爲,不同時期會有不同市場形勢,“DeepSeek的出圈,包括Kimi去年憑藉200萬字長文本的出圈,都說明了創新的重要性”。這在今天的市場上,也成爲了一個新共識。

階躍星辰CEO姜大昕在不久前的一場小範圍溝通會中表達,“DeepSeek給我們的經驗就是,投流的邏輯實際上(對AI的c端產品來說)是不成立的”。

“根據我對Kimi的瞭解,他們一直是把探索AGI、提升模型能力作爲目標的”,前述行業人士對鳳凰網科技表示,發力垂類賽道不等於放棄對基座模型的預訓練,“相反需要在基建上做得更紮實,才能支撐起垂類賽道的專業和領先”。

儘管AI六小虎的概念人們開始提得越來越少了,但其中還是有不少小規模公司仍在追求模型能力的上限。

楊植麟在去年底的溝通中提過一個觀點,其認爲“AI的發展就像盪鞦韆,我們會在兩種狀態之間來回切換:有時候,算法、數據都很ready了,但是算力不夠,我們要做的就是加算力;但今天我們發現,不斷擴大算力規模已經不一定能直接解決問題了,所以這時就需要通過改變算法,來突破這個瓶頸。”

當前,各個公司從不同路線入手,以期達到模型更高的可用性。

就在端午節前夕,DeepSeek更新了R1模型的小版本升級,並透露該版本模型是基於去年12月發佈的V3 Base模型作爲基座模型,但在後訓練中投入了更多算力,顯著提升了模型的思維深度和推理能力。特別是在編程等基準測試中,評分表現已與o3、Gemini-2.5-Pro相當。

DeepSeek官方還着重強調了幻覺改善,稱“與舊版相比,更新後的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更爲準確、可靠的結果”。

阿里雲創始人王堅也在不久前的採訪中對鳳凰網科技表示,當下是基礎模型能力最強的時期,鼓勵更多開發者去做潛在顛覆式應用的開發。

不過,王堅也坦言,個人並不認可“通用人工智能(AGI)”這一新概念,認爲AI的核心價值應迴歸技術本身。“如果一定要談未來,AI的發展階段和能力邊界將遠超今天人類的想象,至於是否會被定義爲AGI,答案或許並不重要。”他強調,技術的顛覆性突破往往誕生於“未被預設的領域”,而當前大模型展現出的能力已讓許多傳統認知被重新定義。

王堅還以OpenAI的發展歷程爲例:“ChatGPT的誕生並非一蹴而就,而是建立在GPT-3.5、GPT-4等多次迭代的基礎上。關鍵在於,開發者能否跳出傳統思維,主動探索模型潛藏的能力。”他特別表示,如今AI基礎模型的成熟度已遠超OpenAI初創時期,且技術門檻的降低讓更多企業站上同一起跑線。“今天具備這樣模型能力的有很多家公司,那在杭州就有DeepSeek,也有千問。(所以)先不要擔心大模型能做什麼,不能做什麼,我覺得這是唯一我們往前走(通往AGI)的方法”。

值得一提的是,最新消息稱,兩名 OpenAI 公司代表在墨西哥舉辦的 AI Summit 峰會上透露,公司正在開發下一代基礎模型 GPT-5,並計劃通過該模型與競爭對手展開更激烈角逐。他們還明確表示,GPT-5即將面世,另有消息稱或許是7月。

如若GPT-5如期面世,AI行業或將再度迎來飛躍性時刻。

本文源自:鳳凰網科技