AI週報 | DeepSeek斬獲ACL 2025最佳論文;庫克稱蘋果計劃“大幅”增加AI投資
DeepSeek斬獲ACL 2025最佳論文
7月27日至8月1日,第63屆 ACL(計算語言學年會)在奧地利維也納舉行。今年大會總投稿量突破8000篇,創歷史新高,最終主會論文接收率爲20.3%,Findings 接收率爲16.7%。根據大會官方數據,中國作者首次在第一作者佔比中過半,達到51.3%,遠超第二名美國(14.0%)。本屆 ACL 共評選出4篇最佳論文,包括了DeepSeek與北京大學聯合發表,並由樑文鋒親自“掛帥”的論文榮獲最佳論文獎。該研究提出的原生稀疏注意力(NSA)機制,爲自然語言處理領域的效率突破提供了新思路。
點評:DeepSeek斬獲大獎,再度引發了學界對這一前沿技術的關注。復旦大學計算機技術碩士、知乎答主Nil-9解讀NSA三個主要部件:壓縮模塊、Blockwise選擇模塊和滑動注意力,指出“NSA既包含了Memory compression的思路,在這個基礎上又引入了稀疏化,並且還加入了位置先驗的稀疏化(sliding component)”。計算機硬件從業者、知乎答主錘鍊小助手則將NSA概括爲:“一個針對transformer attention的、簡單有效、高度硬件友好的token數量壓縮算法”。多家AI企業也相繼發佈了有關稀疏注意力的研究成果。微軟亞研院高級研究員曹士傑分享了團隊稀疏注意力相關的研發進展;月之暗面發佈了開源稀疏注意力框架MoBA。
Anthropic超越OpenAI成首選
近期,Menlo Ventures公佈的最新研究報告揭示了人工智能領域企業市場的一次重大變動。報告顯示,新興的人工智能研究公司Anthropic,其AI模型在企業界的受歡迎程度已經悄然超越了昔日的領頭羊OpenAI。這一轉變標誌着AI技術在商業應用領域的迅速發展。數據顯示,Anthropic目前在企業大型語言模型市場的佔有率達到了32%,相比之下,OpenAI則以25%的市場份額退居次位。這一顯著變化與兩年前的市場格局形成了鮮明對比。彼時,OpenAI牢牢佔據着企業市場的半壁江山,份額高達50%,而Anthropic的份額僅爲12%。
點評:這份報告與目前行業開發者的反饋形成呼應。在記者近期與開發者的交流中得知,Anthropic的Claude模型無論在編碼還是文案編寫、遊戲NPC等領域的表現都是目前首選,此前曾出圈的Manus也曾提及用的是Claude模型。據悉,自2023年起,OpenAI的市場份額遭遇了大幅下滑,而Anthropic則呈現出穩步上升的趨勢,Anthropic也吸收了大量來自OpenAI的人才。OpenAI被曝即將發佈GPT-5,行業期待其靠下一代模型反攻。
階躍星辰開源基礎大模型Step 3
7月31日,AI創業企業開源基礎大模型Step 3。這款大模型採用MoE(專家)架構,總參數量321B(B爲10億),激活參數量38B,有視覺感知和複雜推理能力。在 MMMU、MathVision、SimpleVQA 等評測集的測試中,該模型在同類型開源模型中成績領先。
點評:近期多個模型開源。月之暗面在7月早些時候發佈開源的Kimi K2,該模型參數規模高達一萬億。騰訊近日發佈並開源了混元3D世界模型1.0,後續還計劃開源混元端側混合推理大語言模型。在現階段,開源成爲一種能吸引更多人使用、證明大模型廠商能力的方式。
百度搜索首頁將全面開放智能體入口
日前,百度搜索電腦端正在首頁測試開放智能體應用入口。用戶可在搜索框下方「AI應用入口」,直接調用感興趣或已使用過的智能體。據內部人士透露,首頁集成的智能體主要來自文心智能體平臺、搜索開放平臺接入的外部優質AI應用、以及部分百度自研應用。目前該功能已在灰度測試,預計很快將全量開放。
點評:這是繼今年7月2日官宣十年來最大改版之後,百度搜索的又一新動作。此前百度創始人李彥宏曾公開表示智能體是他最看好的 AI 應用方向,搜索是智能體分發的最大入口。該動作意味着搜索從傳統信息檢索邁向智能交互服務,也爲AI應用開闢新分發渠道,但能否爲百度開闢新增長路徑,實際影響仍待全量開放後觀察。
騰訊張正友稱具身機器人“iPhone時刻”未至
WAIC期間,第一財經記者採訪了騰訊首席科學家、騰訊Robotics X實驗室主任張正友。張正友表示,從行業發展階段看,張正友認爲,類比手機行業,具身智能行業還沒有出現iPhone,甚至還沒有到“大哥大”出現的時候,“‘大哥大’雖然貴,但用的人數還是很多。而現在人形機器人大部分還是用於數據採集、科研、導覽。未來會有某個領域容納大量機器人,讓成本降下來、進入每家每戶,這不用懷疑,在我有生之年就會發生。”
點評:作爲一個7年前就成立的知名機器人前沿研究實驗室負責人,張正友的觀點具有代表性。從研究者的角度看,他認爲具身智能行業發展還處於初期,從機器人形態上看,他認爲侷限在雙足人形機器人會“限制想象力”。當下具身智能行業十分火熱,多家廠商在推動人形機器人量產及商業化,張正友的看法可以提供一種較爲冷靜的視角。
多家算力廠商展出超節點方案
在WAIC展會上,華爲展臺展出一整面昇騰384超節點的“牆”。WAIC期間,上海儀電還聯合曦智科技、壁仞科技、中興通訊發佈國內首個光互連光交換GPU超節點光躍LightSphere X,新華三推出H3C UniPoD S80000超節點,超聚變也展出了超節點方案。有業內人士預計這波超節點熱度會延續下去。
點評:超節點是一種應對大算力集羣芯片協同問題的方案,通過整合算力芯片資源,在一個超節點內構建低延遲、高帶寬的算力實體,讓單個超節點儘可能大地釋放算力。之所以多家廠商都有佈局超節點,是因爲大模型參數量越來越大、算力芯片集羣越來越大,需要新的技術讓集羣性能繼續提升。超節點是在芯片提升製程之外,另一種能讓集羣性能提升的方法。
Meta第二季度營收同比增長22%
美東時間週三,Meta公司公佈截止今年6月底的第二季度財報。該季度Meta營收475億美元,同比增長22%,淨利潤183億美元,同比增長36%。Meta預計第三季度營收將在475億美元至505億美元之間。Meta CEO扎克伯格在財報電話會上表示,Meta的人工智能技術提高了廣告系統的效率和收益。
點評:營收增長的同時,Meta也在加大資本支出、押注AI。Meta上調了2025財年資本開支預期區間的下限,加大對人才、基礎設施、數據中心和能源的投資,以便在AI競賽中擁有競爭力。Meta還預計全年資本支出將在660億美元至720億美元之間,較此前640億至720億美元的預期有所提高。Meta加碼資本支出,一定程度上反映了硅谷巨頭對AI的看好。
發佈最新季度業績後,微軟市值觸及4萬億美元
美東時間週三,微軟發佈了截至2025年6月30日的2025財年第四財季業績。微軟第四財季營收764億美元,同比增長18%。其中,智能雲業務(含Azure)營收299億美元,同比增長26%。第四財季,微軟淨利潤272億美元,同比增長24%。當地時間週四開盤,微軟股價漲超5%,市值突破4萬億美元,成爲第二家觸及4萬億美元市值的公司。
點評:微軟第四財季業績增長有AI推動的因素。受AI服務需求推動,該季度Azure和其他雲服務收入增長39%。微軟首席執行官表示,雲和人工智能是每個行業和部門業務轉型的驅動力。此前,AI芯片廠商英偉達成爲第一家市值突破4萬億美元的公司,現在微軟市值也觸及4萬億美元。隨着AI改變世界,資本市場看好這些頭部AI公司。