字節打響Agent基建之戰

作者 | 劉寶丹

編輯 | 周智宇

經過兩年多的發展後,AI開始加速進入Agent時代。

從移動互聯網時代的App王者,到雲計算市場的追趕者,字節正押注AI Agent這一新範式,發起一場豪賭式的換道超車。

“PC時代主體是Web,移動時代是APP,AI時代則是Agent。”火山引擎總裁譚待認爲,技術主體經歷了三個時代變化,AI時代會推動開發範式與技術架構全面升級。

6月11日,火山引擎在Force原動力大會上接連拋出重磅炸彈,豆包大模型1.6系列正式發佈,綜合成本降低63%。同時,AI雲原生服務全面升級,支持企業構建生產級Agent。

字節跳動CEO樑汝波罕見爲火山引擎站臺,他表示,字節致力成爲優秀的創新科技公司,會堅定長期投入,追求智能突破,服務產業應用。

字節AI錨定Agent落地,開啓了新一輪搶位賽。

字節必須再贏一次

字節對即將到來的AI時代做了堅決的投入,這背後是一種強烈的生存危機感。

AI Agent的崛起正在重構互聯網入口格局,傳統的App交互模式面臨顛覆性挑戰。當用戶可以通過自然語言指令讓Agent自主完成複雜任務時,那些曾經風光無限的超級App可能面臨被邊緣化的風險。

中金公司認爲,AI Agent這類產品形態的創新與底層的模型演進同樣重要,並展現出了強大的商業化變現和落地潛力。展望未來,AI Agent或將通過接管手機的方式,重塑互聯網生態。

作爲APP超級工廠,字節通過推薦算法打造了今日頭條和抖音等內容平臺,做的是流量生意。但AI技術有望顛覆原有的注意力模式,孕育出新的AI超級入口。

字節要想繼續稱霸AI時代,必須抓住新一輪AI技術革命,重新迭代自己。

路徑也很明確,字節、阿里、百度等科技大廠均採取了AI大模型+雲計算+應用側的全棧AI佈局戰略。對擅長產品的字節來說,應用端和模型端已於去年底躋身第一梯隊,火山引擎也呈現翻倍式增長。

根據IDC發佈的《中國公有云大模型服務市場格局分析,1Q25》,按照大模型調用量的市場份額來看,火山引擎佔據46.4%的市場份額,其次是百度智能雲、阿里雲。不過,這只是大模型調用量,縱觀整個雲計算市場,火山引擎還未進入第一梯隊。

Agent無疑是火山引擎彎道超車的最大機會。

“如果我們把時間拉長,把技術棧展開。我們實際正處於PC到移動到AI 三個時代的變化之中。”譚待表示,在這三個時代裡,技術主體在發生變化,PC時代的主體是web,移動時代是APP,AI時代是Agent,它能夠自主地感知,規劃和反思,完成複雜任務。

更重要的是,Agent對雲計算的需求將快速上漲。譚待表示,“Agent而言,它的Token消耗量很大,AI大模型最早的應用就是聊天,一個人跟模型聊一個小時,就是20多萬的Token,但如果讓Agent做一個任務,它要處理特別複雜的事情,一個任務可能就是20萬Token。”

譚待判斷,“如果說24年是中國大模型應用的元年,那25年將很可能是中國Agent落地的元年,Agent將逐步進入企業的各個業務流程。”

IDC認爲,從大模型模態的角度,當前調用量仍然以大語言模型、文本類的能力爲主,自2024年第四季度,語音類模型調用量也開始增長。該機構預計,到2025年,圖像、視頻類大模型的調用量也將開始起量。

對字節來說,Agent是一場必須拿下的戰役,只有此戰勝利了,纔有機會繼續走向AGI。

先鋪路,再跑車

目前來看,決定Agent落地的前提主要有兩個層面,一是AI大模型的智能程度和調用價格,二是與Agent配套的AI基建。

從AI大模型來看,強推理、多模態、低成本是支撐Agent大規模應用的基礎。會上,火山引擎正式發佈豆包大模型1.6系列,包括Doubao-Seed-1.6、Doubao-Seed-1.6-thinking和Doubao-Seed-1.6-flash,Doubao-Seed-1.6是all-in-one的綜合模型,支持深度思考、多模態理解等多項能力,thinking和flash分別是深度思考強化版和極速版。

“Doubao-Seed-1.6是國內首個支持256K上下文的思考模型,這對於複雜Agent的構建來說非常重要。”譚待表示,Agent做複雜任務時,特別是處理圖像和GUI操作或者Coding,窗口很容易就超過128K,提升到256K非常重要。

從測評結果來看,豆包1.6-thinking模型有明顯提升。在GPQA Diamond測評集上取得了81.5分,在AIME25,獲得了86.3分。MultiChallenge上,得分48分。在多個權威測評集上,得分均屬於國際第一梯隊。

繼3月阿里千問QwQ-32B將成本降到DeepSeek R1的1/10,“價格屠夫”字節也繼續發力。

據譚待介紹,絕大部分企業的消耗量集中在0-32K範圍,豆包1.6的價格是每百萬tokens 輸入0.8元,輸出8元。“這是一個非常高性價比的價格,豆包1.6成本下降了63%,企業只需要原來三分之一左右價格,就能獲得新模型。”

字節還發布了最新的豆包視頻生成模型Seedance 1.0 pro。根據第三方權威榜單 Artificial Analysis 最新結果,豆包視頻生成模型在文生視頻、圖生視頻兩個維度都超越了諸多主流模型,登頂全球競技場第一。

Seedance 1.0 pro的價格是每千tokens1分5釐,相當於每生成一條5秒的1080P視頻只需3.67元。譚待表示,假如有1萬塊錢預算,製作超過5秒1080P高清視頻共計2700條,價格遠低於可靈V2.0大師版和Veo2等主流視頻生成產品。

語音正在成爲AI應用和Agent的核心交互方式,會上,字節還宣佈,豆包·實時語音模型正式全量上線開發平臺方舟,對企業客戶開放使用。

在AI基建方面,火山引擎正在構建一個全面的、能滿足未來Agent各種交互需求的技術底座 。

會上,火山引擎發佈了MCP服務、PromptPilot 智能提示工具、AI知識管理系統、veRL強化學習框架等產品,並推出多模態數據湖、AICC私密計算、大模型應用防火牆,以及一系列AI Infra套件。

這些產品背後是技術範式的改變。譚待表示,從Web、Apps再到Agents,核心主體已經改變,以前的架構本質上是爲程序員設計,現在Agents很多集成步驟是通過模型策略展開的,模型跟工具、環境交互,需要更好的模型和Agent平臺。

基礎架構也一樣,譚待表示,數據以前是For BI (商業智能),現在For AI。這次,火山引擎發了兩個安全產品,用來解決大模型防火牆、模型投毒被攻擊,以及通過端加密解決安全隱私的問題。

在譚待看來,雲原生興起於移動互聯網時代,它具備彈性擴縮容、容器化、DevOps、微服務等特點,AI雲原生是爲全新的AI主體去設計,需要更強的模型,更好的Prompt Pilot,以及處理更原始多模態數據的數據湖。

開發範式上,字節跳動技術副總裁洪定坤認爲,隨着模型能力的持續進步,AI有機會成爲調度者,通過調用不同的 Agent 和工具,讓軟件開發“all in one”,更大幅度地降低開發門檻,提升開發效率。

從基礎設施到開發範式,從數據到安全,火山引擎AI雲原生全棧服務升級。譚待希望,用一套完整的AI雲原生能力幫助企業做好Agent落地。

火山,衝撞舊秩序

在AI技術的驅動下,國內公有云市場時隔三年迎來複蘇。

IDC數據顯示,2024下半年,中國公有云(IaaS基礎設施/PaaS平臺軟件/SaaS應用軟件)市場增速17.7%,創近兩年的高點。這是移動互聯網轉向AI時代的一個積極信號。

多年來,國內雲市場格局保持穩定狀態,包括阿里雲、華爲雲、騰訊雲、百度智能雲在內的科技大廠和以中國移動旗下的移動雲、中國聯通旗下的聯通雲等爲代表的電信運營商是雲市場的核心主力。

如今,字節的全方位進擊正在引發產業格局的深度重構,火山引擎有望成爲雲計算市場復甦的最大受益者。

據字節內部人士透露,去年12月,豆包大模型的日均tokens調用量是4萬億。今年3月份,豆包大模型的日均調用數是12.7萬億,而截至今年5月底,這個數字已經超過了16.4萬億,仍然保持着高速增長。

北京星漢未來創始人、CEO劉道儒對華爾街見聞表示,在Agent落地方向,字節、阿里等大廠更適合提供配套工具、外部API,以及通過雲平臺支持企業部署智能體平臺。“智能體開發的配套工具、外部API等種類繁多,且很瑣碎,適合由大廠提供服務。”

廣發證券互聯網傳媒首席分析師曠實對華爾街見聞表示,火山引擎在AI大模型調用量上領先,離不開字節的底層能力,包括推薦算法中臺、數據中心、軟硬件基礎架構的統一,踐行AI雲原生的火山引擎以GPU爲核心優化計算、存儲與網絡架構,降低延遲。

曠實進一步表示,火山引擎通過算法、工程、庫存和供應鏈的管理等實現大幅降價的同時保持毛利,此外,豆包大模型廣泛應用於30多個外部行業,可以幫火山引擎實現客戶突破。

一位業內人士對華爾街見聞表示,火山引擎很擅長打價格戰,而且內部組織效率遠高於其他大廠,這種以小搏大的做法成效顯著,去年5月,豆包大模型率先降價,將大模型價格帶入“釐時代”,阿里、騰訊等只能被動跟隨。

對於這次降價,譚待表示,技術、軟件、硬件都在不斷進步,肯定能持續優化成本。“我們宗旨是做到了一定程度之後,就盡最大可能把技術紅利釋放出來,最重要的是,把紅利釋放出來之後能讓業界所有的開發者和企業都受到實惠,AI應用也會發展更快。”

截至目前,對於火山引擎的降價,其他廠商並未有明顯的降價動作。百度內部人士表示,暫時沒聽說相關消息。

賭局纔剛剛開啓

2017年,字節首次嘗試to B業務,給手機廠商的內置瀏覽器輸出推薦算法和內容,並由此組建了火山引擎,它的角色是字節內部的技術中臺。2020年,火山引擎正式對外,並逐漸瞄準雲計算市場。

入場比同行晚了近10年,字節進軍雲計算市場的決心來自對市場的判斷,公司認爲,雲計算賽道很大,尤其國內雲計算滲透率比國外低。2021年,譚待定下了一個爲期十年的千億收入目標。

to B業務是一個需要時間積累的慢生意,字節入局初期的壓力可想而知,但幸運的是,字節趕上了AI時代。

譚待對華爾街見聞表示,“過去兩年多,字節自研的豆包大模型和火山引擎的AI雲原生基礎設施,已經收穫了不少市場的認可。”據內部人士透露,火山引擎2024年的增速是三位數,收入規模超百億,今年的目標是實現翻倍。

火山引擎是字節押注AI時代確定性最強的底牌,字節看重的是收取AI時代“水電費”的生意。正如去年底崑崙萬維創始人周亞輝所說,字節會學習谷歌和亞馬遜,一邊吃廠商廣告費用,一邊吃IT費用。“字節雲的市場份額會等於字節的廣告市場份額,不僅僅是中國,還包括全球。”

不過,距離千億規模還有很遠的距離,字節要想盡可能多的搶佔AI市場份額,還面臨諸多挑戰和不確定性。

首先,AI技術仍處於全球競賽當中,火山引擎模型調用量主要來自豆包,豆包大模型家族必須持續迭代,保持在第一梯隊,才能和火山引擎形成更好的協同效應。同時,大模型在推理和多模態方面的性能,也將影響Agent落地速度。

“基礎設施成本和擴展性是Agent落地面臨的巨大瓶頸。”一位Agent領域的創業者對華爾街見聞表示,現有云服務難以兼容短時高併發與長時大規模需求,多平臺嚴格的身份驗證迫使用戶頻繁介入,制約了Agent自主性和跨場景協同能力。

AI正從“模型軍備競賽”轉向“實用價值落地”,Agent的核心競爭力將不再僅僅是底層模型的“智商”高低,而是其融入實際場景、解決具體問題、形成商業閉環的能力,這需要強大的平臺生態和豐富的應用支撐。

字節B端基因相對較弱,尤其是相對於阿里這樣採取開源技術棧的大廠來說,需要時間構建生態。華爾街見聞獲悉,火山引擎發起了V-START加速器計劃,扶持AI、具身智能、跨境出海等初創企業。

私有化部署也是一個關注點。劉道儒認爲,Coze屬於國內智能體開發平臺的佼佼者,不過受制於無法私有化部署,Agent落地時沒有歷史數據或一兩個人的早期AI創業團隊會更多選擇Coze,而有歷史數據或小有規模的創業團隊一般會選擇Dify等開源、可私有化部署的智能體開發平臺。

字節還面臨較強的競爭壓力。AI是不能錯過的時代機遇,阿里、騰訊、百度等大廠等也在全面佈局,而且憑藉各自基因建立起競爭優勢,智譜AI、階躍星辰、Manus等創業公司具有較強的創新活力。

值得一提的是,字節在過去兩年吸納了非常多的AI人才,他們的穩定性也是外界關注的焦點。今年3月,字節跳動AI大將駱怡轉戰AI創業公司。近日,字節Seed核心主力李成剛傳出調崗消息。對此,字節未予置評。

在AI大模型的首場戰役裡,字節大力出奇跡,逆襲進入第一梯隊。接下來,AI之戰核心在於技術迭代能力和產品創新能力,這是一場全方位的生態之戰,比拼的是科技公司對現實世界的顛覆能力。

坐上牌桌的字節開始新一輪押注了。