日均調用量106倍狂飆 豆包搶灘“Agent生態卡位戰”

出品 | 本站科技《態度》欄目

作者 | 李姝

編輯 | 丁廣勝

當DeepSeek以開源策略席捲開發者社區時,火山引擎用閉源的方式展示了另一種可能性。

“截至2025年3月底,豆包大模型日均tokens調用量已超過12.7萬億,是2024年12月的3倍,是一年前剛剛發佈時的106倍。”

4月17日,在火山引擎FORCE LINK AI創新巡展上,火山引擎總裁譚待亮出一組數據,爲閉源大模型的生存戰注入強心劑。

如今,豆包大模型已成爲衆多企業AI轉型的核心利器。就在巡展當日,面向企業市場,全新的豆包1.5·深度思考模型正式登場,同時升級文生圖模型3.0及視覺理解模型,還推出了OS Agent解決方案和AI雲原生推理套件。

這一系列動作表明,在模型性能競賽轉向 “Agent生態卡位戰” 的當下,火山引擎已精準錨定新的發展方向。

加量不加價,豆包深度思考模型開放API

官方技術報告顯示,豆包深度思考模型採用MoE架構,總參數200B,激活參數僅20B,以較小參數實現了媲美頂尖模型的效果。得益於高效算法和高性能推理系統,豆包模型的API服務在保證高併發的同時,將延遲降至20毫秒,目前已通過火山引擎開放供用戶體驗。

在數學推理、編程競賽、科學推理等專業領域,豆包模型的性能與OpenAI o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任務上,豆包深度思考模型的人類評估表現比DeepSeek R1高出8%,單位推理成本更是降低了50%,完美實現了性能與效率的平衡。

相較於僅限文字理解的 DeepSeek,豆包深度思考模型的多模態能力優勢顯著。

譚待介紹,升級後的豆包・視覺理解模型具備強大的視覺理解能力,使模型不僅 “會看會想”,還能進行立體思考。從識別菜單內容,根據用戶口味和過敏食物提供點餐推薦,到分析航拍圖上的顏色、形狀等信息並結合地貌進行深度研判,豆包的多模態應用場景豐富且實用。

豆包・文生圖模型3.0同樣表現亮眼,其文字排版和圖像生成能力進一步增強,支持2K高清圖片生成,在影視、海報、繪畫等領域應用廣泛。在最新的文生圖領域權威榜單Artificial Analysis競技場中,豆包・文生圖3.0模型已躋身全球第一梯隊。

豆包這一次放的大招,可謂威力十足。目前豆包已經在AppStore內免費APP排行榜成功登頂,超越位居第三的DeepSeek和第九的騰訊元寶。

迎接Agent元年,“應用Agent”+“OS Agent”雙管發力

強大的模型性能爲AI Agent的發展奠定了堅實基礎。

譚待指出:“AI Agent應用主要分爲應用型Agent和OS Agent兩個方向。應用型Agent專注於特定領域任務,如客服Agent、數據Agent、代碼Agent 等;OS Agent則具備跨場景通用性和靈活性,可操作瀏覽器、電腦、手機等設備,完成複雜任務。”

在應用型Agent領域,面向專業開發者的代碼Agent——Trae重磅推出。相較於傳統AI插件產品,Trae將AI與IDE深度融合,帶來更智能的開發體驗。

在OS Agent方面,火山引擎正式發佈OS Agent解決方案,整合豆包UI-TARS模型,以及veFaaS函數服務、雲服務器、雲手機等產品,實現對代碼、瀏覽器、電腦、手機及其他Agent的高效操作。

針對Agent帶來的大量推理消耗問題,火山引擎推出ServingKit推理套件,可在2分鐘內完成671B DeepSeek R1的下載和預熱,13秒完成推理引擎加載。

同時,通過優化火山引擎EIC,將KV cache命中率提高10倍,在100% cache命中場景下,TPS吞吐量提升至5倍以上;對算子、AI網關、VKE編排調度的升級,也大幅降低了GPU消耗。

對於GPU的折舊問題,譚待認爲:“如果把軟件層面的工作做好,硬件的生命週期是可以拉長的。而且不同的場景對模型的延遲、吞吐要求是不一樣的。更重要的是在軟件層面和運營層面做好相關工作,這樣就能使硬件的生命週期和投資回報率(ROI)都達到最佳狀態。”

模型好壞比開源閉源更關鍵,對豆包充滿信心

“模型好壞,與開源閉源無關。火山引擎在適配DeepSeek方面表現出色,對豆包充滿信心。”火山引擎總裁譚待在交流中直言。

面對豆包大模型日均tokens調用量百倍的增長,譚待表示,技術發展短期易被高估、長期易被低估,tokens增長量取決於模型突破,如視覺推理、Agent等方面的進展,對未來模型調用量百倍增長持謹慎樂觀態度。

2025年被稱爲Agent元年,但譚待認爲:“能寫詩的不是Agent,能跑通供應鏈的纔是。” 這一觀點凸顯了火山引擎的務實佈局。

譚待指出,“我們希望AI能夠解決更復雜,更完整的問題,不再僅僅是對信息的感知、處理和生成,而是能端到端的處理任務。AI能做到這些,才能稱之爲一個合格的Agent。”

他認爲,實現這一目標需完成三大技術突破:首先最核心的是要有更強的模型。要做好Agent,模型需要有能力做好思考、計劃和反思,而且要一定得支持多模態。其次,開發OS Agent架構體系,實現數字與物理世界的雙向交互。最後,通過AI雲原生技術實現推理成本與延遲的指數級下降,支撐大規模應用落地。

目前,火山引擎已支持MCP協議,統一協議有助於降低開發成本、加速行業發展。未來,火山引擎不僅會推出數據智能體Data Agent等垂直類Agent產品,還將爲通用Agent開發提供工具和方案。在譚待看來,判斷真正的Agent,關鍵要看其能否完成複雜任務、是否運用深度思考模型。

當閉源模型憑藉成本優勢挑戰開源陣營,當開源生態反哺商業創新,這場大模型競爭早已超越技術層面,演變爲組織能力與生態運營的全方位較量。

可以預見的是,在Agent戰場中,唯有那些將技術深度融入行業各個環節的參與者,才能最終脫穎而出。