模型上新、降價,火山引擎急推AI應用落地
記者 何己派 編輯 鄢子爲
誰來做Agent大規模落地的核心推手?
火山引擎說,我想。
這朵來自字節跳動的雲,去年發起閃電降價,豆包主力模型,拿出比同行便宜99%的價格,直接引發全行業跟進。
6月11日,火山引擎舉辦Force原動力大會,這一次,它拿出一套工具包,要在技術、成本、服務等維度,繼續推動Agent的大規模普及。
區間定價
“如果說2024年是中國大模型應用的元年,那2025年將很可能是中國Agent落地的元年。”
在火山引擎總裁譚待看來,以PC、移動、AI三個時代來劃分,技術主體在發生變化,從PC時代的web,移動時代的APP,到AI時代,則是Agent。
Agent正逐步進入企業的各個業務流程。怎麼讓Agent星星之火可燎原,打通其規模化落地的堵點,火山引擎的一把火,燒向“區間定價”。
“Agent的Token消耗量是很大的。”會後接受《21CBR》等媒體採訪時,譚待談到,讓Agent執行一項任務,可能需要20萬tokens。因此,怎麼把模型使用成本降下來,非常關鍵。
新發布的豆包大模型1.6,首創按“輸入長度”區間定價的模式,深度思考、多模態能力與基礎語言模型,統一價格。
譚待表示,對同結構、同參數的模型而言,真正影響成本的,是上下文長度,而不是是否開啓了思考和多模態功能。目前模型大部分的調用,輸入範圍都在32K以內。
基於這一觀察,團隊意識到,如果在推理調度上,通過分桶調度做好優化,就能夠讓佔大頭比例的模型請求,享受到更低成本、更快速度。
在企業使用量最大的0-32K輸入區間,豆包1.6的價格,爲每百萬tokens輸入0.8元、輸出8元,綜合成本是豆包1.5深度思考模型、DeepSeek R1的三分之一。
對於企業而言,豆包1.6成本下降了63%,只需要原來三分之一左右的價格,用上這個新模型。
加碼多模態
會上,譚待提了模型進化的三個關鍵方向,深度思考、多模態理解和工具自主調用。
此次發佈的豆包1.6,全系列原生支持多模態思考能力,並基於圖形界面操作能力,進一步具備“行動力”。
演示案例顯示,豆包1.6可自動操作瀏覽器完成酒店預訂,識別購物小票並整理成Excel表格等任務。
新亮相的豆包視頻生成模型Seedance 1.0 pro,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P視頻。
價格方面,Seedance 1.0 pro模型每千tokens僅0.015元,相當於每生成一條5秒的1080P視頻,只需3.67元。
拿着1萬塊錢的預算,使用Seedance 1.0 pro,可製作超過2700條5秒視頻。
數據顯示,豆包大模型日均tokens使用量超過16.4萬億,較去年5月首次發佈時,增長137倍。
在行業應用上,豆包大模型服務着全球TOP10手機廠商中的9家、8成主流汽車品牌、70%的系統重要性銀行及超5成985高校。
譚待向《21CBR》等媒體表示,豆包大模型的迭代,希望保持一年至少出一個大版本的節奏。目前,火山的所有業務裡,大模型的收入增速最快,遠超其他產品,毛利也位居前列。
對今年火山引擎的收入增長和客戶拓展預期,他以“目標很激進”來回應,“需求是明確、清晰且龐大的”。
搶跑Agent時代,豆包如何贏得行業認可,譚待認爲,“訣竅是心誠”,不爲了賺吆喝,而把不好的模型免費。
“要讓更多人運用AI創造價值,就是三件事,把模型做好,把成本做低,把應用落地的各種工具做好。這三個點,我們過去一直在說,未來也不會變。”