AI工具“豆包”最新模型在廈門發佈
日前,AI工具“豆包”最新模型及AI雲原生服務升級成果在廈門發佈。此次升級將爲企業及開發者構建智能體(Agent)及落地AI應用提供全棧支持。
據瞭解,此次升級包括豆包·圖像編輯模型3.0、同聲傳譯模型2.0,以及能適配更多大規模商業化場景的豆包大模型1.6系列,同時推出釦子核心能力開源、企業自有模型託管方案等工具。據悉,升級的新模型將面向企業開放。
針對AI圖像編輯中“聽不懂指令、誤改內容、生成效果差”的痛點,新升級的豆包·圖像編輯模型3.0(SeedEdit 3.0)通過強化指令遵循能力、圖像保持能力及生成質量,讓用戶僅憑自然語言即可完成消除冗餘、調整光影、替換元素等操作,還能實現風格轉換、材質變換、姿勢調整等創新修圖場景。該模型廣泛適用於影像創作、廣告營銷等領域。
另一升級的同聲傳譯模型2.0(Seed-LiveInterpret 2.0)將語音延遲從8-10秒降至2-3秒,實現文本與語音同步生成。據悉,該版本模型還實現了無需提前錄製即可實時生成同音色外語語音,甚至匹配方言口音,大幅提升跨語言溝通沉浸感。
此外,爲助力智能體(Agent)端到端開發與落地,火山引擎持續優化AI雲原生全棧服務。針對有模型定製需求的企業,無需運維底層GPU資源及複雜配置,即可實現自研模型全託管。
來源:東南網