☰

傳媒行業觀察：DeepSeek升級混合推理架構；百度開放全系視頻生成模型

2025年8月，人工智能技術在傳媒領域的應用再迎突破。DeepSeek發佈V3.1版本，首次引入混合推理架構，推動大模型向智能體方向演進；百度蒸汽機2.0則全面開放全系視頻生成模型，以多模態技術重塑影視製作流程。兩項技術革新標誌着行業正加速向智能化、高效化邁進。

一、DeepSeek-V3.1：混合推理架構與智能體能力躍升

DeepSeek-V3.1的發佈標誌着大模型進入混合推理時代。新架構首次支持同一模型同時運行“思考模式”與“非思考模式”，前者強化邏輯推理能力，後者提升實時交互效率。通過API接口的升級，用戶可根據場景需求靈活調用，例如“deepseek-reasoner”適用於複雜問題求解，“deepseek-chat”則適配高併發對話場景，兩者均支持128K長上下文窗口，大幅擴展應用邊界。

在智能體能力優化上，DeepSeek通過Post-Training技術顯著增強工具調用與任務執行能力。新模型支持嚴格模式的FunctionCalling，確保輸出嚴格符合預設參數規範，同時兼容AnthropicAPI格式，便於接入第三方生態框架。這一升級爲金融、教育等垂類場景的智能體開發提供了更穩定的底層支持。

技術迭代的背後是生態兼容性的強化。DeepSeek-V3.1適配下一代國產芯片的FP8精度參數，在同等芯片面積下實現計算性能翻倍，並降低功耗與帶寬需求。硬件與模型的協同優化，爲國產算力生態的自主可控提供了新路徑。

二、百度蒸汽機2.0：視頻生成技術突破與成本重構

百度蒸汽機2.0的全系模型開放，將影視製作門檻降至新低。Turbo、Lite、Pro及有聲版四類模型覆蓋不同需求場景，其中多模態規劃技術實現了語音、脣形、表情與動作的精準同步，即使在複雜互動場景下仍能保持敘事連貫性。基於海量中文訓練的語音模型，其還原度超過98%，顯著降低了傳統影視配音成本。

技術突破帶來的成本重構效應尤爲突出。傳統百萬級特效製作週期長、投入高，而蒸汽機2.0通過AI生成技術，可將成本壓縮至百元級別，覆蓋從角色設計到後期合成的全流程。例如，在虛擬主播場景中，模型可自主協調多角色身份與互動邏輯，減少人工干預需求；在廣告製作中，快速生成個性化內容的能力提升了投放效率。

百度蒸汽機的技術路徑也推動了行業生態協同。其開源策略吸引開發者參與工具鏈優化，例如脣形對齊算法和多模態交互框架的社區貢獻，進一步加速技術迭代。這一模式爲中小型內容創作者提供了商業化落地的可能性，推動影視行業從“重資產”向“輕量化”轉型。

技術的持續革新正在重塑傳媒行業的生產邏輯。混合推理架構與多模態生成能力的結合，不僅提升了內容生產效率，也爲跨場景智能體應用開闢了新空間。未來，生態開放與技術協同將成爲行業競爭的核心變量。

本文源自：金融界

作者：觀察君

傳媒行業觀察：DeepSeek升級混合推理架構；百度開放全系視頻生成模型

相關資訊