百度吳甜:大模型能力的拓展探索出了更富想象力的創新應用

新京報貝殼財經訊(記者羅亦丹)5月20日,百度AI Day活動在北京舉辦,百度集團副總裁吳甜對文心大模型最新版本的技術創新進行了系統性講解。她表示,文心4.5和4.5 Turbo實現了文本、圖像和視頻的混合訓練。針對不同模態數據在結構、規模、知識密度上的差異,通過多模態異構專家建模、自適應分辨率視覺編碼等技術,大幅提升了跨模態學習效率和多模態融合效果,學習效率提高近2倍,多模態理解效果提升超過30%。

吳甜表示,大模型的能力進一步拓展、效率進一步提升之後,可以探索更前瞻、更有想象力的創新應用。

她以需要綜合運用多模態AI技術的超擬真數字人場景舉例稱,百度研製了“劇本”驅動多模協同的超擬真數字人技術,實現了語言、聲音、形象的協調一致。目前這套技術已經支持超過10萬數字人主播,直播轉化率達31%,降低80%直播開播成本。

此外,中國信通院在活動現場發佈大模型推理能力評估結果。結果顯示,百度文心X1 Turbo在24項能力評估中,16項達5分、7項達4分、1項達3分,綜合評級獲當前最高級“4+級”,成爲國內首款通過該測評的大模型。

編輯 陳莉 校對 柳寶慶