浙商證券:開源的多模態模型有望催化推理算力

浙商證券研報稱,1)豆包大模型團隊聯合高校推出視頻生成實驗模型“VideoWorld”,在業界首次實現無需依賴語言模型,即可認知世界。該項目模型與代碼已開源。繼DeepSeek開源R1模型後,國產大模型再度迎來創新與開源。2)現有的大模型,例如Sora 、DALL-E 、Midjourney等,大多依賴語言或標籤數據學習知識,很少設計純視覺信號學習。VideoWorld僅通過 “視覺信息”,即瀏覽視頻數據,就能讓機器掌握推理、規劃和決策等複雜能力。在不依賴任何強化學習搜索或獎勵函數機制前提下,VideoWorld達到了專業5段9x9圍棋水平,並能夠在多種環境中,執行機器人任務。3)國產大模型算法創新+開源生態有望構建一條聯合創新之路,推動中國AI領先。繼OpenAI閉源後,大模型廠商呈現閉源趨勢,直至DeepSeek將高性價比的R1模型開源。作爲國內領先互聯網大廠的核心團隊,字節豆包團隊的VideoWorld開源有望進一步促進國內外大模型行業的開源進程,爲相關開發者提供了來自中國最先進的技術資源與創新基石。未來,如果大模型能夠形成繁榮的開源生態,A基礎模型有望加快創新,AI應用部署門檻降低以及成本帶動應用繁榮,並催化推理算力需求快速增長。建議關注:科大訊飛、萬興科技、中科曙光等。