一天內海外AI大模型接連上新 還有“重大發布”蓄勢待發

《科創板日報》8月6日訊 一天不到的時間內,谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新動作。

先是谷歌正式發佈了Genie 3,這款通用世界模型能生成“前所未有的豐富交互環境”。

有多“前所未有”?Genie 3是首個支持實時交互的世界模型,單次交互時長從幾十秒延長到數分鐘,並首次加入“可提示的世界事件”和“視覺記憶”等關鍵特性,能以每秒20-24幀速度,實時生成720p畫面,並能保持數分鐘的畫面一致性。

通俗點來說,用戶可以在生成的動態世界中多視角自由探索,且即使用戶多次往返之後,同一地點的同一物品細節仍能保持一致——這種“記憶力”對於模型來說可以說是一項重大技術突破。

“這就是遊戲引擎2.0。”英偉達高級科學家Jim Fan如此斷言,“未來某一天,UE5 那樣複雜的系統,將被一個由數據驅動的注意力權重塊取代。這個系統只需要接收來自手柄的操作指令,就能直接渲染一段動態的時空畫面。”

當然,作爲一個通用模型來說,遊戲並非Genie 3的唯一應用場景。除了遊戲外,Genie 3還能爲機器人或自動駕駛系統提供多元化訓練場景,可以爲AI智能體研究提供更長、更穩定的交互回合。

Anthropic則在發佈Claude Opus 4不到3個月之後,推出Claude Opus 4.1。公司表示,新版本是Claude Opus 4在“Agent任務、真實世界編碼和推理能力上的全面提升”。

在SWE-bench Verified基準測試中,Opus 4.1較Opus 4提升了2個百分點,達到74.5%,而相比Sonnet 3.7則提升幅度更大,後者僅爲62.3%。另外,Opus 4.1在智能體工具調用、多語言問答能力和智能體編程上超越OpenAI o3,但在視覺推理和數學能力上與OpenAI o3和Gemini 2.5 Pro還有一定差距。

OpenAI則發佈了兩款“開放權重”大模型,GPT-oss-120b和GPT-oss-20b。公司CEO Sam Altman表示,“GPT-oss是一個重大突破,這是最先進的開放權重推理模型,具備與o4-mini相當的強大現實世界性能,可在電腦上本地運行。”

值得注意的是,OpenAI前不久剛剛宣佈,即將發佈GPT-5,;而Anthropic也在今日宣佈,計劃在未來幾周內發佈“對模型的重大改進”——可以想見,屆時AI大模型又將掀起一波迭代更新潮。

國內方面,多家公司也在近日發佈大模型迭代。例如Kimi發佈Kimi K2,具備更強代碼能力、更擅長通用Agent任務;智譜發佈GLM-4.5,專爲Agent應用打造,增強推理、Agent能力,在工具調用可靠性和任務完成度上表現突出;Qwen3發佈升級版235B和30B模型、以及30B推理模型,顯著提升推理、Agent能力等。

太平洋證券指出,目前模型後訓練階段仍具備工程紅利,基於此國內外大模型持續拓展智能邊界,且國內模型在開源領域表現突出,在Hugging Face開源前10榜單中佔據8位,而海外OpenAI、xAI等仍在閉源發力。同時,各基礎大模型均實現通用Agent能力提升,模型即Agent的範式或正在形成。