☰

一天內海外AI大模型接連上新還有“重大發布”蓄勢待發

《科創板日報》8月6日訊一天不到的時間內，谷歌、OpenAI、Anthropic三家公司在AI大模型上都有了新動作。

先是谷歌正式發佈了Genie 3，這款通用世界模型能生成“前所未有的豐富交互環境”。

有多“前所未有”？Genie 3是首個支持實時交互的世界模型，單次交互時長從幾十秒延長到數分鐘，並首次加入“可提示的世界事件”和“視覺記憶”等關鍵特性，能以每秒20-24幀速度，實時生成720p畫面，並能保持數分鐘的畫面一致性。

通俗點來說，用戶可以在生成的動態世界中多視角自由探索，且即使用戶多次往返之後，同一地點的同一物品細節仍能保持一致——這種“記憶力”對於模型來說可以說是一項重大技術突破。

“這就是遊戲引擎2.0。”英偉達高級科學家Jim Fan如此斷言，“未來某一天，UE5 那樣複雜的系統，將被一個由數據驅動的注意力權重塊取代。這個系統只需要接收來自手柄的操作指令，就能直接渲染一段動態的時空畫面。”

當然，作爲一個通用模型來說，遊戲並非Genie 3的唯一應用場景。除了遊戲外，Genie 3還能爲機器人或自動駕駛系統提供多元化訓練場景，可以爲AI智能體研究提供更長、更穩定的交互回合。

Anthropic則在發佈Claude Opus 4不到3個月之後，推出Claude Opus 4.1。公司表示，新版本是Claude Opus 4在“Agent任務、真實世界編碼和推理能力上的全面提升”。

在SWE-bench Verified基準測試中，Opus 4.1較Opus 4提升了2個百分點，達到74.5%，而相比Sonnet 3.7則提升幅度更大，後者僅爲62.3%。另外，Opus 4.1在智能體工具調用、多語言問答能力和智能體編程上超越OpenAI o3，但在視覺推理和數學能力上與OpenAI o3和Gemini 2.5 Pro還有一定差距。

OpenAI則發佈了兩款“開放權重”大模型，GPT-oss-120b和GPT-oss-20b。公司CEO Sam Altman表示，“GPT-oss是一個重大突破，這是最先進的開放權重推理模型，具備與o4-mini相當的強大現實世界性能，可在電腦上本地運行。”

值得注意的是，OpenAI前不久剛剛宣佈，即將發佈GPT-5,；而Anthropic也在今日宣佈，計劃在未來幾周內發佈“對模型的重大改進”——可以想見，屆時AI大模型又將掀起一波迭代更新潮。

國內方面，多家公司也在近日發佈大模型迭代。例如Kimi發佈Kimi K2，具備更強代碼能力、更擅長通用Agent任務；智譜發佈GLM-4.5，專爲Agent應用打造，增強推理、Agent能力，在工具調用可靠性和任務完成度上表現突出；Qwen3發佈升級版235B和30B模型、以及30B推理模型，顯著提升推理、Agent能力等。

太平洋證券指出，目前模型後訓練階段仍具備工程紅利，基於此國內外大模型持續拓展智能邊界，且國內模型在開源領域表現突出，在Hugging Face開源前10榜單中佔據8位，而海外OpenAI、xAI等仍在閉源發力。同時，各基礎大模型均實現通用Agent能力提升，模型即Agent的範式或正在形成。

一天內海外AI大模型接連上新 還有“重大發布”蓄勢待發

相關資訊

一天內海外AI大模型接連上新還有“重大發布”蓄勢待發