國泰海通:Grok-4引領AI進階 雲服務商和數據中心運營商將直接受益
智通財經APP獲悉,國泰海通發佈研報稱,7月10日xAI 發佈 Grok 4,其碾壓的Benchmark和跨級的表現標誌着xAI率先跨入了下一代AI。美中不足的是,當前Grok-4的多模態能力仍是明顯短板,尤其在圖像理解與生成領域雖取得進展但仍需大幅提升,尚未實現人類級的視聽感知與交互能力。該團隊認爲,雲服務商和數據中心運營商將直接受益於持續增長的算力需求。具備垂直領域優勢和數據壁壘的 AI 解決方案提供商將在競爭中嶄露頭角。
國泰海通具體觀點如下:
深度思考與羣體決策協同,重構超人類推理計算範式。Grok-4的推理計算能力已實現斷層級突破,其預訓練計算量和推理計算能力較前代提升十倍以上,訓練規模更達到Grok-2的百倍量級。通過2500個涵蓋自然科學、工程等學科的博士級難題測試,Grok-4在人類最終測試(HLE)中取得45%的成績,兩倍於過往最先進的AI Gemini 2.5pro。Grok-4不僅全面超越人類研究生的學術能力,更在GPQA、AIME25等權威基準測試中以滿分表現刷新紀錄。其中,多智能體協同的Grok-4 Heavy可以同時結合深度思考與羣體協作糾錯的兩種能力,成功在AIME25中取得滿分成績。這種非人類的推理效能已使傳統人類設計的測試失去意義,其能力邊界正向推動新技術與物理定律的發現邁進,預計將在兩年內催生突破性科研成果。
打通現實場景全鏈閉環,驗證跨行業決策執行力。在解決現實場景問題的能力上,Grok-4展現出革命性進步:語音功能實現響應速度翻倍與延遲減半,Eve英音合成技術賦予對話自然磁性與情感流動性,用戶體驗顯著優於競品;在自動售貨機管理測試(Vending-Bench)中,Grok-4以4694.15的淨資產生成值碾壓第二的Claude Opus 4兩倍以上,驗證其長期策略執行力;同時開放256K上下文API接口後,已在生物醫學領域協助ARC研究所篩選數百萬試驗數據生成研究假設,在金融決策中成爲首選工具,甚至僅用4小時就完成第一人稱射擊遊戲的自主開發,證明其能全流程整合工具鏈解決跨行業複雜任務。
聚焦像素級視頻生成革命,構建人機協同感知新生態。美中不足的是,當前Grok-4的多模態能力仍是明顯短板,尤其在圖像理解與生成領域雖取得進展但仍需大幅提升,尚未實現人類級的視聽感知與交互能力。下一代研發將聚焦視頻生成技術突破,通過"輸入像素-輸出像素"的端到端訓練在X平臺實現AI視頻創作閉環,計劃明年推出整合虛幻引擎的3D資源自動生成系統以賦能遊戲與影視產業。短期將首先強化專用編程模型並優化圖像識別技術,最終目標是構建兼具深度思考、實時響應與多模態協同的超級智能體,徹底重塑人機協作範式。
風險提示:技術競爭加劇,算力供給不足,數據隱私合規風險。