☰

AI行業觀察：OpenAI開源模型迭代；華爲突破推理技術

本週，全球AI領域迎來密集技術迭代。OpenAI推出迄今最強的多模態推理模型GPT-5，並時隔六年重新開源兩款高性能模型，標誌着其策略轉向。與此同時，華爲宣佈即將發佈突破性AI推理技術，旨在降低對HBM的依賴，加速金融等場景的規模化落地。

一、全球AI模型迭代加速開源生態持續擴展

OpenAI發佈GPT-5，性能與爭議並存

OpenAI於8月7日正式發佈GPT-5，稱其爲“最智能、最快、最有用的模型”，在編程、數學、視覺理解等領域實現性能突破。新模型引入安全機制與多檔API定價策略，免費用戶需等待數日才能使用完整功能。儘管基準測試顯示其得分超過前代，但馬斯克公開質疑其AGI能力，稱xAI的Grok4在ARC-AGI測試中表現更優。實際測試中，用戶反饋其生成的文本“AI味”過濃，代碼實用性不足，OpenAI則以低價API策略爭奪市場份額。

開源生態再迎重量級玩家

OpenAI同步開源兩款推理模型gpt-oss-120b與gpt-oss-20b，分別支持單張80GBGPU和消費級設備部署，開放商業化使用。此舉被視爲對DeepSeek等開源力量的迴應。此外，Anthropic推出ClaudeOpus4.1，強化代碼重構與長上下文處理；xAI宣佈下週開源Grok2，提供複雜問題處理能力；小紅書開源多模態模型dots.vlm1，支持圖文交錯分析與文物識別。開源浪潮下，廠商通過漸進式更新提升模型可用性，生態競爭進一步加劇。

技術邊界持續突破

DeepMind發佈的Genie3成爲首個支持實時交互的世界模型，可模擬水、光等自然現象，並以720p分辨率維持數分鐘畫面一致性。谷歌稱其爲“AGI的關鍵墊腳石”，但受限於動作空間與多智能體交互能力。小紅書的dots.vlm1則在多模態評測中接近Gemini2.5Pro，突顯垂直場景模型的價值。

二、華爲突破推理技術金融應用落地提速

技術突破降低HBM依賴

華爲將於8月12日聯合中國銀聯發佈AI推理領域突破性成果，據透露，該技術可減少國內大模型對HBM的依賴，解決數據搬運瓶頸導致的響應延遲問題。業內人士指出，AI產業正從“追求模型極限”轉向“挖掘應用價值”，推理性能優化成爲生態完善的關鍵。華爲此次技術突破有望提升國產大模型的端側部署效率，尤其在金融等高實時性場景中發揮價值。

金融場景規模化落地

在同期舉辦的“2025金融AI推理應用落地與發展論壇”上，華爲將展示推理加速技術如何提升金融服務效率，信通院、清華大學及科大訊飛專家將分享實踐經驗。華爲已服務全球超5600家金融客戶，此次合作標誌着AI推理技術從實驗室向產業核心滲透。數據顯示，AI助推下，金融行業智能化轉型提速，但如何平衡性能與成本仍是挑戰。

行業趨勢與挑戰

當前，AI原生應用市場進入洗牌期。QuestMobile報告顯示，2025年上半年近七成原生APP月活負增長，預裝助手與中長尾玩家受同質化拖累。華爲的技術突圍或將推動端側推理普及，但芯片製程限制與地緣政策風險仍是長期隱憂。此外，谷歌與第三方機構就AI搜索流量爭議的博弈，反映出技術落地與生態利益分配的複雜性。

風險提示

芯片製程發展與良率不及預期；中美科技領域政策惡化；智能手機銷量不及預期。

本文源自：金融界

作者：觀察君

AI行業觀察：OpenAI開源模型迭代；華爲突破推理技術

相關資訊