AI行業觀察:OpenAI開源模型迭代;華爲突破推理技術

本週,全球AI領域迎來密集技術迭代。OpenAI推出迄今最強的多模態推理模型GPT-5,並時隔六年重新開源兩款高性能模型,標誌着其策略轉向。與此同時,華爲宣佈即將發佈突破性AI推理技術,旨在降低對HBM的依賴,加速金融等場景的規模化落地。

一、全球AI模型迭代加速開源生態持續擴展

OpenAI發佈GPT-5,性能與爭議並存

OpenAI於8月7日正式發佈GPT-5,稱其爲“最智能、最快、最有用的模型”,在編程、數學、視覺理解等領域實現性能突破。新模型引入安全機制與多檔API定價策略,免費用戶需等待數日才能使用完整功能。儘管基準測試顯示其得分超過前代,但馬斯克公開質疑其AGI能力,稱xAI的Grok4在ARC-AGI測試中表現更優。實際測試中,用戶反饋其生成的文本“AI味”過濃,代碼實用性不足,OpenAI則以低價API策略爭奪市場份額。

開源生態再迎重量級玩家

OpenAI同步開源兩款推理模型gpt-oss-120b與gpt-oss-20b,分別支持單張80GBGPU和消費級設備部署,開放商業化使用。此舉被視爲對DeepSeek等開源力量的迴應。此外,Anthropic推出ClaudeOpus4.1,強化代碼重構與長上下文處理;xAI宣佈下週開源Grok2,提供複雜問題處理能力;小紅書開源多模態模型dots.vlm1,支持圖文交錯分析與文物識別。開源浪潮下,廠商通過漸進式更新提升模型可用性,生態競爭進一步加劇。

技術邊界持續突破

DeepMind發佈的Genie3成爲首個支持實時交互的世界模型,可模擬水、光等自然現象,並以720p分辨率維持數分鐘畫面一致性。谷歌稱其爲“AGI的關鍵墊腳石”,但受限於動作空間與多智能體交互能力。小紅書的dots.vlm1則在多模態評測中接近Gemini2.5Pro,突顯垂直場景模型的價值。

二、華爲突破推理技術金融應用落地提速

技術突破降低HBM依賴

華爲將於8月12日聯合中國銀聯發佈AI推理領域突破性成果,據透露,該技術可減少國內大模型對HBM的依賴,解決數據搬運瓶頸導致的響應延遲問題。業內人士指出,AI產業正從“追求模型極限”轉向“挖掘應用價值”,推理性能優化成爲生態完善的關鍵。華爲此次技術突破有望提升國產大模型的端側部署效率,尤其在金融等高實時性場景中發揮價值。

金融場景規模化落地

在同期舉辦的“2025金融AI推理應用落地與發展論壇”上,華爲將展示推理加速技術如何提升金融服務效率,信通院、清華大學及科大訊飛專家將分享實踐經驗。華爲已服務全球超5600家金融客戶,此次合作標誌着AI推理技術從實驗室向產業核心滲透。數據顯示,AI助推下,金融行業智能化轉型提速,但如何平衡性能與成本仍是挑戰。

行業趨勢與挑戰

當前,AI原生應用市場進入洗牌期。QuestMobile報告顯示,2025年上半年近七成原生APP月活負增長,預裝助手與中長尾玩家受同質化拖累。華爲的技術突圍或將推動端側推理普及,但芯片製程限制與地緣政策風險仍是長期隱憂。此外,谷歌與第三方機構就AI搜索流量爭議的博弈,反映出技術落地與生態利益分配的複雜性。

風險提示

芯片製程發展與良率不及預期;中美科技領域政策惡化;智能手機銷量不及預期。

本文源自:金融界

作者:觀察君