中信建投:GPT-5發佈與華爲CANN開源有望帶動AI應用發展

智通財經APP獲悉,中信建投發佈研究報告稱,GPT-5正式發佈,在長文本記憶、幻覺率的降低和推理效率優化,爲AI應用的生長提供了更好的土壤。後續可期待Google、Anthropic的更新和國內模型的跟進,以及基模優化下AI應用代幣化的持續落地。華爲全面開源CANN生態,針對不同層級開發者差異化開放,大幅提高開發效率,有望對標CUDA加速追趕。1)利好有數據、有客戶、有場景的軟件企業,AI產品有望帶動公司ARPU提升和項目單價上升;2)模型私有化需求增加,利好一體機、超融合和B端服務外包企業;3)市場成交量持續維持高位,互聯網金融標的有望受益。

中信建投主要觀點如下:

GPT-5正式發佈,刷新多項能力SOTA。2025年8月8日凌晨1點,OpenAI正式發佈GPT-5,包含GPT-5、GPT-5-Mini、GPT-5-Nano三個版本。性能方面,GPT-5刷新多項基準測試Sota,尤其在數學、編程、視覺理解和健康領域表現突出,並在大模型競技場LMArena上各維度取得綜合排名第一的成績。

數學:OpenAI認爲使用工具的Benchmark得分不應該與不具備工具訪問能力的模型進行比較,而GPT-5在AIME 2025 no tools/Python分別得分94.6%/100%,一定程度反映其對工具的有效利用。同時,GPT-5在專家級問題上表現優異,在HMMT(麻省理工學院數學錦標賽)最高獲得100%的得分;GPQA Diamond(博士級科學問題)最高得分89.4%;HLE(跨學科專家問題)得分42.0%。

編程:GPT-5在SWE-bench Verified(With thinking)得分74.9%,略超Claude Opus 4.1的74.5%,取得新的Sota。同時,在LMArena 的各類能力得分中,GPT-5在WebDev上得分1479分,大幅領先排名第二的Gemini-2.5-Pro(1403分)。

多模態:GPT-5在視覺理解方面MMMU(With thinking)得分84.2%(高於gemini 2.5 pro的81.7%,但二者在LMArena得分相同,均爲1253分且排名第一),在MMMU-Pro、VideoMMMU等Benchmark上較前代模型亦有不同程度的提升。

場景: 教育方面,GPT-5可在幾分鐘之內生成數百行代碼,生成互動內容以解釋複雜概念;幾分鐘時間寫出一個法語學習網頁,幫用戶練發音,且語音語調較前代更加自然;醫療爲GPT-5重點應用場景,OpenAI稱其爲迄今爲止最好的健康模型;在涵蓋法律、物流、銷售和工程等 40 多個職業的具有經濟意義的任務上,GPT-5在47.1%的場景中達到了與專家相當或更高的水平。

GPT-5上下文窗口達400K,可通過實時路由器自行決定適用模型。初基準測試外得分高外,GPT-5還是帶實時路由器的統一模型,可以根據用戶對話類型、複雜性、工具需求和明確意圖快速決定使用哪個模型(類似混合推理模型中自己決定快/慢思考)。同時,GPT-5的上下文窗口提升至400K tokens(約30萬字,較o3翻倍),“Memory”功能將新增對Gmail和谷歌日曆的訪問權限(下週推出,先向專業用戶開放,隨後是Plus/團隊/企業用戶),可根據用戶偏好幫助用戶規劃日程。

幻覺率顯著降低,成本優化明顯。在ChatGPT生產環境流量的匿名測試中,GPT-5的事實錯誤率比4o降低約 45%;啓用推理功能時,錯誤率比o3降低約 80%。在開放性事實準確性基準 LongFact和FActScore測試中,GPT-5 thinking的幻覺率比o3減少約六倍;此外,GPT-5進一步降低了模型過於自信的問題,例如在對不存在圖像的多模態問題回覆欺騙率從o3的86.7%%降低至9%。

而在定價&成本方面,GPT-5全用戶可用,Plus用戶用量更高,Pro用戶可使用帶思考能力的GPT-5-Pro。GPT-5每百萬tokens輸入$1.25(緩存命中$0.125),輸出$10,與Gemini 2.5Pro持平;Mini和Nano則爲GPT-5的1/5和1/25。此外,GPT-5在推理效率亦有提升,部分任務表現優於o3,但輸出token減少了 50-80%。

華爲CANN全面開源,加速生態完善。8月5日,在昇騰計算產業發展峰會上,華爲輪值董事長徐直軍宣佈,華爲昇騰硬件使能CANN全面開源開放,Mind系列應用使能套件及工具鏈全面開源,支持用戶自主的深度挖潛和自定義開發,加速廣大開發者的創新步伐,讓昇騰更好用、更易用。

具體而言,CANN(神經網絡異構計算架構)是由多種技能棧和算子加速庫等組成的軟件生態系統,能把上層AI訓練框架(如PyTorch、TensorFlow、MindSpore等)和底層昇騰芯片連接起來,使開發者不用關心芯片細節就能調用底層算力,從而加速昇騰生態建設。

針對不同層級開發者差異化開放,大幅提高開發效率。昇騰CANN針對不同技術層級的開發者推出了差異化開放策略。比如在算法創新層,開發者可基於業務場景進行“魔改式”創新;在系統優化層,CANN開放了190多個底層接口,得以釋放硬件的原子級能力。在編譯生態層,通過開放畢昇編譯器的AscendNPU IR接口,開發者可以在接入Triton後直接使用Python語法編寫高性能算子,底層硬件差異被完全抽象化。

而在效率方面,CANN通過對計算、內存、通信的優化提高效率。計算層面,昇騰CANN針對MoE大模型訓練場景推出了超級算子MLAPO,將MLA前處理耗時從行業平均109ms壓縮至45ms,在金融風控模型、廣告推薦系統中實現了20%以上的端到端性能提升,打破Transformer架構的算力瓶頸;內存層面,多重地址映射技術可以實現內存碎片的自動化拼接利用,解決動態shape場景的“內存碎片化”難題,讓京東商品搜索、騰訊短視頻推薦等業務場景的內存利用率提升了20%以上,突破了單卡可承載併發請求量行業極限。在分佈式訓練領域, NPUDirect通信算法將傳統RDMA通信所需的3對同步精簡爲1次原子操作,讓科大訊飛語音大模型的跨機通信時延下降了90%,走通了萬卡級分佈式訓練可行性路徑。

根據昇騰官方數據,6年來,有超過60萬開發者瞭解CANN、使用CANN、賦予CANN創新活力,在昇騰CANN持續推進開放,以及產業各方開發者、企業積極參與之下,CANN生態正在快速成長。目前CANN的算子認證開發者已經超過了6000人。隨着CANN的進一步開源,昇騰CANN生態有望進一步完善,對標CUDA加速追趕,併爲基於國產算力的AI應用開發提供了更好的基礎。

總結:GPT-5正式發佈,在長文本記憶、幻覺率的降低和推理效率優化,爲AI應用的生長提供了更好的土壤。後續可期待Google、Anthropic的更新和國內模型的跟進,以及基模優化下AI應用代幣化的持續落地。華爲全面開源CANN生態,針對不同層級開發者差異化開放,大幅提高開發效率,有望對標CUDA加速追趕,同樣爲國內AI應用開發提供了更好的基礎。

海外GPT-5推出,降低幻覺的同時,提升推理性能,降低成本。1)利好有數據、有客戶、有場景的軟件企業,AI產品有望帶動公司ARPU提升和項目單價上升。2)模型私有化需求增加,利好一體機、超融合和B端服務外包企業。

風險因素:(1)宏觀經濟下行風險;(2)應收賬款壞賬風險;(3)行業競爭加劇;(4)國際環境變化影響.