OpenAI亮出垂直野心,GPT-5能啃下多少行業硬骨頭?

21世紀經濟報道記者 董靜怡

奧特曼頻頻造勢、全世界都在翹首以盼的GPT-5終於來了。

北京時間8月8日凌晨,OpenAI正式發佈GPT-5模型,舉行了長達1個多小時的線上發佈會。在發佈會上,OpenAICEO山姆·奧特曼(Sam Altman)將GPT-5描述爲“迄今爲止最智能、最快速且最有用的模型”。

GPT-5主要有以下亮點:

1.GPT-5是一個融合模型,能夠根據問題的複雜程度自動調整思考深度;

2.GPT-5在多個行業基準測試中創下新高,如數學、多模態、編程、醫療;

3.“幻覺”問題大大降低,模型也變得更加誠實,會明確告知自身能力邊界。

這些不僅凸顯了模型在認知深度和專業性上的突破,也顯示了大模型正從通用工具向垂直領域的專業化應用邁進。

眼下正值全球AI競爭加劇的關鍵時期,OpenAI的目標顯然已不只是模型本身,其商業化也在加速,在消費者訂閱之外,“更靠譜”的GPT-5瞄準了更多行業應用。

“博士級別”

“GPT-4感覺就像在和一名大學生交談,GPT-5是我們主流模型中首次讓人感覺與一位真正的專家、一位博士級別的專家對話。”奧特曼在發佈會上表示。

OpenAI此次發佈的GPT-5被廣泛認爲是迄今爲止最強大、最全面的AI模型,其技術指標和實際表現均實現了質的飛躍。

根據官方公佈的數據,GPT-5在多個行業基準測試中創下新高:數學推理方面,它在AIME 2025測試中達到94.6%的準確率;多模態理解(MMMU)得分84.2%;醫療健康領域(HealthBench Hard)表現也顯著提升至46.2%。

編程能力的飛躍是GPT-5最引人注目的亮點之一。在衡量編程能力的SWE-bench Verified測試中得分74.9%,在評估多語言代碼編輯準確性的Aider polyglot測試中達到驚人的88%。

現場演示中,OpenAI研究員僅用幾秒就讓GPT-5生成了一款完整的法語學習遊戲,包含數百行可運行代碼,且無需人工調試。

“GPT-5是我們使用過的最智能的編碼模型。”Cursor聯合創始人兼首席執行官Michael Truell反饋稱。Cursor團隊在測試中發現,GPT-5能夠發現其他模型遺漏的代碼錯誤,並能自動運行後臺代理完成複雜任務。

有AI企業的相關負責人向記者表示,“AI編程是AI落地最成熟的場景之一。”Meta首席執行官馬克·扎克伯格此前曾表示,預計明年公司約一半的代碼將由人工智能編寫。微軟首席執行官薩蒂亞·納德拉也公開表示過,公司20%到30%的代碼是由人工智能編寫的。

而AI編程的賽道已經十分擁擠,全球三大公有云巨頭在“AI編碼助手”賽道已全部落子,初創公司也層出不窮。GPT-5的更新無疑會讓競爭更加激烈。

此外,OpenAI還花了很多時間談論GPT-5解決醫療保健用例的能力。據OpenAI介紹,GPT-5是“最準確的醫療問題解答模型”,能夠幫助患者理解、應對複雜的醫療場景並做出知情決策,在HealthBench上的得分高於任何先前的模型。

奧特曼在發佈會上分享了一位乳腺癌倖存者的反饋,GPT-4在她確診時提供了關鍵的信息支持,而GPT-5現在更像是一位“思維夥伴”,不僅能解釋醫學概念,還能結合她的個人情況提供更細緻的建議。

OpenAI同時強調,GPT-5並非要替代醫生,而是通過增強患者的知識水平和提問能力,改善醫患溝通質量。

除了應用上的能力飛躍外,模型本身也更加穩定和易用。

值得注意的是,GPT-5是一個融合模型,能夠根據問題的複雜程度自動調整思考深度,從而在速度和準確性之間取得最佳平衡。

奧特曼舉例說明,如果問GPT-5一個簡單的問題,它會快速回答;但如果是一個複雜的科學或工程問題,它會像專家一樣深入思考,直至找到最優解。這一設計也使得GPT-5在真實世界的應用場景中表現更加穩定。

備受關注的“幻覺”現象也顯著減少,啓用網絡搜索時,事實錯誤率比GPT-4o降低45%;在深度推理模式下,錯誤率比o3低約80%。模型也變得更加誠實,會明確告知自身能力邊界,避免對無法完成的任務進行猜測。

目前,GPT-5已對所有ChatGPT用戶開放,包括免費用戶,付費用戶(Plus、Pro、Team)可獲得更高使用額度或無限使用。

商業化突圍

不難看出,GPT-5的更新更強調其可用性、可靠性,在這背後,是OpenAI的商業模式正面臨關鍵轉折點。

在最新一輪融資中,OpenAI已成功籌集到83億美元,估值達3000億美元。同時,OpenAI的年化經常性收入已從6月份的100億美元躍升至130億美元,預計年底前將突破200億美元。

但從產業角度看,GPT-5的推出正值全球AI競爭進入白熱化階段。谷歌的Genie 3世界模型、Meta的開源Llama 3系列,以及中國企業的Qwen 3和DeepSeek R1等模型都在不同領域展現出強大競爭力。

摩根大通此前發佈的一份報告指出,儘管OpenAI估值驚人,其商業模式面臨的風險正在擴大。OpenAI的早期優勢在於其極高的消費者使用率和品牌實力,但其多元化程度並不高,約75%的收入來自消費者訂閱。

OpenAI顯然意識到了這一風險,正積極拓展企業客戶和政府市場。就在GPT-5發佈一天前,OpenAI宣佈,將在未來一年內以象徵性的1美元價格,向美國所有聯邦行政機構提供ChatGPT企業版。表面上看是低價策略,實則是爲打開利潤豐厚的政府服務市場鋪路,建立長期合作關係。

近幾個月來,OpenAI一直在積極加強與美國國會議員和監管機構的聯繫,並計劃於2026年初在華盛頓特區開設其第一家辦事處。

今年6月,OpenAI推出了“OpenAI for Government”專項業務,並與美國國防部簽署了一份價值高達2億美元的合同。根據該合同,雙方將合作探索人工智能在醫療保健、網絡安全和行政流程優化等領域的應用。

此次GPT-5的發佈也與以往側重消費級應用不同,特別強調了GPT-5在各垂直行業的專業能力和商業化潛力,比如奧特曼在發佈會上重點提到的編程能力和醫療領域的應用。

OpenAI在介紹中表示,運用推理能力時,GPT-5在大約一半的情況下表現達到或優於人類專家水平,且在涵蓋法律、物流、銷售和工程等40多種職業的任務中,整體表現均優於o3和ChatGPT Agent。

有分析認爲,在企業市場,高級推理能力或許能爲OpenAI創造差異化的經濟價值。複雜問題解決能力使GPT-5能夠切入高附加值領域,如戰略諮詢、投資分析、研發設計等,這些領域願意爲可靠的高級認知能力支付溢價。

不過,GPT-5是否能爲Open-AI的企業份額帶來推動,還有待觀察。根據Menlo Ventures的數據,Anthropic在企業人工智能中佔有32%的份額,其次是OpenAI(25%)和谷歌(20%)。

Anthropic尤爲強調安全性和可解釋性,已經贏得了金融、醫療等高度監管行業的青睞;谷歌則利用其雲服務基礎設施和Workspace集成優勢,爲企業提供一站式AI解決方案。OpenAI想要擴大企業市場份額,還需要構建更完整的企業服務體系和行業解決方案。

未來,其垂直行業的深化進展將成爲驗證商業模式可行性的關鍵指標。