☰

OpenAI亮出垂直野心，GPT-5能啃下多少行業硬骨頭？

21世紀經濟報道記者董靜怡

奧特曼頻頻造勢、全世界都在翹首以盼的GPT-5終於來了。

北京時間8月8日凌晨，OpenAI正式發佈GPT-5模型，舉行了長達1個多小時的線上發佈會。在發佈會上，OpenAICEO山姆·奧特曼（Sam Altman）將GPT-5描述爲“迄今爲止最智能、最快速且最有用的模型”。

GPT-5主要有以下亮點：

1.GPT-5是一個融合模型，能夠根據問題的複雜程度自動調整思考深度；

2.GPT-5在多個行業基準測試中創下新高，如數學、多模態、編程、醫療；

3.“幻覺”問題大大降低，模型也變得更加誠實，會明確告知自身能力邊界。

這些不僅凸顯了模型在認知深度和專業性上的突破，也顯示了大模型正從通用工具向垂直領域的專業化應用邁進。

眼下正值全球AI競爭加劇的關鍵時期，OpenAI的目標顯然已不只是模型本身，其商業化也在加速，在消費者訂閱之外，“更靠譜”的GPT-5瞄準了更多行業應用。

“博士級別”

“GPT-4感覺就像在和一名大學生交談，GPT-5是我們主流模型中首次讓人感覺與一位真正的專家、一位博士級別的專家對話。”奧特曼在發佈會上表示。

OpenAI此次發佈的GPT-5被廣泛認爲是迄今爲止最強大、最全面的AI模型，其技術指標和實際表現均實現了質的飛躍。

根據官方公佈的數據，GPT-5在多個行業基準測試中創下新高：數學推理方面，它在AIME 2025測試中達到94.6%的準確率；多模態理解(MMMU)得分84.2%；醫療健康領域(HealthBench Hard)表現也顯著提升至46.2%。

編程能力的飛躍是GPT-5最引人注目的亮點之一。在衡量編程能力的SWE-bench Verified測試中得分74.9%，在評估多語言代碼編輯準確性的Aider polyglot測試中達到驚人的88%。

現場演示中，OpenAI研究員僅用幾秒就讓GPT-5生成了一款完整的法語學習遊戲，包含數百行可運行代碼，且無需人工調試。

“GPT-5是我們使用過的最智能的編碼模型。”Cursor聯合創始人兼首席執行官Michael Truell反饋稱。Cursor團隊在測試中發現，GPT-5能夠發現其他模型遺漏的代碼錯誤，並能自動運行後臺代理完成複雜任務。

有AI企業的相關負責人向記者表示，“AI編程是AI落地最成熟的場景之一。”Meta首席執行官馬克·扎克伯格此前曾表示，預計明年公司約一半的代碼將由人工智能編寫。微軟首席執行官薩蒂亞·納德拉也公開表示過，公司20%到30%的代碼是由人工智能編寫的。

而AI編程的賽道已經十分擁擠，全球三大公有云巨頭在“AI編碼助手”賽道已全部落子，初創公司也層出不窮。GPT-5的更新無疑會讓競爭更加激烈。

此外，OpenAI還花了很多時間談論GPT-5解決醫療保健用例的能力。據OpenAI介紹，GPT-5是“最準確的醫療問題解答模型”，能夠幫助患者理解、應對複雜的醫療場景並做出知情決策，在HealthBench上的得分高於任何先前的模型。

奧特曼在發佈會上分享了一位乳腺癌倖存者的反饋，GPT-4在她確診時提供了關鍵的信息支持，而GPT-5現在更像是一位“思維夥伴”，不僅能解釋醫學概念，還能結合她的個人情況提供更細緻的建議。

OpenAI同時強調，GPT-5並非要替代醫生，而是通過增強患者的知識水平和提問能力，改善醫患溝通質量。

除了應用上的能力飛躍外，模型本身也更加穩定和易用。

值得注意的是，GPT-5是一個融合模型，能夠根據問題的複雜程度自動調整思考深度，從而在速度和準確性之間取得最佳平衡。

奧特曼舉例說明，如果問GPT-5一個簡單的問題，它會快速回答；但如果是一個複雜的科學或工程問題，它會像專家一樣深入思考，直至找到最優解。這一設計也使得GPT-5在真實世界的應用場景中表現更加穩定。

備受關注的“幻覺”現象也顯著減少，啓用網絡搜索時，事實錯誤率比GPT-4o降低45%；在深度推理模式下，錯誤率比o3低約80%。模型也變得更加誠實，會明確告知自身能力邊界，避免對無法完成的任務進行猜測。

目前，GPT-5已對所有ChatGPT用戶開放，包括免費用戶，付費用戶（Plus、Pro、Team）可獲得更高使用額度或無限使用。

商業化突圍

不難看出，GPT-5的更新更強調其可用性、可靠性，在這背後，是OpenAI的商業模式正面臨關鍵轉折點。

在最新一輪融資中，OpenAI已成功籌集到83億美元，估值達3000億美元。同時，OpenAI的年化經常性收入已從6月份的100億美元躍升至130億美元，預計年底前將突破200億美元。

但從產業角度看，GPT-5的推出正值全球AI競爭進入白熱化階段。谷歌的Genie 3世界模型、Meta的開源Llama 3系列，以及中國企業的Qwen 3和DeepSeek R1等模型都在不同領域展現出強大競爭力。

摩根大通此前發佈的一份報告指出，儘管OpenAI估值驚人，其商業模式面臨的風險正在擴大。OpenAI的早期優勢在於其極高的消費者使用率和品牌實力，但其多元化程度並不高，約75%的收入來自消費者訂閱。

OpenAI顯然意識到了這一風險，正積極拓展企業客戶和政府市場。就在GPT-5發佈一天前，OpenAI宣佈，將在未來一年內以象徵性的1美元價格，向美國所有聯邦行政機構提供ChatGPT企業版。表面上看是低價策略，實則是爲打開利潤豐厚的政府服務市場鋪路，建立長期合作關係。

近幾個月來，OpenAI一直在積極加強與美國國會議員和監管機構的聯繫，並計劃於2026年初在華盛頓特區開設其第一家辦事處。

今年6月，OpenAI推出了“OpenAI for Government”專項業務，並與美國國防部簽署了一份價值高達2億美元的合同。根據該合同，雙方將合作探索人工智能在醫療保健、網絡安全和行政流程優化等領域的應用。

此次GPT-5的發佈也與以往側重消費級應用不同，特別強調了GPT-5在各垂直行業的專業能力和商業化潛力，比如奧特曼在發佈會上重點提到的編程能力和醫療領域的應用。

OpenAI在介紹中表示，運用推理能力時，GPT-5在大約一半的情況下表現達到或優於人類專家水平，且在涵蓋法律、物流、銷售和工程等40多種職業的任務中，整體表現均優於o3和ChatGPT Agent。

有分析認爲，在企業市場，高級推理能力或許能爲OpenAI創造差異化的經濟價值。複雜問題解決能力使GPT-5能夠切入高附加值領域，如戰略諮詢、投資分析、研發設計等，這些領域願意爲可靠的高級認知能力支付溢價。

不過，GPT-5是否能爲Open-AI的企業份額帶來推動，還有待觀察。根據Menlo Ventures的數據，Anthropic在企業人工智能中佔有32%的份額，其次是OpenAI（25%）和谷歌（20%）。

Anthropic尤爲強調安全性和可解釋性，已經贏得了金融、醫療等高度監管行業的青睞；谷歌則利用其雲服務基礎設施和Workspace集成優勢，爲企業提供一站式AI解決方案。OpenAI想要擴大企業市場份額，還需要構建更完整的企業服務體系和行業解決方案。

未來，其垂直行業的深化進展將成爲驗證商業模式可行性的關鍵指標。

相關資訊