GPT-4.5發佈:比GPT-4提升10倍 但"並非前沿模型"
2月28日消息,美國時間週四,OpenAI宣佈推出GPT-4.5,這是其最新、最強大的大語言模型(LLM)的研究預覽版,專爲聊天應用設計。不過,這也是OpenAI迄今爲止最昂貴的模型。
不過,GPT-4.5仍然是一款傳統的大型語言模型,而非“推理模型”。此前,OpenAI、DeepSeek、Anthropic等公司都推出了推理模型,這些模型能夠生成“思維鏈”或類似意識流的文本,通過反思自身的假設和結論,嘗試在向用戶提供響應或輸出之前捕捉錯誤。
儘管如此,OpenAI聯合創始人兼首席執行官山姆·奧特曼(Sam Altman)在社交平臺上表示,GPT-4.5是“第一個讓我感覺像是在與一個有思想的人交談的模型。我曾多次靠在椅背上,驚訝於AI能給出真正有用的建議。”
奧特曼還提醒道,由於GPU供應緊張,OpenAI不得不限制對GPT-4.5的訪問。他指出:“壞消息是:這是一個龐大且昂貴的模型。我們本打算同時向Plus和Pro用戶推出,但用戶量大幅增長導致GPU資源不足。我們計劃下週增加數萬顆GPU,並隨後向Plus訂閱用戶開放。(很快還會有數十萬顆GPU到位,我相信大家會充分利用我們部署的每一顆GPU。)這並不是我們理想的運作方式,但很難完美預測導致GPU短缺的需求激增。”
從美國時間週四開始,GPT-4.5將向OpenAI的最昂貴訂閱服務ChatGPT Pro(每月200美元)的用戶開放,並向所有付費API層級的開發者提供訪問權限。OpenAI還計劃在下週將其擴展至價格相對較低的Plus和Team層級(每月20/30美元)。
GPT-4.5支持搜索功能和畫布模式,用戶還可以上傳文件和圖像,但目前還不支持其他多模態功能,如語音模式、視頻和屏幕共享——至少暫時不支持。
通過無監督學習推動AI進步
GPT-4.5代表了人工智能訓練領域的顯著進步,尤其是在無監督學習方面,這大大提升了模型識別模式、建立聯繫以及生成創造性見解的能力。
OpenAI的研究人員提到,GPT-4.5通過基於較小人工智能模型生成的數據進行訓練,這有助於提升其“世界模型”。他們還表示,該模型同時利用多個數據中心進行預訓練,這意味着它採用了一種類似於競爭對手Nous Research的去中心化方法。
這種訓練方式顯然幫助GPT-4.5學會了生成更自然、更直觀的交互,同時更準確地遵循用戶意圖,並展現出更高的情商。該模型在OpenAI此前關於人工智能擴展的工作基礎上取得了突破,進一步驗證了“增加數據和計算能力有助於提升人工智能性能”的理念。
與前代模型及其他同類產品相比,GPT-4.5預計能夠顯著減少幻覺現象(幻覺率爲37.1%,相比之下GPT-4爲61.8%),從而使其在處理廣泛話題時更加可靠。
GPT-4.5的突出特點
根據OpenAI的說法,GPT-4.5旨在創造親切自然、直觀流暢的對話。它對語義細微差異和上下文有更強的把握能力,能夠實現更像人類之間的互動,並更有效地與用戶協作。
GPT-4.5通過擴展的知識庫和敏銳的細微線索解讀能力,在多個領域展現出色表現,包括:
——寫作輔助:優化內容、提升清晰度、激發創意
——編程支持:調試、提出代碼改進建議、自動化工作流程
——問題解決:提供詳細解釋,並協助做出實際決策
此外,GPT-4.5還採用了新的對齊技術,增強了其對人類偏好和意圖的理解能力,進一步提升了用戶體驗。
如何訪問GPT-4.5?
從美國當地時間週四開始,ChatGPT Pro用戶可以在網頁、移動端和桌面端的模型選擇菜單中選擇GPT-4.5。OpenAI計劃在下週將該模型擴展到Plus和Team用戶。
對於開發者,GPT-4.5將通過OpenAI的API提供,包括Chat Completions API、Assistants API和Batch API。它支持函數調用、結構化輸出、流式傳輸、系統消息和圖像輸入等關鍵功能,使其成爲多種人工智能驅動應用的通用工具。不過,GPT-4.5目前尚不支持語音模式、視頻或屏幕共享等多模態功能。
定價及對企業決策者的影響
企業和團隊領導者可以充分利用GPT-4.5帶來的各種功能。憑藉較低的幻覺率、增強的可靠性和自然流暢的對話能力,GPT-4.5能夠支持廣泛的業務功能:
——改善客戶互動:企業可以將GPT-4.5集成到支持系統中,以實現更快、更自然的互動,同時減少錯誤
——增強內容生成:營銷和傳播團隊可以高效地製作高質量、符合品牌的內容
——精簡運營:人工智能驅動的自動化可以幫助調試、優化工作流程並支持戰略決策
——可擴展性和定製化:API允許企業進行量身定製,構建符合其特定需求的人工智能解決方案
然而,對於希望通過GPT-4.5構建應用的第三方開發者來說,GPT-4.5的API定價高得驚人,每百萬輸入/輸出token的價格爲75美元/180美元,而GPT-4o的定價僅爲2.50美元/10美元。
隨着其他競爭對手模型的發佈——如Anthropic的Claude 3.7、Google的Gemini 2 Pro,以及OpenAI自家的推理“o”系列(o1、o3-mini High、o3)——GPT-4.5的性能提升是否足以抵消其高昂成本,特別是在通過API使用時,將成爲一個值得關注的問題。
AI研究人員與資深用戶的早期反應兩極分化
GPT-4.5的發佈在社交平臺上引發了人工智能研究人員和技術愛好者的廣泛討論,尤其是在該模型的“系統卡”(即概述其訓練和評估的技術文檔)提前泄露後,文檔中包含了一系列官方公告前的基準測試結果。
OpenAI在泄露後發佈的最終版系統卡與泄露版本存在顯著差異,刪除了泄露版中“GPT-4.5並非前沿模型,但它是OpenAI最大的LLM,比GPT-4的計算效率提高了10倍以上”的表述。OpenAI的發言人表示,這一說法並不準確。
人工智能模型提供商Nous Research的聯合創始人Teknium(化名)對OpenAI的新模型表示失望,指出在多語言理解(MMLU)和實際編碼基準測試中,GPT-4.5相比其他領先的大語言模型(LLM)的改進微乎其微。Teknium質疑道:“距離GPT-4發佈已經過去2年多,OpenAI投入的資金投入規模擴大上千倍……究竟發生了什麼?”
此外,有人認爲,GPT-4.5在軟件工程基準測試中表現遜於o3-mini,這讓人質疑此次發佈是否代表了真正的技術進步。
然而,也有部分用戶爲GPT-4.5的潛力辯護,認爲其價值不應僅僅依賴於基準測試的結果。
軟件開發人員Haider(@slow_developer)強調,GPT-4.5相比GPT-4在計算效率上提升了10倍,並且其在綜合任務處理能力上優於OpenAI專注於STEM領域的o系列模型。
AI新聞發佈者Andrew Curran(@AndrewCurran_)則從定性角度出發,預測GPT-4.5將在寫作和創造性思維領域樹立新標準,並稱其爲OpenAI的“傑作”。
這些討論凸顯了人工智能領域一個更廣泛的爭論:技術進步是否應單純通過基準測試來衡量,還是應更側重於推理能力、創造力和擬人化交互等定性方面的改進?
仍處於研究預覽階段
OpenAI將GPT-4.5定位爲研究預覽版,以深入瞭解其優勢與侷限性。該公司表示,將繼續探索用戶與模型的互動方式,並挖掘非常規應用場景。
OpenAI稱:“我們發佈GPT-4.5作爲研究預覽版,以更好地瞭解其優勢與侷限性。擴展無監督學習將繼續推動人工智能的進步,提升準確性、流暢性和可靠性。”
隨着OpenAI不斷改進其模型,GPT-4.5爲未來的人工智能進步奠定了基礎,尤其是在推理和工具使用代理方面。儘管GPT-4.5已經展示了令人印象深刻的能力,OpenAI仍在積極評估其在生態系統中的長期作用。
憑藉更廣泛的知識庫、更高的情商和更自然的對話能力,GPT-4.5將爲各個領域的用戶帶來顯著改進。OpenAI期待看到開發者、企業和團隊如何將該模型集成到他們的工作流程和應用中。
隨着人工智能技術的不斷進步,GPT-4.5標誌着OpenAI在追求更強大、更可靠、更符合用戶需求的語言模型道路上邁出了重要的一步,爲企業領域的創新帶來了新的機遇。(小小)