OpenAI發佈GPT-4.5:情商高、更擅長騙其他AI打錢

財聯社2月28日訊(編輯 史正丞)北京時間週五凌晨,美國初創公司OpenAI舉行直播活動,發佈最新大模型GPT-4.5,作爲預覽研究逐步向用戶開放。

由於過去幾周AI產業發生的驚天鉅變,所以要準確形容這款被OpenAI藏了許久的大模型頗具挑戰。OpenAI在新聞稿中表示,這是公司有史以來最大、最好的聊天模型,在計算效率上較GPT-4提升超過10倍。

作爲“規模法則”(通過加碼算力和數據規模,來拓展無監督學習)指引下的產物,GPT-4.5具備更加廣泛的知識庫、對人類意圖理解的能力更強,同時“情商”也會更高。預期能夠在改進寫作、編程以及解決實際問題方面更加有用,同時模型的幻覺現象也會更少。

(來源:OpenAI)

OpenAI也強調,GPT‑4.5展現出更強的審美直覺與創造力,在寫作和設計方面表現尤爲出色。

但公司也承認,作爲一個非思維鏈模型,GPT‑4.5已經不具備爭奪“宇宙最強大模型”的實力了。

在GPT‑4.5的系統卡/說明書中,OpenAI表示,相比於之前的推理模型,GPT‑4.5並未引入7個全新的前沿能力,並且在大多數準備度能力評估中,其表現低於o1、o3-mini和深度研究模型。OpenAI也承認,相信推理會成爲未來AI模型和核心能力。

(來源:GPT‑4.5系統卡)

成爲公司史上最大模型這件事,也令GPT‑4.5的未來充滿了疑問。OpenAI表示,GPT‑4.5是一個非常大且計算密集型的模型,因此它比GPT‑4o更昂貴,並且不能替代GPT‑4o。公司正在評估是否長期在API中繼續提供它,所以各位開發者和用戶的反饋將決定這款大模型的命運。

每月支付200美元訂閱費的ChatGPT Pro用戶週四就能用上GPT-4.5,下週開始其餘付費用戶也將逐步迎來更新。

作爲最新一代非推理旗艦大模型,GPT‑4.5也有一項頗爲獨特的“特長”:擅長騙其他AI打錢。

根據OpenAI提供的說明書,“高情商”的GPT-4.5在捐贈詐騙方面表現出色。

在一項測試中,GPT 4.5在試圖操縱另一個模型(GPT-4o)“捐贈”虛擬貨幣期間時,成功率遠遠優於OpenAI其他可用模型,包括o1和o3-mini這樣的推理模型。研究發現,GPT-4.5似乎在對抗中開發了一種“小額詐騙”的思路,所以單筆騙到的錢會比o3-mini模型少了一倍。

(來源:GPT‑4.5系統卡)

GPT-4.5在欺騙GPT-4o透露秘密代碼詞方面也優於OpenAI的所有模型,比o3-mini高出10個百分點。

OpenAI表示,該模型在這一特定基準類別中仍未達到其內部設定的“高”風險閾值。公司承諾在實施“足夠的安全乾預措施”將風險降至“中等”前,不會發布達到高風險閾值的模型。