OpenAI這次要open了,奧爾特曼所說的“開放權重模型”是什麼?
《科創板日報》4月1日訊(編輯 朱凌)北京時間4月1日凌晨,OpenAI首席執行官薩姆·奧爾特曼(Sam Altman)在社交媒體X平臺宣佈:OpenAI將在未來幾個月內發佈一個“強大的帶有推理能力的全新開放權重(open-weight)模型”。
這是自2019年發佈GPT-2以來,OpenAI時隔六年首次宣佈新的開放模型計劃。
回顧過往,OpenAI雖然以“開放”命名,但自從GPT-3開始,逐步轉向封閉。尤其是ChatGPT問世後,OpenAI模型只能通過其自家平臺或者微軟Azure等合作伙伴訪問或使用API接口。用戶無法在自己的硬件上自行部署運行GPT-3、4、4o、4.5等,無法對它們進行修改或二次開發。
或許是隨着DeepSeek等開放模型迅速崛起,OpenAI壓力逐漸增大。
在今年2月1日的OpenAI o3-mini產品發佈後,奧爾特曼公開承認DeepSeek削弱了OpenAI在AI領域的領先地位。
他認爲,OpenAI在開源AI方面一直站在歷史的錯誤一邊,“我們需要想出一個不同的開源策略”。
並非完全開源模型
2月18日,奧爾特曼在X平臺上發起對OpenAI下一個開源項目的民意調查:是做一個雖然體積小、但仍需要GPU運行的o3-mini級別模型,還是做一個適配手機的輕量模型?
投票結果偏向前者,這也預示了這次開放模型可能是o3-mini級別模型。但從奧爾特曼發起投票時的措辭來看,不會直接是o3-mini,而是一個與o3-mini類似,但有所不同的模型。
即便是開放模型,OpenAI依舊會保留一些“秘方”——例如模型訓練數據、預訓練細節或者關鍵架構組件等。換句話說,這是一個開放權重模型,但不是一個完全開源的模型。
事實上,由於AI模型不僅包括代碼,還涉及數據、參數和權重等,開源模型的定義並不像開源軟件般清晰,目前尚未形成統一定義。
Linux基金會提出的模型開放性框架(MOF)把開放模型分爲了三個逐步擴展的層級——第三級“開放模型”、第二級“開放工具”和第一級“開放科學”。
Deepseek、Qwen2.5等模型只通過了MOF第三級評估,第三級“開放模型”開放範圍包括模型架構、模型參數(最終參數)、模型卡、數據卡、技術報告和評估結果,距離最開放的第一級“開放科學”仍有空間。
而OpenAI將發佈的開放模型是否能達到第三級,目前還不得而知。
開放權重模型意味着什麼?
奧爾特曼在X上表示,“我們希望與開發者深入探討如何最大化發揮其作用,我們很高興能將它打造爲一個非常非常優秀的模型。”
他還透露,OpenAI將在舊金山、歐洲和亞太地區舉辦開發者活動,以收集反饋並提供早期原型試用機會。
奧爾特曼稱,很期待看到開發人員的成果,以及大公司和政府如何使用它來運行自己的模型。
這似乎表明,這次開放模型主要針對開發人員、企業和政府,而不是個人用戶。
開放模型可以本地部署,在特殊應用場景中具有更大的優勢。企業和政府可以在自己的服務器上運行開放模型,無需連接外網或接入雲端算力,在本地處理數據,利用特定領域的數據進行訓練,能夠保護隱私,還可以擺脫對OpenAI平臺的依賴,避免雲服務帶來的延遲、安全和成本問題,同時提供緊急情況下的快速響應。
而且,開放模型可控性和可審計性增強,開發者可以深入理解模型運行機制,更容易調試和調整策略。
此外,開發者可以基於自有數據對模型進行開放模型微調,開發專屬的垂直領域應用,構建衍生模型,甚至將其提煉爲在智能手機等智能終端上就能單機運行起來的AI模型。
英偉達也推出了個人AI超級計算機,使企業和開發者能夠以相對較低的成本運行開放模型。
不過,對於普通個人用戶而言,能夠流暢運行開放模型的硬件成本仍然較高,雲端模型依然具有更高的實用性,尤其在面對複雜任務時,雲端模型在算力和易用性方面仍擁有明顯優勢。