☰

OpenAI這次要open了，奧爾特曼所說的“開放權重模型”是什麼？

《科創板日報》4月1日訊（編輯朱凌）北京時間4月1日凌晨，OpenAI首席執行官薩姆·奧爾特曼（Sam Altman）在社交媒體X平臺宣佈：OpenAI將在未來幾個月內發佈一個“強大的帶有推理能力的全新開放權重（open-weight）模型”。

這是自2019年發佈GPT-2以來，OpenAI時隔六年首次宣佈新的開放模型計劃。

回顧過往，OpenAI雖然以“開放”命名，但自從GPT-3開始，逐步轉向封閉。尤其是ChatGPT問世後，OpenAI模型只能通過其自家平臺或者微軟Azure等合作伙伴訪問或使用API接口。用戶無法在自己的硬件上自行部署運行GPT-3、4、4o、4.5等，無法對它們進行修改或二次開發。

或許是隨着DeepSeek等開放模型迅速崛起，OpenAI壓力逐漸增大。

在今年2月1日的OpenAI o3-mini產品發佈後，奧爾特曼公開承認DeepSeek削弱了OpenAI在AI領域的領先地位。

他認爲，OpenAI在開源AI方面一直站在歷史的錯誤一邊，“我們需要想出一個不同的開源策略”。

並非完全開源模型

2月18日，奧爾特曼在X平臺上發起對OpenAI下一個開源項目的民意調查：是做一個雖然體積小、但仍需要GPU運行的o3-mini級別模型，還是做一個適配手機的輕量模型？

投票結果偏向前者，這也預示了這次開放模型可能是o3-mini級別模型。但從奧爾特曼發起投票時的措辭來看，不會直接是o3-mini，而是一個與o3-mini類似，但有所不同的模型。

即便是開放模型，OpenAI依舊會保留一些“秘方”——例如模型訓練數據、預訓練細節或者關鍵架構組件等。換句話說，這是一個開放權重模型，但不是一個完全開源的模型。

事實上，由於AI模型不僅包括代碼，還涉及數據、參數和權重等，開源模型的定義並不像開源軟件般清晰，目前尚未形成統一定義。

Linux基金會提出的模型開放性框架（MOF）把開放模型分爲了三個逐步擴展的層級——第三級“開放模型”、第二級“開放工具”和第一級“開放科學”。

Deepseek、Qwen2.5等模型只通過了MOF第三級評估，第三級“開放模型”開放範圍包括模型架構、模型參數（最終參數）、模型卡、數據卡、技術報告和評估結果，距離最開放的第一級“開放科學”仍有空間。

而OpenAI將發佈的開放模型是否能達到第三級，目前還不得而知。

開放權重模型意味着什麼？

奧爾特曼在X上表示，“我們希望與開發者深入探討如何最大化發揮其作用，我們很高興能將它打造爲一個非常非常優秀的模型。”

他還透露，OpenAI將在舊金山、歐洲和亞太地區舉辦開發者活動，以收集反饋並提供早期原型試用機會。

奧爾特曼稱，很期待看到開發人員的成果，以及大公司和政府如何使用它來運行自己的模型。

這似乎表明，這次開放模型主要針對開發人員、企業和政府，而不是個人用戶。

開放模型可以本地部署，在特殊應用場景中具有更大的優勢。企業和政府可以在自己的服務器上運行開放模型，無需連接外網或接入雲端算力，在本地處理數據，利用特定領域的數據進行訓練，能夠保護隱私，還可以擺脫對OpenAI平臺的依賴，避免雲服務帶來的延遲、安全和成本問題，同時提供緊急情況下的快速響應。

而且，開放模型可控性和可審計性增強，開發者可以深入理解模型運行機制，更容易調試和調整策略。

此外，開發者可以基於自有數據對模型進行開放模型微調，開發專屬的垂直領域應用，構建衍生模型，甚至將其提煉爲在智能手機等智能終端上就能單機運行起來的AI模型。

英偉達也推出了個人AI超級計算機，使企業和開發者能夠以相對較低的成本運行開放模型。

不過，對於普通個人用戶而言，能夠流暢運行開放模型的硬件成本仍然較高，雲端模型依然具有更高的實用性，尤其在面對複雜任務時，雲端模型在算力和易用性方面仍擁有明顯優勢。

相關資訊