OpenAI睽違六年再推開放權重語言模型gpt-oss系列 回應AI民主化應用願景 (更新)

更新:包含AWS、微軟均宣佈透過其雲端服務平臺提供OpenAI開放權重語言模型gpt-oss系列,分別可透過Amazon Bedrock和Amazon SageMaker AI,或是Azure AI Foundry使用此開放權重模型。

另外,Qualcomm方面也說明可透過搭載旗艦定位Snapdragon運算平臺、內建16GB記憶體容量的裝置執行gpt-oss-20b模型。

OpenAI稍早公佈新款以「開放權重」 (Open-weight)形式打造的大型語言模型gpt-oss-120b及gpt-oss-20b,這也是自2019年推出GPT-2語言模型之後,再度由OpenAI推出非商業導向的開放語言模型,象徵其對「讓人工智慧成果造福全人類」初衷的迴應。

不同於開源模型,gpt-oss並未公開其訓練資料與訓練程式碼,而是釋出模型訓練後產生的權重參數 (weights),亦即模型在學習過程中對輸入資料所賦予數值。雖然無法完整回溯其訓練方式,但使用者仍可在此基礎上進行推論、微調,甚至應用開發相應服務。

根據賓州大學電腦科學教授Benjamin C. Lee的解釋,開放權重模型是一種「介於黑箱商業模型與完全開源模型之間的選項」,開發者可在無需高昂訓練成本的情況下,快速導入、應用功能強大的語言模型。

此次釋出的兩款模型中,gpt-oss-120b擁有約117億組參數,性能接近OpenAI商業版模型o3,適合佈署在高階硬體上 (建議配備80GB記憶體的GPU)。相較之下,gpt-oss-20b僅需一臺具備16GB記憶體的電腦即可運行,更適合個人端進行本地運算,如離線編程輔助、文字生成等。

兩者皆採用Apache 2.0開源授權條款,允許開發者修改、佈署,並且商業化使用,進一步降低AI模型在企業或研究應用的門檻。

功能方面,gpt-oss系列支援鏈路思考推論 (Chain-of-thought reasoning)、工具使用 (例如執行Python程式碼)等高階能力,雖然不具備多模態輸入 (如圖像、語音),但可經由串接OpenAI商業服務取得相關功能補足。

值得注意的是,OpenAI在釋出gpt-oss前進行了額外的安全測試與優化,並且強調目前這批模型將先作爲實驗項目測試,預計視後續回饋情況評估是否進一步擴大開放體驗。首波合作伙伴之一爲瑞典國家人工智慧中心AI Sweden,未來將協助進行應用佈署測試。

此舉也剛好適逢Meta執行長Mark Zuckberg透露「未來將減少開源模型釋出」,因此與OpenAI形成對比。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》