☰

OpenAI睽違六年再推開放權重語言模型gpt-oss系列回應AI民主化應用願景 (更新)

更新：包含AWS、微軟均宣佈透過其雲端服務平臺提供OpenAI開放權重語言模型gpt-oss系列，分別可透過Amazon Bedrock和Amazon SageMaker AI，或是Azure AI Foundry使用此開放權重模型。

另外，Qualcomm方面也說明可透過搭載旗艦定位Snapdragon運算平臺、內建16GB記憶體容量的裝置執行gpt-oss-20b模型。

OpenAI稍早公佈新款以「開放權重」 (Open-weight)形式打造的大型語言模型gpt-oss-120b及gpt-oss-20b，這也是自2019年推出GPT-2語言模型之後，再度由OpenAI推出非商業導向的開放語言模型，象徵其對「讓人工智慧成果造福全人類」初衷的迴應。

不同於開源模型，gpt-oss並未公開其訓練資料與訓練程式碼，而是釋出模型訓練後產生的權重參數 (weights)，亦即模型在學習過程中對輸入資料所賦予數值。雖然無法完整回溯其訓練方式，但使用者仍可在此基礎上進行推論、微調，甚至應用開發相應服務。

根據賓州大學電腦科學教授Benjamin C. Lee的解釋，開放權重模型是一種「介於黑箱商業模型與完全開源模型之間的選項」，開發者可在無需高昂訓練成本的情況下，快速導入、應用功能強大的語言模型。

此次釋出的兩款模型中，gpt-oss-120b擁有約117億組參數，性能接近OpenAI商業版模型o3，適合佈署在高階硬體上 (建議配備80GB記憶體的GPU)。相較之下，gpt-oss-20b僅需一臺具備16GB記憶體的電腦即可運行，更適合個人端進行本地運算，如離線編程輔助、文字生成等。

兩者皆採用Apache 2.0開源授權條款，允許開發者修改、佈署，並且商業化使用，進一步降低AI模型在企業或研究應用的門檻。

功能方面，gpt-oss系列支援鏈路思考推論 (Chain-of-thought reasoning)、工具使用 (例如執行Python程式碼)等高階能力，雖然不具備多模態輸入 (如圖像、語音)，但可經由串接OpenAI商業服務取得相關功能補足。

值得注意的是，OpenAI在釋出gpt-oss前進行了額外的安全測試與優化，並且強調目前這批模型將先作爲實驗項目測試，預計視後續回饋情況評估是否進一步擴大開放體驗。首波合作伙伴之一爲瑞典國家人工智慧中心AI Sweden，未來將協助進行應用佈署測試。

此舉也剛好適逢Meta執行長Mark Zuckberg透露「未來將減少開源模型釋出」，因此與OpenAI形成對比。

《原文刊登於合作媒體mashdigi，聯合新聞網獲授權轉載。》

OpenAI睽違六年再推開放權重語言模型gpt-oss系列 回應AI民主化應用願景 (更新)