OpenAI正打造“最強”開源模型 最早夏初發布
4月24日消息,今年3月下旬,OpenAI宣佈將在年內推出自GPT-2以來的首個"開源"語言模型。隨着該公司與AI開發者社區的交流持續推進,關於這款模型的更多細節也逐步浮出水面。
據知情人士透露,OpenAI研究副總裁艾丹·克拉克(Aidan Clark)正主導這項開發工作,目前仍處於初期階段。OpenAI計劃在今年初夏發佈該模型,目標是打造一個在開源推理模型中達到頂尖水平的產品。這款模型定位爲推理能力模型,類似於OpenAI現有的o系列產品。
知情人士稱,OpenAI正考慮爲該模型採用一種高度寬鬆的開源許可協議,幾乎不設使用或商業限制。這與Meta的Llama、谷歌的Gemma等開源模型形成對比,後者因使用條款過於繁瑣而受到批評。OpenAI顯然希望避免步其後塵。
目前,OpenAI面臨來自包括中國AI實驗室DeepSeek在內的開源策略競爭者的挑戰。這些"開源"競爭者將模型提供給AI社區用於實驗,在某些情況下還允許商業化使用,與OpenAI此前更爲封閉的做法形成鮮明對照。
這種開放策略已被證明對部分企業極其成功。Meta在3月初宣佈,Llama系列模型的累計下載量已突破10億次。而DeepSeek也迅速積累了大量用戶,並獲得本土投資者的關注。
據悉,OpenAI此次推出的開源模型將支持純文本輸入輸出,可在高端消費級硬件上運行。開發者還可能可以選擇是否啓用“推理模式”——推理功能雖能提升準確性,但會以增加延遲爲代價,這與Anthropic等公司近期發佈的推理模型相似。
如果此次發佈反響積極,OpenAI還計劃後續推出更多開源模型,可能包括更小規模的模型版本。
OpenAI首席執行官山姆·奧特曼(Sam Altman)此前曾公開表示,公司在技術開源方面“站在了歷史的錯誤面”,並呼籲重新審視開源戰略。
奧特曼在今年1月參加問答活動時指出:“我個人認爲,我們需要制定一種新的開源策略。儘管並非所有OpenAI員工都認同這一觀點,目前這也不是我們的首要任務,但今後我們會推出更好的模型,不過領先優勢可能不像以往那樣顯著。”
他還表示,這款即將發佈的模型將經歷嚴格的“紅隊測試”和安全評估流程。知情人士透露,OpenAI將爲該模型發佈“模型卡片”(Model Card),即一份全面的技術文檔,詳盡展示模型在內部與外部基準測試、安全性評估等方面的結果。
奧特曼上月發文稱:“我們會在發佈前,依據‘模型準備度框架’對其進行全面評估,並在已知該模型發佈後可能被修改的前提下,做更多的安全準備工作。”
儘管如此,OpenAI近年來也因對部分新模型倉促推進安全測試、未及時發佈模型卡等問題,受到人工智能倫理學者的批評。奧特曼本人也曾在2023年11月被短暫罷免前,在模型安全審查方面誤導高管。(小小)