OpenAI官宣最強模型o3-pro!號稱寫作、編程更準

6月11日消息,據Techcrunch報道,OpenAI發佈了o3-pro,這一AI模型被公司稱爲迄今爲止最強大的產品。

o3-pro是OpenAI今年早些時候推出的推理模型o3的一個版本。與傳統AI模型不同,推理模型能夠逐步推理解決問題,因此在物理、數學和編程等領域表現更爲可靠。

自本週二起,o3-pro已面向ChatGPT Pro和Team用戶開放,取代原有的o1-pro模型。OpenAI表示,企業版與教育版用戶將在下週獲得訪問權限。o3-pro也已於今日上線OpenAI的開發者API。

在API中,o3-pro的定價爲每百萬輸入tokens 20美元,每百萬輸出tokens 80美元。輸入tokens指輸入到模型中的內容,輸出tokens則是模型基於輸入生成的內容。

一百萬輸入tokens大約相當於75萬字,略長於《戰爭與和平》。

OpenAI在更新日誌中寫道:“在專家評測中,評審人員在所有測試類別中均更傾向於o3-pro,尤其是在科學、教育、編程、商務和寫作輔助等關鍵領域。評審人員還一致認爲,o3-pro在表達清晰度、內容全面性、指令遵循度和準確性等方面表現更優。”

根據OpenAI介紹,o3-pro具備多項工具調用能力,可實現網頁搜索、文件分析、圖像內容推理、使用Python、藉助記憶進行個性化響應等。不過,OpenAI也指出,相較於o1-pro,o3-pro生成回覆所需時間通常更長。

o3-pro還存在其他限制。目前,ChatGPT中的臨時對話功能暫時關閉,OpenAI正在解決相關技術問題。o3-pro不支持圖像生成,也無法用於“畫布”(Canvas)這一AI智能工作區功能。

值得一提的是,OpenAI內部測試顯示,o3-pro在多項主流AI基準測試中取得了優異成績。在AIME 2024數學能力評測中,o3-pro得分高於谷歌的旗艦AI模型Gemini 2.5 Pro。在GPQA Diamond(博士級科學知識測試)中,o3-pro也超越了Anthropic近期發佈的Claude 4 Opus。(易句)

(本文由AI翻譯,本站編輯負責校對)