OpenAI 更新 Responses API:支持 MCP、原生 GPT-4o 圖像生成等
OpenAI 正在推出一系列重要更新,針對其新近發佈的 Responses API,旨在幫助開發者和企業更便捷地構建智能化、具備行動能力的代理應用。
這些增強功能包括對遠程 Model Context Protocol (MCP) 服務器的支持、集成圖像生成和 Code Interpreter 工具,以及對文件搜索功能的升級——所有這些均自 5 月 21 日起生效。
Responses API 最初於 2025 年 3 月發佈,作爲 OpenAI 爲第三方開發者提供的工具箱,使其能夠在 ChatGPT 及其內部 AI 代理 Deep Research 和 Operator 的核心功能之上構建代理應用。
自發布以來,該 API 已處理數萬億個 Token,並支持從市場調研、教育到軟件開發及金融分析等各種用例。
利用該 API 構建的熱門應用包括 Zencoder 的編碼代理、 Revi 的市場情報助手以及 MagicSchool 的教育平臺。
Responses API 的基礎與目的
Responses API 與 OpenAI 的開源 Agents SDK 於 2025 年 3 月同步亮相,這是 OpenAI 提供第三方開發者訪問其自有 AI 代理(如 Deep Research 和 Operator)所使用技術的一項舉措。
這樣一來,外部創業公司和企業便可將與 ChatGPT 相同的技術整合到他們自家的產品和服務中,無論是供內部員工使用還是面向客戶和合作夥伴。
最初,該 API 結合了 Chat Completions 與 Assistants API 的元素——提供內置的網頁及文件搜索工具以及計算機使用工具,使開發者能在無需複雜調度邏輯的情況下構建自主工作流。OpenAI 當時表示, Chat Completions API 將於 2026 年中期被棄用。
Responses API 提供了對模型決策的可見性、對實時數據的訪問以及允許代理檢索、推理並對信息做出響應的集成功能。
此次發佈標誌着向爲開發者提供一套統一工具以最小摩擦構建具備生產能力、針對特定領域的 AI 代理邁出的轉變。
遠程 MCP 服務器支持拓寬了集成潛力
此次更新中的一個關鍵新增功能是對遠程 MCP 服務器的支持。開發者現可通過僅幾行代碼將 OpenAI 的模型連接至 Stripe、Shopify、 Twilio 等外部工具和服務。這一能力使得開發者能夠創建能夠執行操作並與用戶日常依賴的系統交互的代理。爲支持這一不斷髮展的生態系統,OpenAI 已加入 MCP 指導委員會。
新工具的接入:原生圖像生成與 Code Interpreter
此次更新爲 Responses API 帶來了新的內置工具,增強了代理在單次 API 調用中所能實現的功能。
基於 OpenAI 大熱的 GPT-4o 原生圖像生成模型的一個變體(該模型曾掀起一股“Studio Ghibli”風格動漫梗的熱潮,並因其受歡迎而讓 OpenAI 的服務器吃緊,但顯然它也能生成許多其他圖像風格)現已通過 API 以模型名稱 “gpt-image-1” 提供。該工具包括諸如實時流預覽和多輪細化等可能非常實用且頗爲出色的新特性。
這使得開發者能夠構建能夠根據用戶輸入動態生成與編輯圖像的應用。
此外,Code Interpreter 工具現已集成進 Responses API,使模型能夠在其推理過程中處理數據分析、複雜數學和基於邏輯的任務。
該工具有助於提高模型在各種技術基準測試中的性能,並允許代理展現出更爲複雜的行爲。
改進的文件搜索與上下文處理
文件搜索功能也已得到升級。開發者現在可以跨多個向量存儲進行搜索,並應用基於屬性的過濾,從而僅檢索與搜索最相關的內容。
這提高了代理所使用信息的精準度,強化了它們解答覆雜問題及在龐大知識領域內執行操作的能力。
面向企業級的新可靠性、透明度功能
若干功能專爲滿足企業需求而設計。後臺模式允許長時間運行的異步任務,從而解決在進行密集推理時因超時或網絡中斷而引發的問題。
新增的 Reasoning summaries 能夠以自然語言解釋模型內部的思考過程,有助於調試和提升透明度。
加密的 reasoning items 爲零數據保留客戶提供了額外的隱私保護層。
這些設計允許模型在不將任何數據存儲在 OpenAI 服務器上的情況下重用先前的推理步驟,從而提高了安全性和效率。
最新功能已覆蓋 OpenAI 的 GPT-4o 系列、GPT-4.1 系列及 o 系列模型,包括 o3 和 o4-mini。這些模型現能在多次工具調用和請求之間維持推理狀態,從而以更低的成本和延遲產生更準確的響應。
昨日價格即今日價格!
儘管功能集得到了擴展,OpenAI 已確認 Responses API 中新工具和功能的定價將與現有費率保持一致。
例如,Code Interpreter 工具的定價爲每個會話 0.03 美元,文件搜索的使用費用爲每 1,000 次調用 2.50 美元,而存儲費用在首個免費千兆字節後爲每 GB 每天 0.10 美元。
網頁搜索的定價則依據模型和搜索上下文大小而變化,範圍爲每 1,000 次調用 25 至 50 美元。通過 gpt-image-1 工具生成圖像的費用也會根據分辨率和質量等級收費,起價爲每幅圖像 0.011 美元。
所有工具使用均按所選擇模型的 Token 費率計費,新增加的功能並未額外加價。
Responses API 的未來展望
隨着這些更新,OpenAI 繼續擴展 Responses API 的可能性。開發者可以獲得更豐富的工具集和企業級功能,而企業也能構建出更加集成、功能更強大且更安全的 AI 驅動應用。
所有功能自 5 月 21 日起已全部上線,定價和實施細節可通過 OpenAI 的文檔獲得。