☰

OpenAI推"降速換降價"新服務！模型使用費直接腰斬

4月18日消息，爲更強勢抗衡谷歌等人工智能公司的競爭，OpenAI宣佈推出“彈性處理”（Flex processing）服務。這一新選項通過犧牲響應速度並接受“偶發性資源不可用”，將模型使用成本降低50%。

OpenAI表示，彈性處理服務目前以測試版形式向新發布的o3和o4-mini推理模型開放，主要適用於模型評估、數據富化和異步任務等低優先級“非生產”場景。

根據定價方案，o3模型在彈性處理模式下，每百萬輸入token（約75萬字）費用從標準模式的10美元降至5美元，每百萬輸出token從40美元降至20美元；o4-mini模型的每百萬輸入token價格則從1.1美元降至0.55美元，每百萬輸出token價格從4.40美元降至2.20美元。

在高端人工智能模型成本持續攀升、競爭對手紛紛推出更廉價高效的“經濟型”模型之際，OpenAI推出彈性處理服務可謂恰逢其時。本週四，谷歌發佈了Gemini 2.5 Flash推理模型，性能相當或超越DeepSeek R1模型，且單位輸入token成本更低。

OpenAI在發給客戶的電子郵件中提到，OpenAI使用層級體系中的第1至第3層用戶（層級由用戶在OpenAI服務上的消費金額決定）若要調用o3，必須完成新增的身份驗證流程。此外，o3及其他模型的推理摘要功能和流式API支持功能也需通過身份驗證後方可使用。

OpenAI先前表示，身份驗證旨在防止惡意用戶濫用使用政策。（辰辰）

相關資訊