OpenAI推"降速換降價"新服務!模型使用費直接腰斬
4月18日消息,爲更強勢抗衡谷歌等人工智能公司的競爭,OpenAI宣佈推出“彈性處理”(Flex processing)服務。這一新選項通過犧牲響應速度並接受“偶發性資源不可用”,將模型使用成本降低50%。
OpenAI表示,彈性處理服務目前以測試版形式向新發布的o3和o4-mini推理模型開放,主要適用於模型評估、數據富化和異步任務等低優先級“非生產”場景。
根據定價方案,o3模型在彈性處理模式下,每百萬輸入token(約75萬字)費用從標準模式的10美元降至5美元,每百萬輸出token從40美元降至20美元;o4-mini模型的每百萬輸入token價格則從1.1美元降至0.55美元,每百萬輸出token價格從4.40美元降至2.20美元。
在高端人工智能模型成本持續攀升、競爭對手紛紛推出更廉價高效的“經濟型”模型之際,OpenAI推出彈性處理服務可謂恰逢其時。本週四,谷歌發佈了Gemini 2.5 Flash推理模型,性能相當或超越DeepSeek R1模型,且單位輸入token成本更低。
OpenAI在發給客戶的電子郵件中提到,OpenAI使用層級體系中的第1至第3層用戶(層級由用戶在OpenAI服務上的消費金額決定)若要調用o3,必須完成新增的身份驗證流程。此外,o3及其他模型的推理摘要功能和流式API支持功能也需通過身份驗證後方可使用。
OpenAI先前表示,身份驗證旨在防止惡意用戶濫用使用政策。(辰辰)