Anthropic新模型發佈在即!“滑動比例”助企業降本增效,編程能力超o3-mini
本文作者:房家瑤
來源:硬AI
美東時間2月13日,據The Information報道,人工智能初創公司Anthropic計劃在未來幾周內推出一款創新的混合AI模型。
這款模型的獨特之處在於,它可以在深度推理和快速回復之間動態切換,爲開發人員提供一個多功能工具。根據一位使用過該模型的人士透露,Anthropic的新模型在處理複雜問題時,可以調動更多計算資源進行深入推理,而面對簡單任務時,模型又能夠像傳統大語言模型一樣快速處理,無需額外計算。
最重要的是,它提供一種新穎的“滑動比例”功能,開發者可以通過滑動條精準控制模型在處理查詢時使用的計算資源量,從而調整推理深度和模型的"思考"時間。例如,將滑動條設置爲“0”時,模型將作爲普通的非推理AI運行,類似於OpenAI的GPT-4o。
這爲開發者提高了成本效益,使他們能夠根據具體需求平衡成本、速度和性能。相比之下,OpenAI在推理能力上的設計選擇較爲簡單。公司目前提供的是“低”、“中”和“高”三個固定設置。一些開發者反映,預測模型在不同級別下實際處理的tokens數量仍然充滿不確定性,這使得他們很難估算單次查詢的成本。
從產品設計來看,OpenAI似乎更注重面向普通消費者和個人專業用戶,因此採用簡單易懂的“低-中-高”命名方式,而Anthropic則更專注於企業市場,其推出的精細化控制功能,允許開發者通過滑動條來調節AI模型的計算資源,使得企業能夠在成本、速度和性能之間找到最佳平衡點。
社交媒體X上有用戶表示:
去年秋季,OpenAI率先發布了具有推理能力的模型,隨後谷歌、阿里巴巴和高飛資本管理等公司紛紛跟進,推動了推理模型的競賽。
而在這場競賽中,Anthropic則保持低調,選擇了一條不同的技術路線。如今,它終於揭開了這一謎底,計劃通過這款新模型實現雄心勃勃的營收目標。根據The Information的報道,Anthropic的目標是超越OpenAI,成爲應用開發者的首選AI供應商。
根據OpenAI首席執行官Sam Altman在社交媒體X上的最新透露,OpenAI將推出GPT-4.5,這將是一個傳統的非推理模型。接下來,OpenAI計劃將GPT模型與"o"推理模型整合爲單一AI系統,這一舉措似乎借鑑了Anthropic的研發路徑。
值得一提的是,Anthropic的新模型在編程方面取得了顯著進步。生成式AI在企業應用中,編程已成爲最強大的應用領域之一。一位使用過該模型的人士表示,當模型被允許以最長時間“思考”時,在某些編程基準測試中,其表現超過了目前客戶可以使用的最先進的OpenAI推理模型(即設置爲“高”推理級別的o3-mini模型)。
與OpenAI的推理模型更擅長處理學術性編程問題不同,Anthropic的模型更適合企業工程師的日常編程任務。特別是在處理複雜的代碼庫時,Anthropic的模型能更好地理解由數千個文件組成的複雜代碼庫,並且能夠生成首次即可運行的完整代碼行。
這一特性尤其值得關注,因爲AI模型在面對複雜編程問題時往往會“偷懶”,僅提供註釋而非實際代碼。
目前,關於Anthropic新模型的定價問題仍未明確。業內普遍關注其是否能比OpenAI最近發佈的o3-mini推理模型更加經濟實惠,後者已被認爲具有較高的性價比,吸引了大量開發者。
隨着像DeepSeek和谷歌最新的Gemini模型等低價AI產品的推出,整個市場是否會趨向低價化,仍然是業內關注的熱點問題。目前,AI模型市場可能分爲兩個陣營,一是前沿開發,即持續改進推理或編程能力的模型仍具有定價優勢。二是“足夠好”模型,它們在價格上可能會相互壓低,形成激烈的競爭。