連續7小時自動編程,Anthropic推出其史上最強大模型

當地時間5月22日,被視爲OpenAI最強競爭對手的美國人工智能公司Anthropic,正式發佈了其迄今爲止最強大的語言模型——Claude 4系列。

其中,旗艦版本Claude 4 Opus在編碼能力方面取得了顯著突破。據Rakuten測試數據,通過Opus 4開發的編程智能體可獨立穩定連續工作7小時,超過了之前OpenAI創造的紀錄。

Claude 4 Opus不僅在編碼任務中表現突出,其在推理、規劃和長期記憶方面也有更多進展。也因此,有聲音認爲其很可能取代部分軟件工程師以及從事簡單代碼編寫和維護的初級程序員、代碼審查員等。

不過,Anthropic方面強調,其AI模型是一種將日常工作自動化的工具,而不是爲了消除工作崗位。

爲了滿足不同用戶的需求,Anthropic還推出了Claude Sonnet 4,這是Claude 4系列中更爲經濟高效的版本,適用於一般任務。Sonnet 4是Sonnet 3.7的迭代版本,在編程領域同樣出色,在SWE-bench基準測試中達到72.7%,超過了OpenAI最新發布的Codex - 1、o3等前沿模型。

兩款模型均可通過Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI訪問。

安全性方面,Claude 4系列被歸類爲ASL-3安全等級,Anthropic採取了多項措施以降低潛在風險,包括引入“思維摘要”功能,以提高模型的可解釋性和透明度。

此次發佈標誌着Anthropic在與OpenAI和Google等科技巨頭的競爭中邁出了重要一步。OpenAI的產品在消費者市場有廣泛影響力,ChatGPT吸引了大量個人用戶。Anthropic則更側重於企業市場,其年收入約8.75億美元主要來自企業產品Claude Enterprise的銷售,但也在不斷拓展市場覆蓋面。

Anthropic由前OpenAI研究副總裁Dario Amodei和其妹妹Daniela Amodei於2021年創立。兩人曾參與OpenAI GPT-2和GPT-3模型的開發。由於對AI安全性和發展方向的分歧,他們選擇離開OpenAI,創辦了Anthropic,希望開發安全、可靠且符合人類價值觀的人工智能系統。

過去幾年中,Anthropic獲得了包括亞馬遜和谷歌在內的多家科技巨頭的支持。今年3月,該公司宣佈完成總額達35 億美元的E輪融資,公司投後估值升至615億美元。同在3月,OpenAI在軟銀集團領投的新一輪融資中籌集400億美元,投資後估值達到3000億美元,仍高出Anthropic不少。

隨着Claude 4系列的推出,Anthropic與OpenAI之間的差距或將進一步縮小。