☰

綜述｜全球人工智能模型又添“新成員”

新華社北京5月25日電　綜述｜全球人工智能模型又添“新成員”

新華社記者馮玉婧

今年，人工智能（AI）技術持續在大語言模型和多模態方面取得新進展。近來，全球多家科技公司推出了新模型，這些模型不僅在理解和生成能力上取得重大突破，也在實用性和效率上邁上新臺階，標誌着AI正逐步從通用大模型向多模態助手和智能體演進。

美國西部時間5月22日，美國Anthropic公司推出“克勞德4”系列兩款新模型：“奧普斯4”（Opus 4）與“十四行詩4”（Sonnet 4），旨在爲業界提供更高標準的編程、推理和智能體應用。該公司表示，Opus 4是行業領先的編程模型，能夠高效完成複雜且持續時間長的任務；而Sonnet 4在此前的3.7版本基礎上顯著升級，具備更強的指令理解能力與推理、編程表現。

美國西部時間5月20日，谷歌宣佈推出多個“雙子座2.5”系列大語言模型，整體性能和智能推理能力均較以往版本大幅提升。當日，谷歌還發布了多個多模態模型，其中包括圖像生成模型Imagen 4和視頻生成模型Veo 3，具備從文本等多種輸入形式生成高質量視覺內容的能力；音樂生成模型Lyria 2則爲音樂人提供了多模態創作工具。此外，AI電影製作工具Flow集成了先進的多模態技術，使用戶通過自然語言描述就能生成高質量的視覺作品。

5月，谷歌公司還發布了全新的進化式編程智能體AlphaEvolve，該系統由谷歌的大語言模型驅動，旨在實現通用算法的發現和優化。據谷歌官方博客介紹，AlphaEvolve不僅能發現單一函數，還能演化整個代碼庫，並開發出複雜的算法。在對超過50個數學難題的測試中，它在約75%的案例中重新發現最優解，並在20%的案例中提出更優方案。谷歌團隊認爲，該智能體未來有望在材料科學、藥物發現、可持續性發展等領域發揮變革性作用。

4月，美國開放人工智能研究中心（OpenAI）先後發佈了GPT-4.1系列模型以及o3和o4 mini兩款推理模型。據OpenAI官網介紹，GPT-4.1系列模型在編程和指令理解方面表現尤爲突出，顯著提升了長文本處理能力，並具備更高的性價比。而o3和o4 mini則被OpenAI稱作該公司“迄今最智能的模型”。o3模型在編程、數學、科學、視覺感知等領域均實現突破，適合處理多維度複雜問題，尤其在圖像、圖表等視覺任務上表現突出。o3還具備嚴謹的分析能力和批判式思維，可被視作可靠的“思維夥伴”。o4 mini則是一款經過優化的小型模型，在數學、編程和視覺任務方面表現出色，適用於快速且成本效益高的推理。

4月，中國AI公司商湯科技宣佈推出全新升級的“日日新SenseNova V6”大模型體系。據該公司官網介紹，這一大模型系統通過多模態長思維鏈訓練、全局記憶、強化學習等技術突破，已形成領先的多模態推理能力，並突破成本邊界。

隨着技術快速發展，AI的能力邊界不斷擴大，正如谷歌旗下“深層思維”公司首席執行官德米斯·哈薩比斯所說，團隊正在塑造一個更加個性化、更主動、更強大的AI，從而加快科學進展的腳步，並開創一個充滿新發現和成就的新時代。（完）

綜述｜全球人工智能模型又添“新成員”

相關資訊