綜述|全球人工智能模型又添“新成員”
新華社北京5月25日電 綜述|全球人工智能模型又添“新成員”
新華社記者馮玉婧
今年,人工智能(AI)技術持續在大語言模型和多模態方面取得新進展。近來,全球多家科技公司推出了新模型,這些模型不僅在理解和生成能力上取得重大突破,也在實用性和效率上邁上新臺階,標誌着AI正逐步從通用大模型向多模態助手和智能體演進。
美國西部時間5月22日,美國Anthropic公司推出“克勞德4”系列兩款新模型:“奧普斯4”(Opus 4)與“十四行詩4”(Sonnet 4),旨在爲業界提供更高標準的編程、推理和智能體應用。該公司表示,Opus 4是行業領先的編程模型,能夠高效完成複雜且持續時間長的任務;而Sonnet 4在此前的3.7版本基礎上顯著升級,具備更強的指令理解能力與推理、編程表現。
美國西部時間5月20日,谷歌宣佈推出多個“雙子座2.5”系列大語言模型,整體性能和智能推理能力均較以往版本大幅提升。當日,谷歌還發布了多個多模態模型,其中包括圖像生成模型Imagen 4和視頻生成模型Veo 3,具備從文本等多種輸入形式生成高質量視覺內容的能力;音樂生成模型Lyria 2則爲音樂人提供了多模態創作工具。此外,AI電影製作工具Flow集成了先進的多模態技術,使用戶通過自然語言描述就能生成高質量的視覺作品。
5月,谷歌公司還發布了全新的進化式編程智能體AlphaEvolve,該系統由谷歌的大語言模型驅動,旨在實現通用算法的發現和優化。據谷歌官方博客介紹,AlphaEvolve不僅能發現單一函數,還能演化整個代碼庫,並開發出複雜的算法。在對超過50個數學難題的測試中,它在約75%的案例中重新發現最優解,並在20%的案例中提出更優方案。谷歌團隊認爲,該智能體未來有望在材料科學、藥物發現、可持續性發展等領域發揮變革性作用。
4月,美國開放人工智能研究中心(OpenAI)先後發佈了GPT-4.1系列模型以及o3和o4 mini兩款推理模型。據OpenAI官網介紹,GPT-4.1系列模型在編程和指令理解方面表現尤爲突出,顯著提升了長文本處理能力,並具備更高的性價比。而o3和o4 mini則被OpenAI稱作該公司“迄今最智能的模型”。o3模型在編程、數學、科學、視覺感知等領域均實現突破,適合處理多維度複雜問題,尤其在圖像、圖表等視覺任務上表現突出。o3還具備嚴謹的分析能力和批判式思維,可被視作可靠的“思維夥伴”。o4 mini則是一款經過優化的小型模型,在數學、編程和視覺任務方面表現出色,適用於快速且成本效益高的推理。
4月,中國AI公司商湯科技宣佈推出全新升級的“日日新SenseNova V6”大模型體系。據該公司官網介紹,這一大模型系統通過多模態長思維鏈訓練、全局記憶、強化學習等技術突破,已形成領先的多模態推理能力,並突破成本邊界。
隨着技術快速發展,AI的能力邊界不斷擴大,正如谷歌旗下“深層思維”公司首席執行官德米斯·哈薩比斯所說,團隊正在塑造一個更加個性化、更主動、更強大的AI,從而加快科學進展的腳步,並開創一個充滿新發現和成就的新時代。(完)