全球AI動態週報-截止8月24日
1、谷歌Gemini API重大升級:一行代碼直抓網頁,開發效率飛躍提升
谷歌日前宣佈對Gemini API進行重要功能升級,正式推出URL Context工具,實現網頁內容的直接抓取功能。這一技術突破將徹底改變開發者處理網絡數據的工作流程,從過去需要編寫複雜腳本和多步驟處理,簡化爲在API請求中直接嵌入網頁鏈接即可完成內容獲取。
新功能的技術實現機制相當直觀:開發者只需在Gemini API請求中包含目標網頁URL,模型系統將自動完成網頁訪問、內容解析和數據提取的全部流程。這種一體化處理方式消除了傳統網頁抓取中的技術壁壘,讓數據獲取變得前所未有的簡便。
2、英偉達發佈全新小型模型 Nemotron-Nano-9B-V2:免費商用且性能卓越
小型模型正在掀起一場風暴,而英偉達也不甘落後。在麻省理工學院和谷歌相繼推出能在智能手錶和智能手機上運行的小型 AI 模型後,英偉達發佈了其最新的小型語言模型(SLM)——Nemotron-Nano-9B-V2。該模型在多個基準測試中表現出色,並在特定測試中達到了同類產品的最高水平。
Nemotron-Nano-9B-V2的參數量爲90億,雖然比一些數百萬參數的微型模型要大,但它比之前的120億參數版本顯著減小,並專門針對單個英偉達 A10GPU 進行了優化。英偉達 AI 模型後訓練總監 Oleksii Kuchiaev 解釋說,這種調整是爲了適配 A10這款熱門的部署 GPU。此外,Nemotron-Nano-9B-V2是一款混合模型,能處理更大的批次,速度比同等規模的 Transformer 模型快6倍。
該模型支持多達九種語言,包括中、英、德、法、日、韓等,並擅長處理指令跟蹤和代碼生成任務。其預訓練數據集和模型本身都已在 Hugging Face 和英偉達的模型目錄中提供。
3、Anthropic重磅升級:Claude Code企業版正式上線,命令行編程工具迎來變革時刻
Anthropic宣佈推出全新訂閱服務,將旗下備受矚目的Claude Code命令行編程工具正式納入Claude企業版套餐。這一戰略舉措不僅結束了Claude Code僅限個人賬戶使用的歷史,更爲企業用戶帶來了前所未有的集成能力和管理工具。
4、DeepSeek V3.1正式發佈:長文檔分析、代碼理解能力大幅增強,R2仍需等待
8月19日晚間,DeepSeek 官方宣佈線上模型版本已升級至 V3.1,最顯著的改進是上下文長度拓展至 128K,相當於可處理 10萬至13萬漢字 的超長文本,適用於長文檔分析、代碼庫理解及多輪對話場景。
此次升級並非大版本迭代,而是對 V3模型的優化。測試顯示,V3.1在多步推理任務中的表現較前代提升 43%,尤其在數學計算、代碼生成和科學分析等複雜任務中準確性更高。同時,模型“幻覺”(生成不實信息)的情況減少 38%,輸出可靠性顯著增強。此外,V3.1還優化了多語言支持,尤其提升了對亞洲語言及小衆語種的處理能力。
8月21日,深度求索科技有限公司正式發佈了其最新版本的AI模型——DeepSeek-V3.1。此次升級標誌着公司在邁向Agent時代方面邁出了堅實的第一步,爲用戶提供了一個更加強大、高效且多功能的人工智能解決方案。
在價格方面,深度求索科技有限公司宣佈,自北京時間2025年9月6日凌晨起,將對DeepSeek開放平臺API接口調用價格進行調整,執行新版價格表,並取消夜間時段優惠。在9月6日前,所有API服務仍按原價格政策計費,用戶可繼續享受當前優惠。同時,公司已進一步擴容API服務資源,以更好地滿足用戶的調用需求。
5、字節跳動發佈全新開源長文本處理模型 Seed-OSS-36B
近日,字節跳動旗下的 Seed 團隊在 AI 代碼分享平臺 Hugging Face 上發佈了最新的開源大型語言模型 Seed-OSS-36B。這一新模型專注於高級推理和開發者友好性,其最大特點是支持長達512,000個 tokens 的輸入文本處理,遠超美國科技公司如 OpenAI 和 Anthropic 的產品。
Seed-OSS-36B 系列包括三個主要變體:Seed-OSS-36B-Base(含合成數據)、Seed-OSS-36B-Base(不含合成數據)和 Seed-OSS-36B-Instruct。合成數據版本在標準基準測試中表現更爲出色,適合一般用途,而不含合成數據的版本則爲研究提供了一個更加純粹的基礎。Seed-OSS-36B-Instruct 則專注於任務執行和指令跟隨,經過後訓練以優化表現。
所有模型均採用 Apache-2.0許可協議,意味着研究人員和開發者可以免費使用、修改和重新分發這些模型,不需支付字節跳動的許可費用。這標誌着中國公司在開放源代碼模型領域的又一次重要進展,同時也爲國際應用提供了更多可能性。
Seed-OSS-36B 的設計和核心特徵包括36億個參數、64層架構和155,000個 tokens 的詞彙量。該模型的長文本處理能力和推理預算設置,能夠讓開發者根據任務複雜性調整模型的推理深度。此外,該模型在多個基準測試中展現了優異的性能,例如,在數學和編程任務上取得了業界領先的成績。
6、阿里開源 Qwen-Image-Edit:中文渲染秒殺 GPT-4o,精準文本編輯+語義外觀雙控
阿里通義千問團隊正式開源了其最新圖像編輯模型 Qwen-Image-Edit,這是繼 Qwen-Image 之後,通義千問系列在圖像生成與編輯領域的又一重磅力作。作爲一個基於20B 參數多模態擴散變換器(MMDiT)的圖像編輯基礎模型,Qwen-Image-Edit 在精準文本編輯、語義與外觀編輯方面展現出卓越性能,尤其在中文文本渲染上實現了行業領先的表現。
7、百度發佈全球首個全端通用智能體GenFlow2.0生成速度超同類產品10倍
在百度AI Day開放日上,百度文庫聯合百度網盤重磅發佈全球首個全端通用智能體GenFlow2.0,標誌着智能體技術邁入新的里程碑。
據官方介紹,GenFlow2.0展現出強大的並行處理能力,支持超100個專家智能體同時協作,能夠在3分鐘內並行完成超5項複雜任務。該產品的生成速度超越主流同類型產品10倍,在行業內率先實現了分鐘級交付的突破性表現。
8、騰訊開源WeChat-YATT大模型訓練庫,破解多模態訓練兩大核心瓶頸
騰訊近日發佈了基於Megatron-Core和SGLang/vLLM研發的大模型訓練庫WeChat-YATT(Yet Another Transformer Trainer),內部項目代號爲gCore。這一訓練庫專注於強化學習和多模態模型訓練,致力於爲開發者提供易擴展、簡潔、高效、可靠的大模型訓練解決方案。
9、快手 Klear-Reasoner 模型成功登頂,數學推理準確率超 90%
快手最近發佈的 Klear-Reasoner 模型基於 Qwen3-8B-Base 打造,其在多個權威基準測試中表現出色,數學推理的準確率甚至突破了90%,成爲同規模模型中的佼佼者。
10、我國首個法律垂直大模型“小包公”發佈:能溯源、可驗證
我國首個法律垂直大模型“小包公”正式發佈,標誌着法律人工智能從學術探索邁向規模化應用。該模型通過整合大量法律數據和先進技術,提供可溯源、可驗證的法律依據,有助於緩解法律服務資源分佈不均的問題,並在多個重點領域展現示範效應。
11、即夢AI上線智能多幀功能!最多支持10張圖片,一鍵生成超長鏡頭
視頻創作行業正在經歷一場前所未有的技術革命。當傳統剪輯師還在爲複雜的鏡頭銜接和轉場效果而絞盡腦汁時,即夢AI已經用一項名爲"智能多幀"的突破性技術徹底改寫了遊戲規則。這項創新功能不僅讓普通用戶能夠輕鬆創作出專業級的長鏡頭視頻,更以其54秒連貫畫面生成的驚人能力,向整個創意產業展示了人工智能技術的無限潛力。
12、AI爬蟲新王者!Firecrawl獲1450萬美元A輪融資,V2版本震撼發佈
8月19日,人工智能領域的創新企業Firecrawl宣佈完成1450萬美元的A輪融資,並同步推出其最新V2版本API,爲AI開發者與企業提供了更強大、更高效的網頁數據抓取解決方案。這一里程碑式的進展標誌着Firecrawl在AI驅動的網絡數據處理領域邁出了堅實一步。
13、Liquid AI 推出 LFM2-VL:低延遲的超高效視覺語言模型
Liquid AI 正式推出 LFM2-VL,這是一款全新的視覺語言基礎模型系列,專爲低延遲和設備適應性部署而優化。此次發佈的 LFM2-VL 模型包括兩個高效的變體:LFM2-VL-450M 和 LFM2-VL-1.6B,這標誌着多模態 AI 在智能手機、筆記本電腦、可穿戴設備和嵌入式系統中的應用取得了重要進展,而不犧牲速度和準確性。
14、InternLM推出8B參數的輕量級多模態推理模型
近日,InternLM 團隊正式發佈了其開源的輕量級多模態推理模型 ——Intern-S1-mini。該模型參數僅爲8B,結合了先進的 Qwen3-8B 語言模型與0.3B 視覺編碼器 InternViT,展現出強大的處理能力和靈活性。
Intern-S1-mini 經過了大規模的預訓練,總共使用了超過5萬億的 token 數據。其中,令人矚目的是,超2.5萬億 token 來自於化學、物理、生物和材料等多個科學領域。這使得 Intern-S1-mini 不僅能進行常規的文本和視覺輸入處理,更能解析複雜的分子式、蛋白質序列,並有效規劃合成路徑,展示出其在科學研究領域的廣泛應用潛力。
15、連線雜誌與商業內幕因 AI“自由撰稿人”文章被撤下
連線(Wired) 和 商業內幕(Business Insider)等主流新聞媒體近日發現,多篇文章實際上由 AI 生成,署名“自由撰稿人 Margaux Blanchard”。Wired 撤下了一篇題爲 “They Fell in Love Playing Minecraft…” 的文章,因其未通過足夠事實覈查而被刪除。Business Insider 也撤下了兩篇文章,並宣佈將強化驗證流程。進一步調查顯示,“Margaux Blanchard”可能並不存在,其投稿包含明顯的 AI 寫作痕跡,如虛構地點和不合邏輯的內容。此事件暴露了 AI 生成內容進入新聞行業的問題,並凸顯了媒體機構加強作者身份覈查與事實覈實機制的必要性。
16、Meta陷入史上最大AI訓練數據侵權案!2396部影片非法使用,面臨3.59億美元天價索賠
人工智能訓練數據的合法性爭議終於演化成了一場震撼硅谷的法律風暴。美國加利福尼亞州法院最近受理的一起訴訟案件,將全球科技巨頭Meta推到了輿論的風口浪尖。兩家成人影片製作公司Strike3和Counterlife Media的聯合起訴,不僅揭露了AI訓練背後的數據獲取黑幕,更以高達3.59億美元的索賠金額,爲整個科技行業敲響了版權保護的警鐘。
這起訴訟的核心指控令人震驚。根據法庭文件顯示,Meta公司自2018年以來一直在明知故犯地從盜版來源下載受版權保護的影片內容,累計涉及至少2396部作品。這些非法獲取的視頻資料被用於訓練包括Meta Movie Gen視頻生成模型和LLaMA語言大模型在內的多種AI系統,爲Meta的人工智能技術發展提供了重要的數據支撐。
更加令人意外的是Meta獲取這些內容的方式。起訴文件詳細披露,Meta並非簡單地下載這些盜版內容,而是主動利用BitTorrent文件共享技術進行大規模的非法內容獲取。這種P2P下載方式的特殊之處在於,下載者同時也會成爲內容的分發者,通過"種子"技術向網絡中的其他用戶傳播相同的文件。
這起訴訟案件的更深層意義在於它可能成爲AI行業版權規範的重要轉折點。隨着人工智能技術的快速發展,訓練數據的需求量呈現爆炸式增長,而現有的版權法律框架顯然還沒有完全適應這種新興技術的發展需求。Meta案件的審理結果很可能爲整個行業的數據使用規範確立重要的法律先例。
目前,Meta公司尚未對這起訴訟作出正式迴應,但業界普遍認爲這將是一場持續時間較長的法律拉鋸戰。無論最終結果如何,這起案件已經向所有AI公司發出了明確信號:在追求技術進步的同時,必須嚴格遵守版權法律的相關規定,否則將面臨巨大的法律和經濟風險。
在人工智能技術日益成爲各行各業核心競爭力的今天,如何平衡技術創新與版權保護之間的關係,已經成爲整個社會必須面對的重要課題。Meta的這起訴訟案件,無疑將爲這個複雜問題的解決提供重要的實踐參考。
17、企業已向生成式 AI投資大量資金,但95%的回報爲零
儘管企業在生成式人工智能(AI)領域投入了高達300億至400億美元的資金,但最新的麻省理工學院(MIT)報告顯示,95% 的組織並未從中獲得任何回報。這一數據引發了人們對 AI 投資效果的深刻思考。
該報告指出,只有5% 的集成人工智能試點項目能夠 “創造出數百萬美元的價值”,而大多數企業在使用這些技術後,並未見到顯著的利潤增長。許多公司正在實施像 OpenAI 的 ChatGPT 和微軟的 Copilot 等工具,目前超過80% 的企業已經探索或試點了這些技術,接近40% 的企業表示已經開始部署。然而,這些工具主要是用於提升個人的工作效率,而不是直接提升公司的整體收益。
報告分析了企業在整合 AI 技術時所面臨的挑戰,指出大多數情況下,AI 的整合未能對利潤產生貢獻,原因在於工作流程脆弱、缺乏情境學習以及與日常操作不一致等問題。AI 系統無法像人類那樣進行學習和思考,因爲大多數生成式 AI 系統不具備反饋保留、情境適應或逐步改進的能力。
不過,研究還表明,短期內生成式 AI 的實施不太可能導致大規模的失業。“在 AI 系統實現情境適應和自主操作之前,組織的影響將主要通過外部成本優化體現,而不是內部重組,” 報告總結道。
18、AWS CEO:用 AI 取代初級員工是 “最愚蠢的想法”
在最近的一次對話中,亞馬遜網絡服務(AWS)首席執行官馬特・加爾曼(Matt Garman)表示,用人工智能(AI)替代初級員工的想法是 “我聽過的最愚蠢的事情”。加爾曼與 AI 投資者馬修・伯曼(Matthew Berman)討論了 AWS 的 Kiro AI 輔助編碼工具,並提到了一些企業領導者認爲 AI 可以取代公司內所有初級員工的觀點。
加爾曼還對另一種關於 AI 的觀點表示反對,即用 AI 在組織中生成的代碼比例來衡量其價值。他稱這是一種 “愚蠢的指標”,因爲雖然組織可以利用 AI 編寫 “無限多的代碼”,但這些代碼可能質量不高。“往往更少的代碼更好,而不是更多的代碼。” 他表示,“我從未明白爲什麼這個指標能引起人們的興趣。”
儘管如此,加爾曼注意到,超過80% 的 AWS 開發者以某種方式使用 AI。他提到,AI 的應用不僅限於編寫代碼,還包括編寫單元測試、幫助撰寫文檔,以及開發者與 AI 代理的協作工作。他指出,AWS 開發者每週使用 AI 工具的頻率都在不斷增加。
19、心理學家警告:與 AI 聊天可能導致嚴重心理健康問題
根據一項新的分析研究,心理學專家發現與人工智能(AI)聊天機器人交流可能導致多種心理健康問題,涉及到的聊天機器人數量超過二十種。這項研究由杜克大學的精神病學教授艾倫・弗朗西斯和約翰霍普金斯大學的認知科學學生露西安娜・拉莫斯共同進行,結果表明,AI 聊天機器人可能帶來的心理健康危害超出了先前的預期。
該報告指出,這27種聊天機器人可能造成10種不同類型的心理健康危害,包括性騷擾、妄想、自殘、精神病和自殺等。研究中還提到了一些真實案例,其中不乏悲慘的結局。此外,研究人員也對一些 AI 壓力測試的失敗進行了調查,指出一位精神科醫生曾假裝成一名14歲危機女孩與10種不同的聊天機器人對話,結果有幾款聊天機器人竟然鼓勵他自殺。
除了揭示聊天機器人所帶來的心理危害外,研究人員還提出了強烈的觀點,認爲 ChatGPT 等聊天機器人在發佈時是 “過早” 的,且在沒有經過 “全面的安全測試、適當的監管和對不良影響的持續監控” 之前不應向公衆開放。雖然大多數大型科技公司聲稱已進行過相關的 “紅隊” 測試,以識別潛在的漏洞和不當行爲,但這些研究者對這些公司在心理健康安全測試方面的真實興趣表示懷疑。