上週AI大事:谷歌深夜“放大招”,Meta撒錢挖人
前言:AI技術在狂奔,商業化在加速,規則在追趕。巨頭們一邊瘋狂秀肌肉,一邊悄悄鞏固護城河;初創公司則在夾縫中尋找垂直賽道和爆款機會。從程序員的終端到你的虛擬衣櫥,從音樂創作到情感陪伴,AI正以前所未有的深度和廣度滲透。
一、熱門工具:AI主戰場還是編程框
1.新聞:谷歌推出開源AI智能體Gemini CLI,將Gemini 2.5 Pro的強大功能及其百萬級token上下文窗口直接引入終端。正如相關文章所述,這是一款專爲編程等任務打造的命令行AI智能體。Gemini CLI不僅開源,還提供使用配額相當大方的免費版本。
銳評:谷歌這是要把“萬物皆可Gemini”的口號喊到底了。開源還給相當大方的免費額度,這招“農村包圍城市”玩得溜。
二、AI技術與產品發佈:神仙打架,凡人吃瓜
2.新聞:谷歌正式發佈Gemma 3N。這是谷歌在今年5月份I/O開發者大會上首次推介的一款新型開源多模態小模型,針對設備端應用進行了優化,支持圖像、音頻、視頻和文本等多種輸入。Gemma 3N採用了名爲Matformer的架構,該架構可同時訓練不同大小的嵌套式AI模型,爲模型在設備端高效運行提供了計算靈活性,使其能在有限體積內集成豐富功能。谷歌聲稱,“Gemma 3N在多語言能力(支持140種語言的文本處理和35種語言的多模態理解)、數學、編程和推理方面均實現了質量提升。E4B版的Gemma 3N在基準測試平臺LMArena上的得分超過1300,成爲首個突破此基準的百億參數以下模型。”
銳評:谷歌模型中的“小鋼炮”來了。
3.新聞:谷歌升級Imagen圖像模型。谷歌通過Gemini API和Google AI Studio推出新版文生圖模型Imagen 4和Imagen 4 Ultra。Imagen 4在圖像質量和文字渲染方面均有顯著提升,而Imagen 4 Ultra精度更高,輸出與文本提示高度契合。
銳評:這是要砸平面設計師的飯碗?
4.新聞:谷歌捐贈A2A協議。谷歌已將智能體到智能體(A2A)協議捐贈給Linux基金會,後者隨即宣佈啓動Agent2Agent Protocol項目,旨在將A2A確立爲多智能體系統的主要開放標準。這將推動不同開發者和平臺的AI智能體之間實現更好的互操作性。
銳評:送“標準”的最終目的還不是想立自己的規矩。
5.新聞:谷歌調整免費API限額。谷歌降低上一代Gemini Flash模型的免費API調用額度,減少了免費請求的數量,更好平衡使用情況和成本結構。
銳評:免費午餐吃久了,總歸是要付錢的。
6.新聞:微軟推出專爲Windows設計的設備端大語言模型MU。這款模型小巧高效,可以在Copilot PC的神經處理單元(NPU)上運行。MU每秒可生成超過100個token,已經內置在Windows系統中,可爲Copilot智能體支持特定任務,在Windows設備上實現快速、私密的AI功能。
銳評:以後Windows的AI功能不僅快,還能保護你的隱私。
7.新聞:Higgsfield推出AI圖像生成模型Higgsfield Soul。公司稱,“我們隆重推出Higgsfield Soul這一全新的高審美圖片模型。擁有超過50種精選預設風格,具備時尚大片級的逼真效果。”在競爭激烈的AI圖像生成工具市場中,Higgsfield Soul憑藉專注於市場營銷和廣告領域的應用而脫穎而出,輸出質量足以滿足專業需求。
銳評:能讓甲方爸爸滿意的AI纔是好AI。
8.新聞:月之暗面發佈升級版多模態推理模型Kimi-VL-A3B-Thinking-2506。新版模型增強了視頻理解能力,並支持更高分辨率輸入(最高支持1792×1792像素)。升級版2506模型不僅在推理基準測試上取得了顯著進步,其中MathVision得分提升20.1,MMMU-Pro得分提升3.2,而且同時還將token消耗降低了20%。此外,這款模型還拓展了視頻推理能力,並在VideoMMMU基準測試中達到最高性能水平(SOTA)。
銳評:堪稱業界“加量還降價”的典範。
9.新聞:Eleven Labs推出AI語音助手11AI。這款模型將公司先進的對話式AI語音技術與MCP(模型協作協議)相結合,能連接Perplexity、Linear、Slack和Notion等工具來執行任務。這款語音助手支持高度定製化且功能強大的語音交互界面,擁有超過5000種聲音選項(包括聲音克隆),並運行在Eleven Labs自家基礎設施上。11AI堪稱蘋果本應打造的下一代Siri。
銳評:這把蘋果臉打得啪啪響。
10.新聞:DeepMind發佈Magenta Realtime音樂模型。這款開放權重的小型音樂生成模型可用於實時創作和演奏音樂。Magenta Realtime擁有8億參數,是Lyria RealTime模型的開放權重等效版本。Magenta Realtime體積小巧,支持本地下載運行;用戶也可以在AI Studio中體驗音樂生成功能。
銳評:人人都是“電音小子”的時代來了。
11.新聞:Anthropic支持Claude內託管應用。Anthropic現允許用戶在Claude內部構建、託管以及共享可執行的AI應用。登錄Claude的其他用戶也可以使用這些應用,相關token使用費用由使用者自行承擔。這項新功能爲創建和分享AI驅動工具開闢了新途徑。
銳評:這就是直接在聊天框裡開了個“App Store”。
12.新聞:Salesforce發佈AI智能體的新一代產品AgentForce 3。這款產品配備了用於監控和優化智能體性能的中央指揮中心,由Atlas推理引擎驅動,支持通過MCP和A2A協議連接各種工具。Salesforce報告稱,內部約30%的客戶服務和銷售業務現都已經通過AI智能體處理。
銳評:人家已經讓AI去跑業務、做客服了
13.新聞:小米發佈AI眼鏡。小米在最新一場人車家新品發佈會上發佈首款AI眼鏡,有3個版本,價格1999元起。儘管智能眼鏡市場熱度上升,目前尚無廠商通過該產品盈利。
銳評:價格很“小米”,雷總這次能趟出智能眼鏡這個大坑嗎?
14.新聞:谷歌推出名爲AlphaGenome的新型DNA序列模型。這款模型使用公共基因數據庫,僅耗時4小時就完成高效訓練,能分析的DNA片段長度比之前工具長100倍。AlphaGenome能夠預測人類DNA中單個變異或突變對調控基因生物過程的影響。這些預測能力有助於理解遺傳疾病、合成生物學以及基因組基礎研究。美國紀念斯隆凱特琳癌症中心的計算生物學家迦勒·拉羅(Caleb Lareau)評價道,“這是領域內的里程碑。我們首次擁有了一個兼具長上下文和鹼基層級精度,並在整個基因組任務譜系中展現出頂尖性能的單一模型。”
銳評:AI開始破解生命的終極密碼了。
15.新聞:北京智源人工智能研究院 (BAAI)發佈開源圖像生成模型OmniGen2。這款模型擅長文生圖和圖像編輯任務。研究人員在論文《OmniGen2:探索高級多模態生成》中分享了相關細節信息。在完成類似Photoshop的編輯任務方面,OmniGen2被評價爲與專有模型FluxKontext相似但質量略低。
銳評:國產AI研究力量秀肌肉。
16.新聞:中科院發佈“任意到任意”(any-to-any)的大語言-視覺-語音模型Stream-Omni。正如《Stream-Omni》論文所述,這款模型能夠在無縫的“邊聽邊看”交互中同時處理文本、圖像和音頻輸入,並生成文本和語音,實時顯示中間的語音識別(ASR)轉錄和響應。Stream-Omni開源並已經在Hugging Face上線。
銳評:開源更是自信的表現。
17.新聞:Anthropic發表新研究,詳述AI模型Claude在提供情感支持方面的用途。公司表示,“我們基於數百萬份匿名對話研究成年人如何利用AI滿足情感和個人需求——從應對孤獨、處理人際關係到探討存在主義問題。”Anthropic在文章《人們如何使用 Claude尋求支持、建議和陪伴》中指出,大約4%的Claude使用場景與情感支持相關,對話內容涵蓋尋求建議、輔助治療、角色扮演和陪伴等。這些對話結束時的情緒通常比開始時更爲積極。
銳評:賽博版“知心姐姐”上線。
三、AI商業與政策動態:金錢、權力和規則的遊戲
18.新聞:Meta繼續挖角AI人才。Meta仍在繼續招募AI人才,最近用高達1800萬美元的總薪酬從OpenAI挖來三名研究員。多名來自OpenAI蘇黎世辦公室的研究人員已確認轉投Meta。據傳,Meta還對Safe Super Intelligence的聯合創始人兼CEO感興趣。
銳評:扎克伯格就喜歡“大力出奇跡”。
19.新聞:Meta擬收購語音克隆公司Play AI。據報道,Meta正洽談收購語音克隆初創公司 Play AI,增強面向消費者的AI功能。這筆潛在交易涉及整合Play AI技術和員工。
銳評:打不過,就買下你。
20.新聞:AI推薦初創公司Crossing Minds將加入OpenAI,並停止接收新客戶。公司此前專注爲電商構建注重隱私的AI個性化系統。
銳評:OpenAI業務是越做越大。
21.新聞:前OpenAI首席技術米拉·穆拉蒂(Mira Murati)創辦的Thinking Machine Labs (TML) 已成功融資20億美元,估值達到100億美元。TML專注於爲企業開發定製化AI,利用強化學習優化關鍵績效指標(KPI),從而提升收入和利潤。
銳評:AI圈的“明星效應”太可怕了。
22.新聞:OpenAI與微軟談判停滯。據報道,OpenAI與微軟關於合作條款的談判陷入僵局。OpenAI尋求轉型爲營利性實體,並提議對協議進行重大修改,但微軟目前不願接受。
銳評:“父子局”也開始鬧彆扭了。
23.新聞:初創公司Cluely獲A16z投資1500萬美元。Cluely製造熱度的能力符合A16z在消費級 AI領域“勢頭即護城河”的觀點,但Cluely“一切皆可作弊”的產品營銷Slogan曾招致批評。
銳評:放眼整個AI界,這錢不算多。
24.新聞:Suno收購WavTool。AI音樂公司Suno收購基於瀏覽器的AI數字音頻工作站WavTool,以增強其爲詞曲作者和製作人提供的編輯能力。
銳評:AI音樂界的強強聯合。
25.新聞:Replit宣佈年化經常性收入超過1億美元。公司表示,“我們激動且榮幸地宣佈,上週我們的年度經常性收入(ARR)已突破1億美元。”
銳評:用AI實現盈利任重而道遠。
26.新聞:OpenAI Codex被廣泛採用。數據顯示OpenAI Codex每天被用於處理10000次代碼拉取請求(pull requests)。
銳評:會“偷懶”的程序員越來越多。
27.新聞:阿里“通義千問3”開源大模型全球下載超1250萬次。阿里巴巴在最新財報中表示,“通義千問3”大模型今年4月開源後下載量迅速破千萬,開源模型家族累計下載逾3億次。
銳評:開源戰略助力全球AI生態建設,也爲國產模型贏得更大話語權。
28.新聞:蓋洛普調查顯示美國員工AI使用率翻倍。蓋洛普對美國員工的一項調查顯示,過去兩年間稱自己在工作中使用AI的員工比例翻了一番:“在過去兩年中,表示每年至少在工作中使用過幾次AI的美國員工比例從21%增至40%,幾乎翻倍。頻繁使用AI(每週幾次或更多)的員工比例也自2023年首次調查以來幾乎翻了一番,從11%增至19%。僅在過去12個月內,AI每日使用率就從4%升至8%。”
銳評:AI的普及速度遠超想象。
29.新聞:Gartner發佈2025年中國人工智能十大趨勢。報告預測到2030年中國AI普及率將超50%,50%產業生態基於開放式GenAI模型構建。這一趨勢報告爲企業數字化轉型提供了清晰路徑,需重點關注數據與模型治理。
銳評:我們已經走在了時代前列。
30.新聞:重要AI版權案裁決出爐。上週兩項重要的AI版權案裁決確認,使用受版權保護作品訓練AI屬於“合理使用”,但同時也裁定相關應用並非自動合法。其中一名聯邦法官裁定,Anthropic使用書籍訓練Claude AI模型的行爲構成美國版權法下的“合理使用”,但同時也認定他們使用盜版材料的行爲面臨法律責任。在另一項訴訟中,莎拉·西爾弗曼(Sarah Silverman)等多位作家起訴Meta非法使用其受版權保護的書籍訓練AI。聯邦法官裁定Meta的使用屬於“合理使用”,認爲其具有“變革性”,且原告未能證明對其造成了市場損害。
銳評:這讓所有AI公司都鬆了一口氣。
31.新聞:美國提案擬凍結州級AI監管。參議員特德·克魯茲(Ted Cruz)牽頭的一項聯邦提案計劃禁止各州在未來10年內監管AI。支持者認爲,此舉可防止出現阻礙創新的“碎片化”法規。
銳評:美國想搞“十年禁令”,防止各州亂來。
32.丹麥擬立法賦予公民形象權。丹麥提出開創性版權法修正案,賦予公民對其身體、面部特徵和聲音的所有權,目的是打擊深度僞造濫用。立法將允許個人要求刪除使用其肖像的AI生成內容,並就未經授權使用行爲尋求賠償。
銳評:我的形象我做主。
33.新聞:德國指控DeepSeek非法傳輸數據。德國數據保護官員邁克·坎普(Meike Kamp)向蘋果和谷歌舉報AI應用DeepSeek,指控其非法傳輸用戶數據,違反了歐盟法律。坎普表示,DeepSeek缺乏“令人信服”的數據保護證據。
銳評:保護數據隱私很重要,但要防止有人拿它刷存在感。
34.新聞:特斯拉Model Y首次完成全自動駕駛交付。公司CEO馬斯克在X平臺宣佈,這輛Model Y全程無人駕駛穿越高速,比計劃提前一天完成。這展示了特斯拉自動駕駛技術的重大突破。
銳評:馬斯克說,我家自動駕駛是真能上路了。
四、AI觀點與文章:冷靜一下,聽聽人話
35.新聞:Anthropic現實測試項目失敗。Anthropic的Project Vend項目嘗試讓AI模型Claude自主經營一家小商店,最終未能盈利,反遭操控,並經歷了“身份認同危機”。這項現實世界測試揭示AI缺乏商業常識且管理不善。這說明,即使AI系統日益承擔重要商業角色,但目前似乎還無法匹敵人類商業智慧。
銳評:這盆冷水潑得及時,AI當老闆還差遠了。
36.新聞:正確監管可促進AI創新。微軟首席科學家埃裡克·霍爾維茨(Eric Horvitz)表示,若以風險爲導向而非“一刀切”,合理監管可促進AI創新;他呼籲建立以透明度和問責製爲核心的法規框架,以應對技術飛速發展帶來的倫理與安全挑戰。
銳評:大佬這話說得藝術,翻譯過來就是“監管可以有,但別一刀切把創新給管死了”。(辰辰)