百度、字節高管隔空互懟;月之暗面或因DeepSeek調整重心;騰訊已對微信接入DeepSeek灰測 | AI週報

整理 | 傅宇琪、褚杏娟

導語:騰訊迴應微信接入 DeepSeek:正在灰度測試;DeepSeek 對豆包衝擊最大?百度、字節高管隔空互懟;月之暗面或因 DeepSeek 調整工作重心,強化學習成關注焦點;亞馬遜 Alexa 升級版因 AI 回答不準確推遲發佈;Meta 部分高績效員工突遭解僱,公司“裁減低績效員工”說法遭質疑;涉嫌代碼抄襲,字節跳動敗訴判賠美攝公司 8000 多萬元;被面試官連問三個小時,應屆博士無緣 DeepSeek;馬斯克方:若 OpenAI 維持非營利,將撤回 974 億美元收購要約;擺脫英偉達依賴,OpenAI 首款自研芯片被曝上半年交由臺積電流片;9.9 萬元起!春晚爆火的宇樹機器人線上首發後當天下架……

行業熱點

騰訊迴應微信接入 DeepSeek:正在灰度測試

近日,有消息稱,微信正在灰測接入 DeepSeek-R1 模型。16 日上午,騰訊方面迴應中新經緯稱,確有其事,正在灰度測試。

騰訊表示,微信搜一搜在調用混元大模型豐富 AI 搜索的同時,近日正式灰度測試接入 DeepSeek。被灰度到的用戶,可在對話框頂部搜索入口,看到“AI 搜索”字樣,點擊進入後,可免費使用 DeepSeek-R1 滿血版模型,獲得更多元化的搜索體驗。

另有知情人士表示,騰訊多個產品正在探索接入 DeepSeek,如騰訊雲 AI 代碼助手、騰訊元寶等,爲用戶提供更豐富的體驗和服務。

2 月 15 日,部分微信用戶發現,微信搜索已經上線“AI 搜索”功能,並接入 DeepSeek-R1 提供的“深度思考”服務。有媒體實測發現,微信已爲搜索功能接入 DeepSeek-R1 模型,處於小範圍灰度測試中。部分用戶可在微信搜索框中點擊“AI 搜索”,並選擇“深度思考”模式,便可獲得由 R1 模型經過長思考提供的更全面的回答。若用戶未顯示該入口,說明暫未覆蓋到賬號,請耐心等待後續開放。

根據公衆號“共識粉碎機”從供應鏈看到了騰訊加單了10-20萬張H20,其判斷看微信版Deepseek就是明確的用途。每張H20可以支持500個Deepseek滿血版用戶同時使用,這意味着10-20萬張H20可以支持5000萬-1億用戶同時在線用戶,這基本滿足了微信第一批Deepseek用戶的用量,也超過了ChatGPT的同時在線用戶。

目前H20成本不到1萬美金,對應集羣1.5萬美金,假設10-20萬張卡差不多是20億美金;按照AWS最新的折舊定義修改,GPU能用5年,平均一年的折舊成本是4億美金。“共識粉碎機”表示,Deepseek已經讓成本降低到巨頭充分可以試錯,而且不影響主營業務了。

DeepSeek 對豆包衝擊最大?百度、字節高管隔空互懟

2 月 13 日,有報道稱,百度智能雲事業羣組昨天召開了全員會。會上,百度集團執行副總裁、百度智能雲事業羣總裁沈抖提到了當下 DeepSeek 爆火,對 ACG 乃至整個模型賽道的影響。

沈抖表示,DeepSeek 在短期內會對百度產生影響,但長期來看是利大於弊的。他提到,即使現在大家看到各家之間你追我趕,但整個行業仍處於很早期的階段,長期來看,還有很多可以創新的點。但面對 DeepSeek 的來勢洶洶,首當其衝的 AI 產品,沈抖認爲,是字節跳動的豆包,理由是其訓練成本和投流成本都很高。

對此,火山引擎總裁譚待通過朋友圈迴應稱,大模型降價是通過技術創新實現的,大家應像 DeepSeek 一樣聚焦基本功,少做無端猜測。譚待表示,豆包 1.5Pro 模型的預訓練成本、推理成本均低於 DeepSeek V3,更是遠低於國內其他模型,在當前的價格下有非常不錯的毛利。

2 月 13 日上午,字節跳動內部舉辦新一期全員會。針對 AI 業務,字節 CEO 樑汝波在會上提出 2025 年的重點目標,包括追求“智能”上限、探索新的交互和加強規模效應。樑汝波也談到了最近爆火的 DeepSeek。他表示,DeepSeek R1 創新點之一的長鏈思考模式不是業界首創。去年 9 月 OpenAI 發佈長鏈思考模型、成爲行業熱點後,字節意識到技術重大變化,但跟進速度不夠,如果當時及時關注到,有機會更早實現。

月之暗面或因 DeepSeek 調整工作重心,強化學習成關注焦點

2 月 15 日消息,據媒體報道,月之暗面內部已將“持續拿到 SOTA 結果”確定爲最重要的工作目標。2025 年,他們計劃在模型能力方向上加強多模態和長文本推理能力。

然而,DeepSeek 的成功讓外界重新審視了月之暗面的技術和用戶增長模式。兩者在閉源與開源、預訓練與蒸餾技術等方面存在差異。雖然尚未明確是否接入 DeepSeek 或開源,但有業內人士透露可能會將強化學習作爲一個工作重點方向。此舉被認爲是對抗 DeepSeek 等競爭對手的一種改變或嘗試。

近日 OpenAI 發佈研究論文報告《Competitive Programming with Large Reasoning Models》,提到中國的 DeepSeek-R1 和 Kimi 1.5 利用思維鏈學習方法,在數學解題與編程挑戰中表現出色。這也進一步引發了對於強化學習路線帶來的模型能力提升的關注。

亞馬遜 Alexa 升級版因 AI 回答不準確推遲發佈

亞馬遜計劃對其人工智能助手 Alexa 進行重大升級,原定於 2 月 26 日展示,但因技術挑戰推遲至 3 月 31 日或更晚。新版本的 Alexa 將具有獨特性格、記憶對話細節等功能,但在測試中出現回答不準確等問題。

亞馬遜在 2023 年宣佈將利用生成式 AI 技術升級 Alexa,但實現過程比預期困難,原計劃 2024 年底發佈也因用戶反饋不佳而推遲。蘋果的 Siri 升級版也面臨類似問題,可能從 iOS 18.4 推遲至 18.5 版本。亞馬遜需在技術創新和用戶體驗間找到平衡,以確保 Alexa 升級版能成功推出。

Meta 部分高績效員工突遭解僱,公司“裁減低績效員工”說法遭質疑

2 月 11 日凌晨,Meta 開始通知受其先前宣佈的裁員影響的員工。據外媒報道,該公司向被解僱員工發送的通知電子郵件標誌着一個解僱過程的開始,預計該過程將持續到 Meta 績效週期結束(2 月底),並導致多達 3600 名員工被解僱。裁員郵件顯示,美國本土員工將獲得包括 16 週薪資在內的遣散費,還會根據工作年限獲得額外兩週薪資。此外,表現符合標準並獲得獎金的員工依然會拿到獎金,員工還會在本月的股票獎勵週期中收到公司股票。多名 Meta 員工表示,儘管去年年中評估時獲得了正面績效評級,他們仍在本週一被裁員。在此次裁員中,Meta 共削減了近 4000 個崗位。

在 Meta 內部溝通平臺 Workplace 上,不少被裁員工發佈了自己的績效記錄截圖。一名員工稱自己“意外”被解僱,並展示了文件,證明自己過去四年一直符合或超出公司預期,但在 2024 年底被降級。另一名員工表示,自己在 2024 年初績效良好,但剛休完育兒假就被解僱。由於績效評級突然下降,一些員工擔心 Meta 公開裁員理由可能會影響他們的未來求職。“Meta 說自己在裁低績效員工,這讓我們像被貼上了‘低績效’的標籤一樣。但事實上,我們並不是。”另一名被裁員工質疑公司的說法:“根據我過去得到的反饋,我很難相信自己是低績效。”還有員工稱,他們的經理此前從未透露過裁員風險,甚至還曾保證他們不會受到影響。“我們甚至無法查看經理對我們的考評意見。”

涉嫌代碼抄襲,字節跳動敗訴判賠美攝公司 8000 多萬元

2 月 13 日消息,美攝科技官微發佈聲明稱,美攝公司起訴字節跳動旗下抖音等 8 款產品代碼抄襲系列案,歷經三年七個月,終於迎來終審判決,且終審勝訴,字節跳動被判賠 8266.8 萬元。判決判令抖音公司及其關聯公司立即停止侵害美攝 SDK 軟件著作權的行爲,向美攝公司賠禮道歉,抖音公司及某員工立即停止侵害美攝公司技術秘密的行爲。

據悉,2021 年 5 月,美攝公司發現抖音軟件的音視頻編輯處理等相關功能代碼大量抄襲美攝公司享有著作權的美攝 SDK 軟件。對此,抖音副總裁李亮迴應稱,一名曾經在美攝工作過的工程師,離職兩年半後加入了字節。在字節工作期間,寫代碼時重複使用了一部分他在美攝工作時寫過的代碼(經司法鑑定,相關重複代碼佔比很小,不超過美攝軟件的 4%、抖音的 0.8%)。這種行爲,屬於嚴重違規,公司是明令禁止的,目前該員工也已經離職。李亮表示:“在美國起訴時,美攝還要求字節披露 TikTok 的全部源代碼。這是我們無法接受的。我們曾多次和美攝溝通,願意向對方提供有誠意的賠償,但美攝卻提出了遠超過相關代碼實際價值的賠償訴求——僅在中國法院,美攝就提出了超過 20 億的索賠,最後法院支持了 8000 多萬。”

值得注意的是,李亮最新還補充了一個細節:美攝曾向美國法院申請打印 1215 頁 TikTok 源代碼。李亮表示:“這個是非常險惡的,不僅明顯超過了案件審理的必要,更可能導致整個 TikTok 的源代碼技術泄露。”好在最後經律師抗辯,美國法院駁回了美攝的請求,並要求美攝補充具體的賠償依據,以及明確具體涉及什麼商業秘密。

一 AI 初創公司 CEO 被捕:融 4 個多億、購豪宅辦婚禮揮霍、敗光後裁掉 50 名員工

據報道,總部位於舊金山的 AI 初創公司 On Platform 的創始人上週被捕,此前檢察官指控他和妻子將價值數百萬美元的投資者資金揮霍在了房地產、珠寶、特斯拉汽車,甚至是舉辦婚禮的社交俱樂部上。檢察官進一步表示,這對夫婦從投資者那裡騙取了 6000 多萬美元(4.4 億元人民幣)。創始人 Alex Beckman 和他最近迎娶的律師 Valerie Lau 上週現身在舊金山法院。夫婦倆被指控“串謀從事電信欺詐、銀行欺詐和證券欺詐,以及嚴重的身份盜竊和妨礙司法公正”。

2024 年 7 月警鐘其實已經拉響,當時 GamesBeat 報道稱 ON(前身爲 GameOn Technology)在發現 1100 萬美元現金憑空消失後,解僱掉了全部 50 名員工。當時 Beckman 引咎辭職,剩下的幾位公司高管在一封信中告訴股東們到底發生了什麼。信中寫道:“令我們感到震驚和恐懼的是,我們發現,實際上銀行賬戶裡頭的餘額僅剩下 37 美分。這一發現讓公司頓時陷入了流動性危機,董事會和管理層被迫迅速採取行動,希望能避免破產。”媒體報道稱:但實際上,GameOn 的年收入從來就沒有超過 50 萬美元,公司也從未盈利過,GameOn 每年虧損數百萬美元。此外,Beckman 一再向投資者出示虛假的公司資產負債表,謊稱現金多達數百萬美元,實際的現金頭寸只是一個零頭而已,有時甚至接近零。

被面試官連問三個小時,應屆博士無緣 DeepSeek

據媒體報道,應聘者劉哲回憶起去年 5 月參加 DeepSeek 線上面試的經歷。那時,面試官連續 3 小時的高強度提問讓他倍感壓力。儘管他作爲 211、985 高校的應屆博士生,在校期間已嶄露頭角,但面對那些深入且具有挑戰性的問題,他仍感到不小的難度。

“在我所經歷過的互聯網公司中,DeepSeek 是唯一一家會根據應聘者的專業背景量身定製編程題目的公司。”回顧面試經歷,劉哲這樣描述。在劉哲看來,DeepSeek 的崛起似乎是必然的。他透露,應聘者普遍來自清華、北大等頂尖學府,面試過程嚴謹且要求高,當時招聘並未設定人數上限,明顯感受到公司旨在網絡頂尖智慧人才,只招收天才級別的精英。

據知情人透露,有朋友曾參與 DeepSeek 的面試,並直接與創始人對話。總體感受是,公司充滿願景,洋溢着理想主義精神,研究氛圍優於高校實驗室,非常適合對 AI 充滿熱情的研究人員。另外,一些參加過 DeepSeek 面試的人表示,公司不設 KPI 考覈,採取扁平化管理模式,每位核心算法人員都能直接與樑文峰探討問題,不太像傳統公司,更像大學的一個研究團隊。

馬斯克方:若 OpenAI 維持非營利,將撤回 974 億美元收購要約

2 月 13 日消息,Elon Musk 的律師當地時間 12 日提交法庭文件稱,若 OpenAI 放棄成爲營利性實體,Musk 方將撤回對 OpenAI 的 974 億美元收購要約。文件稱,Musk 牽頭財團的“認真報價”旨在進一步推進 OpenAI 作爲慈善機構的使命。

當地時間 11 日,OpenAI CEO Sam Altman 接受媒體採訪時表示,公司爲“非賣品”,Musk 提出收購很可能是想拖延公司的發展。“我認爲他可能只是想拖慢我們的腳步。他顯然是一個競爭對手,”Altman 說,“我希望他只是通過打造更好的產品來競爭,但我認爲他已經採取了很多策略,打了很多很多官司,做了很多其他瘋狂的事情,現在又這樣。”

此前有消息稱,Musk 牽頭一組投資者提出收購 OpenAI,Altman 隨後迴應稱,“不了謝謝,但如果你願意,我們可以出 97.4 億美元收購推特(X 前稱)”。

擺脫英偉達依賴,OpenAI 首款自研芯片被曝上半年交由臺積電流片

2 月 11 日消息,據報道,OpenAI 正積極推進其減少對英偉達芯片依賴的計劃,即將完成自家首款自研人工智能芯片。據最新消息,OpenAI 已決定將這款自研芯片交由全球領先的半導體制造商臺積電進行“流片”測試。這一步驟意味着,經過精心設計的芯片將被送往臺積電工廠,進入試生產階段。

OpenAI 規劃着在 2026 年實現自研芯片在臺積電的大規模生產。儘管每次流片測試的費用高達數千萬美元,且通常需耗時約六個月。值得注意的是,首次流片測試並非萬無一失。這款自研芯片在 OpenAI 內部被視爲一種重要的戰略性工具。隨着首款芯片的順利投產,OpenAI 的工程師團隊還將以此爲契機,逐步開發出性能更強、功能更廣泛的處理器系列,進一步鞏固其在人工智能領域的領先地位。

百度開源,並將發佈新模型,與蘋果合作繼續

2 月 13 日晚間消息,有知情人士透露稱,“儘管蘋果公司已與新合作伙伴阿里巴巴集團達成合作,但仍在與百度共同開發中國 iPhone 用戶的人工智能功能。”具體來說,百度一直在開發一種能處理圖片和文本的人工智能搜索功能,並對中文版 Siri 語音助手進行升級。這些功能是“Apple Intelligence”的功能套件的一部分。蘋果與百度以及阿里巴巴的合作顯示了該公司通過與多家 AI 合作伙伴簽訂非獨佔協議來降低風險。目前,百度方面並未迴應相關消息。

日前,2 月 11 日消息,據報道稱,蘋果已經測試了大家期待的 DeepSeek 模型,但因爲 Deepseek 團隊在支持像蘋果這樣的大客戶方面缺乏必要的人力和經驗,沒有繼續使用其模型。與之相對地,蘋果最終決定與阿里巴巴合作,爲中國 iPhone 用戶開發人工智能功能。知情人士透露,此舉是蘋果爲應對在中國銷量下滑的策略之一,旨在爲中國用戶提供更具吸引力的 AI 功能。

2 月 14 日,百度官方微信公衆號宣佈:“我們將在未來幾個月中陸續推出文心大模型 4.5 系列,並於 6 月 30 日起正式開源。”2 月 13 日,百度宣佈文心一言將於 4 月 1 日 0 時起,全面免費,所有 PC 端和 APP 端用戶均可體驗文心繫列最新模型。即日起,文心一言上線深度搜索功能;該功能也將於 4 月 1 日起免費開放使用。

2 月 12 日,據媒體報道,百度今年將推出下一代人工智能模型 Ernie5.0。消息人士稱,被稱爲“基礎模型”的 Ernie5.0,將在多模態能力方面有重大增強,但沒有具體說明其功能。這一消息正值蘋果公司將其潛在客戶轉向阿里巴巴之後,市場普遍猜測此舉是百度爲了應對局勢的變化,試圖穩住股價和市場地位。

9.9 萬元起!春晚爆火的宇樹機器人線上首發後當天下架

2 月 12 日,宇樹科技的 Unitree H1 和 G1 人形機器人正式在京東線上首發開售。其中,Unitree G1 人形機器人在京東的售價爲 99000 元,預計 45 天可交貨。Unitree H1 人形機器人售價爲 650000 元,預計 60 天可交貨。據悉,H1 人形機器人爲宇樹科技的首款全尺寸人形機器人,身高約 180 釐米,體重約 70 公斤,於 2023 年 8 月推出。

然而上線後不久,該產品就從京東平臺下架了。客服表示,這款產品於 2 月 11 日上線平臺,並稱目前不再面向個人進行銷售。“任何普通用戶都可以買的,我們不反對購買。”2 月 12 日晚,宇樹科技市場部工作人員迴應表示:“不是不對個人銷售,誰都可以購買使用。只是現階段人形機器人更加偏重二次開發階段,比如研發機器人大腦、行走運控、全身動作, 所以個人用戶購買我們也希望是‘極客’型的個人用戶。”至於產品上架又下架,工作人員解釋稱:“這就是常規的小操作,公司主要的產品早就開始賣了。”

AI 已進化到可獨立自我繁殖,科學家稱這是流氓 AI 出現的早期信號

據報道,最近,科學家測試了 Meta 的 Llama 和阿里巴巴的通義大模型,結果表明,即使這些模型意識到自己被關閉或禁止複製,它們仍能夠以 50% 和 90% 的概率分別創建自己的副本,也就是說,AI 能夠自我繁殖以繼續執行任務。這種能力可能會讓人類失去對 AI 的控制,AI 可以利用這種能力提高生存能力,並做出違揹人類利益的事情。科學家強調,這是 AI 智勝人類的重要一步,也是流氓 AI 出現的早期信號,是 AI 系統的紅線風險之一。因此,科學家呼籲加強國際合作制定預防措施。

大模型一週大事

Perplexity 免費推出 Deep Research:性能超 R1,CEO:感謝 DeepSeek

AI 搜索平臺 Perplexity 推出了名爲 Deep Research 的新功能,能夠生成深度研究報告。該功能免費向所有人開放,非訂閱用戶每天可查詢 5 次,Pro 用戶每天可查詢 500 次。Deep Research 擅長金融、市場營銷和技術等領域的深度研究,並能在健康、產品研究和旅行計劃等領域作爲個人顧問。

Perplexity 的 CEO Aravind Srinivas 表示,Deep Research 的性能優於其他主流模型,且平均 3 分鐘內完成研究任務。此外,Perplexity 的 Deep Research 與谷歌和 OpenAI 的同名產品不同,其優勢在於速度快、效果好且成本低廉。CEO 還預告下週 Perplexity 將發佈新的產品。

OpenAI 凌晨放王炸!將推出 GPT-5:整合多項技術,取消獨立發佈 o3 模型

2 月 13 日凌晨,OpenAI CEO Sam Altman 放出“王炸”級別更新預告,劇透 GPT-4.5 和 GPT-5 的未來規劃。奧爾特曼表示,OpenAI 將在未來幾個月內推出 GPT-5 模型,該模型將在 ChatGPT 和 API 中整合包括 o3 在內的多項 OpenAI 技術。

OpenAI 不再計劃發佈獨立模型 o3。Altman 表示,GPT-5 推出之前,OpenAI 計劃先發布 GPT-4.5 模型,代號爲“Orion”。他表示這將是 OpenAI 最後一個“非思維鏈模型”。與 o3 及其他推理模型不同,非思維鏈模型在數學和物理等領域往往並不可靠。此外,Altman 還透露免費版 ChatGPT 能在標準智能設置下無限制使用 GPT-5 進行對話。而付費訂閱用戶則能夠體驗更高智能水平的 GPT-5,包括語音、搜索、深度研究等。

字節豆包大模型團隊提出稀疏模型架構,推理成本最高可降低 83%

據豆包大模型團隊消息,字節跳動豆包大模型 Foundation 團隊近期提出 UltraMem,一種同樣將計算和參數解耦的稀疏模型架構,在保證模型效果的前提下解決了推理的訪存問題。據介紹,該架構有效解決了 MoE 推理時高額的訪存問題,推理速度較 MoE 架構提升 2-6 倍,推理成本最高可降低 83%。

企業應用

2 月 13 日,谷歌 CEO Sundar Pichai 聲稱,谷歌正在推進瀏覽器擴展程序“Mariner”項目——AI 可以代替用戶瀏覽網頁、執行復雜任務,並提供完整結果。他表示,這項技術在一年前的完成度僅爲 50%,如今已經提升到 85%。

2 月 13 日,蘋果勢將宣佈首次將 TV+ 流媒體視頻服務擴展到安卓手機。知情人士稱,蘋果將推出一款適用於 TV+ 的安卓應用。在 2019 年推出的 Apple TV+ 一直用於蘋果自己的操作系統和 Roku 等第三方電視平臺。此舉標誌着蘋果罕見地在對手谷歌的安卓系統上提供服務。

2 月 12 日,vivo 手機操作系統 OriginOS 官方發文宣佈,vivo 將深度融合滿血版 DeepSeek,宣稱“藍心大模型與 DeepSeek 雙擎驅動”。此前,除 vivo 外,目前華爲、OPPO、榮耀、魅族都已官宣接入 DeepSeek。

2 月 12 日,騰訊雲開發官宣上新,開發者能夠基於最新的小程序基礎庫,最少僅需輸入 3 行代碼,就可以將“滿血版”DeepSeek 大模型能力接入到小程序中,實現智能對話、文本生成等功能;雲開發新用戶首月套餐免費,並享有 100 萬 token。

2 月 12 日,知情人士透露,Meta 正在討論收購韓國人工智能芯片初創公司 FuriosaAI,這筆交易最早可能在本月完成。報道稱,Meta 是有意收購這家人工智能初創公司的幾家公司之一。如果 Meta 收購 FuriosaAI,這家社交媒體巨頭可能會設計和製造自己的人工智能芯片,而不是在芯片供應緊張的情況下依賴英偉達。

2 月 11 日,國家超算互聯網平臺宣佈推出“AI 生態夥伴加速計劃”,提供 3 個月 DeepSeek API 接口免費使用、千萬卡時算力資源池等激勵。據介紹,超算互聯網平臺已上線 DeepSeek 滿血版的模型鏡像,併爲有需求的企業免費開放 3 個月 DeepSeek API 接口。

極客時間 Deepseek 知識庫來了!!

最新整理,長期更新,優質信息源,一個就夠!

DeepSeek 最新資訊、技術文檔

DeepSeek 操作手冊、提示詞彙總、個人知識庫搭建手冊

50+ 生態適配企業及官方教程

DeepSeek 提效、變現思路及案例

會議推薦

在 AI 大模型技術如洶涌浪潮席捲軟件開發領域的當下,變革與機遇交織,挑戰與突破共生。2025 年 4 月 10 - 12 日,QCon 全球軟件開發大會將在北京召開,以 “智能融合,引領未來” 爲年度主題,匯聚各領域的技術先行者以及創新實踐者,爲行業發展撥雲見日。現在報名可以享受 8 折優惠,單張門票立省 1360 元,詳情可聯繫票務經理 18514549229 諮詢。

今日薦文

你也「在看」嗎?