AI週報|xAI發佈大模型Grok 3;DeepSeek宣佈將開源 5 個代碼庫

xAI 發佈 Grok 3 並開放免費使用

2 月 18 日,馬斯克與 xAI 團隊在直播中正式發佈了 Grok 最新版本 Grok3。從現場展示的數據來看,Grok3 在數學、科學與編程的基準測試上已經超越了目前所有的主流模型,馬斯克甚至宣稱 Grok 3 未來將用於 SpaceX 火星任務計算,並預測“三年內將實現諾貝爾獎級別突破”。2 月 20 日,xAI進一步宣佈Grok 3 開放免費使用(直至服務器崩潰)。隨後,馬斯克曬出了一張蘋果應用商店免費應用下載排行榜的照片,顯示Grok APP 超越 ChatGPT 應用登頂第一名。

點評: 馬斯克將Grok3 稱爲“地球上最聰明的人工智能” ,xAI 稱,Grok 3在 Colossus 超級計算機上運行,使用了 10 萬個 Nvidia H100 GPU,訓練時間長達 2 億 GPU 小時。不過,模型跑分結果顯示,Grok3相比 DeepSeek R1 以及 GPT4.0 ,差距不到 1%~2% ,不少用戶通過實際測試認爲“並無明顯差別”。

DeepSeek發佈最新技術論文,宣佈開源 5 個代碼庫

2月18日,DeepSeek發佈最新技術論文提及NSA(Native Sparse Attention),表示通過針對現代硬件的優化設計,NSA在提升推理速度的同時降低預訓練成本且不犧牲性能。在這篇名爲《原生稀疏注意力:硬件對齊且可原生訓練的稀疏注意力機制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的論文署名中,DeepSeek創始人樑文鋒也作爲共創者在列。兩天後,DeepSeek又宣佈,接下來一週,會陸續開源 5 個代碼庫,DeepSeek 表示,這些在線服務中的基礎構建模塊已經經過文檔化、部署,並在生產環境中經過實戰檢驗。

點評:DeepSeek在公告中稱自己是探索 AGI 的小公司,作爲開源社區的一部分,每分享一行代碼,都會成爲加速 AI 行業發展的集體動力。同時,DeepSeek 稱,沒有高不可攀的象牙塔,只有純粹的車庫文化(不少美國著名企業從車庫裡誕生)和社區驅動的創新。

騰訊元寶成爲蘋果中國區免費APP下載榜第二名

2月22日,騰訊元寶超越豆包,升至蘋果中國區APP下載排行榜第二名,第一名仍爲DeepSeek。此前接入DeepSeek-R1和混元T1後,2月21日,騰訊元寶又進行了更新,元寶中的DeepSeek模型有了理解圖片信息的能力。

點評:騰訊元寶、豆包、DeepSeek這類C端APP雖然還沒有明確的商業變現方式,但這些APP的熱度已經能反映大衆對於使用大模型的熱情。各個大模型APP中,接入DeepSeek模型的決定爲元寶帶來了明顯的熱度。

微信此前接入DeepSeek-R1模型,部分用戶在微信搜索框選擇AI搜索,可使用DeepSeek-R1的深度思考功能。2月18日,爲方便更多用戶使用DeepSeek,騰訊內部緊急協調部署,調用元寶支持微信搜索。微信表示,微信搜一搜小範圍測試接入DeepSeek,用戶的使用熱情遠遠超出預期,目前資源緊張。不在灰度測試範圍內的部分微信用戶進入微信搜索,會在頁面中看到“下載元寶(體驗DeepSeek-R1)”。

點評:騰訊旗下產品接入DeepSeek可爲內容帶來增量流量。騰訊元寶APP早於微信搜索接入DeepSeek-R1。騰訊元寶去年剛上線時並未借騰訊渠道能力做大規模投放。不過,近期接入DeepSeek-R1以及在微信搜索處吸引用戶下載,騰訊元寶可能會借勢收穫一波新用戶。

前OpenAI CTO成立新公司Thinking Machines Lab

北京時間2月19日凌晨,前OpenAI CTO米拉·穆拉蒂(Mira Murati)在社交平臺上表示,她和一羣傑出的科學家、工程師一起創辦了一家名爲Thinking Machines Lab(思考機器實驗室)的公司。這家公司要做的三件事是:幫助人們調整AI系統以滿足他們的特定需求;爲構建更強大的人工智能奠定基礎;培育開放的科學文化並幫助整個領域理解和改進這些系統。

點評:據Thinking Machines Lab網站,這家公司的團隊有29名成員,其中不少來自OpenAI。例如,OpenAI聯合創始人約翰·舒爾曼(John Schulman)擔任首席科學家,前OpenAI研究副總裁巴雷特·佐夫(Barret Zoph)出任首席技術官,前OpenAI安全研究副總裁翁荔也加入這家公司。米拉·穆拉蒂於去年9月宣佈她決定離開OpenAI。多名OpenAI創始團隊成員及核心技術人員離職創立新公司或加入其他AI公司,將使OpenAI擁有更多競爭對手。

騰訊股價重返500港元/股

2月18日收盤,騰訊股價重新站上500港元/股。從1月中旬開始,騰訊控股股價就迎來波動上漲,1月13日收盤366港元/股,2月21日收盤爲517港元/股。消息面上,騰訊旗下微信AI搜索已接入DeepSeek-R1,騰訊旗下多個應用也接入了大模型。此外,對DeepSeek的關注,近日在資本市場上引發了對中國資產進行重估的情緒。此前,騰訊股價曾在2021年初站上700港元/股。

點評:多家機構近日都在熱議中國資產重估。中金公司認爲本輪反彈的本質是建立在對科技趨勢的樂觀情緒上,主要催化因素是DeepSeek“破圈”帶來對科技和整體中國資產的重估情緒,高盛則指出,DeepSeek的崛起爲中概科技股帶來了中長期價值重估的機會。資本市場對國內科技公司有了更大期望,這也建立在AI技術突破能轉化爲實際收入的預期上。

月之暗面收縮產品投放預算

近日有消息稱,月之暗面近期決定大幅收縮產品投放預算。月之暗面內部對此次調整解釋稱,公司近期受到“外部因素和內部戰略調整影響”。知情人士表示,此次調整背後,DeepSeek帶來的熱潮帶動了大衆對AI的認知提升,近期Kimi自然新增用戶量猛漲。

點評:在DeepSeek火爆之前,Kimi是國內知名度最高的C端AI應用之一。DeepSeek證明了,在模型性能足夠好的情況下,不需宣傳投放,用戶就會自然增長。包括月之暗面在內,大模型廠商都需要重估投放廣告宣傳的意義。

阿里AI To C業務人員招聘開放招聘達到數百個

阿里AI To C業務近期開啓大規模人員招聘,開放招聘崗位達到數百個,其中,AI技術、產品研發崗位佔比達到90%,所招聘人員將重點投入到文本、多模態大模型、AI Agent等前沿技術與應用的相關工作中。2 月初,全球頂尖人工智能科學家、前 Salesforce 集團副總裁許主洪出任阿里集團副總裁,負責 AI To C 業務的多模態基礎模型及 Agents 相關基礎研究與應用解決方案。有消息稱,許主洪目前正在緊鑼密鼓籌備規模超百人的頂級 AI 大模型研究團隊。

點評:阿里AI To C業務正在加強人才儲備。全球大模型公司都在搶奪優秀人才。AI應用方面,阿里也在發力。阿里 AI To C 代表產品夸克近期還將品牌標語升級成爲“2 億人的AI全能助手”。

微軟推出世界首款拓撲架構量子芯片

當地時間2月19日,全球首款拓撲量子芯片Majorana 1發佈,該芯片由微軟公司歷時近20年研發,有望於2030年之前上市。微軟的目標是未來在量子芯片上實現百萬個量子比特的相干操縱。微軟董事長兼CEO薩蒂亞·納德拉發文宣佈:“這一突破將使我們在幾年內,而不像一些人預測的那樣用幾十年,創造出一臺真正有意義的量子計算機。”

點評:技術專家相信,量子計算機有朝一日可以完成當今系統需要數百萬年才能完成的計算,有效地解決傳統計算機難以解決甚至不可能解決的問題,並在醫學、化學和許多其他領域帶來新的發現。但業內對於這一願景何時實現,長期以來存在爭議。英偉達創始人CEO黃仁勳上個月表示,量子技術距離超越英偉達芯片還有20年的時間,目前AI芯片仍是人工智能的主力軍。而谷歌等公司則認爲,這一時間點預計將在5年內達到。

谷歌17年老將吳永輝加入字節跳動

有消息稱,在谷歌工作長達 17 年的吳永輝博士已離開谷歌,加入字節跳動。吳永輝在字節跳動將擔任大模型團隊 Seed 基礎研究負責人,專注大模型基礎研究探索、AI for science 等偏長期的研究探索工作,向字節跳動 CEO 樑汝波彙報。字節跳動相關人士向媒體確認了這一消息。

點評:在此次調整前,在內部全員會上,字節跳動 CEO 樑汝波剛剛反思了公司在 AI 領域的短板,包括對重大技術的跟進速度不夠。據悉,吳永輝2008年加入谷歌,2014年加入Google Brain並轉向深度學習方向的研究,是Google神經機器翻譯項目及RankBrain項目的主要貢獻者之一。知情人士稱,吳永輝離開谷歌,是希望做一些新的、偏探索性的工作。這次加盟字節,也將專注在偏長期、偏基礎的科研工作。

瑞金醫院與華爲發佈病理大模型

在近日召開的2025醫療人工智能與精準診療發展論壇上,瑞金醫院攜手華爲共同發佈瑞智病理大模型RuiPath。這一大模型旨在提高病理識別效率和準確率,它基於瑞金醫院豐富的病種和高質量的醫療數據,覆蓋中國每年全癌種發病人數90%的常見癌種,以及垂體神經內分泌腫瘤等罕見病。華爲的DCS AI解決方案掃清了大模型落地的障礙,支持數據工程工具化 ,模型與應用對接標準化,以及有效降低部署成本。

點評:醫療是人工智能技術發揮巨大作用的領域。在DeepSeek發佈之後,國內多家醫院已經將其引入醫療生態。大模型進入醫院已經成爲一股潮流,瑞智病理大模型RuiPath是最新的一例。人工智能的技術能力不斷提升,部署成本則在逐漸降低。瑞金醫院和華爲是各自領域的前沿探索者,瑞智病理大模型的落地有望起到示範性作用。

階躍星辰將在3月份開源圖生視頻

2月21日,階躍星辰CEO姜大昕在生態開放日表示,公司將在3月份開源圖生視頻大模型。此前,階躍星辰已經開源一款視頻生成大模型以及一款語音交互大模型。截至目前,階躍 Step 系列模型矩陣已經發布了 11 款多模態大模型,覆蓋語音識別、語音生成、多模態理解、圖像及視頻生成能力。

點評:DeepSeek發佈的開源大模型,在國內和國外產業界都引起極大關注。它也可能改變國內大模型企業的發展策略,此前百度是閉源的堅定捍衛者,目前也已經轉向了開源。百度、階躍星辰等大模型企業加入開源生態,對於人工智能技術的擴散和產業培育都有積極的促進作用。姜大昕認爲,產業正朝着實現AGI(通用人工智能)的目標穩步前進,目前已進入智能體的發展階段。

編程初創公司Codeium獲新一輪融資,估值達28.5億美元

2 月 20 日消息, AI 驅動的編程初創公司 Codeium 正進行新一輪融資,估值達到 28.5 億美元(當前約 207.57 億元)。這輪融資發生在 Codeium 宣佈完成 C 輪融資僅六個月之後。當時公司獲得了 1.25 億美元的資金,融資後估值爲 12.5 億美元(當前約 91.04 億元)。

點評:知情人士透露,Codeium 目前的年化經常性收入(ARR)約爲4000萬美元。根據這一數據,Codeium的隱含估值大約是ARR的70倍,這一倍數遠高於其他 AI代碼編輯公司。上個月,AI編程助手 Cursor 的製造商 Anysphere 宣佈了一輪新融資,估值爲 25 億美元,根據其報告的1億美元收入,投資者認爲其估值是25倍ARR。