AI週報|黃仁勳更新英偉達芯片路線圖;李開復稱中國主要AI模型公司或將只剩三家
英偉達更新芯片迭代路線圖
北京時間3月19日凌晨,英偉達GTC大會在美國加州聖何塞SAP中心舉行,英偉達CEO黃仁勳穿着黑色皮衣上場。黃仁勳補足了“一年一更”的產品路線圖的信息,包括Blackwell Ultra架構推出時間是今年下半年、2026年下半年英偉達會推出Rubin架構、2027年下半年會推出Rubin Ultra架構、2028年推出Feynman架構。黃仁勳還表示:“關於Scaling Law(縮放定律),去年幾乎全世界都錯了,Scaling Law加速了計算量增長。由於推理技術的加入,代理AI(Agentic AI)動不動就需要高出上百倍的計算量。”
點評:在GTC演講中,黃仁勳努力闡述AI所需計算量還會快速增長的觀點。他認爲AI技術逐漸偏重推理,實際上需要消耗更多token(次元),這需要更多計算量。他還展示了一張圖表,說明全球前四大雲服務商(CSP)今年購買了360萬片Blackwell架構GPU,釋放雲廠商仍有很大需求量的信號。英偉達此次更新產品迭代路線圖,表明其芯片還會快速迭代,也是在給市場信心。
李開復稱未來中國AI模型公司可能只剩DeepSeek、阿里巴巴和字節跳動
近日,零一萬物創始人兼CEO李開復在參與一檔對話節目時表示,DeepSeek掀起的行業變革徹底顛覆了人工智能行業的發展模式,“可能讓OpenAI創始人輾轉難眠”。李開復預測,中國市場最終可能只剩下DeepSeek、阿里巴巴和字節跳動三家主要的AI模型公司,其中DeepSeek目前勢頭最強。李開復還表示,中美兩地的投資人幾乎不再下注更多更貴的底層模型公司,他們更願意投資AI應用、消費者應用、AI基礎設施類型的創新企業。
點評:除了李開復,一些業內人士也認爲,未來大模型公司數量將減少,國內可能不會超過三家,甚至還有可能出現一家獨大的局面,就像移動互聯網系統中安卓的地位。不過,此次李開復點出了DeepSeek、阿里巴巴和字節跳動有可能在大模型競爭中獲勝的廠商,此番言論因此備受外界關注。
百川智能兩位聯合創始人被曝離職創業
3 月17日,有報道稱,大模型六小虎之一的百川智能創始團隊出現變動,其中,聯合創始人焦可已經離職,另一位聯合創始人陳煒鵬也將離職,目前還在走內部流程。報道引述知情人士透露,目前焦可已經在AI語音方向創業,且正在尋求融資;陳煒鵬雖然還沒走完離職流程,但目前已經在籌備創業,項目爲AI Coding方向,並在陸續接觸一些投資人。
點評:焦可和陳煒鵬都是在百川智能創立早期就加入公司的創始團隊成員。焦可在百川智能期間主要負責互聯網業務,陳煒鵬主要負責大語言模型技術部分,同時也曾在搜狗擔任高管。
截至發稿,百川智能官方尚未對上述人事變動作出官方迴應。在上述兩位聯創被曝離職之前,前百川智能聯合創始人、商業化負責人洪濤已於去年離職。百川智能方面彼時回覆稱,洪濤因個人原因從公司離職。
OpenAI 推出最昂貴的推理模型o1-pro
3 月19日,OpenAI宣佈在其開發者API中推出了更強大的推理模型o1-pro。OpenAI 稱,o1-pro 相比之前的 o1 模型,使用了更多的計算資源,以提供持續且更好的響應。o1-pro的定價相當高昂:每百萬 tokens(約 75 萬個英文單詞)輸入費用爲 150 美元,是 GPT-4.5 的 2 倍;每百萬 tokens 輸出費用爲 600 美元(約合人民幣4339元),較普通 o1 模型激增 10 倍。目前,該模型僅向特定開發者開放。
點評:OpenAI 認爲,o1-pro性能的提升將說服開發者支付這筆不菲的費用。然而,早期用戶發現,該模型在處理數獨謎題時表現吃力。此外,OpenAI 去年年底進行的某些內部基準測試顯示,o1-pro 在編碼和數學問題上的表現僅略高於標準版 o1,但在回答這些問題時確實更加可靠。
騰訊今年將增加資本支出
3月19日,騰訊控股公佈2024年第四季度及全年業績。第四季度,騰訊營收1724.46億元,同比增長11%,經營利潤(Non-IFRS)594.75億元,同比增長21%。2024年全年,騰訊控股營收6602.57億元,同比增長8%,經營利潤2378.11億元,同比增長24%。在年報媒體溝通會上,騰訊高管介紹,2024年,騰訊年度資本支出達107億美元,第四季度資本支出增加十分顯著,因爲這一季度購買了很多GPU。騰訊計劃2025年進一步增加資本支出,預期資本支出佔收入的比例爲低兩位數百分比。
點評:騰訊大力投資GPU、加大資本支出釋放了一個信號,即互聯網仍看好AI投資的回報。騰訊高管表示,去年第四季度以來加大對GPU的採購力度,是因爲騰訊看到需求“準備井噴”了,隨着這些GPU部署,預計將加快公司整體收入增長。阿里巴巴也在加碼AI基礎設施投入。今年2月,阿里巴巴宣佈未來三年將投入3800億元建設雲與AI硬件基礎設施。
騰訊元寶日活躍用戶量增長超20倍
3月19日,騰訊總裁劉熾平在2024年年報媒體溝通會上披露,旗下AI助手騰訊元寶2月至3月日活躍用戶量激增超20倍。此外,財報顯示騰訊會議Q4收入同比增長超40%,AI功能月活增長至1500萬,企業微信收入則同比翻倍。
點評:騰訊元寶近期積極投流宣傳,在下沉市場也在“刷牆”廣告。不過,相比目前日活躍用戶量的迅速增長,未來騰訊元寶能留下多少用戶,纔是更重要的指標。從效果上看,劉熾平迴應稱,騰訊元寶投流目前看留存率不錯,但未來不是純粹靠投流來獲得用戶,騰訊會更關注留存率和拉活率,未來還會通過有機聯動方式使元寶和其他產品進一步協作。
黃仁勳承認對量子計算時間線預估有誤
今年的英偉達GTC大會上,英偉達首次推出“量子日”,英偉達邀請了多家量子計算公司負責人蔘會。黃仁勳在“量子日”上表示,引領量子計算的CEO們第一次齊聚一堂討論,他們可以解釋爲什麼他之前的觀點是錯的,“這是歷史上首次有一家公司的CEO邀請所有嘉賓,來解釋他爲什麼錯了。”黃仁勳稱,量子計算技術極其複雜,他本以爲實現量子計算需要多年時間是可以預期的。
點評:今年1月,黃仁勳表示,量子計算機實際應用大約還需要20年時間,15年“爲時過早”,他的言論引發多隻量子計算股的股價下跌。不過,此次承認自己的預估可能有誤後,當日D-Wave Quantum、Rigetti Computing等多隻量子計算概念股股價還是下跌了。此前D-Wave Quantum CEO Alan Baratz曾反駁稱,黃仁勳的判斷對於門模型量子計算機來說可能不是完全錯誤的,但對於退火量子計算機而言則是錯誤的,一些公司已在使用D-Wave Quantum的量子計算機。
Meta的Llama 模型下載量破10億次
3 月 19 日,Meta CEO扎克伯格在 Threads 平臺上宣佈,Meta 的AI模型Llama下載量已達到10億次,相較於2024年12月初的6.5億次下載量,增長了約 53%。此外,Meta正加速Llama開發,並計劃2025年投資高達800億美元用於AI項目。Meta預計未來幾個月將推出多款Llama新模型,包括類似OpenAI o3-mini的“推理”模型和具備原生多模態能力的AI。首屆LlamaCon開發者大會定於4月29日舉行,屆時或將公佈更多相關細節。
點評:Llama 模型是Meta旗下AI助手Meta AI的核心技術支撐,廣泛應用於 Meta旗下的多個平臺,包括 Facebook、Instagram 和WhatsApp等。此外,Llama 模型以專有許可的形式免費提供給開發者和企業使用,雖然許可條款遭質疑,但仍獲廣泛成功。目前,包括 Spotify、AT&T 和 DoorDash 在內的多家知名企業已在生產環境中使用 Llama 模型。
騰訊推出混元T1模型正式版
3月21日,騰訊宣佈推出自研深度思考模型混元T1正式版,並同步在騰訊雲官網上線。通過大規模強化學習,並結合數學、邏輯推理、科學和代碼等理科難題的專項優化,混元T1正式版提升了推理能力。該模型沿用了混元Turbo S的創新架構,採用Hybrid-Mamba-Transformer融合模式。這是工業界首次將混合Mamba架構無損應用於超大型推理模型。價格上,T1輸入價格爲每百萬tokens 1元,輸出價格爲每百萬tokens 4元。
點評:此前混元T1-preview模型已上線騰訊元寶,正式版模型能力有所提升。在數學、編碼、中文能力、推理等測試中,T1在部分測試中分數超過DeepSeek-R1。T1比較受關注的是採用了混合Mamba架構,這一架構降低了傳統Transformer結構的計算複雜度以及訓練和推理成本。
傳商湯聯合創始人徐冰將辭職,官方暫無迴應
3月21日,有報道稱,商湯集團聯合創始人、執行董事及董事會秘書徐冰將自願辭去董事會秘書、執行董事職位。第一財經就此傳言向商湯求證,截至發稿暫無迴應。徐冰最近一次公開對話是在2024年10月底。他出席香港金融科技周時表示,基於三位一體的戰略“大裝置–大模型–應用”,商湯正在建設中國最大的AI雲服務之一,作爲“大裝置”重要一環,爲行業邁向通用人工智能(AGI)做好準備。
點評:徐冰是商湯科技的聯合創始人,自2015年進入董事會,2021年調任執行董事,主導企業戰略、融資及戰略投資管理,是公司從實驗室走向全球AI獨角獸的關鍵推手。他在商湯科技的成就包括2017-2018年主導超10億美元融資,助力商湯成爲全球融資額最大的AI獨角獸之一,並推動其2021年港股上市。
軟銀65億美元收購美國芯片公司Ampere
3月20日,軟銀集團宣佈與美國芯片設計公司 Ampere 達成協議,軟銀將通過子公司以 65 億美元(約合人民幣469.97億元)全現金方式收購 Ampere的全部股權。作爲交易的一部分,Ampere的主要投資者——凱雷集團和甲骨文公司將出售其在Ampere的股份。
點評:軟銀集團董事長兼CEO孫正義表示,AI 未來需要突破性的算力。Ampere 在半導體和高性能計算方面的專業知識將有助於加速這一願景,並深化對美國 AI 創新的承諾。公開資料顯示,Ampere成立於2018年,是一家專注於爲數據中心設備設計處理器的芯片設計公司,其技術基於Arm的技術架構。