決戰AI之巔:馬斯克硬剛奧特曼 樑文鋒PK楊植麟|產業科技週報

【億邦原創】2月18日,馬斯克硬剛奧特曼,樑文鋒PK楊植麟,大模型領域最頂尖的精英們同天在模型層放大招,決戰AI之巔——“城頭變幻大王旗”,誰也無法穩坐高臺。

馬斯克前腳宣佈Grok3是“全球最聰明”,奧特曼後腳就發推“AGI初體驗要來。”

2月18日,馬斯克在直播間發佈xAI公司新一代旗艦大模型Grok 3。2年內,xAI接連推出Grok系列模型:從3140億參數的Grok-1,到多模態的Grok-1.5 Vision,到針對GPT 4o的Grok 2,到“最聰明”的Grok 3,馬斯克一直以來都試圖通過“大力出奇跡”的開源策略硬剛OpenAI的閉源壁壘。

Open AI CEO山姆·奧特曼也不示弱,在X平臺透露,預計GPT-4.5會在一兩週內發佈,屆時拿出滿血的o3, 還將在未來幾個月內推出GPT-5。“GPT-4.5將帶來AGI的初體驗。”

值得注意的是,儘管高舉開源大旗,Grok 3目前仍是閉源大模型,馬斯克表示,大概幾個月後,等Grok 3成熟穩定,再開源Grok 2。

也是在2月18日,DeepSeek和月之暗面不約而同上傳各自最新論文,主題均圍繞如何優化Transformer架構中的注意力機制,試圖在訓練速度、反饋速度、超長上下文處理方面進一步降本增效,兩位創始人名字赫然在列。

這不是DeepSeek和月之暗面第一次“撞車”,在DeepSeek R1發佈即爆火的當天,月之暗面緊隨其後發佈K 1.5模型及技術報告,兩款模型和兩篇論文都指向強化推理方向,甚至都詳細分享瞭如何訓練一個強化推理模型。目前,宣佈接入DeepSeek的模型廠商、雲廠商、應用商已超過200家,而月之暗面與豆包成爲僅剩的“異類”。

劇烈變動的技術生態不僅讓從業者壓力倍增,也讓應用者無從下手。2月14日晚,億邦動力馬蹄社舉辦2025年第一場“馬蹄友局”,主題爲:AI來襲,品牌如何用它改變未來?十餘位來自消費、科技、製造等領域的創始人及高管圍爐夜話,叩問AI能力邊界,深入技術與商業的本質。持續兩小時的思維碰撞,沒有標準答案,卻清晰傳遞出一個信號:AI正在將商業拉入一個“量子態”——舊規則崩塌,新秩序未立。重要的是,要在技術洪流中捕捉轉瞬即逝的確定性:比“如何用AI”更重要的,想清楚是“爲何用AI”。

1、Grok3登頂“全球最聰明大模型”

北京時間2月18日午間,馬斯克旗下xAI公司正式發佈新一代大模型Grok 3,這也是他此前預告的“全球最聰明的大模型。”據介紹,Grok 3在AIME 2025科學推理測試中得分超過Gemini 2 Pro和GPT-4o,其迷你版模型甚至在編程任務中擊敗了DeepSeek-R1。 現場演示中,Grok 3僅用30秒便生成了一份從地球到火星的航天器軌跡圖,並標註出引力彈弓效應的最佳利用節點。 在數學測試中,Grok-3 Reasoning Beta和Grok-3 mini Reasoning的91分和96分,超越了o3mini的87分、o1的83分和DeepSeek-R1的80分。

比Grok更引人注目的事x AI的算力集羣。發佈會上,xAI介紹:122天建成了10萬顯卡集羣,再過了92天后,建成了20萬張H100顯卡集羣。這是世界上最大的H100算力集羣。 據悉在2024年底,xAI在田納西州孟菲斯建成了一座堪比“算力核電站”的數據中心,10萬塊英偉達H100 GPU組成的集羣,讓Grok 3的訓練速度比前代提升十倍。馬斯克在推特上寫:“算力即權力,而我們將擁有最暴力的武器。” 此後馬斯克宣佈融資60億美元,繼續投資Grok大模型的訓練。

2、GPT-4.5即將到來,同時將帶來AGI的初體驗

Open AI山姆·奧特曼在X平臺宣稱:“GPT-4.5將帶來AGI的初體驗。”預計GPT-4.5也會在一兩週內發佈,屆時拿出滿血的o3。OpenAI還將在未來幾個月內推出GPT-5。

3、楊植麟和樑文鋒同天發論文,主題還撞了

2月18日,DeepSeek和月之暗面均在技術社區發佈最新論文,DeepSeek的論文題爲:《Native Sparse Attention:Hardware-Aligned and Natively Trainable Sparse Attention》,月之暗面的論文是《MoBA:MIXTURE OF BLOCK ATTENTION FOR LONG-CONTEXT LLMS》,主題都是優化Transformer架構中的注意力機制,高效處理長文本。

DeepSeek提出新架構NSA(原生稀疏注意力),月之暗面提出MoBA,均指向在全注意力和稀疏注意力機制之間自由切換,以克服Transformer架構本文越複雜,運算越緩慢,技術越卡的問題。

4、百度決定開源下一代文心大模型

2月14日,百度官網宣佈,將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。在此之前的2月13日,百度剛宣佈文心一言將於4月1日零時起全面免費。百度官網曾預告,ERNIE系列的下一代模型Ernie 5.0計劃在2025年下半年發佈,其將在模型多模態能力方面有重大增強。數據顯示,截至2024年11月,文心一言用戶規模爲4.3億,文心大模型日均調用量超過15億次,較2023年增長超30倍。

5、零一萬物商業化加速:蘇州建基地 預備量產行業大模型

2月14日,零一萬物與蘇州高新區聯合成立的產業大模型基地正式授牌。作爲聚焦垂直產業的大模型基地,該基地將重點打造製造、金融、醫療、政務等多個領域的行業大模型解決方案,攜手中細軟集團、超媒體集團(原現代傳播集團)、創新奇智、倍漾量化、呈元科技、穹徹科技、隨銳科技等頭部產業鏈夥伴,探索大模型技術從實驗室走向生產線的產業化路徑。

整體來看,零一萬物產業大模型基地首批公佈的行業解決方案展現出鮮明的產業特徵——以行業融合應用爲需求牽引,攜手產業領軍高新企業,把大模型“超級大腦”凝練爲領域專家,從點到面深入加速蘇州大模型生態發展,實現大模型智賦產業數智化轉型升級,推動實體經濟高質量增長。

6、百川智能打造的首個AI兒科醫生,正式“上崗”

2月13日,國家兒童醫學中心首都醫科大學附屬北京兒童醫院開展了國內首次“AI兒科醫生+多學科專家”的雙醫並行多學科會診。這位AI兒科醫生,由北京兒童醫院與百川智能、小兒方健康科技聯合研發,以Baichuan M1大模型爲底座打造,於1月18日上線,在經過北京兒童醫院近一個月的內測並得到專家的認可後,昨日正式“上崗”。

基於百川智能研發的Baichuan M1大模型,“AI兒科醫生”整合了超過300位北京兒童醫院知名兒科專家的臨牀經驗和數十年的專家高質量病歷數據,通過結構化臨牀推理範式訓練,構建了覆蓋兒童常見病與疑難病症的立體化知識體系。針對臨牀推理,它首先會基於一訴五史生成診療假設,繼而通過檢驗檢查數據進行假設證僞與排除,最終經由自反思機制對剩餘假設進行概率排序,輸出符合臨牀思維路徑的診療建議。

7、國資委籌備組建國家數據集團

2月14日,國務院國資委(下稱“國資委”)正在籌備組建一家新央企,這家企業的名稱爲國家數據集團。一名接近上述新央企籌備的人士表示,這一舉措標誌着中國在數據要素市場化改革中邁出關鍵一步,旨在進一步整合和優化全國數據資源,推動數據要素的高效配置與深度應用。 該集團將承擔起整合、運營和開發國家級數據資源的重任,涵蓋能源、交通、金融、醫療、工業等多個關鍵領域,推動數據資源的跨行業、跨區域流動與共享。

8、當AI成爲品牌的“共生夥伴”:一場關於未來商業的思辨之旅

2月14日晚,億邦動力馬蹄社舉辦2025年第一場【馬蹄友局】,主題爲:AI來襲,品牌如何用它改變未來?十餘位來自消費、科技、製造等領域的創始人及高管在線圍坐,叩問AI能力邊界,深入技術與商業的本質。

有快消品牌通過AI生成短視頻,將單條成本從200元壓縮至5分鐘內的近乎零邊際成本;有跨境商家用AI客服覆蓋全球時區,旺季售後響應效率提升300%;甚至有企業嘗試用AI替代月薪35萬的市場總監,完成從數據分析到策略輸出的全鏈條決策。

但效率的另一面,是技術對人性的挑戰。當AI將電商運營水平拉昇至同一基準線,企業被迫捲入更殘酷的“無差別競爭”;而當員工依賴AI輸出“80分方案”,人類創造力是否會被“平庸化”?

這場持續兩小時的思維碰撞,沒有標準答案,卻清晰傳遞出一個信號:AI正在將商業拉入一個“量子態”——舊規則崩塌,新秩序未立。而馬蹄友局的價值,恰在於聚集一羣“清醒的冒險者”,在技術洪流中捕捉確定性:比“如何用AI”更重要的,是“爲何用AI”。下一場馬蹄友局,邀您共同定義未來。

億邦持續追蹤報道該情報,如想了解更多與本文相關信息,請掃碼關注作者微信。