馬斯克“地球上最聰明AI”Grok3發佈:20萬張GPU,號稱強過DeepSeekV3

出品 | 本站科技《態度》欄目

作者 | 袁 寧

編輯 | 丁廣勝

剛剛,馬斯克的人工智能初創公司 xAI 通過直播的形式,實時演示展示了他口中的“地球上最聰明的人工智能”—— Grok-3。

一、依舊是大力出奇跡

首先,根據直播演示,Grok 3並非單一模型,而更像是一個模型家族。其中,輕量級版本Grok 3 mini主打實時響應,雖會犧牲部分精度,但推理速度較標準版提升5倍;Grok 3 Reasoning則採用類人腦“慢思考”機制,通過多層事實覈查規避AI幻覺。

xAI高管團隊詳細闡述了Grok的構建歷程。他們表示:“要打造頂尖AI,自建數據中心是唯一途徑。由於我們想盡快推出Grok 3,時間異常緊迫。最終我們決定在短短四個月內建成數據中心。”

據xAI透露,團隊僅用122天就完成了首批10萬塊GPU的部署並投入運行,“這堪稱壯舉”。

此外,他們還披露了將H100計算集羣規模翻倍。“爲此我們啓動了二期工程,僅用92天就實現了容量倍增。所有這些算力資源都被持續用於產品迭代優化,”xAI高管說道。

二、號稱超越GPT-4o、DeepSeekV3

據xAI披露,Grok 3在多項基準測試中超越GPT - 4o以及DeepSeekV3。

在評估數學問題解決能力的AIME測試中表現優異,在採用博士級物理、生物、化學試題的GPQA評估體系裡同樣領先。

早期版本在Chatbot Arena(一個通過用戶投票對比AI模型響應質量的衆包測試平臺)中也展現出強勁競爭力。

現場演示環節,工程師僅用“開發結合俄羅斯方塊和星際爭霸玩法的2D遊戲”這一自然語言指令,Grok3完成核心代碼生成與調試。

此前,馬斯克就曾表示,Grok3在數學邏輯測試中表現遠超當前所有公開模型,包括OpenAI的GPT-4o和DeepSeek R1。例如,Grok3已能獨立完成高等數學難題的推導,並計劃在2025年應用於SpaceX的發射窗口優化,以提升火箭軌道計算的精度與效率。

三、可以通過 Grok 應用程序訪問

“X 的 Premium+ 訂閱的訂閱者將首先獲得 Grok 3的訪問權限,我們還推出了一個名爲 Super Grok 的單獨訂閱。”馬斯克在演示中表示。目前尚不清楚 Grok 3最初是免費提供給所有用戶,還是僅提供給 Premium 和 Premium+ 用戶。

用戶可以要求 Grok 3進行“Think”,或者利用“Big Brain” 模式進行,對於更困難的推理。xAI表示推理模型最適合數學、科學和編程相關問題。

SuperGrok 的價格爲每月30美元或每年300美元,可解鎖額外的推理和 DeepSearch 查詢,並提供無限的圖像生成功能。

馬斯克表示,未來,最快一週後Grok 將獲得“語音模式”。幾周後,Grok 3模型將與 DeepSearch 功能一起出現在xAI企業API中。

“我們的一般方法是,當下一個版本完全發佈時,我們將開源Grok的上一個版本,”馬斯克表示。

此刻距離馬斯克“用AI理解宇宙本質”的終極目標還有多遠?

讓我們等Grok 3再飛一會。