☰

Grok-4系列模型已開放使用聰明程度超研究生

【億邦原創】2025年7月10日，馬斯克的xAI公司發佈了Grok-4系列模型。馬斯克表示，Grok-4幾乎在所有學科上都比人類研究生更聰明。

儘管這類宣傳語通常帶有營銷性質，但Grok-4在多項基準測試中表現出色，尤其在AIME25數學等學術問題上達到博士級別，顯示其在邏輯推理和文本理解方面的顯著進步。

發佈會顯示，在“人類最後的考試”（HLE）中，Grok-4基礎能力下不使用任何外部工具的成績爲26.9%，使用工具後成績飆升至41.0%，在“重思考”模式下，Grok-4 heavy的得分達到了58.3%。在AIME25數學競賽上，Grok-4拿下滿分；在GPQA（研究生水平問答）上得分88.9%；在LCB（Jan-May）上得分79.4%；在HMHT25（數學推理）上得分96.7%；在USAMO25（美國數學奧林匹克競賽）上得分61.9%。

Grok-4 還首次嘗試加入多模態信息處理能力，如生成黑洞碰撞的HTML動畫，調用文獻檢索、代碼生成、圖形渲染等多個工具；還能識別“最古怪的員工頭像”，展現出對“古怪”這種模糊定義的理解；語音生成方面，新增五種擬人化聲音，“eve”可即興演唱歌劇，端到端延遲減半，語音更自然。這意味着它不僅限於文本，能夠理解並生成多種形式的內容，這是大模型發展的重要趨勢，將使其在更廣泛的應用場景中發揮作用，尤其是在社交媒體內容處理上更具時效性和文化敏感性。

Grok-4 推出了專門的編程模型 Grok-4 Code，旨在代碼生成、調試等方面提供更專業的支持。Grok-4還與 X（前 Twitter）平臺的數據生態緊密結合，使其能夠獲取和處理實時信息。

目前，Grok-4的標準版本，支持單代理推理，訂閱費爲30美元/月。Grok-4 heavy的多代理版本，訂閱費爲300美元/月。同時，Grok-4的API也已向所有開發者正式開放，定價爲每百萬tokens輸入3美元、輸出15美元。

馬斯克還宣佈了Grok接下來的新新規劃：8月發佈專用編碼模型（Grok code）；9月發佈多模態代理（multi-modal agent）；10月發佈視頻生成模型（video generation model）。

在應用場景方面，馬斯克表示，Grok-4將應用於特斯拉車輛，最遲將在下週實現。此外，Grok-4還將在生物醫藥、金融等跨領域帶來突破，重塑商業AI範式。

Grok-4系列模型已開放使用 聰明程度超研究生

相關資訊

Grok-4系列模型已開放使用聰明程度超研究生