Grok-4系列模型已開放使用 聰明程度超研究生

【億邦原創】2025年7月10日,馬斯克的xAI公司發佈了Grok-4系列模型。馬斯克表示,Grok-4幾乎在所有學科上都比人類研究生更聰明。

儘管這類宣傳語通常帶有營銷性質,但Grok-4在多項基準測試中表現出色,尤其在AIME25數學等學術問題上達到博士級別,顯示其在邏輯推理和文本理解方面的顯著進步。

發佈會顯示,在“人類最後的考試”(HLE)中,Grok-4基礎能力下不使用任何外部工具的成績爲26.9%,使用工具後成績飆升至41.0%,在“重思考”模式下,Grok-4 heavy的得分達到了58.3%。在AIME25數學競賽上,Grok-4拿下滿分;在GPQA(研究生水平問答)上得分88.9%;在LCB(Jan-May)上得分79.4%;在HMHT25(數學推理)上得分96.7%;在USAMO25(美國數學奧林匹克競賽)上得分61.9%。

Grok-4 還首次嘗試加入多模態信息處理能力,如生成黑洞碰撞的HTML動畫,調用文獻檢索、代碼生成、圖形渲染等多個工具;還能識別“最古怪的員工頭像”,展現出對“古怪”這種模糊定義的理解;語音生成方面,新增五種擬人化聲音,“eve”可即興演唱歌劇,端到端延遲減半,語音更自然。這意味着它不僅限於文本,能夠理解並生成多種形式的內容,這是大模型發展的重要趨勢,將使其在更廣泛的應用場景中發揮作用,尤其是在社交媒體內容處理上更具時效性和文化敏感性。

Grok-4 推出了專門的編程模型 Grok-4 Code,旨在代碼生成、調試等方面提供更專業的支持。Grok-4還與 X(前 Twitter)平臺的數據生態緊密結合,使其能夠獲取和處理實時信息。

目前,Grok-4的標準版本,支持單代理推理,訂閱費爲30美元/月。Grok-4 heavy的多代理版本,訂閱費爲300美元/月。同時,Grok-4的API也已向所有開發者正式開放,定價爲每百萬tokens輸入3美元、輸出15美元。

馬斯克還宣佈了Grok接下來的新新規劃:8月發佈專用編碼模型(Grok code);9月發佈多模態代理(multi-modal agent);10月發佈視頻生成模型(video generation model)。

在應用場景方面,馬斯克表示,Grok-4將應用於特斯拉車輛,最遲將在下週實現。此外,Grok-4還將在生物醫藥、金融等跨領域帶來突破,重塑商業AI範式。