《國際產業》聰明到嚇死人!馬斯克Grok 3亮相 拿下AI第一名

在多個測試中,Grok 3展現的「功力」打敗了OpenAI的GPT-4o、Anthropic的Claude-3.5、DeepSeek V3和Google的Gemini 2.0 Pro。xAI目前仍在持續訓練Grok 3,研發團隊表示現在展示的只是測試版本,但已經在多項指標上取得領先。隨着系統持續優化,未來推出的完整版本將更具競爭力。

馬斯克表示Grok 3會首先開放給預定用戶體驗。研發團隊則表示,社羣平臺X上的Premium Plus用戶將率先體驗Grok 3。公司也將推出了高階版訂閱服務「Super Grok」。

當被問及xAI的AI模型是否走向開源,馬斯克表示,每次在開發下一個版本時,就會讓前一個版本轉成開源模式,例如當Grok 3系統穩定之後,過幾個月就可能讓Grok 2變成開源模式。

在現場展示時,馬斯克詢問Grok 3「SpaceX下一次發射是什麼時候」,Grok 3在回答時會像DeepSeek的AI模型一樣呈現出其做出結論的每個過程與瀏覽過的網頁,並確認相關資訊的可信度。

研發團隊並展示Grok 3如何解決一道物理題,以及如何創造出一款結合《寶石迷陣》(Bejeweled)和《俄羅斯方塊》(Tetris)的遊戲。

在AI系統排名網站Chatbot Arena的評測中,Grok 3以1402最高分奪冠,擊敗OpenAI的GPT-4o、Google的Gemini 2.0-flesh和Gemini2.0 pro,並狠甩DeepSeek R1。

馬斯克以「聰明到嚇死人」(scary smart)來形容Grok 3,並聲稱Grok 3的表現超越了所有已發佈的產品。