馬斯克稱將發佈“地球上最聰明AI”,最大特點是引入“思維鏈”推理能力
來源:環球時報
【環球時報特約記者 晨陽】比原計劃推遲了數月之後,美國億萬富豪埃隆·馬斯克宣佈,旗下的人工智能初創公司xAI將於美國當地時間2月17日晚上發佈最新版Grok 3聊天機器人,他將Grok 3描述爲“地球上最聰明的人工智能(AI)”,這也引起外界對Grok 3的高度關注。
美國“商業內幕”網站16日稱,如今人工智能正成爲全球科技巨頭競相角逐的領域,2023年11月,馬斯克宣佈開源大模型Grok 1已接入旗下社交媒體X平臺,用戶可在X上使用Grok聊天機器人。2024年8月,xAI公司發佈了更新一代的Grok 2大模型,主要應用於訓練AI聊天機器人,並在訓練數據的使用上有所改進。Grok 1在訓練時未完全依賴真實世界數據,採用了大量合成數據,導致在處理真實世界中的細微差別和複雜性時表現欠佳。而Grok 2雖然依舊使用了大規模合成數據集,但同時融入了少量高質量的真實世界數據,在一定程度上彌補了初代模型在處理真實場景方面的不足。馬斯克宣稱Grok 2在編程任務、處理複雜問題及數學計算方面展現出了優秀的能力,性能超過了美國OpenAI公司的GPT-4 Turbo。
不過在全球AI大模型的快速迭代之後,目前Grok 2大模型的性能已經落後。2024年夏天,馬斯克曾在社交平臺X上發文稱,xAI的下一代AI模型Grok 3預計將於2024年底推出。但Grok 3並沒有按計劃準時推出,不久前馬斯克在迪拜表示,Grok 3在測試中“表現優於任何已發佈的產品”,這項技術“聰明得嚇人”。他描述稱,Grok 3接受了合成數據的訓練,可以對其進行審查以實現邏輯一致性。“因此,如果它有錯誤的數據,它實際上會反思並刪除錯誤的數據,其基本推理能力非常好。”
根據馬斯克的介紹,Grok 3最大的特點在於引入了“思維鏈”推理能力。該能力讓Grok 3可以像人類認知過程一樣逐步處理複雜任務,顯著提高了模型處理複雜查詢和提供更連貫、更有邏輯的響應的能力。
美國“福布斯”網站稱,xAI公司表示,Grok 3的開發速度得益於使用了由英偉達H100高性能GPU芯片組成的全球最大AI超算Colossus進行訓練,“計算資源的顯著提升幫助Grok 3更高效地處理大型數據集,縮短了訓練時間並提高了準確性”。
報道提到,除了提高計算能力之外,xAI還調整了其訓練方法以改進 Grok 3的能力。例如它採用了合成數據集,即人工生成的專用數據集,而不是真實世界的數據,通過模擬各種場景來訓練AI模型,確保數據集多樣化且受控。這有助於提高AI的學習效率並解決數據隱私問題;Grok 3具備自我糾正機制,即允許大模型識別和糾正自身錯誤的AI技術,它通過評估其輸出並將其與已知的正確響應進行比較,可以隨着時間的推移優化其答案,從而減少錯誤並提高準確性;此外Grok 3還具備強化學習能力,該系統經過訓練,可通過反覆試驗最大限度地提高積極結果,從而提高其決策能力。根據xAI和馬斯克的說法,這些改進將通過使用多個驗證步驟來減少機器幻覺問題的出現,通過可靠來源檢查信息來提高邏輯準確性,並通過持續的自我評估和學習更有效地適應。xAI還宣稱,Grok 3已經引入人工反饋循環和上下文訓練,以確保更自然和準確地響應。
不過也有分析認爲,在中國DeepSeek大模型推出後,未來是否還需要類似OpenAI或xAI這樣利用“大規模堆芯片和算力”的昂貴代價來推進AI發展成爲業內關注的焦點。OpenAI首席執行官奧爾特曼此前表示,DeepSeek讓OpenAI的領先優勢不會像前幾年那麼大了,他表示,在開源模型和研究成果的問題上,OpenAI已經站在了歷史的錯誤一邊,需要制定不同的開源策略。