☰

Meta發佈“世界模型”AI，讓機器真正理解物理世界

6月12日消息，據CNBC報道，Meta週三宣佈，正在推出一款全新的AI“世界模型”（world model），能夠更好地理解三維環境及物體的運動。

Meta擁有Facebook和Instagram等知名社交應用。該公司表示，其全新開源AI模型V-JEPA 2能夠在物理世界中理解、預測並規劃。作爲一種世界模型，該系統借鑑了物理世界的邏輯，構建出對現實的內部模擬，使AI能夠以更接近人類的方式學習、規劃和決策。

以Meta的新模型爲例，V-JEPA 2能夠識別出從桌子上滾落的球會掉到地上，也能判斷視線之外的物體並未憑空消失。

人工智能一直是Meta首席執行官馬克·扎克伯格（Mark Zuckerberg）關注的重點領域，因爲公司正面臨來自OpenAI、微軟和谷歌等參與者的競爭。知情人士向CNBC透露，Meta計劃向人工智能公司Scale AI投資140億美元，並聘請其首席執行官亞歷山大·王（Alexandr Wang）以加強自身AI戰略。

Meta強調，V-JEPA 2模型在送貨機器人和自動駕駛汽車等機器上的應用優勢明顯。這類設備需要能夠實時理解周圍環境，才能在物理世界中順利導航。

Meta稱，與依賴大量標註數據或視頻素材的傳統方法不同，V-JEPA 2在簡化的“潛在空間”（latent space）中進行推理，從而理解物體如何運動、互動和反饋。

Meta首席AI科學家楊立昆（Yann LeCun）週三在巴黎Viva Tech大會的視頻演講中表示：“讓機器理解物理世界，與讓它們理解語言有本質區別。”

他補充道：“世界模型就像現實的抽象數字孿生體，AI可以藉此理解世界、預測自身行爲的後果，從而制定實現特定任務的行動方案。”

AI領域的下一個風口？

近期，研究者的關注點已不再侷限於生成式AI應用背後的大語言模型（如OpenAI的ChatGPT和Google Gemini），世界模型因此在AI社區引發了極大關注。

去年9月，知名AI研究員李飛飛爲其新創業公司World Labs融資2.3億美元，目標是打造更好理解物理世界結構的“大型世界模型”（large world models）。

與此同時，谷歌旗下DeepMind團隊也在開發名爲Genie的世界模型。據稱，該模型能夠實時模擬遊戲和三維環境。（易句）

（本文由AI翻譯，本站編輯負責校對）

Meta發佈“世界模型”AI，讓機器真正理解物理世界

相關資訊