Meta發佈“世界模型”AI,讓機器真正理解物理世界
6月12日消息,據CNBC報道,Meta週三宣佈,正在推出一款全新的AI“世界模型”(world model),能夠更好地理解三維環境及物體的運動。
Meta擁有Facebook和Instagram等知名社交應用。該公司表示,其全新開源AI模型V-JEPA 2能夠在物理世界中理解、預測並規劃。作爲一種世界模型,該系統借鑑了物理世界的邏輯,構建出對現實的內部模擬,使AI能夠以更接近人類的方式學習、規劃和決策。
以Meta的新模型爲例,V-JEPA 2能夠識別出從桌子上滾落的球會掉到地上,也能判斷視線之外的物體並未憑空消失。
人工智能一直是Meta首席執行官馬克·扎克伯格(Mark Zuckerberg)關注的重點領域,因爲公司正面臨來自OpenAI、微軟和谷歌等參與者的競爭。知情人士向CNBC透露,Meta計劃向人工智能公司Scale AI投資140億美元,並聘請其首席執行官亞歷山大·王(Alexandr Wang)以加強自身AI戰略。
Meta強調,V-JEPA 2模型在送貨機器人和自動駕駛汽車等機器上的應用優勢明顯。這類設備需要能夠實時理解周圍環境,才能在物理世界中順利導航。
Meta稱,與依賴大量標註數據或視頻素材的傳統方法不同,V-JEPA 2在簡化的“潛在空間”(latent space)中進行推理,從而理解物體如何運動、互動和反饋。
Meta首席AI科學家楊立昆(Yann LeCun)週三在巴黎Viva Tech大會的視頻演講中表示:“讓機器理解物理世界,與讓它們理解語言有本質區別。”
他補充道:“世界模型就像現實的抽象數字孿生體,AI可以藉此理解世界、預測自身行爲的後果,從而制定實現特定任務的行動方案。”
AI領域的下一個風口?
近期,研究者的關注點已不再侷限於生成式AI應用背後的大語言模型(如OpenAI的ChatGPT和Google Gemini),世界模型因此在AI社區引發了極大關注。
去年9月,知名AI研究員李飛飛爲其新創業公司World Labs融資2.3億美元,目標是打造更好理解物理世界結構的“大型世界模型”(large world models)。
與此同時,谷歌旗下DeepMind團隊也在開發名爲Genie的世界模型。據稱,該模型能夠實時模擬遊戲和三維環境。(易句)
(本文由AI翻譯,本站編輯負責校對)