1天學習500年人類駕駛經驗...特斯拉「世界模擬器」報到!

特斯拉26日揭露建立在神經網絡上的「世界模擬器」(world simulator),該技術爲其全自動輔助駕駛(FSD)和「Optimus」人形機器人計劃打造逼真的虛擬訓練場,大幅降低對道路實測的依賴,是特斯拉向外界展現其AI願景的最新一塊拼圖。

根據負責特斯拉人工智慧(AI)項目的艾魯斯瓦米(Ashok Elluswamy)的介紹和官方示範,這個模擬器是個完全由神經網絡構成的「孿生世界」,能根據真實世界的大量數據,以極高的真實度,生成連續、多視角的虛擬駕駛場景。特斯拉稱,透過這種方式,其AI系統能在一天內學習相當於人類500年的駕駛經驗。

這項進展的直接影響爲,特斯拉可大幅降低對道路實測的依賴,在更安全有效的環境中,評估並改進FSD系統。

更重要的是,這個AI引擎和模擬平臺具多種用途。特斯拉說,訓練汽車的「世界模擬器」也被用來訓練Optimus。這印證了馬斯克的終極願景,也就是打造一個能夠理解真實世界,並與之互動的通用AI,汽車和機器人只是AI的不同「身體」。

AI的無限試煉場

特斯拉「世界模擬器」的核心功能不是駕駛,而是預測,根據當前車輛狀態和駕駛指令,即時生成「世界下一秒樣態」的完整畫面。

特斯拉26日在X上發佈一分多鐘、由AI生成的示範影片顯示,該系統一次可生成長達6分鐘、涵蓋8個鏡頭的逼真駕駛影片。對自動駕駛的開發而言,它有三項本領。一是「封閉循環評估」,新的FSD模型可被直接放入虛擬世界中長期駕駛,以評估其綜合表現,無需承擔道路實測的風險和成本。

二是「情境再現與修改」,開發人員可截取真實發生的危險場景,讓AI在模擬器中以不同方式重新應對,尋找最佳解方;三是「對抗情境生成」,系統可創造極端、罕見的危險情況,專測試AI模型的強度和應急能力。

「端到端」架構

這個無限的虛擬設測場,是特斯拉在FSD和Optimus項目上大躍進的關鍵武器,而「世界模擬器」的實現,與特斯拉在自駕領域採用的「端到端」(End-to-End)技術密不可分。

業界目前對自駕技術的主流解方涉及「感知、預測、規劃」,三個要素各自獨立工作後,再進行整合。特斯拉認爲,這種方式的介面複雜且難以優化,反之,「端到端」架構可直接「看」到畫素,繼之「生出」駕駛指令,一步到位。

不過,特斯拉的這個戰略方法也引發投資人疑慮。一些觀點認爲,若模擬技術發展到可高度替代真實世界數據,理論上競爭對手無需擁有龐大車隊,也能通過模擬足夠的場景來追趕特斯拉。

也有用戶指出,特斯拉仍需解決當前產品存在的「幽靈煞車」(phantom braking)等實際安全問題。對投資人而言,特斯拉的估值已與其AI前景難以切割,世界模擬器的到來,儘管展現其技術實力,也使其未來的競爭格局和技術壁壘,變得額外複雜且值得審視。

特斯拉揭露「世界模擬器」,打造逼真虛擬訓練場,降低對道路實測的依賴,向外界展現其AI願景的最新一塊拼圖。路透