商湯絕影“智駕版DeepSeek”來了!世界模型+端到端,上海車展實機演示

車東西(公衆號:chedongxi)作者 | Janson編輯 | 志豪

車東西2月22日消息,今天下午,商湯大模型生產力論壇正式舉辦,商湯絕影CEO,商湯科技聯合創始人、首席科學家王曉剛發佈了行業首個「與世界模型協同交互的端到端自動駕駛路線R-UniAD」。

該方案通過構建在線交互的仿真環境進行端到端模型的強化學習訓練,旨在推動自動駕駛技術的進步。

這一技術思路與春節期間受到市場關注的DeepSeek技術創新相似,強調從模仿學習向強化學習的轉變,以實現超越人類駕駛表現的目標。

▲商湯絕影CEO,商湯科技聯合創始人、首席科學家王曉剛

王曉剛指出,算法、算力和數據三者共同推動人工智能技術的進步。隨着強化學習等算法在大模型訓練中的應用,數據價值得到了進一步挖掘,模型能力的提升也隨之加速。他表示,強化學習的創新同樣可以應用於端到端自動駕駛領域。

商湯絕影的R-UniAD方案結合了UniAD端到端自動駕駛方案和「開悟」世界模型,計劃在即將到來的上海車展上發佈,並進行實車部署,繼續引領端到端智駕技術的發展。

一、強化學習成新方向 全新端到端自動駕駛技術路線關鍵

在2022年底,商湯絕影提出了行業首個感知決策一體化自動駕駛通用模型UniAD,並在2023年國際計算機視覺與模式識別會議(CVPR)上獲得最佳論文獎。

隨着特斯拉等公司在端到端自動駕駛技術上的推進,數據驅動的解決方案已成爲行業共識。

▲以模仿學習爲主的端到端技術發展面臨的挑戰

端到端自動駕駛技術旨在通過大量高質量的駕駛數據實現最佳的模仿效果,但基於模仿學習的技術在突破人類能力上限方面面臨挑戰。此外,高質量場景數據的稀缺性使得實現人類駕駛能力的目標變得困難。

特斯拉通過大規模的高階智駕量產車和強大的算力基礎設施,成功克服了這一挑戰。人工智能技術的發展也經歷了類似的歷程,隨着數據紅利的消退,性能提升愈發依賴於算力規模的擴大和模型參數的增加。

在春節期間,基於純強化學習的DeepSeek-R1技術引起了廣泛關注。該技術通過少量高質量數據的冷啓動,進行多階段的強化學習訓練,有效降低了大模型訓練的數據規模門檻,併爲模型的進一步發展鋪平了道路。王曉剛表示,這一技術路線同樣適用於端到端自動駕駛算法的研發。

二、AI方式解決智駕問題 強調“多階段強化學習”

在UniAD榮獲CVPR最佳論文之後,2024年北京車展,商湯絕影展示了UniAD的實車上路成果,量產端到端智駕方案則預計會在今年年底交付落地。

2月22日,商湯絕影發佈「與世界模型協同交互的端到端自動駕駛技術路線R-UniAD」,成爲行業率先將基於世界模型的強化學習引入端到端智駕的研發與訓練的AI公司。

▲商湯絕影R-UniAD:「多階段強化學習」端到端自動駕駛技術路線

商湯絕影的R-UniAD採用多階段強化學習方法,首先通過冷啓動數據進行模仿學習訓練,再通過強化學習與世界模型協同交互,最終實現高性能端到端自動駕駛小模型的部署。

這一方法顯著降低了數據需求,並有望提升模型在多元場景和駕駛風格下的性能。

商湯絕影的量產端到端智駕方案預計將在年底交付,基於「開悟」世界模型的能力,數據生產和模型訓練的效率將得到顯著提升。

預計在4月的上海車展上,商湯絕影將展示與世界模型協同交互的端到端自動駕駛方案的實車部署。

通過強大的雲端基礎設施,商湯絕影將助力車企合作伙伴在自動駕駛技術上取得更大突破。

結語:商湯持續突破智駕難題

在自動駕駛技術邁向通用人工智能的浪潮中,商湯絕影以「世界模型 + 強化學習」的創新路徑,爲端到端智駕技術開闢了新路徑。

隨着上海車展即將亮相的實車演示,這一技術將加速從實驗室走向量產,我們不妨期待商湯在智駕上會給市場帶來什麼新的方案。