理想汽車的VLA“長征”
在理想i8發佈會舉行之前,理想汽車董事長兼CEO李想與前同事、維他動力聯合創始人趙哲倫分享了自己關於“選擇”的長期主義哲學。
“要選‘長’的,這件事情最好要很長時間才能成功,如果是個很短時間就能成功的,就意味着所有人都能成功,反而沒什麼壁壘。選‘長’的,跟時間做朋友,就有耐心了。”李想說。
當晚,外界都以爲理想i8是唯一主角。但這是一場有雙主角的發佈會,李想在現場宣佈,理想VLA司機大模型將隨理想i8一同交付。
作爲發佈會上的另一個主角——VLA其實更能反映李想的長期主義哲學。
2025年的智能駕駛戰場,瀰漫着“短平快”的焦慮。數據上,部分車企依賴人工採集“老司機數據”,甚至僱傭數百人實車路測,成本高昂卻效率低下。算法上,端到端+VLM架構遭遇瓶頸——訓練數據突破1000萬Clips後,性能增長緩慢。評測上,實車測試無法復現極端場景,接管里程的數字繁榮背後隱藏着極端場景的未解難題。
面對這些現象,李想曾用這樣一句話提醒公司乃至整個行業——端到端模型像猴子開車,它能夠學習人類行爲,但並不理解物理世界。
李想的犀利比喻,直指行業痛點——短期可落地的技術≠真正智能。基於這樣的信念,理想沒有簡單粗暴地用規則算法“修補”端到端缺陷,而是選擇了一條更艱難的長期主義道路:推翻現有架構,自研VLA司機大模型。
爲何VLA是“正確的事”
區別於端到端架構的模仿學習,VLA司機大模型的優勢是通過強化學習不斷進化,讓機器理解“爲什麼這樣做”。這不僅關乎技術路線,更是一場關於用戶體驗、商業效率與技術野心的深刻重構。
首先,VLA能像經驗豐富的司機一樣預判風險(如盲區車輛切入)。理想汽車自動駕駛研發高級副總裁郎鹹朋希望,未來VLA能將事故里程(MPA)提升至人類駕駛的10倍,做到600萬公里纔出一次事故(當前理想輔助駕駛爲350-400萬公里/次事故,人類駕駛約60萬公里/次事故)。
其次,VLA 還能“越開越像你”。激進派車主獲得高效變道,穩健派車主享受平順巡航——VLA通過持續學習用戶習慣,讓車輛“越開越像主人”。郎鹹朋描繪未來:“強化學習是有這個能力來支撐它這個車越開越像你的風格或體驗,之前端到端可能還不具備這樣的能力。”
郎鹹朋透露,未來不同家庭成員上車,系統將通過Face ID自動切換至其偏好的駕駛風格,車輛真正成爲懂你的“個性化司機”。
理想沒有讓自己陷入“百萬公里實車測試”的重資產泥潭,而是選擇用VLA撕開了行業的成本僞裝。當然,仿真不是爲了省錢所做出的選擇,它是能跑贏技術迭代的選擇——實車測試永遠追不上Corner Case的產生速度。
郎鹹朋揭示了效率本質:“任何技術的提升一定伴隨着研發流程的變革,工業時代來臨後,刀耕火種的流程被機械化替代……而進入了VLA大模型時代,測試效率是提升能力的核心因素。”
2025年上半年,理想依託世界模型的仿真測試累計里程已突破4000萬公里,每天的測試里程最大的峰值可達到30萬公里,這是實車測試無法企及的速度與規模。
郎鹹朋點明VLA快速迭代的秘訣:“VLA評測就像之前的實車評測一樣……我們的VLA仿真評測已經在超級對齊裡做好了基礎,現在已經有超過40多萬個場景評測了。” 這構成了對手難以短時間複製的核心壁壘。
在VLA的長跑中,理想展現出驚人的戰略定力——精準平衡短期妥協與長期收益。
在用戶端,理想接受初期功能保守,例如地庫限速最初爲10 km/h ,現在逐漸提升到15km/h,換取絕對安全冗餘。但郎鹹朋承諾“進一步提升能力並且做好測試之後,我們會逐步打開這個能力的車速上限”。
在技術端,理想犧牲端到端短期數據優勢(堆Clip數),換取VLA的“思維涌現”能力。郎鹹朋對比鮮明:“如果還是沿着端到端思路去做所謂VLA,你的速度一定會變慢……首先你要訓1億個Clips需要多大的訓練算力?”
同時,理想專注構建仿真評測壁壘。郎鹹朋清醒判斷:VLA仍處技術週期早期,首要任務是“很好地驗證這套系統”。
市場反應印證了VLA的長線價值。今年1月發佈的《理想智能駕駛2024年出行報告》顯示,理想汽車智能駕駛試駕率達到72.4%,試駕滿意度爲92%,30萬以及40萬以上車型AD Max交付量佔比分別爲75.4%、84.6%。
可以看出,理想輔助駕駛不再是用戶購車決策中的弱勢項,而是驅動品牌銷量增長的重要因素,這也是VLA司機大模型與理想i8一同發佈、一同交付的原因。
郎鹹朋希望,2025年底將MPI接管里程提升至400-500km,到明年能夠達到1000km。“明年我們如果到了1000km的MPI水平,可能會給用戶這種感覺真的到了一個VLA的ChatGPT的時刻。”理想汽車自動駕駛高級算法專家詹錕說。
對VLA的堅定選擇,背後是理想的技術信仰。VLA是理想對行業本質問題的回答:真正的智能不是“能做什麼”,而是“爲何這樣做”。
數據、算法、算力、工程四重難題
自研VLA,這是人跡罕至的路,郎鹹朋的團隊知道,啃下這塊“硬骨頭”,需要一場從數據、算法、算力到工程能力的全方位“長征”。
在數據問題上,截至2025年7月,理想積攢了累計43億公里輔助駕駛里程、12億公里有效回傳數據——這是理想從2020年理想ONE時代就開始佈局的“數據金礦”。
接下來是數據清洗的“鍊金術”。理想剔除了近1/4“不合規駕駛行爲”,僅保留“老司機數據”。理想汽車自動駕駛高級算法專家湛逸飛解釋:“我們需要的數據用一個詞總結叫‘老司機數據’。”他們在雲端部署模型,甚至利用大模型對數據進行“老司機”標準的嚴苛篩選。
爲了實現世界模型的顛覆性革命,理想做出了一個大膽決策:用仿真測試替代90%實車路測。通過三維重建與場景泛化技術,1:1還原極端場景。這源於一個嚴峻的事實,即實車測試永遠無法100%還原事故現場。
湛逸飛透露,依託強大的世界模型,單日峰值測試里程達到30萬公里,2025年上半年累計超4000萬公里。
這並非一蹴而就。2024年,理想進行了150多萬公里實車測試,並非爲了數據本身,而是爲了驗證和校準仿真環境的可靠性。湛逸飛坦言,最初世界模型仿真復現率是存在問題的,團隊通過一年時間,針對漏洞進行大量工程和算法優化,將仿真一致性提升至99.9%以上。
在算法問題上,李想曾尖銳評價端到端模型“像猴子開車”——能模仿動作,卻無邏輯思維。VLA的突破,核心在於賦予機器“思考的能力”。
CoT思維鏈(Chain-of-Thought)是VLA的核心突破。它能實時呈現決策邏輯(如屏幕顯示“拒絕逆行因安全合規”),徹底解決端到端“無腦執行”的痛點。換句話說,理想不是在教AI開車,而是在教它理解人類世界的規則。
面對大模型部署車端的世紀難題,理想選擇了最硬核的自研之路。
推理速度慢?今年,理想汽車將成爲首個在Thor-U部署VLA模型(4B的MoE混合專家模型)的車企。理想汽車自動駕駛高級算法專家詹錕自豪地說:“目前沒有任何一個架構是這樣的,這是我們與基座團隊共同研發,專門對嵌入式芯片做了定製的MoE混合專家架構,在這個架構上我們才能達到這樣的效果。”
軌跡生成時延高?理想不是直接使用標準Diffusion,而是進行了推理的壓縮。詹錕揭秘:“以前Diffusion可能要推理10步驟,我們使用了flow matching流匹配只需要推理2步就可以了,這方面的壓縮也是導致我們真正能夠部署VLA的本質原因。”效果就是,軌跡生成時延僅15毫秒。
模型部署難?理想將32B雲端大模型蒸餾至3.2B車端MoE模型。詹錕團隊完成了看似不可能的任務:“我們最早訓練了一個32B的雲端大模型……把它做出的思考和推理流程蒸餾到3.2B的MoE模型上。”
在算力問題上, 理想關心“有效算力”。最終,理想在Thor芯片上實現700TOPS有效算力。詹錕解釋秘訣:“傳統的訓練一般都會拿FP32去做訓練...我們有一個訓練過程叫QAT(量化感知訓練)……在訓練過程中,我把參數就把它變成INT8或FP8。”
詹錕回顧攻堅過程:“我們的工程團隊、部署團隊做了非常多的工作,包括我們魔改CUDA的底層,重寫PTX底層指令,才能實現現在的效果。”
爲了打破“芯片歧視鏈”,理想讓Orin X芯片和Thor芯片車型都能獲得VLA,這源於理想工程部署能力的一貫積累。“從早期在地平線J3部署高速NOA,到在Orin芯片上部署大模型,再到現在在Thor芯片上部署VLA高頻快速的大模型……很多技巧和分析方法,以及基礎設施的工具鏈都繼承下來了。”詹錕說。
數據、算法、算力和工程能力的四位一體,構築了理想VLA的護城河。而這場啃硬骨頭的長跑,旨在回答一個問題:真正的智能,是理解“爲何這樣做”。
技術背後的價值觀
當VLA司機在雙向單車道上拒絕執行“左轉避開三輪車”的指令時,一場關於機器價值觀的公開拷問被引爆。這不是技術故障,而是理想團隊主動選擇的安全底線。郎鹹朋深知,VLA的每一步突破,都伴隨着尖銳的質疑與艱難的權衡——這是啃硬骨頭必然付出的代價。
如何應對用戶信任帶來的風險,是理想正在面對的第一個問題。
“請左轉避開三輪車。”——面對這樣的指令,VLA在雙向單車道上陷入沉默。詹錕表示,這不是技術故障,是價值觀的主動選擇。
一方面,複雜指令存在“通識門檻”,例如“前進10米”依賴物理常識涌現。詹錕解釋核心原理:“當量級達到一定規模時,會涌現出組合泛化的能力……它懂了數字,懂了米數,就能組合應用。” 但這需要海量數據與迭代時間。
另一方面,交互權責存在模糊地帶。用戶閒聊提及“左轉”可能誤觸發指令,理想i8發佈會上播放的岳雲鵬駕駛VLA車輛的視頻,就以一種輕鬆的表達方式展現了這個問題。
“我們現在肯定是爲了保持準確,防止出現一些誤判,比如你本來不想操控車的行爲,突然去操控了,這肯定是存在一些還需要迭代和優化的地方。”詹錕坦言挑戰。而理想的解決方案指向“統一大腦”,讓車輛對用戶的想法有更精準的理解。
如何應對效率、安全、舒適的“不可能三角”,是理想正在面對的第二個問題。
郎鹹朋強調,理想的選擇,是安全大於舒適和效率。按照這一原則,現階段車輛即便走錯路,VLA也不會通過一些危險的駕駛動作進行糾正。只有在保證安全的前提下,VLA纔會去努力讓行程更舒適和更高效。
當然,任何選擇都會付出代價。“代價就是初期體驗保守。”郎鹹朋坦言,他同時承諾,我們會逐步打開能力上限。
如何應對行業內卷背景下的對手圍剿和外界質疑,是理想正在面對的第三個問題。
對於理想而言,那些採取“短平快”打法的對手,它們炫耀參數的行爲並不值得自己焦慮,因爲單純的參數優勢,就像廚師誇耀竈臺火力旺一樣,其實,食客只在乎菜是否燒糊了。
從落地節奏看,質疑聲認爲“端到端生命週期僅1年,VLA是否曇花一現”,郎鹹朋表示:“VLA架構會延續到機器人繁榮之後,纔可能被其它技術替代,它是一個相對長期的架構,技術潛力非常大,也更像人類的智能發展規律。”
面對各種質疑,理想應對之道的根基是三大原則:一是安全絕對優先,MPA事故里程目標 600萬公里(優於人類駕駛員10倍),用數據兌現承諾;二是有效算力至上,以 FP8/INT4量化革命讓每顆芯片“鞠躬盡瘁”;三是用戶共建迭代,134萬車主接管數據驅動強化學習。
理想汽車的VLA“長征”,遠非一場單純的技術突圍。它是在智能駕駛喧囂的競技場上,對行業浮躁與捷徑誘惑的一次“撥亂反正”。當整個行業被“短平快”的焦慮裹挾,沉溺於算力參數的軍備競賽時,理想選擇了一條佈滿荊棘的自研之路。
這條路的艱難顯而易見,但理想的創新內核,恰恰體現在這份對困難的坦然擁抱與主動選擇上。李想所言的“選擇‘長’的”,其深意不僅在於時間的長度,更在於路徑的深度——深入本質,重構規則。
免責聲明:本文觀點僅代表作者本人,供參考、交流,不構成任何建議。