☰

理想汽車的VLA“長征”

在理想i8發佈會舉行之前，理想汽車董事長兼CEO李想與前同事、維他動力聯合創始人趙哲倫分享了自己關於“選擇”的長期主義哲學。

“要選‘長’的，這件事情最好要很長時間才能成功，如果是個很短時間就能成功的，就意味着所有人都能成功，反而沒什麼壁壘。選‘長’的，跟時間做朋友，就有耐心了。”李想說。

當晚，外界都以爲理想i8是唯一主角。但這是一場有雙主角的發佈會，李想在現場宣佈，理想VLA司機大模型將隨理想i8一同交付。

作爲發佈會上的另一個主角——VLA其實更能反映李想的長期主義哲學。

2025年的智能駕駛戰場，瀰漫着“短平快”的焦慮。數據上，部分車企依賴人工採集“老司機數據”，甚至僱傭數百人實車路測，成本高昂卻效率低下。算法上，端到端+VLM架構遭遇瓶頸——訓練數據突破1000萬Clips後，性能增長緩慢。評測上，實車測試無法復現極端場景，接管里程的數字繁榮背後隱藏着極端場景的未解難題。

面對這些現象，李想曾用這樣一句話提醒公司乃至整個行業——端到端模型像猴子開車，它能夠學習人類行爲，但並不理解物理世界。

李想的犀利比喻，直指行業痛點——短期可落地的技術≠真正智能。基於這樣的信念，理想沒有簡單粗暴地用規則算法“修補”端到端缺陷，而是選擇了一條更艱難的長期主義道路：推翻現有架構，自研VLA司機大模型。

爲何VLA是“正確的事”

區別於端到端架構的模仿學習，VLA司機大模型的優勢是通過強化學習不斷進化，讓機器理解“爲什麼這樣做”。這不僅關乎技術路線，更是一場關於用戶體驗、商業效率與技術野心的深刻重構。

首先，VLA能像經驗豐富的司機一樣預判風險（如盲區車輛切入）。理想汽車自動駕駛研發高級副總裁郎鹹朋希望，未來VLA能將事故里程（MPA）提升至人類駕駛的10倍，做到600萬公里纔出一次事故（當前理想輔助駕駛爲350-400萬公里/次事故，人類駕駛約60萬公里/次事故）。

其次，VLA 還能“越開越像你”。激進派車主獲得高效變道，穩健派車主享受平順巡航——VLA通過持續學習用戶習慣，讓車輛“越開越像主人”。郎鹹朋描繪未來：“強化學習是有這個能力來支撐它這個車越開越像你的風格或體驗，之前端到端可能還不具備這樣的能力。”

郎鹹朋透露，未來不同家庭成員上車，系統將通過Face ID自動切換至其偏好的駕駛風格，車輛真正成爲懂你的“個性化司機”。

理想沒有讓自己陷入“百萬公里實車測試”的重資產泥潭，而是選擇用VLA撕開了行業的成本僞裝。當然，仿真不是爲了省錢所做出的選擇，它是能跑贏技術迭代的選擇——實車測試永遠追不上Corner Case的產生速度。

郎鹹朋揭示了效率本質：“任何技術的提升一定伴隨着研發流程的變革，工業時代來臨後，刀耕火種的流程被機械化替代……而進入了VLA大模型時代，測試效率是提升能力的核心因素。”

2025年上半年，理想依託世界模型的仿真測試累計里程已突破4000萬公里，每天的測試里程最大的峰值可達到30萬公里，這是實車測試無法企及的速度與規模。

郎鹹朋點明VLA快速迭代的秘訣：“VLA評測就像之前的實車評測一樣……我們的VLA仿真評測已經在超級對齊裡做好了基礎，現在已經有超過40多萬個場景評測了。” 這構成了對手難以短時間複製的核心壁壘。

在VLA的長跑中，理想展現出驚人的戰略定力——精準平衡短期妥協與長期收益。

在用戶端，理想接受初期功能保守，例如地庫限速最初爲10 km/h ，現在逐漸提升到15km/h，換取絕對安全冗餘。但郎鹹朋承諾“進一步提升能力並且做好測試之後，我們會逐步打開這個能力的車速上限”。

在技術端，理想犧牲端到端短期數據優勢（堆Clip數），換取VLA的“思維涌現”能力。郎鹹朋對比鮮明：“如果還是沿着端到端思路去做所謂VLA，你的速度一定會變慢……首先你要訓1億個Clips需要多大的訓練算力？”

同時，理想專注構建仿真評測壁壘。郎鹹朋清醒判斷：VLA仍處技術週期早期，首要任務是“很好地驗證這套系統”。

市場反應印證了VLA的長線價值。今年1月發佈的《理想智能駕駛2024年出行報告》顯示，理想汽車智能駕駛試駕率達到72.4%，試駕滿意度爲92%，30萬以及40萬以上車型AD Max交付量佔比分別爲75.4%、84.6%。

可以看出，理想輔助駕駛不再是用戶購車決策中的弱勢項，而是驅動品牌銷量增長的重要因素，這也是VLA司機大模型與理想i8一同發佈、一同交付的原因。

郎鹹朋希望，2025年底將MPI接管里程提升至400-500km，到明年能夠達到1000km。“明年我們如果到了1000km的MPI水平，可能會給用戶這種感覺真的到了一個VLA的ChatGPT的時刻。”理想汽車自動駕駛高級算法專家詹錕說。

對VLA的堅定選擇，背後是理想的技術信仰。VLA是理想對行業本質問題的回答：真正的智能不是“能做什麼”，而是“爲何這樣做”。

數據、算法、算力、工程四重難題

自研VLA，這是人跡罕至的路，郎鹹朋的團隊知道，啃下這塊“硬骨頭”，需要一場從數據、算法、算力到工程能力的全方位“長征”。

在數據問題上，截至2025年7月，理想積攢了累計43億公里輔助駕駛里程、12億公里有效回傳數據——這是理想從2020年理想ONE時代就開始佈局的“數據金礦”。

接下來是數據清洗的“鍊金術”。理想剔除了近1/4“不合規駕駛行爲”，僅保留“老司機數據”。理想汽車自動駕駛高級算法專家湛逸飛解釋：“我們需要的數據用一個詞總結叫‘老司機數據’。”他們在雲端部署模型，甚至利用大模型對數據進行“老司機”標準的嚴苛篩選。

爲了實現世界模型的顛覆性革命，理想做出了一個大膽決策：用仿真測試替代90%實車路測。通過三維重建與場景泛化技術，1:1還原極端場景。這源於一個嚴峻的事實，即實車測試永遠無法100%還原事故現場。

湛逸飛透露，依託強大的世界模型，單日峰值測試里程達到30萬公里，2025年上半年累計超4000萬公里。

這並非一蹴而就。2024年，理想進行了150多萬公里實車測試，並非爲了數據本身，而是爲了驗證和校準仿真環境的可靠性。湛逸飛坦言，最初世界模型仿真復現率是存在問題的，團隊通過一年時間，針對漏洞進行大量工程和算法優化，將仿真一致性提升至99.9%以上。

在算法問題上，李想曾尖銳評價端到端模型“像猴子開車”——能模仿動作，卻無邏輯思維。VLA的突破，核心在於賦予機器“思考的能力”。

CoT思維鏈（Chain-of-Thought）是VLA的核心突破。它能實時呈現決策邏輯（如屏幕顯示“拒絕逆行因安全合規”），徹底解決端到端“無腦執行”的痛點。換句話說，理想不是在教AI開車，而是在教它理解人類世界的規則。

面對大模型部署車端的世紀難題，理想選擇了最硬核的自研之路。

推理速度慢？今年，理想汽車將成爲首個在Thor-U部署VLA模型（4B的MoE混合專家模型）的車企。理想汽車自動駕駛高級算法專家詹錕自豪地說：“目前沒有任何一個架構是這樣的，這是我們與基座團隊共同研發，專門對嵌入式芯片做了定製的MoE混合專家架構，在這個架構上我們才能達到這樣的效果。”

軌跡生成時延高？理想不是直接使用標準Diffusion，而是進行了推理的壓縮。詹錕揭秘：“以前Diffusion可能要推理10步驟，我們使用了flow matching流匹配只需要推理2步就可以了，這方面的壓縮也是導致我們真正能夠部署VLA的本質原因。”效果就是，軌跡生成時延僅15毫秒。

模型部署難？理想將32B雲端大模型蒸餾至3.2B車端MoE模型。詹錕團隊完成了看似不可能的任務：“我們最早訓練了一個32B的雲端大模型……把它做出的思考和推理流程蒸餾到3.2B的MoE模型上。”

在算力問題上，理想關心“有效算力”。最終，理想在Thor芯片上實現700TOPS有效算力。詹錕解釋秘訣：“傳統的訓練一般都會拿FP32去做訓練...我們有一個訓練過程叫QAT（量化感知訓練）……在訓練過程中，我把參數就把它變成INT8或FP8。”

詹錕回顧攻堅過程：“我們的工程團隊、部署團隊做了非常多的工作，包括我們魔改CUDA的底層，重寫PTX底層指令，才能實現現在的效果。”

爲了打破“芯片歧視鏈”，理想讓Orin X芯片和Thor芯片車型都能獲得VLA，這源於理想工程部署能力的一貫積累。“從早期在地平線J3部署高速NOA，到在Orin芯片上部署大模型，再到現在在Thor芯片上部署VLA高頻快速的大模型……很多技巧和分析方法，以及基礎設施的工具鏈都繼承下來了。”詹錕說。

數據、算法、算力和工程能力的四位一體，構築了理想VLA的護城河。而這場啃硬骨頭的長跑，旨在回答一個問題：真正的智能，是理解“爲何這樣做”。

技術背後的價值觀

當VLA司機在雙向單車道上拒絕執行“左轉避開三輪車”的指令時，一場關於機器價值觀的公開拷問被引爆。這不是技術故障，而是理想團隊主動選擇的安全底線。郎鹹朋深知，VLA的每一步突破，都伴隨着尖銳的質疑與艱難的權衡——這是啃硬骨頭必然付出的代價。

如何應對用戶信任帶來的風險，是理想正在面對的第一個問題。

“請左轉避開三輪車。”——面對這樣的指令，VLA在雙向單車道上陷入沉默。詹錕表示，這不是技術故障，是價值觀的主動選擇。

一方面，複雜指令存在“通識門檻”，例如“前進10米”依賴物理常識涌現。詹錕解釋核心原理：“當量級達到一定規模時，會涌現出組合泛化的能力……它懂了數字，懂了米數，就能組合應用。” 但這需要海量數據與迭代時間。

另一方面，交互權責存在模糊地帶。用戶閒聊提及“左轉”可能誤觸發指令，理想i8發佈會上播放的岳雲鵬駕駛VLA車輛的視頻，就以一種輕鬆的表達方式展現了這個問題。

“我們現在肯定是爲了保持準確，防止出現一些誤判，比如你本來不想操控車的行爲，突然去操控了，這肯定是存在一些還需要迭代和優化的地方。”詹錕坦言挑戰。而理想的解決方案指向“統一大腦”，讓車輛對用戶的想法有更精準的理解。

如何應對效率、安全、舒適的“不可能三角”，是理想正在面對的第二個問題。

郎鹹朋強調，理想的選擇，是安全大於舒適和效率。按照這一原則，現階段車輛即便走錯路，VLA也不會通過一些危險的駕駛動作進行糾正。只有在保證安全的前提下，VLA纔會去努力讓行程更舒適和更高效。

當然，任何選擇都會付出代價。“代價就是初期體驗保守。”郎鹹朋坦言，他同時承諾，我們會逐步打開能力上限。

如何應對行業內卷背景下的對手圍剿和外界質疑，是理想正在面對的第三個問題。

對於理想而言，那些採取“短平快”打法的對手，它們炫耀參數的行爲並不值得自己焦慮，因爲單純的參數優勢，就像廚師誇耀竈臺火力旺一樣，其實，食客只在乎菜是否燒糊了。

從落地節奏看，質疑聲認爲“端到端生命週期僅1年，VLA是否曇花一現”，郎鹹朋表示：“VLA架構會延續到機器人繁榮之後，纔可能被其它技術替代，它是一個相對長期的架構，技術潛力非常大，也更像人類的智能發展規律。”

面對各種質疑，理想應對之道的根基是三大原則：一是安全絕對優先，MPA事故里程目標 600萬公里（優於人類駕駛員10倍），用數據兌現承諾；二是有效算力至上，以 FP8/INT4量化革命讓每顆芯片“鞠躬盡瘁”；三是用戶共建迭代，134萬車主接管數據驅動強化學習。

理想汽車的VLA“長征”，遠非一場單純的技術突圍。它是在智能駕駛喧囂的競技場上，對行業浮躁與捷徑誘惑的一次“撥亂反正”。當整個行業被“短平快”的焦慮裹挾，沉溺於算力參數的軍備競賽時，理想選擇了一條佈滿荊棘的自研之路。

這條路的艱難顯而易見，但理想的創新內核，恰恰體現在這份對困難的坦然擁抱與主動選擇上。李想所言的“選擇‘長’的”，其深意不僅在於時間的長度，更在於路徑的深度——深入本質，重構規則。

免責聲明：本文觀點僅代表作者本人，供參考、交流，不構成任何建議。

理想汽車的VLA“長征”

相關資訊