☰

MindVLA加持，理想汽車開啓自動駕駛全新用戶體驗時代

理想汽車自上市以來，在市場上的表現尤爲搶眼，其多款車型憑藉卓越的性能和智能化配置，贏得了消費者的廣泛青睞。特別是搭載了最新智能駕駛技術的車型，如理想L系列等，憑藉其出色的自動駕駛性能和智能化交互體驗，成爲了市場上的熱門選擇，訂單量持續攀升，展現了理想汽車強大的市場競爭力和技術實力。

2025年3月18日，在NVIDIA GTC 2025大會上，理想汽車自動駕駛技術研發負責人賈鵬發表了主題演講《VLA：邁向自動駕駛物理智能體的關鍵一步》，正式發佈了理想汽車的下一代自動駕駛架構——MindVLA。這一創新架構不僅標誌着自動駕駛技術的重大突破，更將爲用戶帶來前所未有的全新體驗。

MindVLA能像人一樣思考保障安全

MindVLA，即視覺-語言-行爲大模型，是理想汽車自主研發的最新成果。它通過整合空間智能、語言智能和行爲智能，賦予自動駕駛系統強大的3D空間理解能力、邏輯推理能力和行爲生成能力。這意味着，未來的汽車將能夠像人類司機一樣感知、思考和適應環境。

MindVLA採用3D高斯中間表徵技術，借其承載豐富語義和3D幾何表達能力，經自監督學習利用海量數據提升下游任務性能，讓自動駕駛系統更準確理解3D空間信息以作決策。

模型架構方面，其LLM基座模型採用MoE混合專家架構與稀疏注意力機制實現稀疏化，在規模增長時確保端側推理效率，保障實時響應。

訓練時加入未來幀預測生成任務增強空間智能，使模型能更好預測場景變化提前決策，提升安全性和可靠性。

實時推理採用並行解碼技術，小詞表結合投機推理並應用該技術，平衡模型參數規模與實時推理性能，保證精度且快速響應。

針對Diffusion模型效率低的問題，MindVLA進行優化，利用其解碼Action Token成軌跡，聯合建模提升複雜交通環境博弈能力，且採用ODE採樣器快速生成高質量軌跡提高效率和準確性。

基於人類反饋的強化學習（RLHF）技術，面對長尾場景建立人類偏好數據集微調採樣過程，學習對齊人類駕駛行爲提升安全下限，保障廣泛應用。

全方位的智能交互體驗媲美專職司機

對於用戶來說，MindVLA帶來的是革命性的變化。MindVLA能讓理想汽車真正聽懂用戶指令，只要簡單語音指令，車輛就可自主完成導航、調整車速和路線等操作。像在陌生園區找超市，對理想同學說“帶我去找超市”，車輛就能自主漫遊找到目的地。

它具備強大的視覺識別能力，除識別招牌外，還能通過用戶照片定位位置。若用戶在陌生地找不到車，發張附近環境照片，車輛就能自主搜尋到用戶。

MindVLA的空間推理和行爲生成能力使車輛能在地庫、園區和公共道路自主漫遊，找車位停車都不依賴地圖或導航信息。比如商場地庫找不到車位時說“去找個車位停好”，車輛就會利用其能力自主找車位。

而且得益於並行解碼技術和常微分方程採樣器，車輛能在極短時間內完成高質量軌跡生成和決策制定，在複雜交通環境中確保安全性和流暢性，給用戶更安心舒適的駕駛體驗。

MindVLA不僅提升了車輛的自動駕駛能力，還通過語音交互、視覺識別等多種方式，爲用戶提供全方位的智能交互體驗。用戶將感受到更加自然、便捷和智能的駕駛過程，彷彿擁有了一位貼心的專職司機。

MindVLA助力理想汽車持續暢銷

隨着MindVLA的發佈，標誌着理想汽車在自動駕駛技術領域邁出了重要一步。隨着其在市場上的熱門車型持續受到追捧，理想汽車的品牌影響力和市場份額也將進一步提升。

MindVLA賦能的車不再只是一個駕駛工具，而是一個能與用戶溝通、理解用戶意圖的智能體；對於汽車行業而言，像iPhone 4重新定義了手機，MindVLA也將重新定義自動駕駛；對於人工智能領域而言，汽車作爲物理人工智能的最佳載體，未來探索出物理世界和數字世界結合的範式，將有望賦能多個行業協同發展。

值得一提，理想汽車還在人工智能領域頂級學術會議和期刊發表了大量論文，爲加速技術發展貢獻了重要力量，理想汽車將繼續連接物理世界和數字世界，致力於成爲全球領先的人工智能企業，讓自動駕駛技術爲更多用戶帶來更好的用車體驗。（資訊）

上游新聞何保

相關資訊