MindVLA加持,理想汽車開啓自動駕駛全新用戶體驗時代
理想汽車自上市以來,在市場上的表現尤爲搶眼,其多款車型憑藉卓越的性能和智能化配置,贏得了消費者的廣泛青睞。特別是搭載了最新智能駕駛技術的車型,如理想L系列等,憑藉其出色的自動駕駛性能和智能化交互體驗,成爲了市場上的熱門選擇,訂單量持續攀升,展現了理想汽車強大的市場競爭力和技術實力。
2025年3月18日,在NVIDIA GTC 2025大會上,理想汽車自動駕駛技術研發負責人賈鵬發表了主題演講《VLA:邁向自動駕駛物理智能體的關鍵一步》,正式發佈了理想汽車的下一代自動駕駛架構——MindVLA。這一創新架構不僅標誌着自動駕駛技術的重大突破,更將爲用戶帶來前所未有的全新體驗。
MindVLA能像人一樣思考保障安全
MindVLA,即視覺-語言-行爲大模型,是理想汽車自主研發的最新成果。它通過整合空間智能、語言智能和行爲智能,賦予自動駕駛系統強大的3D空間理解能力、邏輯推理能力和行爲生成能力。這意味着,未來的汽車將能夠像人類司機一樣感知、思考和適應環境。
MindVLA採用3D高斯中間表徵技術,借其承載豐富語義和3D幾何表達能力,經自監督學習利用海量數據提升下游任務性能,讓自動駕駛系統更準確理解3D空間信息以作決策。
模型架構方面,其LLM基座模型採用MoE混合專家架構與稀疏注意力機制實現稀疏化,在規模增長時確保端側推理效率,保障實時響應。
訓練時加入未來幀預測生成任務增強空間智能,使模型能更好預測場景變化提前決策,提升安全性和可靠性。
實時推理採用並行解碼技術,小詞表結合投機推理並應用該技術,平衡模型參數規模與實時推理性能,保證精度且快速響應。
針對Diffusion模型效率低的問題,MindVLA進行優化,利用其解碼Action Token成軌跡,聯合建模提升複雜交通環境博弈能力,且採用ODE採樣器快速生成高質量軌跡提高效率和準確性。
基於人類反饋的強化學習(RLHF)技術,面對長尾場景建立人類偏好數據集微調採樣過程,學習對齊人類駕駛行爲提升安全下限,保障廣泛應用。
全方位的智能交互體驗媲美專職司機
對於用戶來說,MindVLA帶來的是革命性的變化。MindVLA能讓理想汽車真正聽懂用戶指令,只要簡單語音指令,車輛就可自主完成導航、調整車速和路線等操作。像在陌生園區找超市,對理想同學說“帶我去找超市”,車輛就能自主漫遊找到目的地。
它具備強大的視覺識別能力,除識別招牌外,還能通過用戶照片定位位置。若用戶在陌生地找不到車,發張附近環境照片,車輛就能自主搜尋到用戶。
MindVLA的空間推理和行爲生成能力使車輛能在地庫、園區和公共道路自主漫遊,找車位停車都不依賴地圖或導航信息。比如商場地庫找不到車位時說“去找個車位停好”,車輛就會利用其能力自主找車位。
而且得益於並行解碼技術和常微分方程採樣器,車輛能在極短時間內完成高質量軌跡生成和決策制定,在複雜交通環境中確保安全性和流暢性,給用戶更安心舒適的駕駛體驗。
MindVLA不僅提升了車輛的自動駕駛能力,還通過語音交互、視覺識別等多種方式,爲用戶提供全方位的智能交互體驗。用戶將感受到更加自然、便捷和智能的駕駛過程,彷彿擁有了一位貼心的專職司機。
MindVLA助力理想汽車持續暢銷
隨着MindVLA的發佈,標誌着理想汽車在自動駕駛技術領域邁出了重要一步。隨着其在市場上的熱門車型持續受到追捧,理想汽車的品牌影響力和市場份額也將進一步提升。
MindVLA賦能的車不再只是一個駕駛工具,而是一個能與用戶溝通、理解用戶意圖的智能體;對於汽車行業而言,像iPhone 4重新定義了手機,MindVLA也將重新定義自動駕駛;對於人工智能領域而言,汽車作爲物理人工智能的最佳載體,未來探索出物理世界和數字世界結合的範式,將有望賦能多個行業協同發展。
值得一提,理想汽車還在人工智能領域頂級學術會議和期刊發表了大量論文,爲加速技術發展貢獻了重要力量,理想汽車將繼續連接物理世界和數字世界,致力於成爲全球領先的人工智能企業,讓自動駕駛技術爲更多用戶帶來更好的用車體驗。(資訊)
上游新聞 何保