再議“激光雷達vs純視覺”:爲何很多智駕像是一個看得清的木訥保安?

很多人一直以爲,激光雷達路線是高級的,純視覺是廉價版的FSD。

但我告訴你吧,FSD的純視覺,纔是整套系統裡最難、最高級、最底層徹底重構的那一種。

它難,不是因爲你省了激光雷達,而是因爲它把整車變成了一個會“看”、會“想”、會“動”的神經系統。

那現在問題來了,爲什麼國內不選純視覺?

不是不想,是根本做不了。

第一,數據不夠。

純視覺不是裝幾個攝像頭就能跑。

你得有海量的真實場景數據去訓練它,它得看過、錯過、撞過,然後才能變得聰明。

特斯拉是從2016年開始收數據,FSD V13背後吃掉的是全球幾十億公里的路況、錯誤、拐點和決策鏈條。

你看國內這些車企,有幾家有這個數據閉環?

就算銷量上來了,你有沒有用戶用智駕?有沒有標註團隊?有沒有端到端迭代的系統?

都沒有。你是靠封閉道路做演示,靠規則模擬做決策,

你喂的是假動作,它練出來的永遠是假身手。

第二,結構錯了。

特斯拉的純視覺,是把整個系統做成了神經網絡結構,從攝像頭進來,到車輪動起來,中間不分模塊,不分角色,就是一整個“思維繫統”。

國內不是,國內是拼裝工程:激光雷達看一遍、攝像頭看一遍、毫米波看一遍,然後感知模塊處理一遍,傳給決策模塊,再傳給控制模塊。

每一個環節都有延遲,有誤差,有丟包。

這不是AI,這叫部門協作。

所以你看到大車了,你甚至知道該剎車了,但剎不住。你要彙報,你要排隊,你要等模塊之間“開會”。

特斯拉FSD不需要通知別人,它自己一看到,就能自己動。

這才叫端到端,這才叫一體化的智能系統。

第三,我們得說說,爲什麼激光雷達就算“看見了”,它也沒用。

你想啊,一輛車在高速上開一百多公里每小時,你就算提前兩三秒看到前面有靜止障礙物,你能不能剎住,不是靠“有沒有看到”,是靠看到以後能不能及時判斷、及時執行。

而激光雷達的數據非常重,它不像攝像頭那種連續視頻流,它是脈衝式、點雲式、一幀一幀發出來、接收回來、再還原三維模型的。

所以你就會有一個非常致命的過程:

看到 → 轉換 → 解析 → 判斷 → 下指令 → 動作

每一步都要時間,每一步都要算力,然後你開着車在真實世界裡跑,一秒鐘就可能是生死。

而特斯拉不是,它從來不追求看得最清楚,它追求的是——反應得最快,決策得最像人,甚至超越人。

它靠的是攝像頭流,就是光子信號,直接餵給神經網絡,然後整車一體判斷,直接執行。

它不用還原三維圖,不用等傳感器拼圖,它是——“看到就是理解,理解就是行動。”

這就是純視覺的力量,也是FSD和其他車之間的斷代差距。

很多人都在追求“我能看多遠、我能識別多少種障礙物”,但FSD追求的,是“我能提前預判你要幹什麼、我要怎麼規避、我要怎麼做得更穩。”

你可以理解爲,很多智駕像是一個看得清的木訥保安,而FSD像是一個直覺敏銳的格鬥高手。

激光雷達是告訴你:“前方三十米有一個靜止目標,形狀如下……”

FSD是告訴你:“前面可能有問題,我現在就準備變道。”

它的厲害,不在於它看得準,

而在於它根本不需要等你“看準”,它已經行動了。

說到底啊,國內這些車企不是不知道神經網絡好,也不是不知道端到端是未來,他們不是不想學特斯拉,他們是——根本跑不動。

爲什麼跑不動?

你先看看FSD的硬件系統。車上用的是特斯拉自己設計的FSD芯片,HW3、HW4,後端5萬塊英偉達H100+Dojo超級計算集羣做訓練,馬斯克說一句“我們不是在跑模型,我們是在訓練一個駕駛的大腦”——這不是誇張。

國內起步本就晚現在高端芯片搞不到,但所有型號的車,必須頂着智駕的招牌往外賣。

更要命的是,硬件上不行,算法還不敢放手做端到端。

怕出錯,怕責任,怕事故,最後只能走一條“模塊化+規則工程”的路:

攝像頭是供應商的,雷達是供應商的,感知模塊來自某某初創公司,

決策模塊還得開會研究,控制模塊還要留一手冗餘……

這裡面每個公司都有可能給自己留一手,多搞點錢,少擔點責。

所以FSD強在哪?

強它背後那一整套能實時理解世界並反應過來的閉環神經網絡系統,這套系統必須高度集成,必須是一個完整的閉環,而不是各家拼湊的產物。

這就是爲什麼FSD面對同樣的場景,比如前車突然變道、前面出現靜止障礙,它能做到——“人還沒反應過來,它已經判斷完並開始變道”。

不是因爲它有外掛,不是因爲它多了傳感器,

而是因爲它真的擁有了AI那種“毫秒級預判”的能力。

不是它看得遠,而是它“知道前車爲什麼這麼動”,然後它不等你開口,它自己就動了。

這,纔是真正的智能駕駛。

不是多裝幾個雷達,不是識別更多種障礙物,而是——你理解世界的方式,已經進化了。

既然特斯拉這條路這麼強,爲什麼國內不學?

爲什麼這些那麼聰明的工程師、企業家,會走錯方向?

說白了,不是技術問題,是結構性決策問題。

特斯拉爲什麼能走純視覺?因爲它敢壓五年、敢燒幾十億美金、敢把用戶罵聲全吃下,

就賭一件事:未來的智能駕駛,一定要靠神經網絡去“理解世界”。

這裡面,馬斯克本人的魄力和膽量毋庸置疑佔據了很大的因素,但是他也得有那個文化土壤,這個我在我自己的節目中有聊過,這裡不再贅述。

而國內呢?你做決策得看資本週期,看項目評審,看年終交付量,看媒體KPI,你是走一步看一步,你沒法all in。

所以他們選了一條看起來最保險的路,能上車、能發佈、能賣、能交作業。

但這一套結構,一開始就註定了你只能做到“看見”,卻做不到“判斷和反應”。

那有沒有機會後來追上?也不是沒有。

但你要清楚一件事,FSD現在的每一次絲滑變道、每一次毫秒級反應,背後是七年時間、數十億公里、幾千個工程師和一個自研神經網絡團隊幹出來的。

你要追,你得先敢推倒現在這套拼裝系統,你得敢說——我們不要激光雷達白名單,我們也要從攝像頭開始訓練理解世界。

你得敢錯、敢慢,最後你纔有可能趕上。

但現實是,大多數公司連“敢錯”這一步,都走不出去。那就不是代差一年兩年,是結構性斷代。

所以今天這一期說了這麼多,我就想留下最後一句話:

你以爲你裝了雷達,就能看得見世界;但特斯拉,是在用神經網絡理解這個世界。

技術的分水嶺,很多時候不在於誰跑得快,而在於誰走對了那條通向未來的路。