VLA本土化破局。
2月底,特斯拉FSD入華了,國內(nèi)全體智駕企業(yè)繃緊了脊背。
3月,特斯拉FSD“翻車”和“絲滑”同時(shí)出現(xiàn),大佬們的笑容雖然回到了臉上,但心里的焦慮就不得而知了。
回顧特斯拉FSD入華后的表現(xiàn),有一種將《智駕迷惑行為大賞》和《智駕優(yōu)秀生演示稿》放在一起排排坐的割裂感。一方面在上海陸家嘴,F(xiàn)SD把公交車道當(dāng)超車道狂飆;廣州塔底下,導(dǎo)航明明顯示綠燈,車子卻因?yàn)榘选扒胺绞┕ぁ钡木九瓶闯闪藦V告牌突然來了個(gè)急剎。一方面,它在常規(guī)駕駛中,展現(xiàn)出了老司機(jī)的水準(zhǔn),能夠準(zhǔn)確避讓非機(jī)動(dòng)車,毫不遲疑地完成掉頭、轉(zhuǎn)彎等動(dòng)作,給到用戶熟練絲滑的體驗(yàn)。

FSD在常規(guī)駕駛中表現(xiàn)絲滑
造成這樣場面的理由也很簡單,特斯拉的底層AI技術(shù)積累雄厚,可以支撐智能駕駛在常規(guī)使用過程中的絲滑體感,但由于搭載了端到端模型(對比傳統(tǒng)模塊化的智能駕駛模型,端到端模型雖然在感知、決策、控制等過程不會(huì)產(chǎn)生信息的損耗,但本質(zhì)上仍是依照指令實(shí)施相應(yīng)的操作,不能理解潮汐車道等特殊路況的行駛規(guī)則)缺乏中國數(shù)據(jù)訓(xùn)練系統(tǒng),導(dǎo)致FSD并不了解中國復(fù)雜的人車博弈場景,看不懂特殊道路的行駛規(guī)則,這也演變出了特斯拉的“智駕迷惑行為大賞”。
而大佬們的集體焦慮癥結(jié)也在于此,因?yàn)槠鋸?qiáng)大的底層邏輯能力,特斯拉一旦補(bǔ)齊了國內(nèi)短板,勢必會(huì)給國內(nèi)車企造就一片“烏云”。
在這時(shí)候,VLA出現(xiàn)了。

一個(gè)好消息和一個(gè)壞消息
好消息是,VLA模型可以解決端到端的“短板”,融合了看、想、做三個(gè)動(dòng)作,分別使用攝像頭+激光雷達(dá)收集路況信息,相當(dāng)于給車裝上了24k大眼睛;大語言模型通過解決交通標(biāo)志、行人意圖等分析接下來的路況,不夸張的說連“行人要闖紅燈”都get到,潮汐車道、公交車道也應(yīng)付得了;根據(jù)看到的和思考的,VLA可以為車輛做出最優(yōu)路線并控制車輛,還能貼心解釋決策邏輯,如“減速是因?yàn)榍胺接袃和蝗粵_出”......
簡單來說就是VLA融合了視覺、語言和動(dòng)作,給車輛賦予了“類人思維鏈”,從端到端的“看圖說話”演變成了“閱讀理解”。
既然VLA可以解決端到端的技術(shù)短板,那為什么國內(nèi)車企對特斯拉FSD進(jìn)入中國還會(huì)感到焦慮?其實(shí)很容易理解,特斯拉FSD的基礎(chǔ)能力與學(xué)習(xí)能力是強(qiáng)大的,僅靠在互聯(lián)網(wǎng)上尋找中國道路的視頻片段來訓(xùn)練,就能讓系統(tǒng)展現(xiàn)出老司機(jī)的一面,一旦特斯拉補(bǔ)齊在中國的數(shù)據(jù),克服在中國遇到的“水土不服”,它或許將成為中國市場最好的智駕之一。 在前幾天的百人會(huì)上元戎啟行CEO周光與博世中國區(qū)總裁吳永橋也直言,F(xiàn)SD V13在端到端智駕技術(shù)上領(lǐng)先國內(nèi)高階智駕系統(tǒng)一個(gè)代差。
那么,底層技術(shù)的參差是國內(nèi)VLA可以跨越的嗎?FSD V13跟VLA在業(yè)界都被視為智駕大模型階段的產(chǎn)物。在周光看來,VLA的能力使其成為“通才系統(tǒng)”,即在垂直領(lǐng)域內(nèi)具備廣泛的場景適應(yīng)性。

“VLA則能補(bǔ)齊端到端模型的短板,是一位駕駛通才,看得懂語義信息,能理解特殊車道的駕駛規(guī)則。只有先成為駕駛通才,才能成為駕駛領(lǐng)域的專家,即實(shí)現(xiàn)完全自動(dòng)駕駛?!敝芄鈱LA架構(gòu)視為走向L5的轉(zhuǎn)折點(diǎn),他認(rèn)為VLA的本質(zhì)是構(gòu)建時(shí)空統(tǒng)一的認(rèn)知框架,這為實(shí)現(xiàn)L5級自動(dòng)駕駛提供了底層支撐。
簡而言之,周光認(rèn)為元戎啟行推的VLA是在保留核心AI能力的基礎(chǔ)上,向L5進(jìn)發(fā)的較優(yōu)方案,既滿足了技術(shù)追求也能滿足商業(yè)化。
好消息足夠令人振奮,壞消息就讓人多少有些不安了——那就是目前還沒有完全VLA車型落地。但是先別急,已經(jīng)在做了。

四條路線的“逆襲”之路
現(xiàn)在國內(nèi)市面上明確布局VLA的玩家有四個(gè),分別是數(shù)據(jù)“狂魔”理想、“合資”大戶奇瑞、“買買買專業(yè)戶”吉利以及激進(jìn)派選手元戎啟行。

理想用的是“MindVLA”,融合了3D高斯編碼、MoE混合專家架構(gòu)這些高大上的技術(shù),復(fù)雜路況決策準(zhǔn)確率確實(shí)領(lǐng)先同行。但關(guān)鍵問題是他們得同時(shí)養(yǎng)著端到端和VLM兩套系統(tǒng),雖然數(shù)據(jù)(底氣)充足——?jiǎng)討B(tài)數(shù)據(jù)湖覆蓋密度全行業(yè)第一,豪言要在2025年實(shí)現(xiàn)“數(shù)據(jù)自由”,但研發(fā)成本直線上升,馬上覆蓋一個(gè)造車新勢力的成本了。
合資大戶奇瑞的訣竅是朋友多,拉上華為、英偉達(dá)做出一個(gè)獵鷹智駕,計(jì)劃VLA模型在獵鷹900上實(shí)現(xiàn),但它的世界模型(WM)預(yù)測能力還沒有達(dá)標(biāo),落地時(shí)間也定在了2027年。
“買家專業(yè)戶”吉利則是以“千里浩瀚”智駕系統(tǒng)為矛頭,祭出“全域AI+天地一體”的組合拳,試圖用生態(tài)碾壓單一技術(shù)。
激進(jìn)派的元戎啟行則和前三者有著本質(zhì)的區(qū)別,它不僅是極少數(shù)投入研發(fā)VLA的智駕方案供應(yīng)商,而且已經(jīng)把前者甩在身后走進(jìn)了量產(chǎn)階段。不出意外,年中就可以看到搭載元戎VLA的車型上路。
別人剛開始研究,元戎已經(jīng)在量產(chǎn)了?其實(shí)仔細(xì)看看元戎啟行的發(fā)展路線,就能發(fā)現(xiàn)其實(shí)TA一直在默默處于前列。2020年元戎啟行提出“無圖”智駕,到了2024年無圖的風(fēng)才刮起來;2024年車企大肆談?wù)摱说蕉说臅r(shí)候,元戎啟行的端到端已經(jīng)落地量產(chǎn);2025年都在搶占端到端市場份額的時(shí)候,元戎的下一代VLA已經(jīng)量產(chǎn)進(jìn)行中了。
周光曾直言自己是國內(nèi)智能駕駛技術(shù)的“啟蒙老師”,現(xiàn)在再來看,確實(shí)也不必驚訝。
在任何行業(yè)里,落后就要挨打都是一個(gè)共識,智能駕駛行業(yè)不外乎。車企都想自己是“最”領(lǐng)先,這個(gè)時(shí)候,選擇一個(gè)“成熟穩(wěn)重”第三方的優(yōu)勢就體現(xiàn)了。
已經(jīng)實(shí)現(xiàn)量產(chǎn)的企業(yè)先一步建成了技術(shù)護(hù)城河:憑借VLA技術(shù)所支持的長時(shí)間推理與全局決策能力,將顯著提升城區(qū)NOA的實(shí)際使用頻率,進(jìn)而為企業(yè)積累更大規(guī)模、更高質(zhì)量的真實(shí)場景數(shù)據(jù);基于Scaling Law(規(guī)模律),數(shù)據(jù)規(guī)模的提升將反哺算法性能迭代,進(jìn)一步提升用戶體驗(yàn)。

譬如元戎啟行,不但已經(jīng)進(jìn)行到了量產(chǎn)階段,而且還已經(jīng)跟高通達(dá)成了合作。通過在算子開發(fā)層面的深研,未來有機(jī)會(huì)把VLA模型釋放到更多芯片平臺,支持純視覺和激光雷達(dá)版本,這意味著作為一個(gè)第三方元戎已經(jīng)生動(dòng)演繹了什么叫“活兒好,事兒少,跟誰都搭?!?/p>
當(dāng)然,后來者想居上也不是沒可能。但這意味著不僅要耗費(fèi)大量的資金和資金,最怕的就是,廢了九牛二虎之力做成了的時(shí)候,別人可能迭代到第3代甚至第4代了,白白錯(cuò)失最佳發(fā)展的“黃金窗口期”。
總結(jié)一句,出力不討好。就像文學(xué)家張岱說的“不能為了喝一口奶去養(yǎng)一頭?!?。因?yàn)橐呀?jīng)有了成熟的牧場,養(yǎng)殖(底層邏輯)-護(hù)理(AI技術(shù)的延展能力)-出品(量產(chǎn)能力)都已經(jīng)成熟,實(shí)在沒必要。
當(dāng)2023年宣布FSD BetaV12(完全自動(dòng)駕駛測試版)全面轉(zhuǎn)向端到端架構(gòu)時(shí),在一定程度上顛覆了行業(yè)的認(rèn)知。當(dāng)特斯拉將未滿血版的V13同步到中國時(shí),國內(nèi)智駕行業(yè)再起波瀾,車企高管們時(shí)刻警惕著自己的心臟能否承擔(dān)起特斯拉的數(shù)據(jù)量補(bǔ)齊后對自家產(chǎn)品帶來的沖擊。
當(dāng)下,國內(nèi)智駕領(lǐng)域的頭部企業(yè)都已實(shí)現(xiàn)量產(chǎn),各家的工程化能力都處于同一水平段。
智能駕駛的競爭也由工程化能力切換為AI模型的底層能力??梢灶A(yù)料的是,當(dāng)今年國內(nèi)搭載VLA技術(shù)的車型逐步上路時(shí),或許特斯拉FSD和國內(nèi)VLA孰強(qiáng)孰弱將有一個(gè)新的答案。

熱門跟貼