打開(kāi)網(wǎng)易新聞 查看精彩圖片




【摘要】中國(guó)自動(dòng)駕駛行業(yè)的端到端技術(shù)競(jìng)賽,隨2024年初馬斯克訪華開(kāi)始愈演愈烈。

但截至2025年,這場(chǎng)革命仍未誕生統(tǒng)一標(biāo)準(zhǔn),Momenta、卓馭、鑒智、元戎、絕影五家分化出了不同的階段式差異。

技術(shù)路線分化背后,也是數(shù)據(jù)主權(quán)、算力效率與商業(yè)模式的博弈。

這場(chǎng)未竟之戰(zhàn),充滿了技術(shù)理想與量產(chǎn)現(xiàn)實(shí)的碰撞,也決定了中國(guó)自動(dòng)駕駛從跟隨到重構(gòu)全球規(guī)則的關(guān)鍵轉(zhuǎn)折。


搜索添加芯流微信Andrew_7251,深入交流更多汽車行業(yè)新進(jìn)展。市場(chǎng)與項(xiàng)目咨詢、人才服務(wù)、決策研判,添加Aristodemus0403。

以下為正文:

2024年初,F(xiàn)SD V12悄然間在北美開(kāi)始加速落地。緊接著的4月28日,特斯拉創(chuàng)始人兼CEO埃隆·馬斯克閃電訪華,爭(zhēng)取獲得數(shù)據(jù)方面的相關(guān)批準(zhǔn)。這一事件在當(dāng)時(shí)被稱為特斯拉FSD入華的“鯰魚(yú)效應(yīng)”。

加之智駕技術(shù)本身趨向躍遷節(jié)點(diǎn),自此,端到端的故事開(kāi)始流傳于國(guó)內(nèi)各大智駕公司。

去年一整年,國(guó)內(nèi)但凡講高階智駕的車企與供應(yīng)商,幾乎都在沖刺“端到端”。

然而,與過(guò)去迅速變化的智駕熱點(diǎn)不同,當(dāng)時(shí)間行進(jìn)至2025年3月,這場(chǎng)高階智駕的狂歡卻仍未形成統(tǒng)一的標(biāo)準(zhǔn)答案。

當(dāng)媒體追問(wèn)“何為真正的端到端”時(shí),不同的受訪公司可以從“感知規(guī)劃一體化”講到“全棧自研大模型”,答案差異頗大。從這個(gè)角度看,盡管端到端已從技術(shù)概念蛻變?yōu)樯虡I(yè)利器,但其技術(shù)內(nèi)核似乎仍處于諸子百家時(shí)代。

與此同時(shí),國(guó)內(nèi)廠商的動(dòng)作也不盡相同。商湯絕影以5.4萬(wàn)塊GPU開(kāi)講世界模型,利用仿真數(shù)據(jù)加持;Momenta在量產(chǎn)車數(shù)據(jù)飛輪基礎(chǔ)上,開(kāi)始沖刺一段式端到端;卓馭早早就開(kāi)始用兩段式端到端布局平民路線,利用硬件優(yōu)勢(shì)在去年底就推出了32TOPS和100TOPS算力的端到端智駕方案;元戎在今年不斷宣發(fā)VLA端到端計(jì)劃;鑒智則是從數(shù)據(jù)閉環(huán)和基礎(chǔ)設(shè)施破局,與車企深度共建,尋求彎道超車的機(jī)會(huì)。

至此,一場(chǎng)熟悉的,關(guān)于技術(shù)路線、商業(yè)模式乃至生存哲學(xué)的未竟之戰(zhàn),又一次在數(shù)據(jù)與算力的硝煙中悄然升級(jí)。

01端到端路線分類

端到端架構(gòu)爆火之前,智能駕駛系統(tǒng)大致由感知、決策、規(guī)控三個(gè)核心板塊組成,大致可以按下圖理解,不同板塊分別承擔(dān)智能駕駛的典型任務(wù)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而端到端自動(dòng)駕駛的核心定義則是:將傳統(tǒng)模塊化架構(gòu)中割裂的感知、決策、規(guī)控等環(huán)節(jié)融合為單一模型,實(shí)現(xiàn)從傳感器輸入到車輛控制指令輸出的全流程自動(dòng)化。

從這個(gè)原始的定義看,最初所說(shuō)的端到端,實(shí)際上是“一段式端到端”,通俗來(lái)講就是全流程貫通,傳感器信號(hào)直接映射為控制信號(hào),中間不保留任何人工定義的功能模塊。

這種路線顯然相對(duì)較為激進(jìn),但效果被寄予厚望。按照絕影智能汽車事業(yè)群總裁王曉剛此前的說(shuō)法,“一段式方案很難,但一旦模型學(xué)出來(lái)能力會(huì)很強(qiáng),這才是我們追求的自動(dòng)駕駛里面的ChatGPT時(shí)刻”。

特斯拉的路線便是純視覺(jué)一段式端到端大模型。

但從上述定義看,一段式端到端的重要基礎(chǔ)便是數(shù)據(jù)資源,這也是去年流傳FSD入華時(shí)馬斯克率先訪華的重要任務(wù)。

實(shí)際上,即使在當(dāng)前這一節(jié)點(diǎn),對(duì)于不少車企和供應(yīng)商而言,即使能夠?qū)⒏兄鸵?guī)控合成一段式大模型,但受制于車型銷量不夠多、數(shù)據(jù)不夠大,也無(wú)法形成有效覆蓋、足夠有底氣的落地應(yīng)用。

有了一段式,兩段式的概念便隨之而來(lái)。從定義看,“兩段式端到端”的架構(gòu)稍微復(fù)雜一些,仍然保留了“感知”和“決策+規(guī)控”兩個(gè)流程,這也是業(yè)內(nèi)流傳的漸進(jìn)式方案。

按照一位智駕產(chǎn)品經(jīng)理的看法,就目前階段而言,模塊化的兩段式端到端方案,即規(guī)控部分使用基于規(guī)則化和基于神經(jīng)網(wǎng)絡(luò)的規(guī)控算法并行,既可以使智駕更加擬人化,提高系統(tǒng)性能上限,又可以有相對(duì)的安全兜底,守住系統(tǒng)下限,是當(dāng)前階段智駕系統(tǒng)最優(yōu)的解決方案之一。

除此之外的第三類思路是端到端架構(gòu)與多模態(tài)大模型的結(jié)合。

所謂多模態(tài)大模型,指的是在多種數(shù)據(jù)模態(tài)(如文本、圖像、聲音等)上進(jìn)行訓(xùn)練的人工智能模型。業(yè)內(nèi)較火的VLM(視覺(jué)-語(yǔ)言模型),以及基于此更進(jìn)一步的VLA(視覺(jué)-語(yǔ)言-動(dòng)作模型),都屬于多模態(tài)大模型。

基于此,也衍生出了VLA端到端、VLM端到端的思路,旨在通過(guò)統(tǒng)一的語(yǔ)言空間表征實(shí)現(xiàn)從傳感器輸入到規(guī)劃任務(wù)輸出的完整自動(dòng)化流程。

VLA目前尚不成熟,處于預(yù)研階段,整體完成度比較好的是Waymo EMMA,除Waymo外,Wayve也宣稱其在構(gòu)建以端到端AI為核心的AV2.0智駕系統(tǒng)。

02五大廠商路線對(duì)比

僅就方案商而言,國(guó)內(nèi)沖刺高階智駕的幾家大多都在第一時(shí)間組建了端到端團(tuán)隊(duì),部分甚至很早就建立了預(yù)研團(tuán)隊(duì)。

其中,商湯絕影屬于一段式端到端路線(不考慮量產(chǎn)),Momenta從去年下半年也開(kāi)始沖刺一段式,卓馭屬于兩段式/模塊化端到端路線,元戎則屬于VLA端到端路線(不考慮量產(chǎn))。

一段式端到端方面,絕影的技術(shù)路線源于2022年商湯及聯(lián)合實(shí)驗(yàn)室提出的行業(yè)首個(gè)感知決策一體化的自動(dòng)駕駛通用模型UniAD,后者榮獲CVPR 2023最佳論文。

具體而言,UniAD將感知、決策、規(guī)劃等模塊都整合到一個(gè)全棧Transformer端到端模型,實(shí)現(xiàn)感知決策一體化的端到端智能駕駛。2024年北京車展,商湯絕影展出了這一方案的階段性成果。

近期,商湯絕影又發(fā)布了行業(yè)首個(gè)與世界模型協(xié)同交互的端到端自動(dòng)駕駛技術(shù)路線R-UniAD,通俗來(lái)講是把強(qiáng)化學(xué)習(xí)引入到端到端自動(dòng)駕駛訓(xùn)練中,并加入了與世界模型的協(xié)同交互,用仿真數(shù)據(jù)做強(qiáng)化。

當(dāng)然,跨越式端到端的難點(diǎn)有目共睹,業(yè)內(nèi)不選擇這個(gè)更激進(jìn)的方案,不僅因?yàn)橘Y源瓶頸,也因?yàn)閷?duì)技術(shù)路線的平滑度存在顧慮。

對(duì)于絕影選擇一段式端到端,業(yè)內(nèi)的評(píng)價(jià)也并不一致。

業(yè)內(nèi)人士分析,一段式端到端對(duì)技術(shù)的研發(fā)能力要求非常高,絕影本身繼承了商湯曾經(jīng)的學(xué)術(shù)化氣質(zhì),技術(shù)研發(fā)的底子厚,更像一個(gè)半學(xué)術(shù)組織,所以才有了這樣的決策?,F(xiàn)在判斷路線正確與否還為時(shí)過(guò)早,關(guān)鍵還是要看技術(shù)的量產(chǎn)落地如何。

與絕影不同,鑒智的破局路線是尋求與車企的深度共建。后者是業(yè)內(nèi)少有的破開(kāi)車企與方案商零和博弈的心態(tài),“車企與算法公司的協(xié)同,不僅是技術(shù)升級(jí)的需求,更是構(gòu)建數(shù)據(jù)閉環(huán)、降低基礎(chǔ)設(shè)施投入的必然選擇?!?/p>

舉例而言,鑒智機(jī)器人率先與嵐圖汽車展開(kāi)深度合作,雙方以量產(chǎn)項(xiàng)目為基石,共享數(shù)據(jù)與工具鏈,共同推進(jìn)高速NOA規(guī)?;涞兀瑫r(shí)加速推進(jìn)端到端城區(qū)NOA量產(chǎn)。

算法能力自研,數(shù)據(jù)和嵐圖共建,并打造基礎(chǔ)設(shè)施和工具鏈,實(shí)現(xiàn)端到端。這一模式不僅助力車企在智駕標(biāo)配戰(zhàn)役中占據(jù)先機(jī),更通過(guò)數(shù)據(jù)反哺加速技術(shù)迭代,為后續(xù)降本普惠奠定基礎(chǔ)。據(jù)悉,鑒智的端到端全場(chǎng)景城區(qū)智駕方案,已經(jīng)與嵐圖共同打造中。

從運(yùn)營(yíng)邏輯上看,這個(gè)實(shí)現(xiàn)路徑也是中小型算法供應(yīng)商最好的破局路線。

業(yè)內(nèi)余下的幾家中,市占率和上車數(shù)據(jù)較多的Momenta,從去年開(kāi)始就主張端到端用一個(gè)大模型來(lái)貫通智駕的感知、預(yù)測(cè)決策、控制環(huán)節(jié),從過(guò)往工程師手寫(xiě)規(guī)則告訴車輛如何行駛,到使用AI大模型、海量數(shù)據(jù)、云端大算力,讓智駕具備自我進(jìn)化能力。

按照曹旭東受訪的口徑,Momenta在2023年初量產(chǎn)兩段式端到端,2024年進(jìn)化到一段式端到端方案。

據(jù)此前宣發(fā)消息,上汽智己、東風(fēng)日產(chǎn)都與Momenta聯(lián)合開(kāi)發(fā)了一段式端到端高階智駕系統(tǒng)。

兩段式/模塊化端到端方面,卓馭選擇也相對(duì)較為保守。

與一眾從創(chuàng)立之初就高調(diào)宣布遠(yuǎn)大目標(biāo)的智駕公司相比,卓馭科技反而一直在扎根中算力路線,一直在追求低算力實(shí)現(xiàn)高階功能。

舉例而言,行業(yè)主流“端到端”智駕方案大多基于英偉達(dá)Orin-X芯片平臺(tái),至少需要254TOPS算力,像用于仰望品牌的比亞迪天神之眼A,算力達(dá)到508TOPS,長(zhǎng)安汽車也表示未來(lái)高階智駕汽車將全系標(biāo)配500TOPS以上的算力。

但2024年底卓馭推出的32TOPS和100TOPS算力端到端智駕方案中,前一方案硬件配置為7個(gè)攝像頭+TDA4 VH芯片,搭載在寶駿、奇瑞iCAR等車型上,可實(shí)現(xiàn)高速巡航和城區(qū)記憶領(lǐng)航,今年上半年將實(shí)現(xiàn)端到端城市領(lǐng)航;100TOPS版本使用了高通Ride 8650芯片,可支持城區(qū)無(wú)圖NOA,已在一汽紅旗的E007、E009等車型上量產(chǎn)落地。二者都是在用中算力做端到端。

這種折中也讓端到端更加“可解釋”,能獲取相應(yīng)的感知和預(yù)測(cè)結(jié)果。

從戰(zhàn)略風(fēng)格上看,卓馭似乎一直不在乎誰(shuí)更能代表“純血”端到端,而一心趴在了能如何解決端到端上車問(wèn)題上,這似乎更符合當(dāng)下車企對(duì)性價(jià)比的狂熱追尋。

VLA端到端方面,元戎啟行CEO周光在公司C輪融資之后便透露,本輪融資,元戎啟行將主要用途放在夯實(shí)國(guó)內(nèi)量產(chǎn)項(xiàng)目,拓展海外業(yè)務(wù),同時(shí)為元戎啟行探索Robotaxi商業(yè)化運(yùn)營(yíng)和布局VLA等前沿技術(shù)提供資金支撐。

按照智駕網(wǎng)此前的報(bào)道,周光的想法更加獨(dú)特,在他看來(lái),現(xiàn)在所有的一段式、兩段式方案都是端到端1.0(版本),甚至都不能稱之為端到端,而元戎則已經(jīng)投入了更多的精力在下一站的VLA模型,這才是端到端2.0(版本)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

按照官方消息,元戎下一步計(jì)劃在英偉達(dá)Thor芯片上進(jìn)行開(kāi)發(fā),不過(guò)Thor推遲到明年年中量產(chǎn),高性能Thor估計(jì)年底,因此其VLA大概率到時(shí)才能卷起聲量。當(dāng)前元戎正在做高通平臺(tái)的適配,志在出海。

VLA 的落地有其難度。除了模型本身的研發(fā)需要時(shí)間,硬件的限制無(wú)法逾越?,F(xiàn)在市面上可采購(gòu)到的芯片,性能基本都無(wú)法支持 VLA 的運(yùn)行。

不過(guò),值得一提的是,長(zhǎng)城汽車可能與元戎有關(guān)聯(lián)。

據(jù)企查查數(shù)據(jù),深圳元戎第六大股東為保定訊奇科技有限公司,保定訊奇的上一層控制主體為保定市蓮池區(qū)南大園鄉(xiāng)集體資產(chǎn)經(jīng)管中心(即魏建軍老家的鄉(xiāng)鎮(zhèn)資產(chǎn))。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

具體而言,長(zhǎng)城如此操作既能保持對(duì)元戎的影響力,又避免了上市公司與供應(yīng)商的強(qiáng)綁定關(guān)系,資本市場(chǎng)監(jiān)管壓力相對(duì)更少,為將來(lái)操作留下了部分余地。

除此之外,長(zhǎng)城當(dāng)前的智駕策略是三條腿賽馬,同時(shí)與毫末智行、Momenta、元戎都有接觸。如果直接入股元戎,與其他供應(yīng)商的關(guān)系很可能會(huì)變得更加微妙,這一選擇尚不影響其根據(jù)市場(chǎng)變化靈活調(diào)整供應(yīng)商組合,保留了更多動(dòng)態(tài)選擇權(quán)。

03尾聲:端到端的中國(guó)式突圍

中國(guó)端到端生態(tài)的多元性,本質(zhì)上還是技術(shù)理想與商業(yè)現(xiàn)實(shí)碰撞的產(chǎn)物,這與十年前自動(dòng)駕駛剛剛在業(yè)內(nèi)興起時(shí)的選擇有不少相似之處。

如何搶節(jié)點(diǎn)、怎樣做前瞻布局,很可能也埋下了當(dāng)前這些公司的未來(lái)結(jié)局。

短期來(lái)看,數(shù)據(jù)與算力的平權(quán)可能為成為勝負(fù)手。

故事的另一面,卓馭在講一個(gè)算力效率的故事,能夠提供的是絕對(duì)規(guī)模之外的超車路徑。

與此同時(shí),VLA模型與端到端的結(jié)合,正在模糊自動(dòng)駕駛與通用人工智能的邊界,盡管尚未量產(chǎn),已經(jīng)拿到了不少資方關(guān)注。

在這場(chǎng)未竟之戰(zhàn)中,中國(guó)廠商擅長(zhǎng)的事情是迅速進(jìn)化,當(dāng)特斯拉端到端不再如鯰魚(yú)入海,中國(guó)式突圍正在重新定義新的駕駛思維。


搜索添加芯流微信Andrew_7251,深入交流更多汽車行業(yè)新進(jìn)展。市場(chǎng)與項(xiàng)目咨詢、人才服務(wù)、決策研判,添加Aristodemus0403。

- XINLIU -

喜歡就獎(jiǎng)勵(lì)芯流一個(gè)“”和“在看”唄~