嚴(yán)選好車163的第1161次推送

打開網(wǎng)易新聞 查看精彩圖片

2025年的中國智駕技術(shù)市場,速度在變快,方向卻不算清晰。

一邊是量產(chǎn)車型不斷增加,高階輔助駕駛開始普及到十萬元以內(nèi)的入門車型;另一邊,關(guān)于安全、責(zé)任和監(jiān)管的討論也從未停下。技術(shù)公司和車企在交付、用戶教育和系統(tǒng)穩(wěn)定性之間反復(fù)拉扯,一些舊有路徑正在失效,一些新方法開始被試探。

就在這樣的背景下,商湯絕影選擇把生成式AI引入車上。它嘗試用世界模型和強(qiáng)化學(xué)習(xí)來重新訓(xùn)練一輛車的駕駛策略,也開始在座艙層重寫操作系統(tǒng)邏輯,從AI內(nèi)核到交互框架都自己構(gòu)建。

打開網(wǎng)易新聞 查看精彩圖片

“我們希望打造智能輔助駕駛通用大腦?!?/strong>商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表述他們的目標(biāo)。

這聽上去有些激進(jìn)。但在通用模型的技術(shù)機(jī)會(huì)和輔助駕駛尚未收斂的節(jié)點(diǎn)上,或許也不是一種過早的設(shè)想。

一、進(jìn)入深水區(qū):輔助駕駛的機(jī)會(huì)與挑戰(zhàn)

2024年下半年,輔助駕駛系統(tǒng)正快速下沉到更多車型與價(jià)格區(qū)間。數(shù)據(jù)顯示,中國市場搭載L2級(jí)輔助駕駛的車型數(shù)量持續(xù)走高,甚至出現(xiàn)在十萬元級(jí)別的家用轎車上。技術(shù)在普及的同時(shí),系統(tǒng)能力、安全爭議、監(jiān)管標(biāo)準(zhǔn)等問題也被一并放大。

王曉剛對(duì)這個(gè)階段的判斷是“市場爆發(fā)”,他認(rèn)為,用戶對(duì)于智駕系統(tǒng)的感知和理解還遠(yuǎn)未成熟,這一輪普及更像是一個(gè)教育過程?!昂芏嗳似鋵?shí)不知道怎么去用智駕?!痹谒磥恚@種信息差帶來的風(fēng)險(xiǎn)并非個(gè)案,如果在這個(gè)階段不進(jìn)行正確引導(dǎo)和認(rèn)知,出現(xiàn)大量事故,整個(gè)行業(yè)會(huì)受到很大的打擊。

輔助駕駛不是新事物,但從過去強(qiáng)調(diào)“能不能跑起來”,到如今關(guān)注“跑得穩(wěn)不穩(wěn)”,行業(yè)的核心衡量標(biāo)準(zhǔn)發(fā)生了變化。王曉剛認(rèn)為,評(píng)判一個(gè)智駕方案的水平,主要看兩點(diǎn):安全性和場景覆蓋度。尤其在城市復(fù)雜交通環(huán)境下,連續(xù)性的決策能力成了分水嶺。

從技術(shù)路徑來看,行業(yè)過去幾年熱衷端到端模型訓(xùn)練,但如今正在逐步暴露出訓(xùn)練數(shù)據(jù)依賴重、泛化能力弱的瓶頸。“哪怕是百萬級(jí)數(shù)據(jù),也很難遇到真正的極端情況。”王曉剛提到,“端到端模型很大程度是在模仿人類駕駛,但它對(duì)沒有見過的場景,處理就會(huì)很不確定。”這也意味著,在能力上,端到端方案往往難以超越人類司機(jī)的決策極限。

與此同時(shí),監(jiān)管態(tài)度也發(fā)生了變化。近期,工信部提出對(duì)智能駕駛系統(tǒng)實(shí)施更加審慎的監(jiān)管策略。這在技術(shù)圈被看作是對(duì)行業(yè)節(jié)奏的一次“勒馬”。但王曉剛并不認(rèn)為這是壞事,“我們正好可以用這個(gè)窗口期,加強(qiáng)測試和系統(tǒng)的安全策略建設(shè)?!?/p>

對(duì)供應(yīng)商而言,這輪行業(yè)進(jìn)入深水區(qū)不僅是交付壓力,也是技術(shù)價(jià)值的檢驗(yàn)期。沒有什么比“車端上的表現(xiàn)”更具說服力。接下來的問題是:如何做得更好?以及,是否還有機(jī)會(huì)做得不同?

二、世界模型的作用不只是“仿真”

2025年,商湯絕影將生成式AI引入輔助駕駛系統(tǒng),推出端到端技術(shù)方案R-UniAD,目標(biāo)是突破目前技術(shù)路線的瓶頸,重建一套能夠動(dòng)態(tài)學(xué)習(xí)、自我進(jìn)化的智能駕駛系統(tǒng)。

核心思路在于“世界模型+強(qiáng)化學(xué)習(xí)”的組合。傳統(tǒng)的端到端系統(tǒng)依賴真實(shí)路況數(shù)據(jù)進(jìn)行訓(xùn)練,但極端場景的數(shù)據(jù)本身極為稀缺,哪怕是百萬輛車的運(yùn)行日志,其中真正能用于訓(xùn)練高風(fēng)險(xiǎn)應(yīng)對(duì)的片段不到1%。世界模型的引入,試圖重構(gòu)這個(gè)限制。

在商湯定義中,“世界模型”不僅是仿真環(huán)境,更是一個(gè)具備動(dòng)態(tài)重構(gòu)、可控生成能力的數(shù)據(jù)生產(chǎn)系統(tǒng)。通過“絕影開悟2.0”世界模型,工程師可以將路測視頻解耦、建模、重建,構(gòu)建出帶有空間結(jié)構(gòu)與物理邏輯的4D場景。接著,再以強(qiáng)化學(xué)習(xí)算法訓(xùn)練AI駕駛模型在這些場景中反復(fù)試錯(cuò),逐步形成“高反饋-高優(yōu)化”的閉環(huán)。

打開網(wǎng)易新聞 查看精彩圖片

R- UniAD架構(gòu)也做了層級(jí)分段。首先通過模仿學(xué)習(xí)完成冷啟動(dòng)訓(xùn)練,其次是世界模型中的仿真環(huán)境訓(xùn)練強(qiáng)化學(xué)習(xí)模型,最后將云端大模型蒸餾為可部署在車端的小模型。這意味著算法在安全邊界內(nèi)可以充分訓(xùn)練、打磨,然后被移植到資源受限的硬件上,完成最終落地。

打開網(wǎng)易新聞 查看精彩圖片

在上海車展上,絕影團(tuán)隊(duì)展示了“施工占道剎?!边@樣一個(gè)典型難場景的演練流程。在傳統(tǒng)的端到端方案中,這類復(fù)雜場景由于缺乏真實(shí)數(shù)據(jù),很難被有效覆蓋?!斑@些特殊場景往往是數(shù)據(jù)訓(xùn)練的難點(diǎn),我們通過真實(shí)采集也很難遇到,更別說反復(fù)驗(yàn)證了?!蓖鯐詣偙硎?。R-UniAD不僅能完成幾何場景重建,還能模擬車輛軌跡,并通過評(píng)分機(jī)制反復(fù)優(yōu)化駕駛策略?!拔覀兡茏屇P驮谶@個(gè)場景里跑幾千遍,通過反饋系統(tǒng)找出最優(yōu)的應(yīng)對(duì)策略?!蓖鯐詣傉f。

相比傳統(tǒng)方案的工程耗時(shí),R-UniAD的優(yōu)勢是效率和場景控制力。“我們可以在幾小時(shí)內(nèi)完成一個(gè)場景的訓(xùn)練流程,而且這些訓(xùn)練可以是結(jié)構(gòu)化的、有方向的?!?/p>

在行業(yè)對(duì)“確定性安全”的呼聲越來越高的當(dāng)下,這種方式的出現(xiàn),意味著安全不再只是依賴經(jīng)驗(yàn)和測試樣本的累積,而可以主動(dòng)生成與泛化。

三、AIOS不是助手,而是操作系統(tǒng)

與生成式智駕并行推進(jìn)的,是商湯絕影在車載AI操作系統(tǒng)上的探索。

在商湯看來,過去的智能座艙仍是“指令-響應(yīng)”的交互范式,本質(zhì)是把語音助手嵌入車機(jī)UI,沒有系統(tǒng)性重構(gòu)。而所謂AIOS,應(yīng)該是一套以AI為內(nèi)核,從感知到記憶、從決策到交互都能自我進(jìn)化的智能體系統(tǒng)。

2024年11月,商湯發(fā)布車載AIOS內(nèi)核“絕影千機(jī)”,結(jié)合MOE多模態(tài)模型、類人記憶架構(gòu)與原生智能體框架,構(gòu)建了AI操作系統(tǒng)的底層邏輯。它不僅重寫了操作系統(tǒng)的數(shù)據(jù)流路徑,也提出了開發(fā)層級(jí)的統(tǒng)一接口標(biāo)準(zhǔn),支持智能體開發(fā)者進(jìn)行快速適配。

打開網(wǎng)易新聞 查看精彩圖片

“我們把車當(dāng)成一個(gè)智能體系統(tǒng)來看待,它有自己的感知、記憶、規(guī)劃和動(dòng)作?!?/b>王曉剛說。類人記憶模塊將用戶的偏好、交互、環(huán)境等信息在“瞬時(shí)-情境-長期”中進(jìn)行分類沉淀,為智能體的行為提供上下文。這種系統(tǒng)也強(qiáng)調(diào)隱私性,私密數(shù)據(jù)在端側(cè)封閉運(yùn)行。

在交互界面上,New Member則是“絕影千機(jī)”最直觀的產(chǎn)品體現(xiàn)。在多個(gè)演示場景中,它不再是被動(dòng)問答的助手,而能夠識(shí)別場景中的用戶狀態(tài)、語義暗示、甚至情緒波動(dòng)。例如,在車主討論雨崩徒步路線時(shí),它能自動(dòng)插話提醒羽絨服;在情侶爭執(zhí)出行方式時(shí),它嘗試緩解情緒、提供選擇。

打開網(wǎng)易新聞 查看精彩圖片

此外,New Member首次實(shí)現(xiàn)免喚醒的多人多輪交互,在座艙多人環(huán)境中自動(dòng)感知對(duì)話并參與。“我們不是在做一個(gè)更智能的語音助手,而是在搭建一個(gè)面向未來的AI中臺(tái)?!鄙虦^影團(tuán)隊(duì)成員表示。

對(duì)車企來說,“重寫操作系統(tǒng)”意味著系統(tǒng)主導(dǎo)權(quán)、數(shù)據(jù)閉環(huán)能力與生態(tài)控制力的變化。在合作層面,商湯正在將“絕影千機(jī)”與車企現(xiàn)有的OS進(jìn)行適配整合,試圖打造統(tǒng)一的AIOS生態(tài)。

四、向量產(chǎn)駛?cè)ィ簲?shù)據(jù)閉環(huán)之外的落地問題

技術(shù)之外,量產(chǎn)是更嚴(yán)峻的考題。

截至2025年第一季度,商湯絕影的輔助駕駛方案已合作超30家車企,覆蓋130余款車型,累計(jì)交付超360萬輛。年初與廣汽合作的基于地平線征程?6M平臺(tái)的輔助駕駛系統(tǒng)正式上市;與奇瑞合作的地平線征程?6E平臺(tái)方案、與東風(fēng)合作基于英偉達(dá)Thor平臺(tái)的一段式端到端方案也計(jì)劃在今年完成交付。

打開網(wǎng)易新聞 查看精彩圖片

與絕影的高端Thor平臺(tái)方案并行推進(jìn)的,還有中低端市場的J6E/J6M平臺(tái)。這些多層次的產(chǎn)品線背后,是對(duì)車企多樣化成本結(jié)構(gòu)和需求的回應(yīng)。

但交付規(guī)模并不意味著風(fēng)險(xiǎn)結(jié)束。目前行業(yè)內(nèi)尚未形成統(tǒng)一的安全評(píng)估標(biāo)準(zhǔn),大模型在車端的更新機(jī)制和責(zé)任歸屬依然模糊。

此外,智能駕駛系統(tǒng)的成本壓縮空間已相當(dāng)有限。王曉剛在采訪中坦言,“車的價(jià)格戰(zhàn)已經(jīng)是極限狀態(tài),價(jià)格繼續(xù)壓縮并不利于行業(yè)發(fā)展。最終我們還是要做到可盈利,才是可持續(xù)的。”

在被問到中國產(chǎn)智駕能否追上特斯拉時(shí),他給出的回答是,“特斯拉靠的是700萬輛車的數(shù)據(jù)閉環(huán)。我們需要靠生成式AI和世界模型去縮短這個(gè)差距?!彼M(jìn)一步解釋說:“你很難在真實(shí)世界中采集足夠多的極端場景,不僅成本高,而且存在風(fēng)險(xiǎn)。世界模型讓我們可以用仿真來還原這些場景,強(qiáng)化學(xué)習(xí)則是通過數(shù)千次的試錯(cuò),讓系統(tǒng)學(xué)會(huì)如何應(yīng)對(duì),而不是單純模仿人類駕駛?!?/p>

智能駕駛的未來充滿不確定性,但對(duì)于商湯絕影而言,重構(gòu)能力邊界與工程交付能力,兩者缺一不可。眼下,他們正試圖在這場比拼中同時(shí)發(fā)力。

走的人多了 也便成了路

絕影的系統(tǒng),已經(jīng)出現(xiàn)在了幾百萬輛車上。但這并不意味著挑戰(zhàn)結(jié)束,可能恰恰是剛剛開始。

技術(shù)上,它還在和傳統(tǒng)端到端方法拉開差異,需要靠世界模型和強(qiáng)化學(xué)習(xí)真正跑通訓(xùn)練閉環(huán);工程上,它要面對(duì)不同平臺(tái)、不同成本預(yù)期下的交付要求;系統(tǒng)上,它還要證明自己不是一個(gè)“語音助手Plus”,而是一套可以運(yùn)行的智能體系。

在中國智駕產(chǎn)業(yè)進(jìn)入深水區(qū)的當(dāng)口,每家公司都在尋找自己的穩(wěn)定支點(diǎn)。有的選擇沿用既有方案,在成本和效率中博弈;也有的像商湯絕影這樣,從底層邏輯重做,希望把大模型帶來的能力變成新的系統(tǒng)能力。

沒人能確認(rèn)下一階段會(huì)是誰主導(dǎo),但至少現(xiàn)在,這條路徑是清晰的:

如果智能駕駛真要走到“超越人類”的階段,它首先要自己知道在看什么、怎么想、該不該動(dòng)。