
圖片來源:視覺中國
藍(lán)鯨新聞4月29日訊(記者 陳業(yè) 李卓玲)"從汽車智能化發(fā)展角度而言,目前還處在一個(gè)快速上升、演進(jìn)、變化的時(shí)間點(diǎn),遠(yuǎn)沒有達(dá)到瓶頸。"
前述言論來自藍(lán)鯨汽車日前與商湯絕影CEO,絕影旗下產(chǎn)品線覆蓋駕駛、座艙、云端三大模塊。
近日,商湯絕影也攜系列生成式AI汽車新品亮相上海車展,其中,在駕駛輔助方面,其展示了以VLAR技術(shù)架構(gòu)為核心的生成式智能輔助駕駛R-UniAD技術(shù)方案,宣稱能突破現(xiàn)階段端到端范式下數(shù)據(jù)、安全和性能的三大瓶頸,將實(shí)采場(chǎng)景數(shù)據(jù)的需求降低兩個(gè)數(shù)量級(jí);其世界模型"絕影開悟"升級(jí)為2.0版本,進(jìn)化為近實(shí)時(shí)在線交互的4D世界模型。面向智能座艙,商湯絕影則首發(fā)專為車載AIOS打造的AI內(nèi)核"絕影千機(jī)"。
那么,絕影旗下駕、艙、云三大板塊誰是未來?王曉剛表示,"駕"未來的營收貢獻(xiàn)或更多,但從長遠(yuǎn)來看,這三大板塊并非孤立發(fā)展,會(huì)形成一個(gè)聯(lián)合的業(yè)務(wù)模式。"我們要把汽車的智能化當(dāng)做整體來看。因?yàn)榘殡S智能輔助駕駛的發(fā)展,其應(yīng)用的安全性更高,覆蓋的場(chǎng)景更多,接著還要跟座艙里面的這種體驗(yàn)相結(jié)合,即‘艙駕融合’。"
據(jù)官方數(shù)據(jù)顯示,截至2024年底,商湯絕影已與超30家國內(nèi)外車企達(dá)成合作,覆蓋130余款車型,量產(chǎn)交付累計(jì)360萬輛。其中,在輔助駕駛領(lǐng)域,其量產(chǎn)方案已合作4家車企,上車7款車型,目前,其也正與東風(fēng)合作推動(dòng)UniAD一段式端到端方案的量產(chǎn)落地。
值得關(guān)注的是,去年12月,商湯宣布完成戰(zhàn)略組織架構(gòu)重組,建立了"1+X"架構(gòu)。其中,"1"指生成式AI相關(guān)業(yè)務(wù),包括提供算力的"大裝置"、AI基礎(chǔ)模型和應(yīng)用;"X"則代表生態(tài)企業(yè)矩陣,包括智能汽車"絕影"、家庭機(jī)器人"元蘿卜"等。被藍(lán)鯨汽車問及后續(xù)絕影會(huì)否獨(dú)立融資時(shí),王曉剛予以肯定的答復(fù),但坦言具體時(shí)間表還不方便透露。

商湯絕影CEO,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛
以下為藍(lán)鯨汽車與商湯絕影CEO,商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛的對(duì)話內(nèi)容(經(jīng)刪改整理):
駕駛輔助未來營收占比將更高,絕影后續(xù)有獨(dú)立融資計(jì)劃
Q:了解到商湯絕影其實(shí)是有三大板塊的,駕-艙-云,你覺得哪一塊會(huì)是未來?
王曉剛:現(xiàn)在都差不多。將來如果從收入的角度來說,智能輔助駕駛可能會(huì)再多一些。不過,我覺得這三個(gè)不是一個(gè)孤立的體現(xiàn),會(huì)形成一個(gè)聯(lián)合的業(yè)務(wù)模式。比如說我們提供的世界模型也是智能輔助駕駛非常關(guān)鍵的一部分,但它是部署在云端的。別人在用我們的世界模型時(shí),可能用的是我們的云服務(wù)。再者,座艙里面各種大模型的應(yīng)用,可能也會(huì)落到我們的云上,所以這幾個(gè)里面它是一個(gè)融合的狀態(tài)。
Q:商湯絕影后續(xù)有否獨(dú)立融資規(guī)劃?具體時(shí)間表是如何?
王曉剛:有的。商湯采取的是"1+X"戰(zhàn)略,"1"就是大模型等,"X"代表絕影等板塊。所以后續(xù)絕影是有獨(dú)立融資規(guī)劃的。
Q:能否談?wù)劥舜闻c東風(fēng)的合作?
王曉剛:我們跟東風(fēng)的合作,本身就是非常難能可貴的。比如說目前我們看到智能輔助駕駛,其在端側(cè)、車端的開發(fā)量逐漸在變少,在云端的開發(fā)量實(shí)際上在變多,這里面依托的就是一個(gè)比較強(qiáng)的基礎(chǔ)設(shè)施。從2019年開始,我們就在上海建立AIDC數(shù)據(jù)中心的基礎(chǔ)設(shè)施,這是我們的優(yōu)勢(shì)。
另一方面,車企比如說東風(fēng),它有天然接近于客戶,能得到客戶反饋(數(shù)據(jù))等優(yōu)勢(shì)。我們一起把算法和基礎(chǔ)設(shè)施相結(jié)合,鋪設(shè)打好數(shù)據(jù)的一個(gè)管線,將來能夠不斷地從終端用戶方面得到體驗(yàn)反饋,驅(qū)動(dòng)整個(gè)智能輔助駕駛體驗(yàn)的迭代。
DeepSeek的成功在于強(qiáng)化學(xué)習(xí),但它仍離不開較強(qiáng)的仿真環(huán)境
Q:目前大模型在整個(gè)汽車行業(yè)的應(yīng)用現(xiàn)狀如何?后續(xù)走向?yàn)楹危?/strong>
王曉剛:大模型賦能智能汽車還在一個(gè)快速的發(fā)展階段,無論是從產(chǎn)品體驗(yàn),還是說從技術(shù)架構(gòu),還是能夠有一個(gè)快速的升級(jí)。我們?nèi)ツ暾f的是"端到端"的智能輔助駕駛,今年在這個(gè)基礎(chǔ)上又往前走了一步:世界模型、模擬仿真。
目前大家對(duì)智能輔助駕駛的安全性特別關(guān)注,模擬仿真就可以讓我們反復(fù)重現(xiàn)同一個(gè)場(chǎng)景,并且去泛化到其他的場(chǎng)景里面去,能夠讓安全邊界更有確定性,而且能夠去趕上,甚至超越人的駕駛水平。
座艙的話,也可以看到大模型的這些能力,包括DeepSeek出現(xiàn)之后,它具有的深度思考和推理能力。去年,我們希望說每一臺(tái)車有一個(gè)有趣的靈魂。所謂這個(gè)有趣,它就是建立在一個(gè)深度思考的基礎(chǔ)之上。所以這里面也給我們進(jìn)行座艙各種產(chǎn)品體驗(yàn)提升打開非常大的一個(gè)空間,包括艙駕的融合。當(dāng)然,也可以說為了更有安全性。我們對(duì)駕駛員的狀態(tài)要求會(huì)更高,比如是不是適合駕駛,以及駕駛員的3D視線到底是注視車外的哪些目標(biāo)等,這些我們都能夠通過AI去做到。所以,當(dāng)有危險(xiǎn)場(chǎng)景逼近的時(shí)候,如果駕駛員的注意力不集中,我們背后的AI系統(tǒng)大模型就能夠明確地捕捉到,并采取補(bǔ)救的措施。
Q:之前商湯絕影提出過把強(qiáng)化學(xué)習(xí)引入到端到端智能輔助駕駛訓(xùn)練中,這個(gè)思路是受到DeepSeek的啟發(fā)嗎?您也提到過強(qiáng)化學(xué)習(xí)需要配合強(qiáng)大的世界模型,這背后有什么樣的標(biāo)準(zhǔn)?
王曉剛:DeepSeek的成功是通過強(qiáng)化學(xué)習(xí)產(chǎn)生了原來超越人類的知識(shí)庫,我覺得除了有解題的答案,它會(huì)產(chǎn)生各種解題的思路,但是它離不開比較強(qiáng)的仿真的環(huán)境,和我們所說的世界模型。
比如我們跟東風(fēng)合作"端到端",這里面并不是對(duì)立和矛盾的,實(shí)際上是技術(shù)在研究過程中不斷給我們補(bǔ)充,通過強(qiáng)化學(xué)習(xí)、世界模型,讓我們"端到端"的模型更加強(qiáng)大。
我們對(duì)世界模型的要求還是非常高的。比如我們有11個(gè)攝像頭,這里面要做到時(shí)空的一致性,生成的東西必然要是符合交通法則和各種物理規(guī)律等。如果說有的攝像頭里面是一個(gè)實(shí)線,在其他的攝像頭里面變成了虛實(shí)線,它時(shí)空不一致,把這些數(shù)據(jù)加入到我們的量產(chǎn)訓(xùn)練過程當(dāng)中,它是會(huì)產(chǎn)生各種問題和退化的。所以在這個(gè)過程里,量產(chǎn)的團(tuán)隊(duì)會(huì)對(duì)我們的世界模型提出各種要求,保證時(shí)空一致性和真實(shí)性。
另外就是多樣性和復(fù)雜性,你不能說只在單一一輛車去模擬各種情況,你要仿真各種不同類型的車。目前對(duì)于仿真的要求,不是說在正常的一些交通場(chǎng)景下的數(shù)據(jù),這些數(shù)據(jù)大家已經(jīng)采的是很多了,要求的是各種復(fù)雜極端的交通場(chǎng)景,比如像馬上快要發(fā)生碰撞等場(chǎng)景。
數(shù)據(jù)對(duì)場(chǎng)景多樣性而言仍非常重要
Q:我們一直在強(qiáng)調(diào)仿真,那是否意味著以后數(shù)據(jù)是沒有用的?
王曉剛:數(shù)據(jù)還是很重要。數(shù)據(jù)的重要點(diǎn)在什么地方?比如說DeepSeek,DeepSeek產(chǎn)生了很多沒有出現(xiàn)過的數(shù)據(jù),它在什么過程中產(chǎn)生呢?它是在解題的過程當(dāng)中,你給它問了很難的問題。所以給它提出好問題變得很難。因此現(xiàn)在類似這種DeepSeek的大模型發(fā)展,它遇到的一個(gè)瓶頸是什么?它需要有人給他提出更難的、有價(jià)值的問題。
對(duì)于智能輔助駕駛來說,它的體現(xiàn)是什么?你的駕駛行為因?yàn)橛辛藦?qiáng)化學(xué)習(xí),所以重構(gòu)了這個(gè)場(chǎng)景,你的駕駛行為是可以通過強(qiáng)化學(xué)習(xí)學(xué)出來的。原來大家比較難的點(diǎn)是找不到高質(zhì)量的駕駛行為,現(xiàn)在這個(gè)瓶頸能夠被強(qiáng)化學(xué)習(xí)解掉,但是它缺少什么?它缺少場(chǎng)景,你得告訴它這個(gè)是難的場(chǎng)景,那個(gè)是難的場(chǎng)景。換言之,怎么開它可以通過強(qiáng)化學(xué)習(xí)學(xué)到,但場(chǎng)景的多樣性,這個(gè)不能憑空產(chǎn)生,所以在這方面數(shù)據(jù)還是比較重要的。
Q:之前地平線余凱說99%的人類駕駛數(shù)據(jù)都不值得學(xué)習(xí),你怎么看這個(gè)觀點(diǎn)?
王曉剛:這是一個(gè)很顯然的事情。端到端的自動(dòng)駕駛,它的模式是你輸入視頻、輸出駕駛行為。你開車的時(shí)候,90%的情況下你是勻速直線開車,如果你的行駛軌跡一直都是一條直線,那這種監(jiān)督信號(hào)是沒有用的。只有當(dāng)你駕駛狀態(tài)發(fā)生改變的時(shí)候,比如要避讓、轉(zhuǎn)彎、剎車等情況下,駕駛行為(數(shù)據(jù))是有用的。即便是這種有用的信號(hào)里面,因?yàn)槿撕腿碎_車不一樣,尤其是在比較難的場(chǎng)景,可能10個(gè)司機(jī)有8個(gè)是一些低質(zhì)量的數(shù)據(jù),那就要把這些低質(zhì)量的數(shù)據(jù)剔除掉。實(shí)際上這件事不是一件新鮮事,因?yàn)樵陬愃拼竽P虲hatGPT從互聯(lián)網(wǎng)上搞的這些數(shù)據(jù),90%多的數(shù)據(jù)也是沒有用的,你要不停地去篩選,去掉一些無用的數(shù)據(jù),這是同樣的道理。
"會(huì)基于不同平臺(tái)、方案、傳感器配置,來確定每種技術(shù)方案的安全邊界"
Q:在成本敏感的低價(jià)車型中,商湯絕影如何實(shí)現(xiàn)智能輔助駕駛功能的規(guī)?;渴??
王曉剛:我們會(huì)基于不同的平臺(tái)、不同的方案、不同的傳感器配置,來確定每種技術(shù)方案它的安全邊界到底在哪里:什么樣的事情它是能做的、什么是不能做的。所以這里面對(duì)駕駛方案的成熟性,還有仿真測(cè)試的要求,也會(huì)更高。
Q:目前國內(nèi)智能輔助駕駛賽道中,既有自研的車企玩家,也有供應(yīng)商玩家,如何看待這一賽道的競(jìng)爭(zhēng)?
王曉剛:我們跟東風(fēng)的自研團(tuán)隊(duì)實(shí)際上是有一個(gè)深度的合作。無論是智能輔助駕駛,還是人工智能,它未來發(fā)展的道路還是很長的。將來數(shù)據(jù)其實(shí)是一個(gè)非常核心的影響因素。數(shù)據(jù)在哪里?實(shí)際上是在車廠這里。所以說大家一定要做到智能輔助駕駛的自主可控,把握住數(shù)據(jù)的核心。在智能輔助駕駛的安全性方面,它也有要求。
另外一方面,人工智能的發(fā)展又是一個(gè)長期、需要持續(xù)投入的領(lǐng)域。其目前并未到天花板,而是不斷有新的技術(shù)、范式出現(xiàn),這給了我們一個(gè)比較好的發(fā)展空間。
Q:智能輔助駕駛的終局是什么?
王曉剛:這里應(yīng)該不光是智能輔助駕駛。我們要把汽車的智能化當(dāng)做整體來看,因?yàn)榘殡S智能輔助駕駛的發(fā)展,其應(yīng)用的安全性更高,覆蓋的場(chǎng)景更多,接著還要跟座艙里面的這種體驗(yàn)相結(jié)合,即"艙駕融合"。除了完成基本的通行功能,還要對(duì)整個(gè)的場(chǎng)景做判斷。艙外的智能輔助駕駛數(shù)據(jù),跟艙內(nèi)的體驗(yàn)也會(huì)結(jié)合在一起,所以未來發(fā)展還是有非常大的空間在。
從另一個(gè)角度來說,我們認(rèn)為技術(shù)也并不是到了一個(gè)時(shí)間點(diǎn)就固定下來了。比如去年都在談?wù)?端到端"是不是一個(gè)終極解決方案,但現(xiàn)在來看,"端到端"也有其局限性,所以如今我們討論的世界模型、模擬仿真、強(qiáng)化學(xué)習(xí),這里面的發(fā)展空間還是很大。
汽車智能化還處于快速上升、演進(jìn)、變化的時(shí)間點(diǎn)
Q:目前越來越多的車企開始提L3,您覺得L3還有哪些方面需要完善加強(qiáng)的?
王曉剛:本質(zhì)上我們還要去提升智能輔助駕駛的安全性,這是一個(gè)核心的點(diǎn),原來可能就是在宣傳過程中有各種不嚴(yán)謹(jǐn)。此外,我覺得可能對(duì)人和車間的關(guān)系要求會(huì)更高,包括艙駕融合等。
Q:從汽車智能化發(fā)展角度來看,現(xiàn)在到瓶頸期了嗎?
王曉剛:我覺得還沒有。目前汽車行業(yè)發(fā)展還是非常快的,競(jìng)爭(zhēng)也非常激烈,大家對(duì)新技術(shù)、新趨勢(shì)擁抱程度都非常高。所以,如果是從汽車智能化的角度來看,現(xiàn)在還處在一個(gè)快速上升、演進(jìn)、變化的時(shí)間點(diǎn),遠(yuǎn)沒有達(dá)到瓶頸。
Q:汽車行業(yè)競(jìng)爭(zhēng)越激烈,對(duì)你們而言是機(jī)會(huì)還是挑戰(zhàn)?
王曉剛:有機(jī)會(huì)有挑戰(zhàn)。競(jìng)爭(zhēng)激烈的時(shí)候,說明這個(gè)行業(yè)發(fā)展非???,也給了我們更大的發(fā)展機(jī)會(huì),比如說今年的智能輔助駕駛的爆發(fā)。挑戰(zhàn)的話,會(huì)對(duì)你成本控制、自身交付的能力、交付的質(zhì)量等要求非常高,所以是并存的。
熱門跟貼