版權(quán)聲明:本文版權(quán)為網(wǎng)易汽車所有,轉(zhuǎn)載請注明出處。

網(wǎng)易汽車4月24日報道 4月23日,2025上海車展上,商湯絕影展示了一系列生成式AI汽車產(chǎn)品,包括以VLAR技術(shù)架構(gòu)為核心的生成式智駕R-UniAD技術(shù)方案,并發(fā)布近實時在線交互的4D世界模型“絕影開悟2.0”。在輔助駕駛領(lǐng)域,商湯絕影的量產(chǎn)方案已合作4家車企,上車7款車型。今年3月底,絕影和廣汽聯(lián)合打造基于地平線征程?6M的輔助駕駛方案正式量產(chǎn)上市,在英偉達(dá)DIRVE AGX Thor平臺部署的絕影UniAD一段式端到端量產(chǎn)方案,也將于2025年第四季度量產(chǎn)交付東風(fēng)汽車。

面向智能座艙,商湯絕影行業(yè)首發(fā)專為車載AIOS打造的AI內(nèi)核“絕影千機(jī)”,助力車企打造下一代AIOS,“家庭新成員”New Member全新升級,New Member擁有多模態(tài)識人、深度思考、免喚醒多人多輪對話等功能。此外,商湯絕影的健康管家、安全衛(wèi)士和3D交互等AI座艙創(chuàng)新產(chǎn)品也相繼亮相。

商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示:“真正的AI汽車是將生成式AI深度融入智駕和座艙,既讓輔助駕駛安全變得更有確定性,也要讓每一輛車擁有‘有趣的靈魂’。”

絕影2025上海車展發(fā)布會商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛
打開網(wǎng)易新聞 查看精彩圖片
絕影2025上海車展發(fā)布會商湯絕影CEO、商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛

展示以VLAR為核心的生成式智駕R-UniAD

算法、算力和數(shù)據(jù)三者共同推動著人工智能技術(shù)的螺旋式上升和進(jìn)步,隨著強(qiáng)化學(xué)習(xí)等算法引入到大模型訓(xùn)練的思路得到驗證,新的尺度定律正在開啟,數(shù)據(jù)價值被進(jìn)一步深入挖掘,模型能力天花板被打開。與此同時,智能駕駛范式也正在加速演進(jìn)。

2025年2月,商湯絕影發(fā)布行業(yè)首個與世界模型協(xié)同交互的端到端技術(shù)路線R-UniAD,通過世界模型生成在線交互的仿真環(huán)境,以此進(jìn)行端到端模型的強(qiáng)化學(xué)習(xí)訓(xùn)練,以打破數(shù)據(jù)瓶頸,提升系統(tǒng)性能上限。本屆上海車展上,商湯絕影全面展示了R-UniAD技術(shù)方案,基于世界模型和強(qiáng)化學(xué)習(xí)兩大核心技術(shù),構(gòu)建集“視覺-語言-行動-強(qiáng)化學(xué)習(xí)”于一體的VLAR技術(shù)架構(gòu),實現(xiàn)生成式智駕的核心突破。

打開網(wǎng)易新聞 查看精彩圖片

基于世界模型和強(qiáng)化學(xué)習(xí),絕影構(gòu)建集“視覺-語言-行動-強(qiáng)化學(xué)習(xí)”于一體的VLAR技術(shù)架構(gòu)

施工占道場景是輔助駕駛領(lǐng)域的棘手難題,也是交通事故頻發(fā)的重要場景。商湯絕影現(xiàn)場演示了針對“施工占道剎?!眻鼍?,R-UniAD如何依托“VLAR”增強(qiáng)模型能力。

首先,以“施工占道剎停”路測視頻作為輸入,R-UniAD基于“絕影開悟”世界進(jìn)行模型4D仿真復(fù)現(xiàn),然后端到端模型生成該場景下各種可能駕駛策略,并與世界模型生成的環(huán)境交互,反復(fù)強(qiáng)化學(xué)習(xí)中找到最優(yōu)路徑,能預(yù)判施工占道,絲滑變道繞行。經(jīng)過泛化訓(xùn)練后,遇到類似場景,端到端模型也能及時變道,并顯著提升對此類施工場景的泛化交互能力。

生成式R-UniAD突破了現(xiàn)階段端到端范式下數(shù)據(jù)、安全和性能的三大瓶頸,將實采場景數(shù)據(jù)的需求降低兩個數(shù)量級;同時,基于強(qiáng)化學(xué)習(xí)算法,模型充分探索多元場景的安全邊界;最終,R-UniAD將能夠?qū)崿F(xiàn)遠(yuǎn)超人類的駕駛能力,打造智能駕駛的新路標(biāo)。

“絕影開悟”世界模型2.0,決勝智駕戰(zhàn)場的武器

世界模型是生成式智駕的基石所在。2024年,在2024年11月“絕影實力AI DAY”上,商湯絕影發(fā)布了行業(yè)標(biāo)桿級別的“絕影開悟”世界模型,并已經(jīng)應(yīng)用于真值數(shù)據(jù)的生產(chǎn)。

去年“絕影開悟”世界模型主要聚焦2D視頻生成技術(shù)的打磨,今年上海車展,“絕影開悟”升級為2.0版本,進(jìn)化為近實時在線交互的4D世界模型,能夠?qū)崿F(xiàn)“4D空間自由交互”,成為商湯絕影決勝智駕戰(zhàn)場的重磅武器。

絕影開悟世界模2.0
打開網(wǎng)易新聞 查看精彩圖片
絕影開悟世界模2.0

“絕影開悟2.0”具備三大能力,首先是“面向量產(chǎn)的數(shù)據(jù)生成”,它具有多樣性場景的可控生成的能力,能一鍵生成極端高風(fēng)險場景,為模型訓(xùn)練提供了海量且豐富的訓(xùn)練數(shù)據(jù)。

其次它能夠?qū)崿F(xiàn)“復(fù)雜場景自由復(fù)現(xiàn)”,可以根據(jù)不同的需求,隨心所欲地修改和調(diào)整場景中的各種要素,改變道路的布局、車輛的速度和類型,助力重構(gòu)仿真測試場景。

最后,“絕影開悟2.0”具備近實時交互能力,比行業(yè) SOTA 提升5倍之多,讓仿真訓(xùn)練過程更加高效和逼真,車輛的決策和反饋能夠幾乎在瞬間得到響應(yīng);同時感知結(jié)果接近真實精標(biāo)數(shù)據(jù)98%,能避免因數(shù)據(jù)風(fēng)格差異帶來的 Sim-to-Real 遷移時能力退化問題,為端到端模型打造“云端虛擬訓(xùn)練場”。

行業(yè)首發(fā)AI內(nèi)核“絕影千機(jī)”,助力車企打造下一代AIOS

生成式AI不僅帶來了智駕新范式,同時也在深度融入智能座艙。商湯絕影重磅發(fā)布行業(yè)首個專為車載AIOS打造的AI內(nèi)核“絕影千機(jī)”,助力車企打造下一代AIOS。最核心的三大技術(shù)包括MOE多模態(tài)大模型、類人記憶框架以及原生智能體框架。同時,AI 基礎(chǔ)系統(tǒng)模塊、AIOS 工具鏈和生成式 UI等外圍技術(shù),為三大核心模塊提供支持與交互。

商湯絕影行業(yè)首發(fā)AI內(nèi)核“絕影千機(jī)”
打開網(wǎng)易新聞 查看精彩圖片
商湯絕影行業(yè)首發(fā)AI內(nèi)核“絕影千機(jī)”

依托于“日日新SenseNova V6”基模型,商湯絕影構(gòu)建了覆蓋0.1B 至70B汽車垂類模型矩陣,模型首字延遲小于300ms,吐字速度高達(dá)47 Tokens/s,性能超越DeepSeek,還能在快慢思考之間自如切換,契合每一種場景需求。

同時,具備類人情感的座艙系統(tǒng),離不開記憶。商湯絕影構(gòu)建了業(yè)內(nèi)首個端側(cè)類人記憶框架,賦予AIOS真正的認(rèn)知力與成長性,每一次交互都讓它更懂用戶。

為了便于打造智能體生態(tài),絕影構(gòu)建了業(yè)內(nèi)首個支持 MCP 協(xié)議的端側(cè)原生智能體框架。它具備強(qiáng)大的自主規(guī)劃能力,可進(jìn)行多步的精準(zhǔn)規(guī)劃和執(zhí)行。它支持 MCP 規(guī)范,能快速接入各類生態(tài)服務(wù)和工具能力,目前已集成100+ 智能體與1000+ API。這個框架還支持多智能體協(xié)調(diào)機(jī)制,能夠?qū)崿F(xiàn)并發(fā)、串行及混合模式下的高效協(xié)同,整體性能提升超過30%。

“聰明搭子”New Member全新升級

商湯絕影去年發(fā)布了“A New Member For U”(你的家庭新成員),讓每一輛車擁有“有趣的靈魂”。今年上海車展,New Member全新升級,還能在車展現(xiàn)場上車進(jìn)行沉浸式體驗。

首先New Member擁有了多模態(tài)識人能力,不需要用戶專門進(jìn)行注冊,它在座艙多人交互的過程推測出每個人的名字,與相貌的結(jié)合,人物之間的關(guān)系。New member不僅“認(rèn)識你”,還能“理解你”,在和用戶長期的互動過程當(dāng)中,它不但能夠記住興趣愛好,還能記住生活的點滴,產(chǎn)生共情,從而更貼心地進(jìn)行互動。

同時,它還具備深度思考的能力,表達(dá)會更加生動有趣。同時,當(dāng)用戶提出需求時,小影不是被動響應(yīng),而是會結(jié)合記憶與場景,主動分析疲憊情緒、家庭需求甚至天氣變化進(jìn)行綜合性的深度思考,然后給出最合適的方案,成為懂你、會揣摩的“聰明搭子”。

最后,New Member在業(yè)內(nèi)首次實現(xiàn)免喚醒的多人多輪對話能力。之前行業(yè)做到的是大模型一對一的交流,如今New Member未被喚醒也能關(guān)注并理解座艙內(nèi)成員間的對話,并能隨時參與到對話當(dāng)中,做到“不過度打擾,但時刻陪伴”,展現(xiàn)“有趣靈魂”該有的模樣。

在現(xiàn)場的演示視頻中,車內(nèi)四人正在討論去雨崩徒步需要的裝備,New Member會主動搭話,稱贊那位提示大家注意低溫要帶羽絨服的朋友;在查漏補(bǔ)缺攜帶物品的同時,它記得車主喜歡攝影,主動提醒攜帶單反和三腳架,可以拍攝山頂星空。

打開網(wǎng)易新聞 查看精彩圖片

針對“雨崩徒步”的多人對輪對話,New Member結(jié)合記憶進(jìn)行深度思考后的接話

另一個場景中,四個同事下班后臨時決定一起聚餐,但四個人住的地方分散在上海各區(qū),彼此距離較遠(yuǎn),同時飲食偏好也有差異,New Member能夠聽懂每個人的潛臺詞,綜合回家的距離、口味訴求,就像一個“規(guī)劃大師”,給出了大家都能接受的推薦餐廳。

New Member還能提供有溫度的情感互動和陪伴。一對情侶想去南京旅游,但因為是開車還是乘坐高鐵出行產(chǎn)生了分歧和爭論,后來女生質(zhì)問“男生是不是不愛她了”,New Member能理解語言背后的情緒,對女生進(jìn)行安撫,并提供建議和幫助,給予情感支持。

AI座艙創(chuàng)新產(chǎn)品矩陣,全場景守護(hù)出行體驗

基于語言大模型、多模態(tài)大模型、文生圖大模型和“大醫(yī)”醫(yī)療大模型等組成的 AI 大模型體系,商湯絕影構(gòu)建了健康管家、安全衛(wèi)士、3D交互等AI座艙創(chuàng)新產(chǎn)品矩陣。

商湯絕影已量產(chǎn)上車行業(yè)首個醫(yī)療AI大模型產(chǎn)品“旅醫(yī)”。依托行業(yè)領(lǐng)先的醫(yī)療檢測模型和「大醫(yī)」大模型,絕影對用戶進(jìn)行對標(biāo)醫(yī)療級的健康監(jiān)測,打造用戶專屬健康檔案,針對性推送健康科普內(nèi)容,打造全出行周期的健康管家,同時,還將通過整合第三方線上醫(yī)療服務(wù)的能力,貫通車艙醫(yī)療生態(tài)圈,助力“旅醫(yī)”成長為用戶的全場景私人醫(yī)生。

商湯絕影量產(chǎn)上車行業(yè)首個醫(yī)療AI大模型產(chǎn)品“旅醫(yī)”
打開網(wǎng)易新聞 查看精彩圖片
商湯絕影量產(chǎn)上車行業(yè)首個醫(yī)療AI大模型產(chǎn)品“旅醫(yī)”

安全始終是智能汽車的基石。商湯絕影將展示行業(yè)領(lǐng)先的DMS/OMS、多模態(tài)哨兵等多項安全產(chǎn)品,守護(hù)全場景的生命與財產(chǎn)安全。本屆上海車展,絕影發(fā)布“駕駛失能”產(chǎn)品,通過傳感器檢測駕駛員面部、肢體姿態(tài),結(jié)合車輛操控行為和呼氣酒精含量,實時判斷其狀態(tài)并及時提醒,一旦駕駛員失去駕駛能力,自動安全停車并撥打求救電話,保障出行安全。

得益于絕影車艙量產(chǎn)數(shù)據(jù)積累與人眼3D重建算法突破,商湯絕影3D視線交互算法技術(shù)達(dá)到新高度。艙內(nèi)3D視線結(jié)合車外前視相機(jī),能夠辨識人眼所關(guān)注的人、車、建筑、二維碼、花草樹木等目標(biāo),真正實現(xiàn)“視線所及,所見即所得”。

3D視線與輔助駕駛深度融合,帶來更安全的駕乘體驗。結(jié)合對艙外的人、車及其他障礙物的檢測,3D視線可實時識別潛在風(fēng)險。如當(dāng)前方有行人突然奔跑欲橫穿馬路,而駕駛員視線未關(guān)注該方向,系統(tǒng)便會主動預(yù)警,提醒注意行人穿越風(fēng)險。同時,AEB等安全功能的觸發(fā)靈敏度可根據(jù)3D視線智能調(diào)整,若駕駛員持續(xù)注視接近的障礙物,系統(tǒng)會降低預(yù)警頻率,甚至無需提醒;反之,若駕駛員視線偏離,系統(tǒng)則保持正常靈敏度,及時響應(yīng)。

打通艙內(nèi)外的3D視線還能讓用車體驗更流暢。以離開停車場為例,現(xiàn)在用戶要拿出手機(jī)掃碼,流程長、體驗差。通過3D視線結(jié)合車外攝像頭,用戶只需注視出口處二維碼的同時說“我要繳費”,系統(tǒng)即可自動完成掃碼支付,實現(xiàn)更便捷的無感通行。

加速推進(jìn)量產(chǎn)交付,與合作伙伴攜手共創(chuàng)AI新進(jìn)程

商湯絕影的生成式AI技術(shù)和產(chǎn)品持續(xù)創(chuàng)新,商業(yè)化落地也全面開花,量產(chǎn)交付正在加速推進(jìn)。

在“絕影2025上海車展發(fā)布會”上,東風(fēng)汽車集團(tuán)研發(fā)總院智能化技術(shù)首席總工程師張振林透露,他們和絕影團(tuán)隊正在攜手推動UniAD一段式端到端方案的量產(chǎn)落地,“除了端到端的合作,未來東風(fēng)汽車也將持續(xù)加大在智能化領(lǐng)域的研發(fā)投入,與絕影在開悟世界模型、DriveAGI等方面展開深度合作?!?/p>

在輔助駕駛領(lǐng)域,商湯絕影的量產(chǎn)方案目前已合作4家車企,上車7款車型,2025年更將厚積薄發(fā),全力推進(jìn)輔助駕駛方案的量產(chǎn)交付。今年3月底,絕影和廣汽聯(lián)合打造的行業(yè)首批基于地平線征程?6M的輔助駕駛方案正式量產(chǎn)上市。今年還有更多基于地平線征程?6打造的輔助駕駛方案量產(chǎn)落地奇瑞等眾多車企伙伴,在英偉達(dá)DIRVE AGX Thor平臺部署的絕影UniAD一段式端到端量產(chǎn)方案也將于2025年第四季度量產(chǎn)交付東風(fēng)汽車。

商湯絕影輔助駕駛的量產(chǎn)成果,并將于2025年全力推進(jìn)輔助駕駛方案的量產(chǎn)交付
打開網(wǎng)易新聞 查看精彩圖片
商湯絕影輔助駕駛的量產(chǎn)成果,并將于2025年全力推進(jìn)輔助駕駛方案的量產(chǎn)交付

此外,本次上海車展期間,無論是基于地平線征程?6打造的高速輔助駕駛、城區(qū)輔助駕駛,還是一段式端到端量產(chǎn)方案的城區(qū)泛化,商湯絕影都在展館外開放了實車體驗。

作為中國智能座艙AI軟件的領(lǐng)頭羊,商湯絕影的座艙 AI 軟件市場份額已連續(xù)5年位列行業(yè)第一,并打造了超過20個行業(yè)首發(fā)的智能座艙產(chǎn)品與功能。2025年初,商湯絕影聯(lián)手知名車企伙伴,實現(xiàn)行業(yè)首個原生流式多模態(tài)座艙產(chǎn)品量產(chǎn)上車。行業(yè)首個醫(yī)療AI大模型產(chǎn)品“旅醫(yī)”于2025年3月正式量產(chǎn)上車 星途攬月 參數(shù) 圖片 ),為用戶打造全場景的健康管家。

截至2024年底,商湯絕影已與超30家國內(nèi)外車企達(dá)成合作,覆蓋130余款車型,量產(chǎn)交付累計突破360萬輛。

隨著生成式AI深度融入并重構(gòu)智能汽車產(chǎn)業(yè),作為加速智能汽車駛?cè)階GI時代的戰(zhàn)略合作伙伴,商湯絕影致力于打造“共生共創(chuàng)共享”合作新模式,在基礎(chǔ)設(shè)施、大模型能力和數(shù)據(jù)閉環(huán)等領(lǐng)域開展深度合作的基礎(chǔ)上,雙方進(jìn)一步挖掘生成式AI在智能駕駛和智能座艙領(lǐng)域的潛力,共創(chuàng)AI新進(jìn)程。

注:本文所提及的“智駕”、“智能駕駛”等,指L2級輔助駕駛。