

AGI時代下,“未來汽車”出行會是怎么樣的?在2025上海車展開幕之際,記者采訪了商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家、商湯絕影CEO王曉剛。商湯絕影是專注于汽車行業(yè)領(lǐng)先的AI公司,旨在推動智能汽車加速駛?cè)胪ㄓ萌斯ぶ悄軙r代。王曉剛認(rèn)為:原生流式多模態(tài)大模型帶來人機交互體驗的變革,智能汽車可以擁有“有趣的靈魂”。
問:AGI賦能下,會給智能汽車帶來哪些主要變革?
答:我認(rèn)為主要在三方面:第一是通過原生流式多模態(tài)大模型帶來的人機交互體驗的變革;第二是通過端到端智駕技術(shù)的升級,帶來極致自動駕駛安全和效率;第三是艙駕融合驅(qū)動智能汽車往超級智能體方向演進(jìn),極大拓展了人與物理和數(shù)字世界的連接。
在智能汽車的應(yīng)用部署上,絕影制定了端云協(xié)同的部署策略,通過意圖分流來進(jìn)行任務(wù)在端云兩側(cè)的協(xié)同,當(dāng)前場景任務(wù)有80%是在端側(cè)處理。端云協(xié)同的方式可覆蓋廣泛的場景交互,保證安全可靠、實時響應(yīng),并充分保障個人隱私安全。
問:在“艙—駕—云”三方面,現(xiàn)在有哪些被業(yè)界廣泛認(rèn)可的解決方案?
答:在智能駕駛領(lǐng)域,我們在2022年發(fā)布了行業(yè)首個感知決策一體化的輔助駕駛通用模型UniAD,這是和特斯拉FSD一樣的一段式端到端方案,獲得2023年國際計算機視覺與模式識別會議的最佳論文,引領(lǐng)行業(yè)的潮流。今年,我們又發(fā)布了行業(yè)首個與世界模型協(xié)同交互的端到端智駕技術(shù)方案R-UniAD,讓世界模型和強化學(xué)習(xí)框架相結(jié)合,構(gòu)建生成式智駕新范式,這也是今年行業(yè)都非常認(rèn)可的技術(shù)方案。
面向智能座艙,我們打造了新一代座艙情感引擎New Member“家庭新成員”,能夠察言觀色、無時不在、與你心有靈犀,讓每一輛車擁有“有趣的靈魂”,這個產(chǎn)品得到很多認(rèn)可,已經(jīng)在知名車企量產(chǎn)交付了。
我們還有更多的AI產(chǎn)品也都是創(chuàng)新性的,比如我們有一個全場景健康管家產(chǎn)品,3月份量產(chǎn)上車了星途攬月,是行業(yè)首個量產(chǎn)上車的醫(yī)療AI大模型產(chǎn)品。
問:大模型為智能汽車的發(fā)展帶來了哪些助力?
答:絕影打造了世界模型“開悟”——它可以理解真實世界中的“物理法則”和“交通規(guī)則”,并在此基礎(chǔ)上,能夠生成“準(zhǔn)確”的場景?!伴_悟”生產(chǎn)數(shù)據(jù)的效率很高,生成的場景是可控的,能細(xì)微到“元素級別”,生成場景非常精細(xì),完全滿足端到端模型訓(xùn)練和仿真對于數(shù)據(jù)質(zhì)量的高要求。
上海車展上,“開悟”世界模型也升級到了2.0版本,結(jié)合強化學(xué)習(xí)框架,能夠?qū)崿F(xiàn)端到端算法和世界模型的協(xié)同交互,打破數(shù)據(jù)瓶頸,讓輔助駕駛的安全更有確定性。
New Member“家庭新成員”背后則離不開多模態(tài)大模型的支持,絕影的原生流式多模態(tài)大模型讓世間萬物都可被感知、被理解、被交互。我們在端側(cè)部署了商湯的日日新V6多模態(tài)大模型,New Member能夠做到多模態(tài)識人,汽車不僅能夠認(rèn)識你,還可以理解你,不再是被動響應(yīng),而是成為一個懂你、會揣摩你心思的“聰明搭子”,能夠真正參與座艙內(nèi)的多人多輪對話,既不過度打擾,又能時刻陪伴。
原標(biāo)題:《新民·科技前沿③|商湯絕影王曉剛:智能汽車可以擁有“有趣的靈魂”》
欄目編輯:王蔚 文字編輯:馬丹
來源:作者:新民晚報 郜陽
熱門跟貼