打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

AGI時代下,未來汽車出行會是怎么樣的?在2025上海車展開幕之際,新民晚報記者采訪了商湯科技聯(lián)合創(chuàng)始人、首席科學家、商湯絕影CEO王曉剛。商湯絕影是最專注于汽車行業(yè)領先的AI公司,旨在推動智能汽車加速駛?cè)胪ㄓ萌斯ぶ悄軙r代。

在他看來,“未來汽車”要實現(xiàn)更為自然的、有溫度的人車交互體驗,讓智能汽車從出行代步工具,進化為有情感的家庭新成員;同時它還能結(jié)合世界模型,持續(xù)提升輔助駕駛的性能,讓駕駛安全更有確定性。

打開網(wǎng)易新聞 查看精彩圖片

商湯科技聯(lián)合創(chuàng)始人、首席科學家、商湯絕影CEO王曉剛

新民晚報:AGI賦能下,會給智能汽車帶來哪些主要變革?

王曉剛:我認為主要在三方面:第一是通過原生流式多模態(tài)大模型帶來的人機交互體驗的變革;第二是通過端到端智駕技術的升級,帶來極致自動駕駛安全和效率;第三是艙駕融合驅(qū)動智能汽車往超級智能體方向演進,極大拓展了人與物理和數(shù)字世界的連接。

在智能汽車的應用部署上,絕影制定了端云協(xié)同的部署策略,通過意圖分流來進行任務在端云兩側(cè)的協(xié)同,當前場景任務有80%是在端側(cè)處理。端云協(xié)同的方式可覆蓋廣泛的場景交互,保證安全可靠、實時響應,并充分保障個人隱私安全。

新民晚報:在“艙—駕—云”三方面,絕影提供了哪些被業(yè)界廣泛認可的解決方案?

王曉剛:在智能駕駛領域,我們在2022年發(fā)布了行業(yè)首個感知決策一體化的輔助駕駛通用模型UniAD,這是和特斯拉FSD一樣的一段式端到端方案,獲得2023年國際計算機視覺與模式識別會議的最佳論文,引領行業(yè)的潮流。今年,我們又發(fā)布了行業(yè)首個與世界模型協(xié)同交互的端到端智駕技術方案R-UniAD,讓世界模型和強化學習框架相結(jié)合,構(gòu)建生成式智駕新范式,這也是今年行業(yè)都非常認可的技術方案。

面向智能座艙,我們打造了新一代座艙情感引擎New Member“家庭新成員”,能夠察言觀色、無時不在、與你心有靈犀,讓每一輛車擁有“有趣的靈魂”,這個產(chǎn)品得到很多認可,不少車企也在之后發(fā)布了類似的概念,這款產(chǎn)品已經(jīng)在知名車企量產(chǎn)交付了,今年車展我們也進一步升級,發(fā)布行業(yè)首個專為車載AIOS打造的AI內(nèi)核“絕影千機”,助力New Member實現(xiàn)突破性技術升級。

打開網(wǎng)易新聞 查看精彩圖片

我們還有更多的AI產(chǎn)品也都是創(chuàng)新性的,比如我們有一個全場景健康管家產(chǎn)品,3月份量產(chǎn)上車了星途攬月,是行業(yè)首個量產(chǎn)上車的醫(yī)療AI大模型產(chǎn)品。

新民晚報:現(xiàn)在是大模型的時代,大模型為智能汽車的發(fā)展帶來了哪些助力?

王曉剛:絕影打造了世界模型“開悟”——它可以理解真實世界中的“物理法則”和“交通規(guī)則”,并在此基礎上,能夠生成“準確”的場景。具體來說,生成的視頻是11V時空一致的,時間最長可以達到150秒,分辨率能夠達到1080P;同時,“開悟”生成的場景也是可控的,能細微到“元素級別”,生成場景非常精細,完全滿足端到端模型訓練和仿真對于數(shù)據(jù)質(zhì)量的高要求。

“開悟”生產(chǎn)數(shù)據(jù)的效率很高。對比行業(yè)平均水平,我們進行過測算,基于1張 A100 GPU,“開悟”世界模型平均每天的數(shù)據(jù)生成量,相當于100臺路測車的數(shù)據(jù)采集能力,比得上500臺量產(chǎn)車的效率。

打開網(wǎng)易新聞 查看精彩圖片

世界模型“開悟”

上海車展上面,“開悟”世界模型也升級到了2.0版本,結(jié)合強化學習框架,能夠?qū)崿F(xiàn)端到端算法和世界模型的協(xié)同交互,打破數(shù)據(jù)瓶頸,讓輔助駕駛的安全更有確定性。

New Member(家庭新成員)背后則離不開多模態(tài)大模型的支持,絕影的原生流式多模態(tài)大模型讓世間萬物都可被感知、被理解、被交互。商湯最近發(fā)布了日日新V6多模態(tài)大模型,我們也實現(xiàn)了端側(cè)部署,New Member也有突破性的技術升級,能夠做到多模態(tài)識人,汽車不僅能夠認識你,還可以理解你,不再是被動響應,而是成為一個懂你、會揣摩你心思的“聰明搭子”,能夠真正參與到座艙內(nèi)的多人多輪對話當中,既不過度打擾,但又能時刻陪伴。

我們的New Member是通過集成了大語言模型、多模態(tài)大模型還有記憶框架等AI能力,才能實現(xiàn)察言觀色、無時不在、與你心有靈犀的交互,讓每一輛車擁有“有趣的靈魂”。

原標題:《新民·科技前沿|商湯絕影CEO王曉剛:智能汽車如何駛向AGI時代》

欄目編輯:馬丹 圖片來源:采訪對象供圖

來源:作者:新民晚報 郜陽