4月23日,第二十一屆上海國際汽車工業(yè)展覽會(huì)開幕,AI成為今年本屆上海車展的關(guān)鍵詞之一。車展前夕,騰訊推出座艙端側(cè)大模型,基于混元2B(B為十億)小參數(shù)模型;英特爾首次參加車展并與面壁智能共同研發(fā)端側(cè)原生智能座艙;寶馬則在車展期間宣布DeepSeek年內(nèi)將搭載于多款在售新車。

今年年初,面壁智能CEO李大海就告訴第一財(cái)經(jīng)記者,比較主要的終端設(shè)備中,汽車和手機(jī)是今年AI落地最好的場景。記者了解到,近期大模型廠商對于智能座艙AI落地的考慮更具象化了。

騰訊智慧出行副總裁鐘學(xué)丹告訴記者,騰訊的端側(cè)模型和Agent(智能體)已在跟多家車企合作,車的量產(chǎn)還需要一段時(shí)間。端側(cè)模型在本地推理,可分析用戶當(dāng)下需求,提供駕駛行為建議、車輛操作指導(dǎo)等,并在遇到復(fù)雜問題時(shí)尋求云端模型支持。

具體而言,騰訊在智能座艙場景將Agent等大模型能力與社交、娛樂生態(tài)結(jié)合?!榜{駛中語音指令‘點(diǎn)一杯大杯拿鐵’,Agent就知道用戶喜歡的咖啡店和咖啡種類,并調(diào)用咖啡品牌的車載微信小程序,選擇最近的咖啡店,用戶順路取餐?!?騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生舉例稱。

值得注意的是,汽車座艙端側(cè)模型也有能力邊界。鐘學(xué)丹表示,2B模型很難具備很強(qiáng)的推理能力,推理能力是通過云端其他模型引入。問答對話在車上本就不是一個(gè)很好的應(yīng)用場景,端側(cè)模型會(huì)更多聚焦用戶行為、意圖的識(shí)別和判斷,而不是聚焦于問答。

打開網(wǎng)易新聞 查看精彩圖片

大模型廠商還需要應(yīng)對AI幻覺問題。鐘學(xué)丹告訴記者,大模型運(yùn)行的本質(zhì)是預(yù)測下一個(gè)token(詞元),無法做到100%精準(zhǔn),要減少端側(cè)模型的幻覺問題,一方面要將行業(yè)相關(guān)數(shù)據(jù)加入模型訓(xùn)練,此外則是增強(qiáng)知識(shí)理解能力,以提升端側(cè)模型的精準(zhǔn)度。

此外,端側(cè)模型落地汽車座艙,算力也需要具備足夠的條件。鐘學(xué)丹告訴記者,落地車端的節(jié)奏取決于兩個(gè)因素,一是車端算力,二是端側(cè)模型與應(yīng)用結(jié)合的進(jìn)展。即便是小參數(shù)模型,也對車端算力提出要求。2B小參數(shù)模型未經(jīng)極限測試,搭載于車上不僅需要考慮算力支撐情況,也要考慮車內(nèi)應(yīng)用和系統(tǒng)資源消耗的情況,預(yù)計(jì)運(yùn)行在類似高通8295這樣的芯片上體驗(yàn)較好,在算力較低的車上還很難有較好體驗(yàn)。

高通8295芯片的NPU算力為30TOPS。記者了解到,考慮到本地運(yùn)行需求,智能座艙、手機(jī)搭載的大模型參數(shù)量較小,多為幾十億參數(shù)。這既與芯片的算力限制有關(guān),也與功耗相關(guān),如果模型過大會(huì)加快電量消耗。

不僅智能座艙引入端側(cè)模型對車端算力提出要求,一些業(yè)內(nèi)人士近期也注意到,端到端模型在智能駕駛領(lǐng)域的推廣也帶來了算力消耗增加。

“業(yè)界普遍預(yù)測,模塊化的端到端(模型)將在年內(nèi)量產(chǎn)上車,而one-model(一個(gè)統(tǒng)一模型)端到端模型也預(yù)計(jì)在2026或2027年量產(chǎn)。智能駕駛從原有的規(guī)則驅(qū)動(dòng)走向了數(shù)據(jù)驅(qū)動(dòng)范式?!辩妼W(xué)丹稱。湯道生稱,端到端模型處理的數(shù)據(jù)量將是過去的10倍以上。

元戎啟行CEO周光則將智能駕駛技術(shù)與大語言模型做類比。他表示,ChatGPT面世前的語言模型是弱專家系統(tǒng),ChatGPT面世后大模型明顯提升了通才能力,近期大模型則走向垂直領(lǐng)域,變成強(qiáng)專家系統(tǒng),例如在數(shù)學(xué)、物理等領(lǐng)域達(dá)到博士水平。

“今天的智能駕駛技術(shù)還在弱專家系統(tǒng)階段,下一步將進(jìn)入通才階段,通用化是走向強(qiáng)專家系統(tǒng)的必經(jīng)之路。自動(dòng)駕駛廠商希望達(dá)到的L5級(jí)自動(dòng)駕駛,對應(yīng)的是強(qiáng)專家系統(tǒng)?!敝芄獗硎?,機(jī)器人和自動(dòng)駕駛落后大語言模型一到兩年時(shí)間,現(xiàn)在即將進(jìn)入通才階段,這個(gè)階段的智能駕駛神經(jīng)網(wǎng)絡(luò)是典型的VLA(視覺語言動(dòng)作模型)架構(gòu),具備思維鏈能力,未來對算力的要求將會(huì)增長。