一夜醒來(lái),自動(dòng)駕駛行業(yè)大變天。端到端技術(shù)還沒(méi)普及,新的技術(shù)形態(tài)又出來(lái)了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

前兩天,小鵬汽車(chē)發(fā)布了 “云端基座模型”。希望通過(guò)知識(shí)蒸餾和強(qiáng)化學(xué)習(xí)的方式持續(xù)提升車(chē)端系統(tǒng)的能力上限。知識(shí)蒸餾是DeepSeek對(duì)Open AI彎道超車(chē)的大殺招,如今被小鵬用在了自動(dòng)駕駛上。

為了開(kāi)發(fā)這個(gè)世界基座模型。小鵬汽車(chē)專(zhuān)門(mén)打造了一座“云端模型工廠”,工廠“車(chē)間”涵蓋基座模型預(yù)訓(xùn)練和后訓(xùn)練(強(qiáng)化學(xué)習(xí)訓(xùn)練)、模型蒸餾、車(chē)端模型預(yù)訓(xùn)練到部署上車(chē)的全流程生產(chǎn)鏈路。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

小鵬汽車(chē)自動(dòng)駕駛負(fù)責(zé)人李力耘介紹,小鵬基模是一個(gè)以大語(yǔ)言模型為骨干網(wǎng)絡(luò),使用海量?jī)?yōu)質(zhì)駕駛數(shù)據(jù)訓(xùn)練的多模態(tài)大模型,具備視覺(jué)理解能力、鏈?zhǔn)酵评砟芰蛣?dòng)作生成能力。提升智駕能力上限。

“端到端的車(chē)端模型也許可以給大家提供一個(gè)非常好的極致的L2的+++的體驗(yàn),但作為我們自動(dòng)駕駛?cè)说某跣囊罱K走向L3、L4的自動(dòng)駕駛?!?/p>

李力耘認(rèn)為,車(chē)端訓(xùn)練的算力有限,能夠承載的數(shù)據(jù)量有限,即便端到端技術(shù)范式下,智駕的能力也不會(huì)太高。小鵬希望通過(guò)“云端基座模型”訓(xùn)練更多的數(shù)據(jù),無(wú)限提升智駕的能力上限。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

它可以理解成一個(gè)云端大模型,大模型結(jié)構(gòu)的第一層采用Encoder編碼器,對(duì)所有信號(hào)進(jìn)行融合。你沒(méi)有看錯(cuò),是各種信息,包括視頻信號(hào),以及導(dǎo)航音頻、車(chē)載視頻,甚至耳朵、超聲波雷達(dá)、毫米波雷達(dá)聽(tīng)到的各種信號(hào)。目前能夠處理的參數(shù)量達(dá)到720億參數(shù)(一個(gè)模型是72B),VLA模型參數(shù)差不多在1B-2B之間,大概是35倍的差值。

接下來(lái)就來(lái)到了最核心的部分,小鵬通過(guò)語(yǔ)言大模型(LLM)讓各種各樣的傳感器信息、元素對(duì)齊,使它能夠作為標(biāo)準(zhǔn)化“符號(hào)”被處理,這樣大語(yǔ)言模型就具備了推理能力,以及持續(xù)的思維鏈能力,通過(guò)前方車(chē)輛的繞行推測(cè)前方可能有障礙物,進(jìn)而推理出前方施工等場(chǎng)景,從而提前做出應(yīng)對(duì)。

經(jīng)過(guò)Encoder(編譯器/編碼器)到語(yǔ)言大模型之后,模型會(huì)變成一個(gè)聰明的學(xué)生或者剛?cè)胄械穆斆鞯那嗄杲處?。?jīng)驗(yàn)少,但是天賦高。然后再通過(guò)高質(zhì)量數(shù)據(jù)的方式強(qiáng)化學(xué)習(xí)讓系統(tǒng)變成一個(gè)經(jīng)驗(yàn)豐富的老教授先放到車(chē)端。

強(qiáng)化學(xué)習(xí)是大模型訓(xùn)練的經(jīng)典思路,Open AI的很多模型都是采取這個(gè)方式。先通過(guò)設(shè)置獎(jiǎng)勵(lì)函數(shù)給系統(tǒng)設(shè)置一些邊界,再通過(guò)獎(jiǎng)勵(lì)模型提供更連續(xù)、更泛化、更多維的獎(jiǎng)勵(lì)信息給到強(qiáng)化學(xué)習(xí),最后再通過(guò)世界模型對(duì)他進(jìn)行多維度的模擬驗(yàn)證。

于是,一個(gè)經(jīng)過(guò)海量數(shù)據(jù)訓(xùn)練的優(yōu)秀老司機(jī)云端大模型就這樣誕生了。最后再通過(guò)蒸餾的方式把云端訓(xùn)練的能力沉淀出來(lái),生成“小身材、大智商”的端側(cè)模型,下放在車(chē)端。

小鵬說(shuō)這個(gè)基座模型可以為不同需求的汽車(chē)定制不同的“大腦”,讓“千人千面”的模型研發(fā)成為可能。

這里其實(shí)有一個(gè)非常有意思的地方。地平線余凱,博世吳勇橋等都認(rèn)為,自動(dòng)駕駛將來(lái)會(huì)是一個(gè)標(biāo)準(zhǔn)件一樣的東西,智駕不會(huì)出現(xiàn)郭德綱和林志玲的不同風(fēng)格,但是這里又說(shuō)智駕千人千面。我的理解是不是不同的車(chē)型搭載的硬件不一樣,模型參數(shù)量不一樣從而產(chǎn)生差異化的情況。

這個(gè)世界基礎(chǔ)模型更像是小鵬做了一個(gè)數(shù)據(jù)訓(xùn)練模型的放大器,讓模型能夠吞吐更大規(guī)模的參數(shù)量,并且開(kāi)發(fā)了一系列的配套小模型,然后在把海量數(shù)據(jù)訓(xùn)好的小模型下放在車(chē)端。

到這里其實(shí)思路已經(jīng)比較清晰了,小鵬希望通過(guò)這套世界模型解決更高維度L3,甚至L4的問(wèn)題。這列理念算不上新,小馬智行CTO樓教主很早就說(shuō)過(guò)了。但是小鵬推進(jìn)的效果更迅猛。

世界基礎(chǔ)模型的設(shè)想很美好,但實(shí)際實(shí)施起來(lái)并不容易。

首先是端側(cè)芯片算力,即便是蒸餾過(guò)后的模型,也比目前的端到端模型大很多。目前市面上的芯片基本都是公用芯片,在特定模型的處理效率上并不高。這也是小鵬選擇自研芯片的原因。何小鵬透露,小鵬專(zhuān)門(mén)針對(duì)其自研的世界基座大模型設(shè)計(jì)的芯片將會(huì)在今年2季度量產(chǎn)上車(chē),它的專(zhuān)屬性更強(qiáng),效率更高。

另一個(gè)就是云端算力。小鵬目前的AI算力已經(jīng)達(dá)到了10EFLOPS,實(shí)現(xiàn)了萬(wàn)卡集群。并且云端的訓(xùn)練集群常年保持在90%以上利用率。

除了GPU,多模態(tài)大模型還需要解決數(shù)據(jù)訪問(wèn)的效率問(wèn)題。小鵬汽車(chē)自主開(kāi)發(fā)了底層的數(shù)據(jù)基礎(chǔ)設(shè)施(Data Infra),使數(shù)據(jù)上傳規(guī)模提升22倍、訓(xùn)練中的數(shù)據(jù)帶寬提升15倍;通過(guò)聯(lián)合優(yōu)化GPU / CPU以及網(wǎng)絡(luò)I/O,最終使模型訓(xùn)練速度提升了5倍。如果把數(shù)據(jù)傳輸理解成一個(gè)水管放水,小鵬相當(dāng)于專(zhuān)門(mén)為這個(gè)數(shù)據(jù)工廠建了一個(gè)抽水泵,讓它的效率更高。

解決了進(jìn)水效率,“水”(數(shù)據(jù))從哪來(lái)?

小鵬一方面通過(guò)多賣(mài)車(chē)來(lái)收集數(shù)據(jù)。這里可以聯(lián)想一下小鵬去掉激光雷達(dá)的邏輯,去掉激光雷達(dá)降車(chē)價(jià)帶來(lái)的銷(xiāo)量提升立竿見(jiàn)影;另一方面其實(shí)上文也有提到,在世界基座模型工廠里其實(shí)有世界模型,專(zhuān)門(mén)用來(lái)生產(chǎn)仿真數(shù)據(jù)。還用于調(diào)教真實(shí)的Smart Agent(智能體)的反饋,和它之間的博弈和接下來(lái)要做哪些動(dòng)作。

目前,小鵬汽車(chē)用于訓(xùn)練基座模型的視頻數(shù)據(jù)量高達(dá)2000萬(wàn)clips,這一數(shù)字今年將增加到2億clips。

在這些基礎(chǔ)設(shè)施之上,小鵬的云端基礎(chǔ)模型更像是一個(gè)車(chē)端模型的效率工廠。它能夠快速在12小時(shí)就能訓(xùn)練一版模型。

這套理論最核心的支撐點(diǎn)在于Scaling Law(尺度定律:參數(shù)量越大,模型訓(xùn)練效果越好),這個(gè)已經(jīng)在大語(yǔ)言模型被證明的定律。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

當(dāng)然,在這之前,小鵬需要回答另一個(gè)問(wèn)題是,蒸餾之后的模型效果到底好不好?達(dá)到什么樣的標(biāo)準(zhǔn)才能上車(chē)?

Deepseek的邏輯是不管怎么蒸餾,模型始終在云端。但小鵬這個(gè)的邏輯是大模型蒸餾之后下放到車(chē)端。

李力耘的說(shuō)法是,加大車(chē)端算力,模型的承載能力也會(huì)更大。這其實(shí)又回到了小鵬自研芯片的邏輯。

目前,小鵬的大模型還在訓(xùn)練“老師”(云端大模型)階段,也就是所謂的基礎(chǔ)大模型,目標(biāo)是接近L3,但目前還沒(méi)有量化的數(shù)據(jù)出來(lái),“學(xué)生”(蒸餾后的端側(cè)模型)的能力更是無(wú)從得知,但從小鵬X9在香港的測(cè)試來(lái)看,內(nèi)部認(rèn)為其實(shí)表現(xiàn)出來(lái)的能力已經(jīng)遠(yuǎn)超目前系統(tǒng)的能力。

雖然還沒(méi)上車(chē),但小鵬已經(jīng)驗(yàn)證了幾個(gè)基本規(guī)律:

1、驗(yàn)證規(guī)模法則在自動(dòng)駕駛領(lǐng)域持續(xù)生效。也就是說(shuō)大模型的Scaling Law在自動(dòng)駕駛同樣奏效;

2、在后裝算力的車(chē)端成功實(shí)現(xiàn)基??剀?chē);

3、啟動(dòng)72B參數(shù)基模訓(xùn)練,搭建針對(duì)強(qiáng)化學(xué)習(xí)的模型訓(xùn)練框架。

十年前,小鵬汽車(chē)成立時(shí)就堅(jiān)定了自動(dòng)駕駛的大方向,它是第一個(gè)將激光雷達(dá)量產(chǎn)落地在輔助駕駛的乘用車(chē)企,兜兜轉(zhuǎn)轉(zhuǎn)幾年之后小鵬又重新去掉激光雷達(dá),采用純視覺(jué)方案。毫無(wú)疑問(wèn),這是一條完全Follow特斯拉的技術(shù)路線。在智能駕駛到來(lái)的浪潮前夕,中美企業(yè)代表再一次同頻共進(jìn)。