2025年5月7日,理想汽車開啟“理想AI Talk第二季——理想VLA司機(jī)大模型,從動(dòng)物進(jìn)化到人類”活動(dòng),理想汽車董事長兼CEO李想分享了諸多關(guān)于人工智能及VLA司機(jī)大模型的見解,為智能駕駛領(lǐng)域帶來了新的思考與方向。

AI工具三階進(jìn)化:從信息到生產(chǎn)

李想將AI工具劃分為信息工具、輔助工具和生產(chǎn)工具三個(gè)層級(jí)。當(dāng)下,多數(shù)人把AI當(dāng)作信息工具,可它常充斥著大量無效信息,僅能提供參考。而輔助工具雖能提升效率,像現(xiàn)在的輔助駕駛,但仍離不開人類的參與。真正的變革在于AI成為生產(chǎn)工具,那時(shí)它將獨(dú)立完成專業(yè)任務(wù),大幅提升效率與質(zhì)量。

打開網(wǎng)易新聞 查看精彩圖片

李想認(rèn)為,判斷Agent(智能體)是否智能,關(guān)鍵看其是否成為生產(chǎn)工具。就像人類會(huì)雇傭司機(jī),人工智能技術(shù)最終也會(huì)承擔(dān)類似職責(zé),成為真正的生產(chǎn)工具。這一觀點(diǎn)為AI的發(fā)展指明了方向,讓我們看到了AI在專業(yè)領(lǐng)域發(fā)揮巨大潛力的可能。

VLA進(jìn)化之路:從“昆蟲”到“人類”

VLA(Vision-Language-Action Model,視覺語言行動(dòng)模型)的出現(xiàn),讓AI有望真正成為司機(jī),成為交通領(lǐng)域的專業(yè)生產(chǎn)工具。但VLA的實(shí)現(xiàn)并非一蹴而就,而是經(jīng)歷了三個(gè)階段的進(jìn)化,對應(yīng)著理想汽車輔助駕駛的昨天、今天和明天。

打開網(wǎng)易新聞 查看精彩圖片

第一階段,理想汽車自2021年起自研依賴規(guī)則算法和高精地圖的輔助駕駛,類似“昆蟲動(dòng)物智能”,能力相對有限。第二階段,從2023年起研究并于2024年正式推送端到端+VLM輔助駕駛,接近“哺乳動(dòng)物智能”,不過端到端模型處理復(fù)雜問題有局限,VLM使用開源模型在交通領(lǐng)域能力有限,且難以與人類溝通。于是,2024年起理想汽車開展VLA研究,在多項(xiàng)頂級(jí)學(xué)術(shù)會(huì)議上發(fā)表論文,夯實(shí)理論基礎(chǔ)。

到第三階段,VLA將開啟“人類智能”階段。它能通過3D和2D視覺組合完整看到物理世界,擁有完整腦系統(tǒng),具備語言、CoT推理能力,能看、能理解還能執(zhí)行行動(dòng),完全符合人類運(yùn)作方式。這一進(jìn)化過程,體現(xiàn)了理想汽車在智能駕駛領(lǐng)域不斷探索、逐步突破的決心和能力。

VLA訓(xùn)練與安全保障:模擬人類與超級(jí)對齊

VLA的訓(xùn)練過程模擬人類學(xué)習(xí)駕駛技能,分為預(yù)訓(xùn)練、后訓(xùn)練和強(qiáng)化訓(xùn)練三個(gè)環(huán)節(jié)。預(yù)訓(xùn)練相當(dāng)于學(xué)習(xí)物理世界和交通領(lǐng)域常識(shí),訓(xùn)練出云端的VL基座模型并轉(zhuǎn)化為端側(cè)模型。后訓(xùn)練類似去駕校學(xué)開車,加入Action數(shù)據(jù)后VL基座變?yōu)閂LA司機(jī)大模型,具備實(shí)時(shí)性和博弈能力。強(qiáng)化訓(xùn)練則類似實(shí)際開車練習(xí),通過RLHF和純強(qiáng)化學(xué)習(xí)模型放入世界模型中訓(xùn)練,讓VLA司機(jī)大模型更安全、舒適,對齊人類價(jià)值觀,甚至超越人類駕駛水平。

打開網(wǎng)易新聞 查看精彩圖片

除了提升專業(yè)能力,VLA司機(jī)大模型還需解決安全性和模型黑盒問題。理想汽車在強(qiáng)化訓(xùn)練環(huán)節(jié)投入大量資源,組建超級(jí)對齊團(tuán)隊(duì),為司機(jī)Agent注入職業(yè)素養(yǎng)。同時(shí),結(jié)合重建和生成兩種路徑打造世界模型,覆蓋所有交通參與者和要素,讓VLA能在世界模型中低成本、準(zhǔn)確驗(yàn)證現(xiàn)實(shí)問題,有效應(yīng)對模型黑盒挑戰(zhàn)。判斷司機(jī)Agent好壞有三個(gè)關(guān)鍵標(biāo)準(zhǔn),VLA司機(jī)大模型在專業(yè)能力、職業(yè)能力和構(gòu)建信任的能力方面都表現(xiàn)出色。

打開網(wǎng)易新聞 查看精彩圖片

理想汽車發(fā)展啟示:基本功與正能量

理想汽車實(shí)現(xiàn)技術(shù)快速躍遷,離不開從研究、研發(fā)到能力表達(dá),再到業(yè)務(wù)價(jià)值的基本功積累。研究是關(guān)鍵,突破后研發(fā)效率大幅提升,注重價(jià)值轉(zhuǎn)化實(shí)現(xiàn)業(yè)務(wù)落地。理想汽車堅(jiān)持自研,通過技術(shù)賦能用戶價(jià)值,在輔助駕駛等方面取得顯著成果。

李想在創(chuàng)業(yè)路上也有著積極樂觀的心態(tài),他認(rèn)為創(chuàng)業(yè)雖苦,但沒必要苦哈哈的,應(yīng)保留有價(jià)值的美好片段激勵(lì)自己。成為更有能量的人,關(guān)鍵在于關(guān)注自我,用成長替代改變,同時(shí)重視親密關(guān)系,家人和同事能相互支撐。

理想汽車在智能駕駛領(lǐng)域的探索和突破令人欽佩。它不僅在技術(shù)上不斷創(chuàng)新,從AI工具層級(jí)劃分到VLA司機(jī)大模型的進(jìn)化,再到訓(xùn)練和安全保障,都展現(xiàn)出了強(qiáng)大的研發(fā)實(shí)力和前瞻性的思維。而且,理想汽車堅(jiān)持自研、注重基本功積累以及積極樂觀的創(chuàng)業(yè)心態(tài),都值得其他企業(yè)學(xué)習(xí)。在AI時(shí)代,理想汽車有望憑借這些優(yōu)勢,在智能駕駛領(lǐng)域持續(xù)引領(lǐng)潮流,為用戶帶來更安全、更便捷的出行體驗(yàn)。