
5個月前,作為中國新勢力中首家實現(xiàn)盈利的車企,理想汽車CEO李想高調(diào)宣布了將All in AI,表示理想要從智能汽車公司,轉(zhuǎn)為AI科技公司。
2025年初,理想汽車完成了一次人事架構(gòu)變動,由理想汽車總裁、總工程師馬東輝擔(dān)任智能汽車戰(zhàn)略負責(zé)人,李想則專注于AI方向發(fā)展。
彼時,市場曾猜測李想是否不再負責(zé)汽車業(yè)務(wù)。但在2024年財報業(yè)績會上,他表示自己仍是CEO,管理汽車業(yè)務(wù)相關(guān)的產(chǎn)品線、產(chǎn)品部、品牌、戰(zhàn)略等團隊,只不過對BLM(業(yè)務(wù)領(lǐng)導(dǎo)力模型)和DSTE(戰(zhàn)略開發(fā)到執(zhí)行過程)的負責(zé)人做了新的分工,仍將通過全公司的協(xié)同方式來實現(xiàn)戰(zhàn)略目標(biāo)。
2024年12月,在《理想AI Talk》第一季中,李想對于人工智能侃侃而談。市場從中看到了李想的決心,也了解到了理想汽車究竟要做怎樣的AI產(chǎn)品。
但隨后的130天里,DeepSeek的突然崛起讓行業(yè)發(fā)生了翻天覆地的變化。極氪、零跑等車企開始主動尋求與DeepSeek合作。
5月7日晚,《理想AI Talk》第二季上線,李想也帶著全新的VLA(視覺語言行動模型)走到了公眾面前。VLA是理想汽車在輔助駕駛領(lǐng)域“端到端+VLM”雙系統(tǒng)架構(gòu)上進化而來的新架構(gòu),也凝結(jié)著理想對于AI不斷加深的思考。
李想表示:輔助駕駛正處于“黎明前的黑暗”。理想汽車要做的不是汽車的智能化,而是人工智能的汽車化,并將推動人工智能普惠到每一個家庭。
01、從DeepSeek學(xué)到,先做研究再做研發(fā)
今年年初,強調(diào)“深度思考”與“任務(wù)解決”能力的DeepSeek-R1的出現(xiàn),將大模型帶到了全新的發(fā)展階段,也讓理想汽車重新梳理了研發(fā)節(jié)奏。
在此之前,理想汽車的編譯團隊已經(jīng)在芯片上操作FP8(8 位浮點數(shù)格式)的工程優(yōu)化。按照原有計劃,到今年9月,理想會完成一個高性能的語言模型,作為后續(xù)訓(xùn)練VLA的基礎(chǔ)。
DeepSeek的出現(xiàn),讓理想內(nèi)部開始重新評估當(dāng)前進展是否過于落后。他們發(fā)現(xiàn),DeepSeek V3+R1的性能已經(jīng)超過了自己9月即將推出的模型,并且DeepSeek開源得非常徹底。
這也讓李想考慮,為何不站在“巨人”的肩膀上,直接基于DeepSeek的成果來構(gòu)建VLA 中的Language(語言)部分。
李想回憶道,起初他擔(dān)心內(nèi)部模型團隊的感受。但他與理想CTO謝炎和基座模型負責(zé)人陳偉溝通后,他們都非常支持這一決策,認為擁抱DeepSeek將大大加速理想的研發(fā)節(jié)奏。
為此,理想專門成立了一個人工智能戰(zhàn)略小組,以DeepSeek為基礎(chǔ),加速VLA和端到端的多模態(tài)的進展,并研究如何在芯片上跑出同樣的訓(xùn)練和推理效率。
李想直言,從DeepSeek身上,自己學(xué)到了非常重要的一點:DeepSeek極簡地運用了“人類的最佳實踐”來構(gòu)建強大的AI模型。比如在DeepSeek V3中,它采用了MoE(混合專家模型)架構(gòu),參數(shù)規(guī)模達到 671B。這個架構(gòu)的核心是:把多個“專家”組合在一起,每個部分專注一個特定能力,從而整體提升模型的表現(xiàn)力。
這背后體現(xiàn)了一個清晰的方法論:先做研究,再做研發(fā),然后是能力表達,最終將能力轉(zhuǎn)化為實際業(yè)務(wù)中的價值。
李想坦言,這恰恰是企業(yè)很容易忽略的過程。企業(yè)常常看到目標(biāo),便直接啟動研發(fā),而忘了第一步的研究。為此,理想在推進端到端、VLM(視覺語言模型)、VLA的過程中,都在效仿從DeepSeek學(xué)到的方法論。
而之所以要在當(dāng)下All in AI,也源于此刻或正是AI引爆的新生產(chǎn)力革命的前夜。雖然有人質(zhì)疑,AI看似取代了部分人類的工作,但在許多場景中人類工作并未減輕,反而加重了。而在李想看來,人工智能目前還是輔助工具,只有變成了生產(chǎn)工具,才是真正人工智能爆發(fā)的時刻。
“只要人類會雇用司機,人工智能技術(shù)就是把類似這樣的一些功能和角色,去變成真正的生產(chǎn)力、生產(chǎn)工具,然后去進行替代?!?/p>
而理想汽車目前研發(fā)的“VLA視覺-語言-行為”大模型,正是要打造一個“司機大模型”,像人類司機一樣去感知、理解和決策。
李想將“司機大模型”的發(fā)展比作從動物到人類進化的三個階段?!暗谝粋€階段像昆蟲式智能,比如螞蟻依靠預(yù)設(shè)規(guī)則完成任務(wù)。第二個階段是端到端模型,更像哺乳動物的智能,比如馬戲團里的動物,模仿人類行為來完成任務(wù)。第三個階段則是VLA司機大模型,它的能力就接近于人類司機了?!?/p>
02、AI將成新車亮點
All in AI后,除了李想本人迅速變成了AI專家,理想汽車也完成了在輔助駕駛領(lǐng)域,身位的不斷追趕。
一方面,基于理想自研基座大模型Mind GPT的“理想同學(xué)”已經(jīng)從車機進入手機,從智艙智能助理轉(zhuǎn)變?yōu)橥ㄓ弥悄苤?,App也于去年12月27日全量上線。
另一方面,在輔助駕駛領(lǐng)域,理想一直被詬病是落后者,尤其與競爭對手鴻蒙智行相比,產(chǎn)品體驗處于下風(fēng)。經(jīng)過一年多的努力,如今理想汽車的輔助駕駛技術(shù)已躋身行業(yè)第一梯隊。
這背后是理想汽車模型版本的不斷迭代。自2024年7月底推出端到端輔助駕駛內(nèi)測版以來,理想以每周更新兩個模型版本的頻率,提升綜合MPI(在人類駕駛員需要介入系統(tǒng)前,輔助駕駛系統(tǒng)能夠自主駕駛的平均里程數(shù))。
到2024年10月23日,理想推送了“端到端+VLM”功能,首次實現(xiàn)了一體化端到端模型的大規(guī)模實踐應(yīng)用,并將大模型部署至車端量產(chǎn)芯片上——這也標(biāo)志著理想輔助駕駛正式進入了AI大模型時代。
但“端到端+VLM”雙系統(tǒng)架構(gòu)的能力,被李想自嘲為還是“猴子開車”——還是需要人類輔助決策,雖然能力提升了,但還無法達到人類頂級職業(yè)司機的水平。
而進一步提高模型能力,投入必不可少。擁抱了DeepSeek后,理想汽車把基座模型的團隊拆分了出去。此前理想一年100億元的研發(fā)投入,已有接近一半投在了人工智能。李想透露,在訓(xùn)練硬件方面,理想購買的訓(xùn)練卡數(shù)量已達到了預(yù)期的3倍。
目前理想訓(xùn)練的模型主要有兩個版本,一個是給“理想同學(xué)”用的,是一個約3000億參數(shù)(300B)的大模型;另外一個版本是用于輔助駕駛的VLA,其中VL(視覺+語言)部分是一個320億參數(shù)(32B)的模型。
而理想的VLA即將在7月,與純電產(chǎn)品理想i8同時發(fā)布。理想i8定位在30萬~40萬元區(qū)間,主打三排座純電SUV,也將成為理想在這一價格區(qū)間的首款純電產(chǎn)品。

▲理想i8。來源/理想官方
不過盡管i8還未上市,它的競爭對手已經(jīng)數(shù)不清了。最近亮相/上市的樂道L90、問界M8、小鵬G9等車型,都將與i8共同角逐市場。對于理想汽車而言,純電i8不容有失,而AI能力將是一大亮點。
除了理想i8,理想i6也將在下半年發(fā)布。李想曾透露,i8與i6的上市節(jié)奏和2022年理想L9和理想L8的發(fā)布節(jié)奏相似。這樣的好處是,新車型能夠在下半年獲得較好銷量表現(xiàn)的同時,也為下一年第一季度儲備更多的訂單。
但要實現(xiàn)預(yù)期效果,前提在于理想i8能夠像理想L9一樣迅速打開市場。
2022年6月理想L9發(fā)布后,在首個完整交付月就實現(xiàn)了超過1萬臺的交付成績。李想表示,即便3年過去,仍然可以看到至少有5家以上的企業(yè),在打造跟理想L9相同的產(chǎn)品。
要締造下一個L8和L9,理想需要找到新的“殺手锏”,而VLA便是李想錨定的秘密武器之一。
為此,理想汽車已啟動了下一代VLA模型的研發(fā)。盡管目前有了DeepSeek的加持,但理想汽車還在自研基座模型。
李想解釋道,在VLA中,視覺(V)和語言(L)都有特殊要求,視覺部分需要支持3D和高清2D的理解,訓(xùn)練數(shù)據(jù)需要涉及大量汽車產(chǎn)品以及交通領(lǐng)域的專業(yè)語義語料,還有面向家庭用戶的語義內(nèi)容。無論是OpenAI還是DeepSeek,都沒有這樣的數(shù)據(jù)、場景和需求,也解決不了這樣的問題。
VLA能否成為解決輔助駕駛的終極架構(gòu)?李想表示,VLA能夠?qū)崿F(xiàn)全自動駕駛,是不是效率最高的方式,還要打個問號。大概率未來還會出現(xiàn)更高效的新架構(gòu)。畢竟VLA還是基于Transformer(深度學(xué)習(xí)模型架構(gòu)),而Transformer是否就是最優(yōu)的結(jié)構(gòu),目前還不確定。
李想坦言,DeepSeek沒走過這條路,OpenAI、谷歌、Waymo也沒有走過,理想汽車要走入的是一個無人區(qū)。
(作者 |楊十二,編輯 |李不清,圖片來源 | 視覺中國,本內(nèi)容來自財經(jīng)天下WEEKLY)
熱門跟貼