打開(kāi)網(wǎng)易新聞 查看精彩圖片

不久前,退網(wǎng)多時(shí)的李想再次出現(xiàn)在公眾視野。歸來(lái)的李想一改往日單人演講式的發(fā)言方式,選擇了用接受媒體采訪的對(duì)談方式,探討了理想汽車(chē)在人工智能領(lǐng)域的戰(zhàn)略布局和未來(lái)愿景。

當(dāng)然,形式雖然變了,但李想依然理想,本次對(duì)談保持了他一貫高信息密度、體系化的談話輸出。

上一次還是在2023年春天,李想選擇的主題是如何理解造車(chē)。這一次,李想的主題已經(jīng)進(jìn)化成了如何理解AI,以及,如何用造車(chē)通向AGI。

對(duì)這一次主題略顯宏大的談話,各方質(zhì)疑正如采訪者張小珺所問(wèn):一個(gè)造車(chē)時(shí)選擇用增程開(kāi)局的實(shí)用主義者,怎么似乎突然間變成了擁有宏偉AI愿景的理想主義者?

李想沒(méi)有直接回答,但三小時(shí)的問(wèn)答和理想過(guò)去九年的實(shí)踐,本身構(gòu)成了回答:做不做AI對(duì)他來(lái)說(shuō)不構(gòu)成問(wèn)題,何處切入AI,何時(shí)All in AI,如何做好AI,才是真正的問(wèn)題。

為什么從造車(chē)All in AI

作為一個(gè)相信AI的創(chuàng)業(yè)者,李想為什么不直接做AI,而要從造車(chē)切入AI?

看起來(lái)和問(wèn)題關(guān)系不大,但最底層的回答是:為了更好地改造物理世界。這個(gè)答案的產(chǎn)生,則要追溯到十年甚至更早之前。

2013年,汽車(chē)之家在美上市,市值突破30億美元,成為國(guó)內(nèi)最成功的汽車(chē)網(wǎng)站。這段創(chuàng)業(yè)中,李想培養(yǎng)了對(duì)市場(chǎng)的需求洞察、對(duì)產(chǎn)品的精準(zhǔn)定義的能力,也錘煉了帶隊(duì)打勝仗的能力和對(duì)創(chuàng)業(yè)節(jié)奏的把握能力,同時(shí),積累了財(cái)富和投資人的信任。

但李想創(chuàng)業(yè)最大的遺憾也恰恰來(lái)自這段經(jīng)歷——選擇的創(chuàng)業(yè)領(lǐng)域過(guò)于垂直,以至于“為了一棵樹(shù),錯(cuò)過(guò)了一片森林”。

李想不止一次地用零售電商和汽車(chē)電商的命運(yùn)分野,分析了這種遺憾。

在移動(dòng)互聯(lián)網(wǎng)熱潮期,零售電商們不僅在線上提供了交易平臺(tái),也顯著地改變了零售在線下的倉(cāng)儲(chǔ)、物流、交付等環(huán)節(jié),革命性地提升了效率?;趯?duì)現(xiàn)實(shí)中零售業(yè)態(tài)巨大改造釋放出的價(jià)值,零售電商成長(zhǎng)出多家千億乃至萬(wàn)億級(jí)企業(yè)。

同一時(shí)期,汽車(chē)之家與其他同行嘗試用電商改造汽車(chē)零售,卻均以失敗告終。究其原因,汽車(chē)交易有更多無(wú)法被壓縮的環(huán)節(jié)發(fā)生在真實(shí)的線下而非虛擬的線上。對(duì)于一家大部分業(yè)態(tài)都在互聯(lián)網(wǎng)上,自身體量又有限的企業(yè),大規(guī)模改造汽車(chē)交易還是太難了。

零售電商與汽車(chē)電商截然不同的結(jié)局,帶給李想的是兩點(diǎn)略微苦澀的啟示:

一是一家企業(yè)的價(jià)值,歸根結(jié)底要用“多大程度改變了物理世界”來(lái)衡量;

二是物理世界雖然還有廣袤的改造余地,但基本已是難啃的骨頭,互聯(lián)網(wǎng)打法顯出疲態(tài),得使用更先進(jìn)的業(yè)態(tài)和技術(shù)。

當(dāng)李想在2015年再次出發(fā)創(chuàng)業(yè),正與AI合流的新能源汽車(chē)不意外地成為最佳選擇。

作為新一輪能源革命和信息革命的交匯點(diǎn),智能電動(dòng)汽車(chē)兼具移動(dòng)、空間、軟硬件、大規(guī)模制造屬性——很少有其他產(chǎn)業(yè)能像它一樣,如此多維地和物理世界產(chǎn)生關(guān)聯(lián),又積極地?fù)肀ё钚碌募夹g(shù)潮流,這為AI發(fā)揮作用提供了充足空間。

加入造車(chē)大軍后,理想的A面是將增程電動(dòng)、家庭用車(chē)做大做強(qiáng),B面則可套用一句老話,“用AI把汽車(chē)的各個(gè)環(huán)節(jié)重做一遍?!?/p>

其中能見(jiàn)度高的AI產(chǎn)品,是智能助手理想同學(xué),以及端到端+VLM架構(gòu)的智能駕駛。數(shù)據(jù)顯示,2024年理想同學(xué)累計(jì)喚醒23.8億次,累計(jì)智駕里程超過(guò)29億公里,在國(guó)內(nèi)車(chē)企中居于領(lǐng)先位置。

領(lǐng)先的先決條件是飽和投入。2024年,理想的百億研發(fā)費(fèi)用,近一半用在了AI上,讓理想將關(guān)鍵的AI能力掌握在自己手里。

比如國(guó)內(nèi)多數(shù)車(chē)企的智能助手選擇調(diào)用第三方大模型能力,理想則為理想同學(xué)自研了基座模型Mind GPT。在智能駕駛領(lǐng)域,理想的團(tuán)隊(duì)率先量產(chǎn)了采用端到端+VLM雙系統(tǒng)架構(gòu)的智能駕駛,將自家高階智駕車(chē)型銷(xiāo)售占比提升至50%以上。

一個(gè)細(xì)節(jié):理想車(chē)輛下線檢測(cè)時(shí)采用無(wú)人駕駛節(jié)省人力
打開(kāi)網(wǎng)易新聞 查看精彩圖片
一個(gè)細(xì)節(jié):理想車(chē)輛下線檢測(cè)時(shí)采用無(wú)人駕駛節(jié)省人力

在不易被外界關(guān)注的環(huán)節(jié),理想也在使用AI為生產(chǎn)經(jīng)營(yíng)提質(zhì)增效。

比如在零售、營(yíng)銷(xiāo)、客服、財(cái)務(wù)、 金融反欺詐等職能部門(mén),理想的智能商業(yè)團(tuán)隊(duì)部署了相應(yīng)的AI模型來(lái)輔助工作。

理想整車(chē)生產(chǎn)流程中AI的存在感也頗高。比如理想一度被電驅(qū)NVH傳統(tǒng)檢測(cè)方法測(cè)不準(zhǔn)、效率低的問(wèn)題困擾,但在理想智能工業(yè)團(tuán)隊(duì)訓(xùn)練出一個(gè)AI檢測(cè)模型,部署在電驅(qū)供應(yīng)商的產(chǎn)線邊實(shí)現(xiàn)就地檢測(cè)后,難題迎刃而解。

類(lèi)似的AI能力嵌入在生產(chǎn)制造的各個(gè)環(huán)節(jié),串聯(lián)起來(lái)則是被理想稱為L(zhǎng)i-MOS的智能制造操作系統(tǒng)。理想L6從上市發(fā)售到爬滿2.6萬(wàn)輛/月的產(chǎn)能只用了不到兩個(gè)月,帶給行業(yè)一點(diǎn)小小的爬產(chǎn)震撼,其中Li-MOS的支持尤為重要。

理想的AI智能模型橫貫用戶體驗(yàn)、商業(yè)經(jīng)營(yíng)、 生產(chǎn)管理
打開(kāi)網(wǎng)易新聞 查看精彩圖片
理想的AI智能模型橫貫用戶體驗(yàn)、商業(yè)經(jīng)營(yíng)、 生產(chǎn)管理

到2024年,理想對(duì)物理世界的改造初見(jiàn)成效: 對(duì)用戶,交付了上百萬(wàn)輛搭載理想同學(xué)和智駕能力的車(chē)型,改變了數(shù)百萬(wàn)人的出行體驗(yàn); 對(duì)行業(yè),提供了一套AI化的高效生產(chǎn)經(jīng)營(yíng)體系范本; 基于這些改造提供的價(jià)值,理想也成為一家千億級(jí)公司。

李想在上一段創(chuàng)業(yè)中未盡的愿望,通過(guò)AI驅(qū)動(dòng)的造車(chē)完成了序章。

為什么這時(shí)候All in AI

不過(guò)這不足以解釋另一個(gè)問(wèn)題:作為宣稱對(duì)AI有信仰的一家公司,理想為什么不是在自動(dòng)駕駛創(chuàng)業(yè)浪潮興起的2016年All in AI,也不是在Transfomer大放異彩的2021年All in AI,而是在2023年才把AI作為陽(yáng)謀,在2024年末才喊出了AGI的目標(biāo)?

以李想的“創(chuàng)業(yè)節(jié)奏論”解釋則是,一家企業(yè)不應(yīng)在0-10的階段,做10-100階段的事。

OpenAI的例子表明,AGI很可能是有史以來(lái)最壯烈、復(fù)雜的商業(yè)/技術(shù)競(jìng)賽,它需要海量的資金、數(shù)據(jù)、算力,以及頂級(jí)人才,有著漫長(zhǎng)的實(shí)現(xiàn)周期,競(jìng)爭(zhēng)維度也超越了既有商業(yè)組織的邊界。

以AGI為己任的OpenAI創(chuàng)立于2015年,匯聚了過(guò)去十余年AI領(lǐng)域的超級(jí)大腦,至2024年累計(jì)融資179億美元且越虧越多,為了訓(xùn)練模型OpenAI幾乎爬光整個(gè)互聯(lián)網(wǎng)的公開(kāi)數(shù)據(jù),其最大股東微軟為了提供算力支持,去年向英偉達(dá)購(gòu)買(mǎi)了近50萬(wàn)顆Hopper GPU。

在這樣的競(jìng)賽中,即使是市值萬(wàn)億的頂級(jí)企業(yè)也心驚膽戰(zhàn)。而理想如果沒(méi)有選擇“先造車(chē),廣積糧”的迂回路線,很可能連AGI的友誼賽名額都拿不到。

如果以AGI為目的地回望,理想成立這九年主要的經(jīng)營(yíng)目標(biāo)可以總結(jié)為:度過(guò)企業(yè)的0-1、1-10階段,找到一塊有足夠利潤(rùn)和數(shù)據(jù)產(chǎn)出的根據(jù)地,點(diǎn)出AGI的前置科技樹(shù),籌集AGI競(jìng)爭(zhēng)的入場(chǎng)券。

正因?yàn)閷?duì)創(chuàng)業(yè)節(jié)奏的理解,理想選擇了以增程路線切入造車(chē)。同樣,對(duì)節(jié)奏的把握也貫穿在理想打造AI產(chǎn)品的過(guò)程中。

比如在早期資源受限的情況下,理想在智駕產(chǎn)品上采取了跟隨策略,同時(shí)做好了可以長(zhǎng)期發(fā)揮效用的數(shù)據(jù)沉淀與基建工作,等待算力、算法、數(shù)據(jù)升級(jí)。在2023有了進(jìn)一步的商業(yè)成功,智駕的營(yíng)養(yǎng)系統(tǒng)——現(xiàn)金、算力和數(shù)據(jù)都足夠充沛后,理想果斷轉(zhuǎn)向端到端+VLM,引領(lǐng)了技術(shù)范式,實(shí)現(xiàn)了智駕體驗(yàn)的快速提升,帶動(dòng)了高配車(chē)型銷(xiāo)售。

理想率先量產(chǎn)了端到端+VLM雙系統(tǒng)架構(gòu)高階智駕
打開(kāi)網(wǎng)易新聞 查看精彩圖片
理想率先量產(chǎn)了端到端+VLM雙系統(tǒng)架構(gòu)高階智駕

這種變道超車(chē)一方面離不開(kāi)智駕部門(mén)打硬仗的戰(zhàn)役能力,另一方面也考驗(yàn)企業(yè)對(duì)內(nèi)部能力、資源進(jìn)行評(píng)估,對(duì)外部環(huán)境、需求變化進(jìn)行感知,做出決斷的戰(zhàn)略能力。

理想在2024年末All in AI,實(shí)際是管理層進(jìn)一步看到了內(nèi)外部條件的變化,判斷可以、也需要開(kāi)啟下一篇章:

于內(nèi),以理想同學(xué)和智能駕駛為代表,理想的AI產(chǎn)品在2024年打了勝仗,積累了數(shù)據(jù),培養(yǎng)了人才隊(duì)伍,收獲了商業(yè)回報(bào),AI能力的建設(shè)度過(guò)了1-10階段,在認(rèn)知智能和空間智能上都取得了一定建樹(shù),通往AGI的路徑不再是空談。

于外,無(wú)論是馬斯克創(chuàng)辦xAI,還是量化出身的幻方推出技驚四座的DeepSeek V3,都表明人工智能正在進(jìn)一步打破不同類(lèi)型企業(yè)的邊界,在AI上不思進(jìn)取會(huì)面臨被跨行業(yè)而來(lái)的對(duì)手用AI端掉飯碗的風(fēng)險(xiǎn)。

但同時(shí),在基座模型上領(lǐng)先的企業(yè)們,在Scaling Law的規(guī)則下一路狂飆后,終于撞到了一堵無(wú)形的墻——網(wǎng)絡(luò)上的公開(kāi)數(shù)據(jù)已經(jīng)耗竭,接下來(lái)將考驗(yàn)垂直場(chǎng)景和物理世界數(shù)據(jù)的收集利用,成本與難度要高得多。而智能電動(dòng)汽車(chē)恰好是一個(gè)足夠大的細(xì)分場(chǎng)景,也是絕佳的物理世界數(shù)據(jù)生產(chǎn)終端。

對(duì)理想來(lái)說(shuō),All in AI最好的時(shí)機(jī)到了。

該用什么方式All in AI

選擇全面躬身入局后,理想的AI方法論也依然帶著鮮明的理想式烙印:把AI的產(chǎn)品做得更好,吸引更多人。

12月27日,理想AI Talk的最后一天,理想同學(xué)APP在App Store、小米應(yīng)用商城等上線,這是車(chē)企研發(fā)的智能助手首次從車(chē)機(jī)進(jìn)入手機(jī)。此前,車(chē)企的語(yǔ)音助手只搭載于車(chē)上,用在車(chē)內(nèi),服務(wù)自家車(chē)主,超出汽車(chē)場(chǎng)景與其他設(shè)備搶用戶,會(huì)被認(rèn)為偏離造車(chē)主線。

但這一“不務(wù)正業(yè)”的舉動(dòng),在理想的規(guī)劃中是通往AGI的必由之路。

一方面,只在車(chē)內(nèi)單一場(chǎng)景發(fā)揮作用的智能助手,最終不可能是一個(gè)好的助手——用戶很難指望一個(gè)在你開(kāi)車(chē)時(shí)嘮會(huì)兒嗑的對(duì)話機(jī)器人真的懂你。跨越不同的設(shè)備、場(chǎng)景,被足夠多的用戶使用足夠長(zhǎng)的時(shí)間,智能助手才會(huì)越來(lái)越智能,越來(lái)越好用。

另一方面,ChatGPT橫空出世后,對(duì)話機(jī)器人成為AI最廣泛的應(yīng)用。更重要的,自然語(yǔ)言很可能會(huì)成為AGI時(shí)代最通用的交互入口,以對(duì)話形式與人交互的智能助手,將是最基本且普遍的產(chǎn)品形態(tài)。如果一家企業(yè)的目標(biāo)是AGI,智能助手的產(chǎn)品打造和技術(shù)建設(shè)都是不可繞過(guò)的一環(huán)。

但將理想同學(xué)推向手機(jī)、進(jìn)入更多場(chǎng)景,也意味著加入一個(gè)更激烈的戰(zhàn)場(chǎng),需要更強(qiáng)的實(shí)力。理想選擇在基座模型上下功夫。理想新一版端到端多模態(tài)模型Mind GPT3o已正式上線為理想同學(xué)提供支持,其響應(yīng)速度達(dá)到百毫秒級(jí),能夠理解不同模態(tài),記憶、規(guī)劃、工具、表達(dá)能力均得到提升。

手機(jī)上的理想 同學(xué),會(huì)展現(xiàn)思考過(guò)程
打開(kāi)網(wǎng)易新聞 查看精彩圖片
手機(jī)上的理想 同學(xué),會(huì)展現(xiàn)思考過(guò)程

李想向團(tuán)隊(duì)提出了目標(biāo),未來(lái)幾年在國(guó)內(nèi)保證理想大語(yǔ)言模型的基座模型位于行業(yè)前三,這是一個(gè)頗具挑戰(zhàn)性的任務(wù)。

2024年末,國(guó)內(nèi)排行前三的智能助手豆包、文心一言、Kimi月活分別約6000萬(wàn)、1300萬(wàn)、1280萬(wàn),比理想同學(xué)的月活用戶有一個(gè)數(shù)量級(jí)的領(lǐng)先,且同時(shí)登陸PC與手機(jī),提供的能力也更多元。再次扮演追趕者的理想,勢(shì)必要在2025年對(duì)Mind GPT的資金、人才密度進(jìn)一步加碼。

在另一頭,去年讓理想成功躋身智駕第一梯隊(duì)的智駕團(tuán)隊(duì),也并無(wú)閑暇享受勝利。因?yàn)槔硐胫邱{業(yè)務(wù)的階段性目標(biāo)并非問(wèn)鼎L2輔助駕駛,而是實(shí)現(xiàn)有監(jiān)督的自動(dòng)駕駛即L3。

在2025年,理想將尋求高階智駕產(chǎn)品能力的進(jìn)一步提升,比如將接管里程提升至500公里。這需要更快地轉(zhuǎn)動(dòng)數(shù)據(jù)飛輪。理想預(yù)估,要達(dá)成接管里程500公里的目標(biāo),需要從50億乃至100億公里駕駛里程中,篩選2000萬(wàn)個(gè)老司機(jī)駕駛視頻片段供端到端網(wǎng)絡(luò)訓(xùn)練。

這是一項(xiàng)對(duì)數(shù)據(jù)和算力體系的魔鬼考驗(yàn)。但理想以每個(gè)月超2萬(wàn)輛速度擴(kuò)充的高階智駕車(chē)隊(duì),成倍增長(zhǎng)的智駕里程,高度自動(dòng)化的標(biāo)注體系,以及8.1EFlops的云端算力儲(chǔ)備,提供了可行性。

與此同時(shí),理想也開(kāi)始努力鞏固在國(guó)內(nèi)智駕領(lǐng)域“先進(jìn)技術(shù)量產(chǎn)先鋒”的地位。

在最新一版智駕系統(tǒng)中,理想將高速場(chǎng)景納入到端到端架構(gòu),并首次推出了智駕的AI推理可視化——引入思維鏈技術(shù), 在AD Max車(chē)型上展示端到端和VLM系統(tǒng)的感知、推理過(guò)程。

在直播中實(shí)時(shí)運(yùn)行的理想智駕推理可視化UI
打開(kāi)網(wǎng)易新聞 查看精彩圖片
在直播中實(shí)時(shí)運(yùn)行的理想智駕推理可視化UI

智駕系統(tǒng)對(duì)自身思考過(guò)程進(jìn)行展現(xiàn),是解決端到端架構(gòu)黑箱難題的重要方法。打開(kāi)神經(jīng)網(wǎng)絡(luò)的黑箱,既可贏取用戶的信任,也便于智駕團(tuán)隊(duì)對(duì)問(wèn)題場(chǎng)景追根溯源,持續(xù)提升智駕模型的能力。

用一句話總結(jié)理想在2025年的AI戰(zhàn)略,便是理想同學(xué)和高階智駕將繼續(xù)作為理想AI拳頭產(chǎn)品,成倍接入資源,獲取更多用戶,在產(chǎn)品形態(tài)和性能方面向上“摸高”。

理想之所以選擇兩手抓,是因?yàn)閮烧叻謩e代表認(rèn)知(語(yǔ)言)智能和空間(行為)智能,也是人類(lèi)主要的兩種智能表現(xiàn)方式。但人類(lèi)能夠?qū)煞N智能融匯應(yīng)用,這是AI目前的短板。反過(guò)來(lái)意味著,如果能讓AI同時(shí)掌握兩種智能,很可能就找到了AGI的鑰匙。

因此在All in AI的階段,理想已經(jīng)開(kāi)啟下一代基座模型VLA(視覺(jué)語(yǔ)言行動(dòng)模型)的預(yù)研——目的是將認(rèn)知智能和空間智能統(tǒng)一起來(lái),讓一輛理想像人一樣同時(shí)擁有認(rèn)知智能和空間智能,從而實(shí)現(xiàn)L4自動(dòng)駕駛,成為李想定義中“你的助手”。三年之后,理想計(jì)劃推出首款為L(zhǎng)4級(jí)自動(dòng)駕駛定義的汽車(chē)。

屆時(shí),或許就是理想開(kāi)啟機(jī)器人產(chǎn)品線,邁向打造“硅基家人”的開(kāi)始。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

編輯:羅松松

視覺(jué)設(shè)計(jì):疏睿

責(zé)任編輯:李墨天

打開(kāi)網(wǎng)易新聞 查看精彩圖片