作為一名圍棋愛好者,樓天城至今還經(jīng)常喜歡看棋。

在觀看Master(AlphaGo的升級形態(tài))下棋時,如果出現(xiàn)了不理解的招數(shù),他會下意識覺得是因為「身為人類的自己太蠢了」。

在他看來,現(xiàn)階段的L4自動駕駛也步入了這一階段——Robotaxi的決策和軌跡開始變得不易被人理解。

相比較下,L2則會永遠停留在理解范圍之內(nèi),因為后者只是模仿人類,而前者必須超越人類。

打開網(wǎng)易新聞 查看精彩圖片

在4月23日的上海車展上,小馬智行發(fā)布了搭載第七代自動駕駛系統(tǒng)方案。搭載該方案的Robotaxi擁有100%車規(guī)級零部件(覆蓋從線束、連接器到固態(tài)激光雷達、英偉達Orin-X芯片等零部件),自動駕駛套件總成本較前代下降70%,還可支持平臺化適配設計。

同時,基于小馬智行PonyWorld 世界模型技術(shù)基座,Robotaxi安全性比人類駕駛高出10倍。

在發(fā)布會后,RoboX與小馬智行聯(lián)合創(chuàng)始人、CTO——樓天城進行了對話,談到了「從L2到L4」、機器人,以及海外發(fā)展等話題。

VLA只會「短跑」,而非「長跑」

盡管小馬智行直到現(xiàn)在才發(fā)布Ponyworld世界模型,但其實他們已經(jīng)使用了多年此類技術(shù):“世界模型在機器學習領(lǐng)域已經(jīng)有30年歷史了,我們使用世界模型已接近6年,L4都普遍在用…我一直以為這是業(yè)界共識,并未意識到大家不知道這一信息,所以從未強調(diào)過?!?/strong>樓天城說道。

世界模型帶來的主要是學習方式的改變——人類有兩種學習模式:一種是模仿學習,方便快捷,也沒有不確定因素,但學生很難超過老師;另一種是強化學習:由老師創(chuàng)造試驗環(huán)境,自己去摸索。

樓天城指出,所有L4公司都是在強化學習模式中演進。直到端到端、世界模型等術(shù)語成為L2輔助駕駛最火的概念,他才將早已在用的技術(shù)對外擺在了臺面上。

打開網(wǎng)易新聞 查看精彩圖片

“小馬智行的技術(shù)路線經(jīng)歷了多次變革,其中也包括端到端——自Transformer出現(xiàn)開始,小馬智行就開始整合從感知到執(zhí)行的模塊,使得訓練難度、表達能力都逐步提升。彼時,Waymo、百度也都已經(jīng)開始用上了這一思路。”

2023年8月,小馬智行就已將感知、預測、規(guī)控三大傳統(tǒng)模塊打通,統(tǒng)一成端到端自動駕駛模型,搭載到L4級自動駕駛出租車和L2級輔助駕駛乘用車上。該模型在L4級車輛扮演冗余系統(tǒng)的角色,同時也可作為L2級車輛的解決方案。

到了現(xiàn)在,端到端成為了L2的必選項,但對L4公司來說,卻早已是標配了。

至于VLA(視覺語言模型,Vision-Language Model),樓天城的態(tài)度則更加明確:“VLA在L4上基本幫不上忙?!?/strong>

VLA模型擅長整合視覺和語言信息,處理跨模態(tài)任務(如圖像描述、視覺問答),其核心優(yōu)勢在于跨領(lǐng)域通用性。但它通常不針對特定領(lǐng)域進行深度優(yōu)化,其知識通過大規(guī)模預訓練獲得,缺乏對自動駕駛中極端場景的建模能力。(編者注)

他指出,從VLA模型的屬性來看,它相當于一個「全科大夫」,可追求極端安全的L4需要的是「??拼蠓颉埂?/p>

“它就像一個更優(yōu)秀的短跑運動員,但腿部肌肉并不適合長跑。哪怕它經(jīng)過不斷鍛煉成為了博爾特,也不代表他能長跑?!?/p>

個人用戶何時能用上L4?

從產(chǎn)品形式來說,即便是「車位到車位」,也終究人需要人類介入,這樣的產(chǎn)品屬性永遠沒法跨越。

“換句話說,如果安全有一條及格線,L4的安全及格線基本就是滿分線,L4真正的挑戰(zhàn)就在這里。在此標準上,L2差得非常遠……它其實根本過不了L4的及格線,而且會越差越遠。”

打開網(wǎng)易新聞 查看精彩圖片

樓天城認為,目前在L2已經(jīng)逐漸「平權(quán)」的情況下,行業(yè)尋求向L3進階是情理之中的事。然而L3的很多做法,還只是延續(xù)了L2的影子,并非實現(xiàn)質(zhì)變,也不會漸進到L4。

那么,L4的技術(shù),何時能降維到面向個人的量產(chǎn)車上呢?這或許會比預想的要久。

“至少不會是二零二幾年。因為目前的Robotaxi還需要專門的區(qū)域控制、運營、看護、遠程客服等多維度的工作。直到今天,L4也只做了幾個城市,賣給個人的難度更是不可同日而語?!?/p>

具身智能也將經(jīng)歷「真空期」

盡管自動駕駛和機器人有共通之處,甚至前者也是具身智能的一部分。但小馬智行仍然沒有做機器人的計劃。

“不是因為技術(shù)不通用,而是因為我覺得自動駕駛是機器人領(lǐng)域最容易落地的東西。如果連這點都做不到,其他也無從談起?!?/strong>

樓天城認為,具身智能和需要蜇伏更長的時間,和AGI一樣,都會經(jīng)歷和自動駕駛一樣的真空期。

打開網(wǎng)易新聞 查看精彩圖片

在他看來,具身智能今天的狀態(tài)和自動駕駛2018年的狀態(tài)非常像:“我非常懷念那個時候,那時只要做做Demo就行了。”

在次年,疫情來襲,他認為這反而為自動駕駛提供了一個潛心研究的「蟄伏期」:“那段時間,大家的心態(tài)平比較淡一些,這幫助團隊撐過了那段真空期?!?/p>

他坦言,如今具身智能做的很多展示都很炫酷,但真正的商業(yè)化需要考慮很多長尾問題。只有撐過這段沒有任何進展的真空期,才能繼而衡量其商業(yè)和應用價值。

這些挑戰(zhàn)都是自動駕駛曾經(jīng)遭遇過的,因為他經(jīng)歷過,才知道有多困難。

“自動駕駛恐怕是Agent領(lǐng)域中最pioneer的應用了,沒有比Robotaxi更好落地應用的。如果連這一方面都做不到的話,一定上不了牌桌?!?/p>

第七代系統(tǒng)的使命

如今,小馬智行的Robotaxi車隊已至少已經(jīng)跑了50萬個小時,已經(jīng)擴展至市中心、高快速路。

所以到了現(xiàn)在,樓天城認為,是時候講成本和量產(chǎn)了。

現(xiàn)在小馬智行的Robotaxi已實現(xiàn)零部件100%都是車規(guī)的,這也是降本的關(guān)鍵所在。“在這一點上,其他家都還沒做到,尤其Waymo是做得最差的。”

打開網(wǎng)易新聞 查看精彩圖片

樓天城指出,降本的過程有兩個大的里程碑:1、去掉人,2、車規(guī)化量產(chǎn)的這種硬件。這一代系統(tǒng)就是為了達到這個目的。

另外,至今還總有人認為Robotaxi需要付出大量「云代駕」的成本,樓天城也對此進行了澄清。

“我從不會以任何方式嘗試云代駕的邏輯。一般人可能不清楚云代駕的網(wǎng)費高昂到什么地步,而且它對網(wǎng)絡的要求非常高,可能配有云代駕的一輛車,相當于購買并折舊十輛普通車輛的成本總和。而且,由于沒有身臨其境的感覺,云代駕做的判斷也是有誤差的。”

樓天城表示,小馬智行從第一天就沒有嘗試過任何代駕的概念,只是有遠程客服,Waymo也從未做過云代駕。

盡管在降本上,小馬智行已做到了極致,可樓天城還是直言,第七代小馬智行Robotaxi的價格,會在合理范圍內(nèi)定得相對較高。“因為AI的本意,是提供好的產(chǎn)品和高質(zhì)量的服務,而不是把價格卷得更低?!?/strong>