分析師 Xuanhao
量子位智庫 | 公眾號 AI123All

AI的未來,絕不僅限于聊天機器人和數(shù)字世界。

物理世界的AI推進,已經(jīng)開始。而且定義正在被包括李飛飛在內(nèi)的大牛明確——

空間智能。

空間智能是什么?包含哪些應用領域?如何系統(tǒng)性地看待空間智能?隨著技術的不斷進步,虛實融合邊界持續(xù)消融,空間智能的階段性成果、當前的認知和格局,正在愈發(fā)清晰。

在大量桌面研究、調研訪問、數(shù)據(jù)分析之后,為了更好把握空間智能現(xiàn)狀和未來發(fā)展方向,量子位智庫在《空間智能研究報告》(以下簡稱《報告》)中回答如上問題,同時系統(tǒng)性梳理了各應用領域重要玩家,并對產(chǎn)業(yè)迭代影響要素作出研判。

這也是國內(nèi)首份明確以空間智能為對象,提供空間智能產(chǎn)業(yè)圖譜的報告

打開網(wǎng)易新聞 查看精彩圖片

高清版圖譜及報告可點擊「閱讀原文」獲得,文末亦附有完整報告下載鏈接。

首份空間智能研究報告和產(chǎn)業(yè)玩家圖譜

《報告》認為,空間智能是主要基于3D視覺信息進行理解、推理、生成、交互的AI系統(tǒng)。

打開網(wǎng)易新聞 查看精彩圖片

以具體應用領域劃分,按不同的成熟度,空間智能可分為以下三種應用領域:

  • 自動駕駛
  • 3D生成
  • 具身智能

此外,擴展現(xiàn)實(XR,Xtended Reality)是空間智能的原生交互方式,而準確的世界模型是空間智能發(fā)展的終局狀態(tài)。

打開網(wǎng)易新聞 查看精彩圖片

根據(jù)上面的應用領域劃分,結合目前的格局、發(fā)展等多方要素,量子位智庫在《報告》中詳細梳理了當下全球空間智能玩家的首份圖譜:

打開網(wǎng)易新聞 查看精彩圖片

重點關注數(shù)據(jù)體系的成熟度

針對空間智能的不同應用領域,可以從數(shù)據(jù)成熟度、算法成熟度、算力支撐、普及便捷度、經(jīng)濟性等維度進行觀察。

綜合不同維度來看,三個應用領域中自動駕駛成熟度最高,3D生成位居其次,最后是具身智能。

打開網(wǎng)易新聞 查看精彩圖片

其中最值得重點關注的是「數(shù)據(jù)體系的成熟度」這一維度

對比得出,相比語言、圖片和視頻等,空間智能現(xiàn)存的數(shù)據(jù)規(guī)模更少。這就可以解釋為什么空間智能的成熟度更低——尤其具身智能,高質量的真機數(shù)據(jù)數(shù)量稀少。

文字、圖片及視頻等數(shù)據(jù)的成熟支撐了以大語言模型為核心的AI浪潮爆發(fā),《報告》認為,未來待3D、物理AI相關數(shù)據(jù)成熟后,空間智能也將迎來爆發(fā)時刻。

打開網(wǎng)易新聞 查看精彩圖片

作為觀察空間智能進展最重要的維度,除上述數(shù)據(jù)積累規(guī)模外,數(shù)據(jù)體系成熟度具體還包括數(shù)據(jù)構成精簡度、數(shù)據(jù)分布多樣性以及數(shù)據(jù)閉環(huán)成熟度4個部分。

數(shù)據(jù)構成精簡度主要指該領域數(shù)據(jù)模態(tài)、數(shù)據(jù)類型的復雜度,例如具身智能需要融合多種傳感器數(shù)據(jù),成熟度更低、更復雜;數(shù)據(jù)分布多樣性主要指該領域數(shù)據(jù)分布是否足夠豐富以支持模型的泛化;數(shù)據(jù)閉環(huán)成熟度主要指能否構建數(shù)據(jù)飛輪的正反饋加速模型迭代。

打開網(wǎng)易新聞 查看精彩圖片

自動駕駛領域已出現(xiàn)Scaling Law

自動駕駛領域已出現(xiàn)Scaling Law

《報告》表示,自動駕駛是空間智能目前規(guī)模最大、最成熟的應用,已經(jīng)接近人類水平。

其技術前沿開始從模仿學習轉向強化學習,以保持性能增長。

目前,自動駕駛領域已經(jīng)出現(xiàn)屬于空間智能的Scaling Law:可接管里程隨底層算力擴展和強化學習新進展快速增加。

數(shù)據(jù)顯示,2026年以后,當背后算力支持超過百萬卡集群時,預計自動駕駛水準將超過人類駕駛水準。

打開網(wǎng)易新聞 查看精彩圖片

在空間智能的三大具體應用賽道,自動駕駛的數(shù)據(jù)體系目前最為成熟。

  • 數(shù)據(jù)積累規(guī)模來看,駕駛里程積累在百億英里級別;
  • 數(shù)據(jù)構成精簡度上來看,目前主要以視覺信息為核心,輔以激光雷達等少量信息;
  • 數(shù)據(jù)分布多樣性來看,可以覆蓋多樣的駕駛場景(受益于發(fā)達的道路交通系統(tǒng));
  • 數(shù)據(jù)閉環(huán)來看,自動駕駛構建了規(guī)模最大、最成熟的空間智能數(shù)據(jù)閉環(huán)。

打開網(wǎng)易新聞 查看精彩圖片

3D生成已有千萬級別數(shù)據(jù)積累

3D生成已有千萬級別數(shù)據(jù)積累

3D生成是數(shù)字世界的空間智能,由圖形學和AI共同驅動,處于技術快速進步階段。

當前,3D生成的最大瓶頸是難以找到具有良好擴展性的3D數(shù)據(jù)表征。

打開網(wǎng)易新聞 查看精彩圖片

數(shù)據(jù)積累規(guī)模來看,3D生成有千萬級別的數(shù)據(jù)積累,足以支撐可以商業(yè)化的產(chǎn)品;從數(shù)據(jù)構成上看,目前有多種數(shù)據(jù)表示形式,較復雜,技術方向尚未收斂;從數(shù)據(jù)分布多樣性來看,可以覆蓋3D資產(chǎn)生成的大部分應用場景;從數(shù)據(jù)閉環(huán)來看,尚未形成閉環(huán)模式。

具身智能整體成熟度尚且較低

具身智能整體成熟度尚且較低

《報告》認為,可以和物理世界深度交互的具身智能,是空間智能未來規(guī)模最大的應用。

但就目前而言,具身智能整體成熟度較低,不過頭部玩家即將開始生產(chǎn)環(huán)境實驗。

打開網(wǎng)易新聞 查看精彩圖片

數(shù)據(jù)積累規(guī)模來看,需要廠商從零做起采集真機數(shù)據(jù),存量積累規(guī)模小;從數(shù)據(jù)構成精簡度來看,具身智能涉及多種數(shù)據(jù)模態(tài)的融合,十分復雜,且面臨跨本體的泛化性問題;從數(shù)據(jù)分布多樣性來看,目前真機數(shù)據(jù)的分布也較為單一,以常見的運動和抓取場景為主;從數(shù)據(jù)閉環(huán)成熟度來看,機器人落地應用較為早期,尚未構建有效的數(shù)據(jù)飛輪

XR可實現(xiàn)3D類內(nèi)容的原生消費

XR可實現(xiàn)3D類內(nèi)容的原生消費

擴展現(xiàn)實(XR)的硬件基礎正在成熟,可實現(xiàn)3D類內(nèi)容的原生消費,未來隨著3D原生內(nèi)容和相關應用生態(tài)的成熟,將打開更大的市場。

XR是目前訓練具身智能的關鍵數(shù)據(jù)采集方式,可以加速真機數(shù)據(jù)增長推動空間智能發(fā)展。英偉達、特斯拉、Meta等領先機構已有相關探索實踐。

打開網(wǎng)易新聞 查看精彩圖片

精確完備的世界模型是空間智能發(fā)展的終局狀態(tài)

世界模型是從大量數(shù)據(jù)中構建理解世界運作方式的內(nèi)部表征,可以推理行動后果預測未來,精確完備的世界模型是空間智能發(fā)展的終局狀態(tài)。

《報告》認為世界模型可以通過各種技術路徑逼近,但不同路徑的精度和效率各異。

其中,側重3D和物理AI的空間智能,可能是建模真實世界的最佳方式。

打開網(wǎng)易新聞 查看精彩圖片

有關空間智能的更多詳細內(nèi)容,可在完整報告中獲取。

報告下載鏈接:

https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f