作 者

先進(jìn)制造業(yè)研究中心

打開網(wǎng)易新聞 查看精彩圖片

具身智能體通過物理實體和環(huán)境的動態(tài)交互,實現(xiàn)感知、認(rèn)知、決策和行動一體化,較為典型的具身智能體包括智能機(jī)器人、自動駕駛汽車、自動飛行無人機(jī)等,它們顛覆了傳統(tǒng)人工智能“離身性”局限,推動人工智能從虛擬走向物理操作。具身智能體不僅是技術(shù)革命的“領(lǐng)航員”,更是國際競爭新賽道的核心內(nèi)容,其發(fā)展水平將深刻影響國家綜合實力與全球科技治理格局,成為塑造未來社會形態(tài)的關(guān)鍵力量。

01

美國具身智能體發(fā)展步入快車道

美國多維度政策聯(lián)動推動具身智能體發(fā)展

美國聚焦技術(shù)、倫理規(guī)范等領(lǐng)域,通過政策、基金等方式助推具身智能體發(fā)展。從技術(shù)層面來看,2023年,美國更新《國家人工智能研發(fā)戰(zhàn)略計劃》,仍重點聚焦機(jī)器人、人工智能等具身智能體關(guān)鍵環(huán)節(jié),重點關(guān)注人工智能交互和協(xié)作的的新范式等內(nèi)容。從倫理規(guī)范來看,2023年,美國發(fā)布《關(guān)于安全、可靠和可信的AI行政命令》,主要為規(guī)避AI系統(tǒng)潛在風(fēng)險,主要內(nèi)容包括制定標(biāo)準(zhǔn)、工具和測試,以確保AI系統(tǒng)安全、可靠、可信,解決算法歧視問題。從基金資助層面來看,2024年,美國國家科學(xué)基金委(NSF)資助多項人工智能、機(jī)器人、邊緣計算等領(lǐng)域研發(fā)。

美國實驗室聚焦基礎(chǔ)研究及跨學(xué)科深度融合持續(xù)為具身智能體提供核心驅(qū)動力

斯坦福大學(xué)、哈佛大學(xué)、麻省理工學(xué)院、加州大學(xué)圣地亞哥分校、卡內(nèi)基梅隆大學(xué)、加州理工學(xué)院、加州大學(xué)伯克利分校、賓夕法尼亞大學(xué)等多所高校建設(shè)具身智能領(lǐng)域?qū)嶒炇?,對于前瞻性、?chuàng)新性強(qiáng),甚至具有顛覆性、變革性技術(shù)可獲美國國家科學(xué)基金委(NSF)探索性研究基金資助,容錯率較高,該類實驗室主要尋求物理交互建模、多模態(tài)感知融合等基礎(chǔ)研究突破,構(gòu)建具身智能體感知層及執(zhí)行層的基礎(chǔ)邏輯。同時,美國高校多所實驗室聚焦跨學(xué)科協(xié)同研究,將人工智能、神經(jīng)科學(xué)、材料學(xué)、心理學(xué)等進(jìn)行深度融合,重點研究自修復(fù)軟體機(jī)器人、基于深度學(xué)習(xí)的情感感知傳感器、智能探索、具有社會情感智能的社交機(jī)器人等領(lǐng)域項目。

表1:美國部分具身智能體領(lǐng)域?qū)嶒炇?/p>

打開網(wǎng)易新聞 查看精彩圖片

美國以全球領(lǐng)先的具身智能體技術(shù)塑造產(chǎn)業(yè)競爭力

美國具身智能體技術(shù)全球領(lǐng)先,尤其是在基礎(chǔ)理論、算法創(chuàng)新及硬件領(lǐng)域競爭力強(qiáng)勁。在基礎(chǔ)理論領(lǐng)域,美國高校通過心理學(xué)與AI交叉研究,揭示物理交互對智能涌現(xiàn)的影響,為機(jī)器人自主決策提供更接近人類認(rèn)知的框架。在算法創(chuàng)新方面,美國高校的Dense Fusion算法通過視覺與觸覺的結(jié)合,大幅提升多模態(tài)目標(biāo)檢測精度,擴(kuò)散引導(dǎo)控制模型提高機(jī)器人在復(fù)雜環(huán)境中的動作規(guī)劃效率,支持全身靈巧機(jī)器人的開發(fā)。在硬件領(lǐng)域,美國GPU、NPU等芯片產(chǎn)業(yè)生態(tài)成熟,有效支撐美國具身智能體發(fā)展。

美國具身智能體領(lǐng)域投融資活躍加速其商業(yè)化

美國具身智能體的蓬勃發(fā)展與其活躍的投融資生態(tài)密不可分,資本、技術(shù)、市場的高效聯(lián)動快速推進(jìn)美國具身智能體商業(yè)化進(jìn)程。目前,美國具身智能體已吸引超百億美元投融資,F(xiàn)igure AI等企業(yè)單輪融資超過5億美元。Figure AI成立于2022年,融資總額已超8億美元,在第二輪投資6個月后,F(xiàn)igure AI發(fā)布機(jī)器人沖咖啡視頻,已具備自主學(xué)習(xí)和任務(wù)執(zhí)行能力,三輪融資后,F(xiàn)igure AI機(jī)器人語言交互能力、任務(wù)執(zhí)行能力大幅提升。

表2:美國部分具身智能體領(lǐng)域公司主要投融資情況

打開網(wǎng)易新聞 查看精彩圖片

02

具身智能體整體發(fā)展面臨多重挑戰(zhàn)

技術(shù)維度:感知、交互、決策執(zhí)行的“三重困境”

具身智能體作為新興技術(shù),已在多個細(xì)分領(lǐng)域取得顯著進(jìn)展,但其相關(guān)技術(shù)仍面臨諸多挑戰(zhàn)。一是環(huán)境等感知精度不足,例如在復(fù)雜光照、遮擋或動態(tài)場景中,現(xiàn)有感知技術(shù)存在顯著誤差,同時,對于多模態(tài)感知融合技術(shù),視覺、聽覺、觸覺等跨模態(tài)對齊仍需要持續(xù)突破。二是交互能力有限,目前具身智能體的大模型能夠處理的任務(wù)相對固定,在多樣化、復(fù)雜場景中的泛化能力有限,且目前具身智能體控制系統(tǒng)延遲時間遠(yuǎn)超人類神經(jīng)系統(tǒng)。三是決策執(zhí)行仍需突破,在高頻交互的場景下,目前算法的決策速度無法滿足需求。

應(yīng)用維度:落地應(yīng)用的“理想與現(xiàn)實差距”

具身智能體應(yīng)用場景廣泛,但其落地仍存在一定問題。一是從仿真到現(xiàn)實的遷移難度較大,具身智能體的仿真環(huán)境與現(xiàn)實環(huán)境之間仍存在較大差異,且仿真環(huán)境缺乏真實物理世界的高質(zhì)量動態(tài)數(shù)據(jù),導(dǎo)致具身智能體在仿真環(huán)境中表現(xiàn)良好,但在現(xiàn)實環(huán)境中表現(xiàn)不佳。二是需求碎片化,具身智能體在工業(yè)、醫(yī)療、物流、商業(yè)、教育、娛樂、安防等應(yīng)用場景需求差異較大,單一產(chǎn)品難以覆蓋,需高度定制化,研發(fā)周期較長。三是消費者預(yù)期較高,目前具身智能體產(chǎn)品成熟度不足,例如,家庭清潔機(jī)器人僅能完成基礎(chǔ)清潔,養(yǎng)老陪護(hù)機(jī)器人方言識別能力較弱,應(yīng)對突發(fā)情況能力不足,難以滿足消費者的實際需求。

監(jiān)管維度:隱私、倫理偏見的“治理真空”

具身智能體的快速發(fā)展帶來了顯著的隱私、倫理偏見挑戰(zhàn),成為制約其健康、可持續(xù)發(fā)展的重要因素。一是存在數(shù)據(jù)安全和隱私風(fēng)險,具身智能體存在隱蔽收集用戶數(shù)據(jù)可能性,例如,具身智能體通過攝像頭等在家庭應(yīng)用場景中收集用戶數(shù)據(jù)。二是數(shù)據(jù)、算法等導(dǎo)致潛在的偏見問題,數(shù)據(jù)來源不均衡、數(shù)據(jù)標(biāo)注不準(zhǔn)確等數(shù)據(jù)偏見、算法偏見等都可能導(dǎo)致模型對某些群體的偏見,從而導(dǎo)致歧視性決策。三是人機(jī)權(quán)力關(guān)系失衡,自主性邊界不清晰,具身智能體過度自主可能剝奪人類選擇權(quán),如養(yǎng)老機(jī)器人強(qiáng)制安排作息,同時,還存在情感操縱風(fēng)險,兒童教育機(jī)器人通過個性化交互誘導(dǎo)用戶行為,如過度依賴或消費引導(dǎo)。

03

具身智能體發(fā)展的幾點啟示

系統(tǒng)性與協(xié)同性共生,打造蓬勃產(chǎn)業(yè)生態(tài)

生態(tài)軟實力是具身智能體發(fā)展的重要基礎(chǔ),以系統(tǒng)性布局構(gòu)建產(chǎn)業(yè)生態(tài),以協(xié)同創(chuàng)新突破核心技術(shù),推動具身智能體從實驗室走向千行百業(yè)。一是搭建公共平臺,例如開放數(shù)據(jù)集與仿真平臺,加速訓(xùn)練迭代,打造數(shù)據(jù)標(biāo)注、存儲、分析平臺,促進(jìn)數(shù)據(jù)流通與價值挖掘。二是構(gòu)建產(chǎn)業(yè)創(chuàng)新聯(lián)合體,整合硬件、算法、應(yīng)用方等產(chǎn)學(xué)研資源,支持強(qiáng)化算法-硬件協(xié)同創(chuàng)新。三是設(shè)置倫理容錯機(jī)制,構(gòu)建責(zé)任認(rèn)定與補(bǔ)償機(jī)制,設(shè)定一定程度的合規(guī)緩沖期。四是提前布局基礎(chǔ)設(shè)施,建設(shè)智算中心等算力新基建,進(jìn)行5G專網(wǎng)覆蓋,重點園區(qū)實現(xiàn)μs級延遲。五是構(gòu)建政府引導(dǎo)基金、產(chǎn)業(yè)資本、風(fēng)險投資、債券融資等多元創(chuàng)新金融支持體系,探索技術(shù)期權(quán)貸款,按研發(fā)專利潛在價值授信。

技術(shù)與市場雙輪驅(qū)動,加速商業(yè)化落地

具身智能體的商業(yè)化需以技術(shù)突破為根基,以市場需求為導(dǎo)向,深化應(yīng)用場景,最終實現(xiàn)具身智能體在工業(yè)、醫(yī)療、家庭等領(lǐng)域的全面滲透。一是制定核心技術(shù)突破優(yōu)先級矩陣,率先突破高精度執(zhí)行器、仿生觸覺傳感、仿生驅(qū)動關(guān)節(jié)、輕量化材料、具身認(rèn)知算法、邊緣計算芯片等關(guān)鍵核心環(huán)節(jié)。二是打造測試認(rèn)證體系,建立具身智能體測試認(rèn)證平臺,對認(rèn)證體系進(jìn)行分層設(shè)計,培育第三方認(rèn)證機(jī)構(gòu),提供市場化檢驗服務(wù)。三是打造垂直場景標(biāo)桿案例,在工業(yè)、醫(yī)療、家庭等場景率先打造示范工程,通過高復(fù)雜度場景壓力測試加速技術(shù)成熟,形成“技術(shù)研發(fā)-場景驗證-市場反饋-迭代升級”的正向循環(huán),通過示范工程實現(xiàn)技術(shù)落地及市場需求挖掘培育。

倫理與標(biāo)準(zhǔn)先行,構(gòu)建風(fēng)險可控國際化發(fā)展框架

具身智能體作為鏈接虛擬與物理世界的重要載體,其倫理規(guī)范和標(biāo)準(zhǔn)是具身智能體可持續(xù)發(fā)展的前置要求。一是構(gòu)建政府監(jiān)管框架,實施“動態(tài)監(jiān)管沙盒+負(fù)面清單”組合管理,在限定區(qū)域測試高風(fēng)險應(yīng)用,實時監(jiān)測社會影響構(gòu)建跨部門數(shù)字監(jiān)管中臺,建立類似藥物臨床試驗的AI倫理委員會,強(qiáng)制關(guān)鍵場景,例如醫(yī)療、教育等進(jìn)行審查。二是進(jìn)行技術(shù)糾偏,開發(fā)偏見檢測工具,量化評估具身智能體的決策偏差,合成數(shù)據(jù)增強(qiáng),用生成對抗網(wǎng)絡(luò)(GANs)補(bǔ)充少數(shù)群體數(shù)據(jù),研發(fā)倫理嵌入型芯片,在算法底層植入可解釋性模塊。三是提前布局標(biāo)準(zhǔn)國際化,積極牽頭制定人機(jī)交互安全標(biāo)準(zhǔn)、環(huán)境適應(yīng)性標(biāo)準(zhǔn)等國際標(biāo)準(zhǔn),爭取國際話語權(quán)。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

滑動查看報告全文

更多行業(yè)案例及其特點,請掃描下方二維碼關(guān)注“賽迪顧問”,獲取最新動態(tài)。

微信號:ccidconsulting

打開網(wǎng)易新聞 查看精彩圖片

本公眾號提供的內(nèi)容用于個人學(xué)習(xí)、研究或欣賞,不可用于其他商業(yè)用途。如有關(guān)于作品內(nèi)容、版權(quán)及其它問題,請及時在公眾號留言。

如果獲得轉(zhuǎn)載授權(quán),請注明作者姓名和轉(zhuǎn)載的出處,不修改文章的標(biāo)題、文字、圖片或者音視頻,以免曲解原文意思。