4月29日,第八屆數(shù)字中國建設峰會開幕。

由國家數(shù)據(jù)局主辦,國家數(shù)據(jù)發(fā)展研究院、國家發(fā)展改革委城市和小城鎮(zhèn)改革發(fā)展中心、中國信息通信研究院等承辦的數(shù)字中國建設峰會數(shù)字經(jīng)濟分論壇在同日舉行。

杭州宇樹科技有限公司(以下簡稱宇樹科技)董事王其鑫發(fā)表了主題演講。王其鑫表示,2024年國內(nèi)的具身/人形項目融資突破100億元,在可展望的未來,人形機器人會走進千家萬戶。

王其鑫認為,以人形機器人實現(xiàn)具身智能在技術(shù)路線上的發(fā)展可分為三步。第一,建立第一視角下靈活的具身認知系統(tǒng);第二,實現(xiàn)高度自主的決策規(guī)劃能力;第三,實現(xiàn)目標驅(qū)動與物理世界的精確運動交互。

AGI的實現(xiàn)是非常有可能的

王其鑫介紹稱,目前宇樹科技的產(chǎn)品分為消費級和行業(yè)級的機器人。

“消費級的機器人就是普通消費者可以買回去(使用),比如幫你取外賣、取快遞,跑步幫你背個水,買菜幫你背包,做一些簡單的事情,售價也會比較便宜,在天貓、京東就可以直接下單購買?!蓖跗漩伪硎?。

王其鑫稱,宇樹科技主要的銷售來源其實是工業(yè)端?!拔覀児I(yè)級的四足機器人,它可以在電力巡檢、消防救援、園區(qū)安防等領域提供服務。一般應用場景都是一些有毒氣、輻射或者是特別惡劣的環(huán)境里,為人類減輕負擔?!蓖跗漩畏Q。

對于目前AI(人工智能)的發(fā)展,王其鑫認為會分成三個階段?!笆紫仁侨魽I階段,指的是只能做一些單一領域工作的人工智能系統(tǒng),比如谷歌的阿爾法狗(即AlphaGo)圍棋系統(tǒng)。”

“下一個階段是強AI,但是目前還沒有達到強AI階段,強AI除了在特定領域有一些應用,可以做到很智能的程度,同時具備一定的學習能力,具備比較廣泛的智能能力。雖然說現(xiàn)在沒有達到強AI階段,但是我們看到這兩年AI大模型發(fā)展得比較火熱,AI大模型的非提前預設‘涌現(xiàn)能力’,是我們邁向強AI的一個重要的發(fā)展階段?!蓖跗漩畏Q。

王其鑫繼續(xù)說道:“最后一個階段就是AGI——通用人工智能,是指AI能夠完全模仿人類的智能行為,比如說它可以實現(xiàn)自我學習、自我改進、自我調(diào)整等,目前來看只能在一些科幻作品里面看到這樣的概念,但是AGI的實現(xiàn)是非常有可能的,實現(xiàn)它的途徑之一必然是具身智能?!?/p>

王其鑫解釋,具身智能是融合了身體感知、環(huán)境交互和運動能力的綜合性概念。具身智能非常強調(diào)身體在智能行為當中的重要性,即必須要有一個智能體通過身體來感知周圍的環(huán)境,比如具有視覺、嗅覺、聽覺等,獲取到了環(huán)境信息之后,再做出一些決策和改變,進一步跟環(huán)境進行交互,從而進行學習。

“具身智能在生活里面有很多應用案例,只不過(目前)都比較初級?!蓖跗漩闻e例稱,比如醫(yī)療機器人,它可以縫合一個生雞蛋,它是在感知到包裹蛋液的非常脆弱的外皮之后,還可以完美地把它縫合起來。

“比如說服務機器人,我們宇樹的機器人去年在泰山清運垃圾。比如說工業(yè)機器人,我們看到汽車工廠里有很多機械臂,可以幫助(人類)減輕工作負擔,這都屬于具身智能的范疇。自動駕駛汽車同樣屬于這個領域,比如說它現(xiàn)在已經(jīng)有非常強的感知能力,能夠適應道路的變換、識別人行馬路等,這些其實都是具身智能的應用案例,只不過目前還不是特別高級的具身智能?!蓖跗漩伪硎?。

實現(xiàn)具身智能分三步走

“(業(yè)內(nèi))大家有一個共識,就是我們(國家)在具身智能領域其實是并不弱于發(fā)達國家,因為我們有非常完善的產(chǎn)業(yè)鏈,所以說我們在這一方面其實并不差。尤其是美國硅谷精英,他們并不太愿意去做硬件產(chǎn)品,他們更喜歡做軟件,這就是我們的機會。”王其鑫表示。

“其實國內(nèi)在具身智能領域已經(jīng)有很多新公司涌現(xiàn)出來了,比如,僅2024年就有百億元的融資,要知道這里面大部分的公司其實都是初創(chuàng)企業(yè)?!蓖跗漩伪硎尽?/p>

打開網(wǎng)易新聞 查看精彩圖片

圖片來源:每經(jīng)記者 趙李南 攝

王其鑫認為,人形機器人應該是具身智能最好的形態(tài)之一。如果想要用人形機器人實現(xiàn)具身智能,要分三步走。

“第一步先要產(chǎn)生認知。舉一個例子,國外一個研究團隊基于宇樹的人形機器人做的一個全身(實時控制)的遙控操作系統(tǒng),這個技術(shù)方案我們也已經(jīng)開源了一部分,它可以幫助機器人迅速認識我們周圍的環(huán)境?!蓖跗漩伪硎?。

“第二步是讓機器人具有決策能力??▋?nèi)基梅隆大學基于宇樹提出WoCoCo框架,解決了人形機器人順序接觸任務執(zhí)行難題。這個框架可以有效幫助機器人迅速完成決策,比如,機器人可以在跳箱子的過程中自動決策自己的路線?!蓖跗漩伪硎?。

王其鑫繼續(xù)說道:“第三步就是交互。斯坦福大學基于我們?nèi)诵螜C器人發(fā)表的一篇論文是(關于)跟蹤和模仿人類,可以看到我們的機器人可以認知到很多細節(jié)問題。比如在開柜門的時候,它可以拉到柜門的門把手;在疊衣服的時候,它可以準確地交互到衣角、衣袖,完成疊衣服的過程?!?/p>

王其鑫也介紹了宇樹科技的技術(shù)路線。“我們首先會基于人類的行為視頻,或者是動作捕捉數(shù)據(jù)等,來構(gòu)建我們?nèi)诵螜C器人(所需要的)海量行為數(shù)據(jù)庫,通過并行仿真和訓練平臺可以很好地實現(xiàn)基于強化學習的端到端的運動控制技術(shù),這都是要基于我們數(shù)據(jù)平臺來實現(xiàn)的?!蓖跗漩伪硎尽?/p>

展望未來,王其鑫認為,具身智能的實現(xiàn)需要兩到三個階段。

“第一個階段是可能會先應用在工業(yè)領域,比如一些特種行業(yè)、制造行業(yè)等,讓機器人去做一些復雜、沉重的事情。在邁向民用階段之前可能還會有一個商業(yè)階段,比如零售業(yè)、康養(yǎng)業(yè)可能會讓機器人先做一些工作,最終我們一定是希望人形機器人進入千家萬戶,來為我們每一個人提供幫助?!蓖跗漩伪硎?。