4月29日,第八屆數(shù)字中國建設(shè)峰會開幕。
由國家數(shù)據(jù)局主辦,國家數(shù)據(jù)發(fā)展研究院、國家發(fā)展改革委城市和小城鎮(zhèn)改革發(fā)展中心、中國信息通信研究院等承辦的數(shù)字中國建設(shè)峰會數(shù)字經(jīng)濟(jì)分論壇在同日舉行。
杭州宇樹科技有限公司(以下簡稱宇樹科技)董事王其鑫發(fā)表了主題演講。王其鑫表示,2024年國內(nèi)的具身/人形項(xiàng)目融資突破100億元,在可展望的未來,人形機(jī)器人會走進(jìn)千家萬戶。
王其鑫認(rèn)為,以人形機(jī)器人實(shí)現(xiàn)具身智能在技術(shù)路線上的發(fā)展可分為三步。第一,建立第一視角下靈活的具身認(rèn)知系統(tǒng);第二,實(shí)現(xiàn)高度自主的決策規(guī)劃能力;第三,實(shí)現(xiàn)目標(biāo)驅(qū)動與物理世界的精確運(yùn)動交互。
AGI的實(shí)現(xiàn)是非常有可能的
王其鑫介紹稱,目前宇樹科技的產(chǎn)品分為消費(fèi)級和行業(yè)級的機(jī)器人。
“消費(fèi)級的機(jī)器人就是普通消費(fèi)者可以買回去(使用),比如幫你取外賣、取快遞,跑步幫你背個(gè)水,買菜幫你背包,做一些簡單的事情,售價(jià)也會比較便宜,在天貓、京東就可以直接下單購買。”王其鑫表示。
王其鑫稱,宇樹科技主要的銷售來源其實(shí)是工業(yè)端。“我們工業(yè)級的四足機(jī)器人,它可以在電力巡檢、消防救援、園區(qū)安防等領(lǐng)域提供服務(wù)。一般應(yīng)用場景都是一些有毒氣、輻射或者是特別惡劣的環(huán)境里,為人類減輕負(fù)擔(dān)?!蓖跗漩畏Q。
對于目前AI(人工智能)的發(fā)展,王其鑫認(rèn)為會分成三個(gè)階段?!笆紫仁侨魽I階段,指的是只能做一些單一領(lǐng)域工作的人工智能系統(tǒng),比如谷歌的阿爾法狗(即AlphaGo)圍棋系統(tǒng)?!?/p>
“下一個(gè)階段是強(qiáng)AI,但是目前還沒有達(dá)到強(qiáng)AI階段,強(qiáng)AI除了在特定領(lǐng)域有一些應(yīng)用,可以做到很智能的程度,同時(shí)具備一定的學(xué)習(xí)能力,具備比較廣泛的智能能力。雖然說現(xiàn)在沒有達(dá)到強(qiáng)AI階段,但是我們看到這兩年AI大模型發(fā)展得比較火熱,AI大模型的非提前預(yù)設(shè)‘涌現(xiàn)能力’,是我們邁向強(qiáng)AI的一個(gè)重要的發(fā)展階段?!蓖跗漩畏Q。
王其鑫繼續(xù)說道:“最后一個(gè)階段就是AGI——通用人工智能,是指AI能夠完全模仿人類的智能行為,比如說它可以實(shí)現(xiàn)自我學(xué)習(xí)、自我改進(jìn)、自我調(diào)整等,目前來看只能在一些科幻作品里面看到這樣的概念,但是AGI的實(shí)現(xiàn)是非常有可能的,實(shí)現(xiàn)它的途徑之一必然是具身智能?!?/p>
王其鑫解釋,具身智能是融合了身體感知、環(huán)境交互和運(yùn)動能力的綜合性概念。具身智能非常強(qiáng)調(diào)身體在智能行為當(dāng)中的重要性,即必須要有一個(gè)智能體通過身體來感知周圍的環(huán)境,比如具有視覺、嗅覺、聽覺等,獲取到了環(huán)境信息之后,再做出一些決策和改變,進(jìn)一步跟環(huán)境進(jìn)行交互,從而進(jìn)行學(xué)習(xí)。
“具身智能在生活里面有很多應(yīng)用案例,只不過(目前)都比較初級?!蓖跗漩闻e例稱,比如醫(yī)療機(jī)器人,它可以縫合一個(gè)生雞蛋,它是在感知到包裹蛋液的非常脆弱的外皮之后,還可以完美地把它縫合起來。
“比如說服務(wù)機(jī)器人,我們宇樹的機(jī)器人去年在泰山清運(yùn)垃圾。比如說工業(yè)機(jī)器人,我們看到汽車工廠里有很多機(jī)械臂,可以幫助(人類)減輕工作負(fù)擔(dān),這都屬于具身智能的范疇。自動駕駛汽車同樣屬于這個(gè)領(lǐng)域,比如說它現(xiàn)在已經(jīng)有非常強(qiáng)的感知能力,能夠適應(yīng)道路的變換、識別人行馬路等,這些其實(shí)都是具身智能的應(yīng)用案例,只不過目前還不是特別高級的具身智能。”王其鑫表示。
實(shí)現(xiàn)具身智能分三步走
“(業(yè)內(nèi))大家有一個(gè)共識,就是我們(國家)在具身智能領(lǐng)域其實(shí)是并不弱于發(fā)達(dá)國家,因?yàn)槲覀冇蟹浅M晟频漠a(chǎn)業(yè)鏈,所以說我們在這一方面其實(shí)并不差。尤其是美國硅谷精英,他們并不太愿意去做硬件產(chǎn)品,他們更喜歡做軟件,這就是我們的機(jī)會。”王其鑫表示。
“其實(shí)國內(nèi)在具身智能領(lǐng)域已經(jīng)有很多新公司涌現(xiàn)出來了,比如,僅2024年就有百億元的融資,要知道這里面大部分的公司其實(shí)都是初創(chuàng)企業(yè)。”王其鑫表示。

圖片來源:每經(jīng)記者 趙李南 攝
王其鑫認(rèn)為,人形機(jī)器人應(yīng)該是具身智能最好的形態(tài)之一。如果想要用人形機(jī)器人實(shí)現(xiàn)具身智能,要分三步走。
“第一步先要產(chǎn)生認(rèn)知。舉一個(gè)例子,國外一個(gè)研究團(tuán)隊(duì)基于宇樹的人形機(jī)器人做的一個(gè)全身(實(shí)時(shí)控制)的遙控操作系統(tǒng),這個(gè)技術(shù)方案我們也已經(jīng)開源了一部分,它可以幫助機(jī)器人迅速認(rèn)識我們周圍的環(huán)境。”王其鑫表示。
“第二步是讓機(jī)器人具有決策能力??▋?nèi)基梅隆大學(xué)基于宇樹提出WoCoCo框架,解決了人形機(jī)器人順序接觸任務(wù)執(zhí)行難題。這個(gè)框架可以有效幫助機(jī)器人迅速完成決策,比如,機(jī)器人可以在跳箱子的過程中自動決策自己的路線。”王其鑫表示。
王其鑫繼續(xù)說道:“第三步就是交互。斯坦福大學(xué)基于我們?nèi)诵螜C(jī)器人發(fā)表的一篇論文是(關(guān)于)跟蹤和模仿人類,可以看到我們的機(jī)器人可以認(rèn)知到很多細(xì)節(jié)問題。比如在開柜門的時(shí)候,它可以拉到柜門的門把手;在疊衣服的時(shí)候,它可以準(zhǔn)確地交互到衣角、衣袖,完成疊衣服的過程?!?/p>
王其鑫也介紹了宇樹科技的技術(shù)路線?!拔覀兪紫葧谌祟惖男袨橐曨l,或者是動作捕捉數(shù)據(jù)等,來構(gòu)建我們?nèi)诵螜C(jī)器人(所需要的)海量行為數(shù)據(jù)庫,通過并行仿真和訓(xùn)練平臺可以很好地實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的端到端的運(yùn)動控制技術(shù),這都是要基于我們數(shù)據(jù)平臺來實(shí)現(xiàn)的?!蓖跗漩伪硎?。
展望未來,王其鑫認(rèn)為,具身智能的實(shí)現(xiàn)需要兩到三個(gè)階段。
“第一個(gè)階段是可能會先應(yīng)用在工業(yè)領(lǐng)域,比如一些特種行業(yè)、制造行業(yè)等,讓機(jī)器人去做一些復(fù)雜、沉重的事情。在邁向民用階段之前可能還會有一個(gè)商業(yè)階段,比如零售業(yè)、康養(yǎng)業(yè)可能會讓機(jī)器人先做一些工作,最終我們一定是希望人形機(jī)器人進(jìn)入千家萬戶,來為我們每一個(gè)人提供幫助?!蓖跗漩伪硎尽?/p>
熱門跟貼