
「全球首個一腦多能、一腦多機的通用具身智能平臺來了。具身智能在勞動自動化方面的進展正日益加快,并超出我們的預期。」
文|DeepAI 王欣
編輯 | 擎天柱
3月12日,北京人形機器人創(chuàng)新中心(以下簡稱:創(chuàng)新中心)發(fā)布了全球首個一腦多能、一腦多機的通用具身智能平臺「慧思開物」。
在這次發(fā)布會現(xiàn)場,《智駕網(wǎng)-DeepAI》看到,基于虛實結合的訓練模式和以技能庫為核心的運動執(zhí)行方式,通過語音交互、APP直連,慧思開物就可以讓天工機器人完成在工業(yè)分揀、積木搭建、桌面清理和物流打包四個場景的真機操作。
近年來機器人技術發(fā)展有一句話很火——人類寫詩、機器人刷碗,還是機器人寫詩、人類刷碗?
這一說法源自近年來人工智能技術發(fā)展引發(fā)的社會討論,用來形容生成式AI(如作詩、繪畫模型)的快速發(fā)展與機器人實際應用場景的滯后形成鮮明對比,揭示了AI技術路徑與人類需求之間的錯位。
直至這次北京國家隊出手,具身智能在勞動自動化方面的進展正日益加快,并超出我們的預期。
01.
能分揀、搭積木,解放人類勞動力的時刻不遠了?
「慧思開物」就像具身智能機器人的中樞神經(jīng)系統(tǒng),集成了感知、決策、語言、學習及運動控制等高級認知功能,可以為具身智能機器人提供感知、決策與執(zhí)行能力。
只需要人類一句語言指令,機器人就可以實現(xiàn)從任務理解、環(huán)境感知到執(zhí)行的全流程智能化,具備處理多種場景復雜任務的泛化能力。
創(chuàng)新中心首席技術官唐劍向《智駕網(wǎng)-DeepAI》表示:「“慧思開物”作為機器人中樞神經(jīng)系統(tǒng),集成感知、決策、語言、學習及運動控制等高級認知功能,通過多專家智能體協(xié)同實現(xiàn)模型能力提升,增強機器人在復雜任務中的智能化與執(zhí)行效率,同時通過低代碼方式降低機器人開發(fā)門檻,簡化開發(fā)流程。」

那么,都解鎖了哪些場景呢?
場景一:工業(yè)分揀
在工業(yè)分揀任務中,通過「慧思開物」APP直連,UR-5e機械臂能夠精準解析語音指令,將復雜的技術能力(如推理、規(guī)劃、技能調(diào)用)封裝為簡單易用的操作流程,并通過雙臂協(xié)同的方式完成分揀操作,顯著降低了用戶使用門檻。

同時,平臺支持自定義模型和技能的快速添加,能夠靈活適配不同場景的應用需求,為工業(yè)自動化領域提供便捷、高效的解決方案。并且這也是行業(yè)內(nèi)首創(chuàng)的「APP+機器人」模式。

場景二:積木搭建
在積木搭建實驗中,「慧思開物」通過大模型思維鏈能力,首次實現(xiàn)了復雜任務的智能化拆解與執(zhí)行。
當面對隨機組合的積木模型時,「 測試中,"天工"機器人以毫米級操作精度,準確拾取相應積木,并按次序完成了3層積木的毫米級精準搭建。 場景三:桌面清理 在桌面清理場景中,人形機器人「天工」展現(xiàn)了端到端模型賦能下的雙臂協(xié)作的高效性與動態(tài)環(huán)境下的自適應能力,流暢地整理桌面餐具,將垃圾收進錫紙盤并放入垃圾桶。整個過程中,機器人在多次任意隨機的人為打斷和移位干擾的情況下,仍能自主糾錯、重新規(guī)劃并完成任務。 當積木組件意外偏移時,天工僅用0.3秒便重新規(guī)劃運動軌跡,通過多模態(tài)感知實時調(diào)整抓取角度,最終以±0.1毫米的精度完成搭建。 這種將動態(tài)環(huán)境建模、多關節(jié)運動優(yōu)化與即時糾錯融為一體的智能決策體系,也標志著全開放場景驗證的通用型學習框架正式落地。 場景四:物流打包 在物流打包場景,基于「慧思開物」平臺,「天工PRO」首次實現(xiàn)了全尺寸人形機器人物流打包全流程的自主作業(yè)。 通過上半身29個自由度的配合,「天工PRO」使用左右手分別拿起物品和掃碼槍,通過頭部相機確認物品條形碼位置,雙手協(xié)同完成掃碼、裝箱、封箱及粘貼快遞標簽等一系列操作。 現(xiàn)在,創(chuàng)新中心正在將這些能力逐步實現(xiàn)商業(yè)化落地。創(chuàng)新中心首席技術官唐劍稱,「現(xiàn)在主要探索的方向為教育科研、健康養(yǎng)老、特種作業(yè)以及工業(yè)制造。」 據(jù)《智駕網(wǎng)-DeepAI》在發(fā)布會現(xiàn)場了解,例如優(yōu)必選的新產(chǎn)品「天工行者」,將基于「天工」平臺重點應用至教育領域。 「天工行者」是優(yōu)必選聯(lián)合創(chuàng)新中心當天發(fā)布的全尺寸科研教育人形機器人,售價僅需29.9萬元,是業(yè)內(nèi)首款30萬元以下的全尺寸科研級人形機器人。 天工行者搭載了創(chuàng)新中心搭載了創(chuàng)新中心「慧思開物」通用具身智能平臺,能為高校及科研機構提供完整的人形機器人研究解決方案。 據(jù)介紹,機器人擁有170cm仿人身高,高度仿生的軀干構型和擬人化的運動控制能力,全身多達20個自由度,能以10km/h的速度穩(wěn)定奔跑,具備在山坡、臺階、沙地、雪地等復雜泛化地形平穩(wěn)移動、抗沖擊干擾等運動功能。 目前天工行者已開放預訂,并將于二季度開始交付。 02. 人形機器人,配上更強的大小腦 根據(jù)著名的莫拉維克悖論:對機器人來說,簡單的動作比復雜的推理更難以實現(xiàn)。 為什么?因為簡單的動作可能需要「多腦」配合。 能讓機器人在多領域全才開花的「慧思開物」,由兩大部分組成:具身「大腦」先進行任務規(guī)劃,再調(diào)用具身「小腦」技能庫執(zhí)行具體動作,并將執(zhí)行反饋傳遞給具身「大腦」,形成任務閉環(huán)。 慧思開物的具身大腦: 作為認知決策中心,由AI大模型驅動的大腦負責高階認知任務,具備自然交互、空間感知、意圖理解、分層規(guī)劃和錯誤反思等能力。 任務規(guī)劃:通過自然語言交互解析指令,結合空間感知和意圖理解能力,將復雜任務拆解為可執(zhí)行的子任務序列。 動態(tài)路徑規(guī)劃與糾錯:實時監(jiān)測環(huán)境變化,通過強化學習和自適應機制優(yōu)化任務執(zhí)行路徑,應對突發(fā)干擾。 錯誤反思與學習:失敗時自動記錄并分析原因,通過模擬訓練更新模型,提升泛化能力。 數(shù)據(jù)驅動的端到端技能執(zhí)行具身「小腦」: 具身「小腦」分為具身操作和具身運控兩個子平臺:具身操作涵蓋元技能庫、泛化抓取、技能拆解和錯誤處理等功能。 而具身運控負責實現(xiàn)全身控制、雙臂協(xié)作、穩(wěn)定行走和移動導航等任務。 基于具身「大腦」與具身「小腦」架構,「慧思開物」可以精準解析自然語言交互指令,通過多模態(tài)信息融合與上下文理解,將復雜任務分解為可執(zhí)行的子任務序列,并在任務執(zhí)行過程中實時監(jiān)測狀態(tài),通過自適應糾錯機制和動態(tài)路徑規(guī)劃,確保任務的高效推進與準確完成。 同時,「慧思開物」還內(nèi)置多場景適配引擎,支持從工業(yè)制造到家庭服務等多種場景,結合資源調(diào)度與并行計算能力,能夠精準滿足特定場景下的工作節(jié)拍與精度標準,為機器人在復雜場景的應用提供可靠的技術保障。 除了具身「大腦」和具身操作能力,基于「慧思開物」,「天工」機器人的具身運控能力也在持續(xù)升級。 發(fā)布會現(xiàn)場,搭載「慧思開物」的「天工」機器人穩(wěn)健地走上舞臺,并與唐劍進行了多輪流暢對話,而這背后,離不開慧思開物」平臺在感知、決策與執(zhí)行一體化方面的能力展現(xiàn)。 ▲「天工」與創(chuàng)新中心首席技術官唐劍共同上臺并完成多輪對話互動 「大腦」和「小腦」提供的感知、決策與執(zhí)行能力背后,是一套高質(zhì)量的具身智能數(shù)據(jù)在支撐。 據(jù)了解,「慧思開物」依托創(chuàng)新中心構建的具身智能數(shù)據(jù)全鏈路解決方案,以及行業(yè)首個標準化通用具身智能數(shù)據(jù)集和Benchmark RoboMIND,實現(xiàn)了對多模態(tài)數(shù)據(jù)的高效利用與精準學習。 RoboMIND覆蓋工業(yè)、家庭、辦公等多場景任務,具備高度的通用性和可擴展性,作為業(yè)內(nèi)首個經(jīng)由多類視覺語言動作(VLA)及端到端模型充分驗證的跨本體標準化大規(guī)模數(shù)據(jù)集,為「慧思開物」提供了從任務理解到執(zhí)行的全流程數(shù)據(jù)支持。 「慧思開物」平臺的技術突破與多場景應用能力,也為生態(tài)合作與產(chǎn)業(yè)賦能奠定了堅實基礎。 除了此次慧思開物搭載至優(yōu)必選最新發(fā)布的天工行者人形機器人,不久前,優(yōu)必選在全球范圍內(nèi)首次實現(xiàn)把群腦網(wǎng)絡(BrainNet)用于人形機器人執(zhí)行整條產(chǎn)線的工業(yè)級任務。 不難看出,優(yōu)必選通過「慧思開物」平臺與「群腦網(wǎng)絡」技術的耦合實踐,也標志著具身智能技術從單機智能向群體智能、從實驗室驗證向工業(yè)級落地的關鍵跨越。 通過通用平臺兼容多本體(機械臂/人形機器人)、多場景(工業(yè)/家庭),解決了行業(yè)長期存在的「場景碎片化-系統(tǒng)專用化」惡性循環(huán),大幅降低了規(guī)?;渴鸪杀?,這也是產(chǎn)業(yè)一直以來亟待解決的痛點。 創(chuàng)新中心總經(jīng)理熊友軍熊友軍向坦言,具身智能在「智能化」方面仍處于初級階段,行業(yè)亟需一個具備多本體兼容性、多場景適應性和強大泛化能力的通用智能平臺。 而這次,為了替具身智能產(chǎn)業(yè)補上通用軟件系統(tǒng)這塊重要拼圖,創(chuàng)新中心研發(fā)的全球首個支持多本體多場景應用的通用具身智能平臺「慧思開物」,就是最好的例子。 03. 北京爭奪具身智能第一城 作為國家科技創(chuàng)新的核心城市,北京市人工智能產(chǎn)業(yè)的發(fā)展一直處于全國領先地位,隨著具身智能熱度攀升,北京近期出臺了多項推動具身智能產(chǎn)業(yè)發(fā)展的相關政策。 2月28日,北京市科學技術委員會、中關村科技園區(qū)管理委員會等部門發(fā)布了《北京具身智能科技創(chuàng)新與產(chǎn)業(yè)培育行動計劃(2025—2027年)》提出,北京將利用三年時間,力爭突破百余項關鍵技術,推動萬臺具身機器人規(guī)模落地,培育千億級產(chǎn)業(yè)集群。 同時,該行動計劃還提到,到2027年,具身智能芯片、全身運動控制等方面突破不少于100項關鍵技術,產(chǎn)出不少于10項國際領先的軟硬件產(chǎn)品,具身智能上下游產(chǎn)業(yè)鏈基本實現(xiàn)國產(chǎn)化。 此外,在2025年國務院政府工作報告中也明確提到了具身智能:要建立未來產(chǎn)業(yè)投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。同時,報告還強調(diào),要持續(xù)推進「人工智能+」行動,大力發(fā)展智能網(wǎng)聯(lián)新能源汽車、人工智能手機和電腦、智能機器人等新一代智能終端以及智能制造裝備。 現(xiàn)在,北京正通過「核心攻關+場景驅動+資本助推+生態(tài)協(xié)同」的組合政策,構建具身智能產(chǎn)業(yè)的全鏈條支持體系。 這些政策的推出與當年新造車運動的興起有相似之處,即國家等相關政府機構通過政策激勵,在具身智能尚缺乏相應的商業(yè)落地場景之時,吸引資本流入,通過激活產(chǎn)業(yè),慢慢實現(xiàn)從政策驅動過渡到市場驅動。 而當下北京人形機器人創(chuàng)新中心即起到了類似的作用,這不僅可以強化技術的自主性,也可以創(chuàng)造相應的場景開放加速商業(yè)化落地,為全國具身智能發(fā)展提供「北京范式」。 而市場,特別是資本市場也在呼應這一趨勢,AI與具身智能也正在資本市場成為中國價值重估的代表。 end. 【關注智能出行,關注智駕網(wǎng)視頻號】 關注汽車的智駕時代上智駕網(wǎng)(http://autor.com.cn)
▲搭載「慧思開物」的「天工」完成桌面清理任務
合作or新聞線索提供,聯(lián)系郵箱:editor@autor.com.cn
熱門跟貼