智東西(公眾號:zhidxcom)
作者云鵬
編輯漠影
隨口說上一句話,機器人就可以為你倒一杯果汁、打一個雞蛋、將桌子上的碗筷準(zhǔn)確放到收納架上,機器人還可以讀懂你的喜怒哀樂,頗具幽默感地給你講個小笑話。
今天,這些頗具科幻感的場景已經(jīng)成為各路科技巨頭發(fā)布機器人新品時的常見演示,AI大模型讓AI可以更好地看懂世界、理解世界并與人和世界產(chǎn)生更好的交互。
在大模型能力的快速迭代下,具身智能已經(jīng)成為當(dāng)下機器人賽道聚光燈下的焦點,國內(nèi)資本市場火爆,各路創(chuàng)企涌入,巨頭們也紛紛行動,電影中的大管家“賈維斯”,似乎正在向我們招手。
但相比發(fā)布會上的“仰望星空”,機器人賽道顯然需要更多的腳踏實地,如何讓機器人能夠在更多場景中落地、實實在在地去服務(wù)企業(yè)和消費者、解決需求痛點,是更為實際的問題。
服務(wù)機器人市場作為機器人領(lǐng)域商用較為成熟的領(lǐng)域,正在具身智能的發(fā)展下涌現(xiàn)出新的變量。
近日,有著豐富產(chǎn)品矩陣與落地場景的全球服務(wù)器機器人巨頭擎朗智能,再度發(fā)布了一系列新品,并亮出了基于自身海量真實場景數(shù)據(jù)打造的具身多模態(tài)模型。
其人形具身服務(wù)機器人新品XMAN-R1,基于“崗位化、親和力、安全性”理念設(shè)計,已經(jīng)具備了在服務(wù)行業(yè)中處理長程任務(wù)的理解規(guī)劃能力,成為業(yè)內(nèi)關(guān)注的焦點。
▲XMAN-R1
擎朗自研的多模態(tài)模型正在幫助服務(wù)機器人一步步腳踏實地走向場景,解決更加復(fù)雜動態(tài)化的任務(wù),具身智能核心的泛化能力得到大幅提升。
其實早在去年的WAIC世界機器人大會上,擎朗就已經(jīng)推出了XMAN-W3這樣的產(chǎn)品,在酒店機器人基礎(chǔ)上增加了靈活的雙臂,這也是擎朗在具身智能領(lǐng)域的前瞻探索,這款可愛的XMAN-W3與XMAN-R1屬于同門同系師兄弟。

▲XMAN-W3
可以說,在具身智能商業(yè)化落地方面,擎朗一直跑在前面。
毫無疑問,當(dāng)下具身商用服務(wù)機器人市場正涌現(xiàn)出巨大機遇,而擎朗基于自身15年行業(yè)積淀,掏出從大模型技術(shù)、軟硬件工程化/產(chǎn)品化能力到技術(shù)商業(yè)化驗證三張王牌,已經(jīng)向著具身商用服務(wù)機器人的藍海邁出了一大步。
一、服務(wù)機器人規(guī)?;铀?,泛化能力如何打破數(shù)據(jù)瓶頸?
根據(jù)市研機構(gòu)IDC預(yù)測,未來全球具身智能服務(wù)機器人市場將快速增長,五年后的2030年,市場規(guī)?;蜻_到939億美元(約合人民幣6819億元),復(fù)合增長率達到86.2%。
具身智能涌現(xiàn)出的巨大增長潛力,給商用服務(wù)機器人賽道的玩家們帶來了巨大動力,同時也帶來了新的挑戰(zhàn)。
近年來,服務(wù)機器人在餐飲配送、商用清潔、銀行導(dǎo)覽、酒店服務(wù)等領(lǐng)域已經(jīng)形成規(guī)?;涞?,在商超、文娛、醫(yī)療、康養(yǎng)等細(xì)分領(lǐng)域也展現(xiàn)出強勁的增長潛力。
與此同時,機器人面對的場景越來越復(fù)雜、非結(jié)構(gòu)化,比如餐廳、醫(yī)院等場景充滿不確定性,突發(fā)情況較多、光線也十分復(fù)雜,人類可以依靠經(jīng)驗快速調(diào)整,而傳統(tǒng)機器人則需依賴預(yù)編程規(guī)則與強化學(xué)習(xí),效率低且難以覆蓋長尾場景。
具身智能的核心在于“智能體通過身體與環(huán)境的互動來學(xué)習(xí)”,正是當(dāng)下行業(yè)痛點的良好解法,而這一過程也天然需要泛化能力。
服務(wù)行業(yè)需要有泛化能力的具身智能機器人,需要具身智能機器人“更聰明更懂人”,克服動態(tài)非結(jié)構(gòu)化復(fù)雜環(huán)境、人與機器的高頻交互博弈、全流程閉環(huán)這三大挑戰(zhàn),更好地解決實際生活中的問題。

但當(dāng)前具身智能的泛化面臨瓶頸。相對于多模態(tài)大模型可以利用互聯(lián)網(wǎng)文字、圖像、視頻、音頻等數(shù)據(jù)進行訓(xùn)練,具身智能大模型目前依然缺少可用于訓(xùn)練的高質(zhì)量、大規(guī)模人類操作數(shù)據(jù)。
正如擎朗CEO李通所說,對于具身智能的發(fā)展來說,這是一個“先有雞還是先有蛋”的問題。
具體來講,具身智能的數(shù)據(jù)來源包含遙操作采集(通過手柄、體感設(shè)備等遙控機器人完成任務(wù)來采集數(shù)據(jù))、生產(chǎn)伴隨采集(在真實環(huán)境中,人類操作員通過穿戴外骨骼等設(shè)備,在實際生產(chǎn)中采集數(shù)據(jù))、仿真數(shù)據(jù)合成(在高仿真3D環(huán)境中,實現(xiàn)機器人的數(shù)據(jù)采集)三個主要途徑。
根據(jù)不同的場景任務(wù),綜合三種采集方式,可以顯著提高具身智能體模型訓(xùn)練效果,快速實現(xiàn)模型能力落地。
所以相比“一口吃個胖子”,放個吸睛感十足的“大招”,擎朗選擇了更腳踏實地真正可行的一條路,優(yōu)先實現(xiàn)局部泛化。
在擎朗看來,現(xiàn)階段直接實現(xiàn)完全泛化的具身智能是幾乎不可能的,但通過單一任務(wù)泛化實現(xiàn)商業(yè)落地是可行的,讓機器人先專注于特定崗位場景,再逐步擴展其他崗位場景,最終融會貫通。
二、軟硬件自研技術(shù)齊頭并進,擎朗具身服務(wù)機器人打出三張關(guān)鍵王牌
在這樣的理念加持下,擎朗在具身智能風(fēng)口找到了自己的準(zhǔn)確方向,并率先交出了答卷,此次XMAN-R1的發(fā)布以及自研垂類多模態(tài)大模型的深度融合,為擎朗在具身智能服務(wù)機器人賽道按下了加速鍵。
具體到XMAN-R1,其核心的設(shè)計理念是崗位化、親和力、安全性。這三方面的關(guān)鍵特性可以說是具身智能服務(wù)機器人落地的關(guān)鍵抓手。

在崗位化方面,XMAN-R1可以模擬崗位化姿態(tài)或崗位化行為模式,簡單來說,就是機器人可以學(xué)習(xí)人類服務(wù)人員的動作邏輯。
值得一提的是,“機器人崗位化”的概念是由擎朗首次提出的,直觀理解,就是將服務(wù)場景解構(gòu)為標(biāo)準(zhǔn)化崗位單元,再將機器人定位為標(biāo)準(zhǔn)化的“崗位員工”。
比如一個機器人專門就負(fù)責(zé)快餐店的漢堡制作,一個機器人可以專門負(fù)責(zé)炸薯條的制作,而另一個負(fù)責(zé)打包收款結(jié)賬。
每一項工作內(nèi)容都可以被精確描述,結(jié)果可以被標(biāo)準(zhǔn)化評估,這無疑更利于在商業(yè)環(huán)境形成機器人能力的閉環(huán)。
與此同時,通過不斷的復(fù)制“崗位化”工作模式,擎朗的人形具身服務(wù)機器人可以不斷學(xué)習(xí)和拓展多樣化工作能力,并持續(xù)迭代基礎(chǔ)動作模型能力,從而實現(xiàn)更廣泛的落地場景應(yīng)用。
在另一個關(guān)鍵特性安全方面,XMAN-R1也可以說是黑科技武裝到牙齒。
其搭載了攝像頭、激光雷達、深度相機等種類豐富的傳感器,在算法層面則采用了擎朗自研的實時空間三維重建技術(shù)。
各項技術(shù)加持下,機器人具備了很強的環(huán)境感知能力,能實時對環(huán)境中的靜、動態(tài)障礙物進行準(zhǔn)確識別和未來行為預(yù)測,并通過云端大腦對復(fù)雜任務(wù)進行多級規(guī)劃,最后結(jié)合本地小腦進行自適應(yīng)運動控制,保障機器人的擬人化動作邏輯。
感控一體的全身運動規(guī)劃模型,可以在開放式復(fù)雜環(huán)境中確保人機協(xié)作和周邊人群安全。
這種云端“大腦”任務(wù)理解+本地“小腦”運動規(guī)劃與控制的模式可以很好地兼顧性能、效率、功耗、成本等多方面因素。
在這背后,擎朗長期積累的海量開放場景語義數(shù)據(jù)和擎朗具身多模態(tài)模型的實時決策能力都發(fā)揮著關(guān)鍵作用。
在避障算法領(lǐng)域,擎朗同樣有著深厚積累,截至2025年,擎朗智能在避障領(lǐng)域已申請165件發(fā)明專利,據(jù)查詢,在服務(wù)機器人領(lǐng)域的授權(quán)發(fā)明專利數(shù)量上,擎朗在中國服務(wù)機器人行業(yè)居首位。
此外,在各類傳感器原始數(shù)據(jù)處理、平衡性能與精度、降低時延、降低功耗等方面,擎朗也實現(xiàn)了諸多軟硬件技術(shù)層面的創(chuàng)新。
最后,在親和力方面,這次XMAN-R1的外觀更模擬人體比例,富有親和力的設(shè)計可以讓它更好地融入商業(yè)環(huán)境中,機身流暢精煉的線條可以兼顧科技感與力量感。
在這三大特性之外,擎朗自身服務(wù)機器人生態(tài)在協(xié)同性方面也涌現(xiàn)出巨大潛力。

在擎朗看來,人形具身服務(wù)機器人不是對現(xiàn)有產(chǎn)品的替代,而是對現(xiàn)有機器人生態(tài)的完善和升維,去解決服務(wù)行業(yè)的最后一環(huán)任務(wù)難題。人形具身服務(wù)機器人會與專用型具身服務(wù)機器人實行崗位化分工,融入整個擎朗的機器人服務(wù)生態(tài)。
從餐飲領(lǐng)域的配送機器人T10、酒店場景的服務(wù)機器人W3到清潔機器人C30、醫(yī)療領(lǐng)域的X101和工業(yè)領(lǐng)域的S100,人形具身服務(wù)機器人XMAN-R1將成為擎朗服務(wù)機器人生態(tài)矩陣的關(guān)鍵一環(huán)。
人形具身服務(wù)機器人具備較強的通用性和適應(yīng)性,能夠執(zhí)行復(fù)雜、非結(jié)構(gòu)化的任務(wù),可以與在特定任務(wù)上具備高效率和高精度的專用機器人形成很好地“互補”。
比如在餐廳中,XMAN-R1可以獨立完成取酒倒酒、放置托盤等配餐動作,并通過機器間任務(wù)調(diào)度,將餐品交接給配送機器人T10,后者會按最優(yōu)路徑送餐,最終完成服務(wù)閉環(huán)。
可以說,通用具身服務(wù)機器人與專用具身服務(wù)機器人的協(xié)同必然會是未來智能機器人發(fā)展的重要方向之一,兩者的結(jié)合可以充分發(fā)揮各自的優(yōu)勢,更高效、更靈活執(zhí)行任務(wù)。
總體來看,從機器人的內(nèi)在到外在,從各類自研軟硬件技術(shù)到機器人生態(tài)協(xié)同,從崗位化專用做到極致到泛用性的高效迭代,在具身服務(wù)機器人該怎么做這件事上,擎朗已經(jīng)趟出了一條切實可行的新路子。
三、每天數(shù)億條數(shù)據(jù)、數(shù)千萬次人機交互背后,具身智能商業(yè)化落地加速
面對具身智能的火爆,所有機器人企業(yè)都面臨著新的機遇和挑戰(zhàn)。行業(yè)到底會如何發(fā)展?企業(yè)要如何抓住需求、快速迭代產(chǎn)品技術(shù)、拓展市場?
在擎朗看來,具身智能的發(fā)展必然要先做好“專用”這一環(huán),這也是具身服務(wù)機器人商業(yè)化落地的最佳路徑。
李通提到,通用人形機器人的未來是非常光明的,擎朗也非常認(rèn)同這一方向,但當(dāng)下數(shù)據(jù)不足已經(jīng)成為行業(yè)的核心痛點。
只有先通過專用機器人創(chuàng)造場景入口,積累數(shù)據(jù)反哺技術(shù),才能進一步迭代使得具身智能可以拓展邊界,進而拉動更多專用設(shè)備部署,形成良性的商業(yè)閉環(huán)。
從行業(yè)視角來看,擎朗的做法顯然有極高的參考價值,在各個領(lǐng)域打造一群“專家機器人”,通過高度崗位化的場景海量獲取高質(zhì)量數(shù)據(jù),快速迭代模型和算法,不斷提升機器人的泛化能力。
最終,當(dāng)無數(shù)細(xì)分領(lǐng)域的專家機器人的能力被匯聚起來,真正泛用、通用的人形具身智能機器人,也就離我們不遠了。
未來,真正的“大管家”具身服務(wù)機器人,也許會由一個通用大模型作為大腦,而各類來自于各領(lǐng)域“專家”的優(yōu)秀小模型則會讓機器人在處理各類任務(wù)時都能游刃有余、專業(yè)高效。
在與擎朗CEO李通的深入交流中我們感受到,擎朗對于通用具身智能未來的發(fā)展是積極樂觀的。
從創(chuàng)業(yè)之初,擎朗就一直希望做能夠服務(wù)好企業(yè)和消費者的服務(wù)型機器人,在這條路上,不斷有新的技術(shù)涌現(xiàn),從深度學(xué)習(xí)強化學(xué)習(xí)到如今的AI大模型、具身智能,新的技術(shù)都會成為擎朗優(yōu)化機器人體驗的利器。
在過去的15年里,擎朗完成了專用服務(wù)機器人的產(chǎn)業(yè)化和商業(yè)化普及,成為全球最大的商用服務(wù)機器人企業(yè)。

▲擎朗智能機器人生態(tài)矩陣
從餐飲、酒店到醫(yī)院等場景,擎朗累計部署了超過10萬臺配送、清潔等專用機器人,服務(wù)網(wǎng)絡(luò)已經(jīng)覆蓋了60多個國家和地區(qū)。
這樣深厚的積累,正是擎朗可以在具身智能浪潮中快速跑在行業(yè)前列,能做好具身服務(wù)機器人的突出優(yōu)勢之一。
十幾年的服務(wù)機器人行業(yè)經(jīng)驗,讓擎朗積累了海量的服務(wù)場景數(shù)據(jù),涵蓋餐飲、酒店、醫(yī)療、工業(yè)等場景。這些數(shù)據(jù)對于擎朗具身多模態(tài)模型的能力提升有著極大的促進作用。
通過各個場景的視覺、語音等多模態(tài)數(shù)據(jù)的訓(xùn)練,使得擎朗的多模態(tài)大模型具有優(yōu)秀的場景感知與任務(wù)理解能力,這正是其它機器人企業(yè)所不具備的。
正如李通所說,機器人不僅是效率工具,更是數(shù)據(jù)入口——擎朗智能每天產(chǎn)生超數(shù)億條環(huán)境感知數(shù)據(jù)、數(shù)千萬次人機交互記錄,擁有全球最大的商用機器人場景數(shù)據(jù)源。
“專用機器人的價值不僅是完成任務(wù),更是為通用化提供數(shù)據(jù)。”

與此同時,十余年來,擎朗對商業(yè)服務(wù)場景中的客戶需求、場景特點、交互方式等非常熟悉,擎朗會花大量的時間去了解客戶的整個流程的操作細(xì)節(jié)。
展望未來,AI大模型賦能繼續(xù)加速、多模態(tài)感知技術(shù)加速迭代,具身服務(wù)機器人加速走向“通用泛化”,機器人會通過模塊化技能庫組合應(yīng)對新任務(wù),會像人類嬰兒一樣,通過感知運動經(jīng)驗自主構(gòu)建物理規(guī)律認(rèn)知。
而已經(jīng)實現(xiàn)全場景滲透、全品類布局、全球化拓展,掌握技術(shù)、市場和模式多重優(yōu)勢的擎朗,已經(jīng)成為撕開萬億藍海市場的核心推手。
結(jié)語:服務(wù)機器人賽道掀起具身智能浪潮,擎朗提前交卷
海量真實場景數(shù)據(jù)而來的具身多模態(tài)模型、軟硬件工程化/產(chǎn)品化能力、充足的技術(shù)商業(yè)化驗證,這三個關(guān)鍵優(yōu)勢已經(jīng)成為擎朗在具身智能時代的最硬底牌。
此外,擎朗智能保持著開放生態(tài)與尖端設(shè)計的能力,如今擎朗機器人已完成市面上多款熱門AI大模型的接入,并實現(xiàn)應(yīng)用場景的成功落地;旗下機器人產(chǎn)品頻頻斬獲德國紅點獎、德國IF設(shè)計獎等世界級頂尖獎項。
當(dāng)下商用服務(wù)機器人市場正處于技術(shù)革新的關(guān)鍵年,國產(chǎn)化替代加速、覆蓋場景加速擴展,具身智能必將成為全球商用服務(wù)機器人的核心角逐焦點,AI將給服務(wù)機器人賽道帶來哪些新的變量,又有哪些產(chǎn)品將驚艷登場,我們拭目以待。
熱門跟貼