打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

智平方推出自研的全域全身VLA大模型、新一代人形機(jī)器人。

作者 | 許麗思

編輯 | 漠影

機(jī)器人前瞻4月17日?qǐng)?bào)道,昨天,智平方推出了全棧自研的全域全身VLA大模型——Alpha Brain,該模型具備了從桌面到環(huán)境、從單臂到全身、從簡(jiǎn)單到長(zhǎng)程的能力,能夠讓人形機(jī)器人實(shí)現(xiàn)在全身協(xié)同控制和全場(chǎng)景任務(wù)覆蓋中的高效交互與自主行動(dòng)。

另外,智平方還發(fā)布了搭載Alpha Brain的通用智能機(jī)器人AlphaBot 2(愛寶2),該機(jī)器人無需訓(xùn)練就能完成多種任務(wù),具有360°?360°全空間探測(cè)感知能力,腰腿可升降。

01.

推出全棧自研的全域全身VLA大模型

讓機(jī)器人全流程DIY早餐

之前,智平方曾推出國(guó)產(chǎn)自主可控的具身大模型AI2R Brain,在泛化任務(wù)成功率及端側(cè)運(yùn)行速度等方面表現(xiàn)不錯(cuò)。

這次該公司將AI2R Brain升級(jí)為Alpha Brain,Alpha Brain搭載了智平方全棧自研的全域全身VLA(GOVLA:Global & Omni-body Vision-Language-Action)大模型,具備從桌面到環(huán)境,從單臂到全身,從簡(jiǎn)單到長(zhǎng)程能力的視覺-語言-行動(dòng)大模型,能夠?qū)崿F(xiàn)讓機(jī)器人這樣的智能終端,實(shí)現(xiàn)在全身協(xié)同控制和全場(chǎng)景任務(wù)覆蓋中的高效交互與自主行動(dòng)。

GOVLA大模型由空間交互基礎(chǔ)模型、慢系統(tǒng)和快系統(tǒng)三部分組成。其通過解析用戶指令(如語音指令)、實(shí)時(shí)環(huán)境信息和機(jī)器人狀態(tài),雙系統(tǒng)分工協(xié)作:快系統(tǒng)System1快速響應(yīng)簡(jiǎn)單任務(wù),輸出動(dòng)作軌跡;慢系統(tǒng)System2負(fù)責(zé)復(fù)雜邏輯推理,任務(wù)拆解,輸出語言交互內(nèi)容,兼顧實(shí)時(shí)響應(yīng)與復(fù)雜決策能力。

值得一提的是,常規(guī)的VLA大模型只是輸出機(jī)械臂動(dòng)作,而GOVLA大模型首次提出輸出全身控制和移動(dòng)軌跡。

此外,智平方還在GOVLA大模型的慢系統(tǒng)中引入了DeepSeek語言大模型,賦予機(jī)器人對(duì)長(zhǎng)程復(fù)雜任務(wù)的理解和分析。

打開網(wǎng)易新聞 查看精彩圖片

具體來說,搭載常規(guī)VLA大模型的機(jī)器人,需要人把食材放到桌面,放到機(jī)器人的可視范圍內(nèi),因?yàn)樗荒芸吹阶烂?,只能在桌面操作,做完之后還需要人去給機(jī)器人提供服務(wù),跟一個(gè)早餐機(jī)沒太大區(qū)別。

而搭載GOVLA大模型的機(jī)器人能夠360°感知周圍環(huán)境,可以自己去冰箱取食材,自己配比健康早餐,做完之后還可以送到餐桌,完成一個(gè)管家的全鏈條服務(wù),這是一個(gè)機(jī)器人管家和一個(gè)自動(dòng)化設(shè)備的最大區(qū)別。

另外,北京大學(xué)與智平方共同成立的“北大—智平方具身智能聯(lián)合實(shí)驗(yàn)室”也正式揭牌,雙方將致力于突破4D世界模型、端到端智能體等具身智能相關(guān)的前沿技術(shù)難題。

02.

全空間感知、腰腿能升降的機(jī)器人發(fā)布,

將進(jìn)入全球生物科技龍頭工廠

此次發(fā)布的通用智能機(jī)器人AlphaBot 2搭載了Alpha Brain,無需訓(xùn)練即可完成多種任務(wù),而且能快速掌握新任務(wù),穩(wěn)定適應(yīng)各種變化。

硬件架構(gòu)上,該機(jī)器人能夠?qū)崿F(xiàn)360°?360°全空間探測(cè)感知。例如,可以實(shí)時(shí)感知人類面部的表情和意圖,明白“點(diǎn)頭是yes、搖頭是no”。

打開網(wǎng)易新聞 查看精彩圖片

該機(jī)器人全身自由度34+,采用腰腿升降結(jié)構(gòu),垂直工作范圍0-240cm,單臂臂展700mm(不含末端夾具)。這種可折疊的升降結(jié)構(gòu)和高自由的機(jī)械臂,能夠適配汽車制造、半導(dǎo)體分揀等任務(wù)。

在生活場(chǎng)景中,這樣的結(jié)構(gòu)也讓機(jī)器人可以完成泡茶等精細(xì)化操作,能夠?qū)崟r(shí)響應(yīng)環(huán)境變化,并快速調(diào)整操作策略。

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

打開網(wǎng)易新聞 查看精彩圖片

智平方還與全球生物科技龍頭華熙生物正式宣布達(dá)成戰(zhàn)略合作,雙方將共同打造面向生物科技領(lǐng)域的通用智能機(jī)器人解決方案。智平方機(jī)器人將在華熙生物的工廠實(shí)現(xiàn)物料協(xié)同轉(zhuǎn)運(yùn)、智能拆包消毒、智能視覺檢驗(yàn)、多物料協(xié)同智能供料等操作,覆蓋全流程自動(dòng)化作業(yè)。

同時(shí),智平方還公布了在機(jī)場(chǎng)和社區(qū)這類公共服務(wù)場(chǎng)景的布局。今年第三季度,智平方的機(jī)器人將上線國(guó)內(nèi)一線城市的機(jī)場(chǎng);今年第四季度,智平方的機(jī)器人將在國(guó)內(nèi)示范小區(qū)落地應(yīng)用。

03.

結(jié)語:市場(chǎng)需求擴(kuò)大

人形機(jī)器人商業(yè)化進(jìn)程加速

隨著智能機(jī)器人操作能力的進(jìn)一步提升,市場(chǎng)對(duì)智能機(jī)器人的需求將迎來井噴。高盛在分析報(bào)告《Humanoid Robot: The AI accelerant》中指出,全球人形機(jī)器人到2035年的市場(chǎng)規(guī)模將達(dá)到380億美元,出貨量達(dá)到140萬臺(tái)。

面對(duì)不斷擴(kuò)大市場(chǎng)需求,智平方在發(fā)布會(huì)上宣布啟動(dòng)自有產(chǎn)線建設(shè),并提出階段性的商業(yè)化目標(biāo):2028年實(shí)現(xiàn)萬臺(tái)場(chǎng)景應(yīng)用,2030年為南山區(qū)產(chǎn)值貢獻(xiàn)一個(gè)百分點(diǎn)(達(dá)到百億級(jí)營(yíng)收),2033年拓展至百萬臺(tái)規(guī)模,覆蓋工業(yè)、物流、家庭服務(wù)等多元化場(chǎng)景。

可以預(yù)見,隨著市場(chǎng)對(duì)人形機(jī)器人的需求從工業(yè)產(chǎn)線精密協(xié)作、養(yǎng)老陪護(hù)到家庭服務(wù)等場(chǎng)景擴(kuò)容,企業(yè)持續(xù)發(fā)力技術(shù)研發(fā)、布局量產(chǎn)產(chǎn)線、優(yōu)化成本結(jié)構(gòu),也推動(dòng)人形機(jī)器人從實(shí)驗(yàn)室走向商用落地,商業(yè)化進(jìn)程不斷提速。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片