打開(kāi)網(wǎng)易新聞 查看精彩圖片

打開(kāi)網(wǎng)易新聞 查看精彩圖片

在春晚上跳秧歌的宇樹(shù)機(jī)器人不會(huì)想到,

僅僅過(guò)了一個(gè)多月,

自己就已經(jīng)在“節(jié)目效果”上落后了。

擊敗它的,是一臺(tái)來(lái)自深圳的“眾擎機(jī)器人”——絲滑流暢的斧頭幫舞蹈過(guò)于完美,以至于讓很多質(zhì)疑中國(guó)科技發(fā)展水平的人表示這肯定是CG合成或者AI生成。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

他們不得不面對(duì)這樣的一個(gè)艱難的選擇:要么承認(rèn)中國(guó)機(jī)器人技術(shù)先進(jìn),要么承認(rèn)中國(guó)AI技術(shù)先進(jìn),要么承認(rèn)中國(guó)CG制作先進(jìn)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

后來(lái)為了應(yīng)對(duì)這些質(zhì)疑,眾擎專門(mén)拿出了第三視角的錄像畫(huà)面和訓(xùn)練花絮。結(jié)果卻更令人感到驚艷——眾擎的這款機(jī)器人對(duì)舞蹈動(dòng)作的學(xué)習(xí),似乎并不是依靠手動(dòng)輸入的程序指令,而是像人類一樣,一邊看著舞蹈老師的示范,一邊自己模仿。

這是什么?

這就是“端到端”?。?/strong>

今天能跟著舞蹈老師學(xué)跳舞,

明天就能跟著工人師傅學(xué)著打螺絲,

后天就能跟著特種兵學(xué)戰(zhàn)術(shù)動(dòng)作。

這背后的想象空間,哎呀,過(guò)癮吶!過(guò)癮!

打開(kāi)網(wǎng)易新聞 查看精彩圖片

實(shí)際上,從2024年底開(kāi)始,中國(guó)的機(jī)器人企業(yè)便開(kāi)始了密集的新款機(jī)器人產(chǎn)品的宣發(fā)——云深處的輪足機(jī)器狗可以在崎嶇的南方山地中隨意穿梭,“華為天才少年”彭志暉的智元機(jī)器人已經(jīng)開(kāi)始在進(jìn)行家務(wù)勞動(dòng)訓(xùn)練。

這么一看,宇樹(shù)機(jī)器人單純的扭秧歌,確實(shí)在節(jié)目效果上就落后太多了。

不過(guò),人家宇樹(shù)也沒(méi)閑著,你們愛(ài)怎么跳舞就怎么跳舞,人家一個(gè)機(jī)器人側(cè)空翻視頻,就又一次證明了自己的實(shí)力——這動(dòng)作對(duì)于機(jī)器人的動(dòng)作算法、機(jī)械性能、平衡能力的要求是相當(dāng)高的。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

雖然2025年到現(xiàn)在才過(guò)去了不到三個(gè)月,但再往后的九個(gè)月時(shí)間里,關(guān)于機(jī)器人的新聞一定不會(huì)少。

更細(xì)思極恐的是:這一切,其實(shí)都已經(jīng)被計(jì)劃好了——早在2021年12月的《“十四五”機(jī)器人產(chǎn)業(yè)發(fā)展規(guī)劃》里就已經(jīng)提出了“到2025年,我國(guó)要成為全球機(jī)器人技術(shù)創(chuàng)新策源地”,在2023年工信部的《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》中,也提出“到2025年,人形機(jī)器人創(chuàng)新體系初步建立,“大腦”“小腦”“肢體”等一批關(guān)鍵技術(shù)取得突破,確保核心部組件安全有效供給?!?/p>

只能說(shuō),出來(lái)混,說(shuō)要搞出來(lái),那就要搞出來(lái)。非如此,就顯不出咱們的手段。

今天,我們就來(lái)徹底聊聊中國(guó)的人形機(jī)器人產(chǎn)業(yè)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

人形機(jī)器人的價(jià)值有多大?

人形機(jī)器人的地位,濃縮成一句話就是:這是一個(gè)官方認(rèn)證的“顛覆性產(chǎn)品”。

不要低估了“顛覆性產(chǎn)品”這個(gè)詞,雖然最近這幾年,“顛覆性產(chǎn)品”這個(gè)詞已經(jīng)被很多企業(yè)給玩兒壞了,搞得隨便什么一個(gè)產(chǎn)品的發(fā)布會(huì)都要說(shuō)幾聲“顛覆”、道幾句“炸裂”,好像不用這些大詞就不足以表達(dá)產(chǎn)品的先進(jìn)一樣。

但是,在嚴(yán)謹(jǐn)且克制的官方話語(yǔ)體系中,“顛覆性產(chǎn)品”這個(gè)詞的含金量并沒(méi)有打絲毫折扣——在2023年的那份,《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》中工信部一共列出了四類“顛覆性產(chǎn)品”——前三個(gè)分別是電腦、智能手機(jī)、新能源汽車(chē),第四個(gè)就是人形機(jī)器人。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

官方口徑里的“顛覆性產(chǎn)品”,那就一定是顛覆性的產(chǎn)品。因?yàn)橄脒_(dá)到工信部的“顛覆性產(chǎn)品”標(biāo)準(zhǔn),要求是相當(dāng)高的,從電腦、智能手機(jī)、新能源汽車(chē)的發(fā)展歷程來(lái)看,它們無(wú)一例外都滿足以下三條標(biāo)準(zhǔn):

這款產(chǎn)品,必須能深刻地改變整個(gè)中國(guó)社會(huì)。

這款產(chǎn)品,必須能拉動(dòng)萬(wàn)億人民幣的市場(chǎng)。

這款產(chǎn)品,必須能培養(yǎng)出至少五家千億元市值的頭部大廠。

言下之意就是:這款產(chǎn)品的普及程度一定極高、銷(xiāo)量一定極為巨大,高到社會(huì)上大多數(shù)人都會(huì)用到,否則談不上深刻改變整個(gè)社會(huì)。而超高的銷(xiāo)量,也就意味著背后有漫長(zhǎng)的產(chǎn)業(yè)鏈,不僅是幾個(gè)龍頭集成商的事兒,更是背后成百上千家供應(yīng)商的事業(yè)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

回想一下電腦、智能手機(jī)、新能源汽車(chē)這些年帶來(lái)的變化,我們就能感受到工信部所說(shuō)“顛覆性產(chǎn)品”的含金量——人形機(jī)器人是一個(gè)能培育出像華為、小米、比亞迪這樣的超級(jí)大廠的賽道,是一個(gè)能讓現(xiàn)在本就如日中天的大廠們更上一個(gè)臺(tái)階的賽道,是一個(gè)能夠養(yǎng)活包括軟件、硬件、應(yīng)用在內(nèi)各種配套產(chǎn)業(yè)的賽道

也只有這樣的賽道,才配得上“科技競(jìng)爭(zhēng)新高地、未來(lái)產(chǎn)業(yè)新賽道、經(jīng)濟(jì)發(fā)展新引擎”的描述。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

為什么一定要做成人形?

那么,人形機(jī)器人憑什么能有這么大能量呢?

憑什么可以被安上如此高的價(jià)值呢?

很簡(jiǎn)單,因?yàn)椤叭诵巍薄?/strong>

“人形”并不是一個(gè)簡(jiǎn)單的外觀問(wèn)題,背后的含義那是相當(dāng)深刻。

“人形”的真正含義是:不論在工業(yè)生產(chǎn)場(chǎng)景還是在日常生活場(chǎng)景,都能提供超強(qiáng)的通用性。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

以工業(yè)生產(chǎn)場(chǎng)景為例,人形機(jī)器人幾乎是實(shí)現(xiàn)“智能制造”“柔性制造”的必要條件。

眾所周知,人是最精密的機(jī)器,因?yàn)槿说男袆?dòng)是“三維”的。

假設(shè)你現(xiàn)在有一個(gè)生產(chǎn)筷子的工廠,生產(chǎn)工序的最后一步就是把十根筷子塞進(jìn)一個(gè)圓筒里并擰上蓋子。

如果是人工操作,那么這道工序就非常容易——點(diǎn)出來(lái)十根筷子、一把抓起、在桌面上懟一下對(duì)齊、塞進(jìn)圓筒、擰好蓋子——這就是人工操作的優(yōu)勢(shì),簡(jiǎn)單直白、清楚明確,干就完了。

這種簡(jiǎn)單到極致、高效到極致的操作,就是人類三維動(dòng)作的優(yōu)勢(shì)。

不過(guò),雖然人類的動(dòng)作兼具了簡(jiǎn)潔和高效,但人類實(shí)在太脆弱了——“整理筷子”這個(gè)動(dòng)作,做一次兩次不算個(gè)事兒,那如果要做1000次2000次呢,要是每天連續(xù)不停做好幾個(gè)小時(shí)呢?人類的小胳膊小腿兒,還能扛住嗎?

這個(gè)時(shí)候,就要選擇“自動(dòng)化流水線”了。

自動(dòng)化流水線的優(yōu)勢(shì)很好理解。它是機(jī)器,可以24小時(shí)不間斷運(yùn)行,不知疲倦,而且速度比人類快得多。但劣勢(shì)則在于,它是“二維”的——一個(gè)人類可以輕松完成的動(dòng)作,機(jī)器想做到往往需要拆分為多個(gè)步驟。

還是以“整理筷子”為例,一個(gè)自動(dòng)化流水線想完成這個(gè)在人類看來(lái)非常簡(jiǎn)單的動(dòng)作可能需要如下流程:

用振動(dòng)盤(pán)整理散亂的筷子,

用計(jì)數(shù)器點(diǎn)出十根筷子,

用夾具抓取10根筷子、同時(shí)將圓筒固定好,

筷子和圓筒對(duì)齊后,把筷子塞進(jìn)圓筒里,

最后用伺服電機(jī)配合夾具擰緊蓋子。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

雖然一個(gè)動(dòng)作拆成好幾個(gè)步驟看上去不怎么優(yōu)雅,但這樣做的效率也可以很高。 只是,這種把“簡(jiǎn)單的事情變復(fù)雜”的行為卻有一個(gè)相當(dāng)大的弊端——自動(dòng)化流水線是高度定制化的,整理筷子的流水線是沒(méi)辦法用在整理盤(pán)子上的,想用來(lái)生產(chǎn)新產(chǎn)品,很多時(shí)候就需要重新設(shè)計(jì)、建造生產(chǎn)線。

你工廠的SKU但凡多一點(diǎn),牽連的生產(chǎn)線升級(jí)費(fèi)用那就是一大筆錢(qián)。

而這種弊端,和“柔性制造”“智能制造”的大趨勢(shì)完全矛盾。

說(shuō)到底,傳統(tǒng)的自動(dòng)流水線,它還是“結(jié)構(gòu)化”的——哪怕現(xiàn)在有不少企業(yè)生產(chǎn)的“柔性制造”能力很強(qiáng),本質(zhì)上也不過(guò)就是把好幾套動(dòng)作、好幾種硬件融合在一起而已。

它可能真的學(xué)了不少姿勢(shì),

但其實(shí)身體并不靈活。

寫(xiě)到這里,我們就能知道“人形機(jī)器人”的價(jià)值了。因?yàn)槿诵危运膭?dòng)作也是三維的、是不需要展開(kāi)成為多個(gè)二維動(dòng)作的——面對(duì)生產(chǎn)不同產(chǎn)品的任務(wù),人形機(jī)器人只需要在軟件層面改變動(dòng)作方式即可,不需要像傳統(tǒng)自動(dòng)流水線那樣完全另起爐灶。

相比起傳統(tǒng)流水線,人形機(jī)器人是“非結(jié)構(gòu)化”的。

理論上來(lái)說(shuō),只要算法、硬件足夠強(qiáng)大,人形機(jī)器人就能做到和人一樣的靈活——?jiǎng)e看它現(xiàn)在沒(méi)學(xué)幾種姿勢(shì),但它身段足夠靈活,以后總是能學(xué)會(huì)的。

那么,對(duì)于制造業(yè)企業(yè)來(lái)說(shuō)這意味著什么呢?

首先就是響應(yīng)速度可以很快,可以非??斓剡m應(yīng)市場(chǎng)需要。

其次就是極大程度降低改造和升級(jí)的成本。

傳統(tǒng)自動(dòng)流水線的建設(shè)流程是相當(dāng)長(zhǎng)的,非標(biāo)自動(dòng)化這個(gè)行業(yè)主打的就是一個(gè)卷,你得親身去工廠和工廠老板談,知道人家到底想要的是什么,然后展開(kāi)設(shè)計(jì)、建造、調(diào)試,后期還有維護(hù)和修理在等著你......總之整個(gè)周期可以說(shuō)是相當(dāng)長(zhǎng),也相當(dāng)死板。

而且傳統(tǒng)自動(dòng)流水線的設(shè)計(jì)往往也都是“一次性”的,很多流水線在設(shè)計(jì)的時(shí)候沒(méi)有什么模塊化的概念,遇到升級(jí)改造就得推翻重來(lái),舊有設(shè)計(jì)不能重復(fù)使用,設(shè)計(jì)成本和出錯(cuò)的概率大大增加。

最終結(jié)果就是:一旦市場(chǎng)有變,需要在產(chǎn)品上加點(diǎn)什么新功能、新部件,那原來(lái)設(shè)計(jì)好的東西很可能就廢了。

以杭州某企業(yè)為例,2023年底的時(shí)候,這家企業(yè)曾經(jīng)開(kāi)發(fā)過(guò)一種AI攝像機(jī)。本來(lái)風(fēng)平浪靜的,結(jié)果正好迎頭趕上了AI行業(yè)火爆,市場(chǎng)對(duì)AI算力的需求提高,產(chǎn)品的性能需要翻倍。但遺憾的是,這家企業(yè)的生產(chǎn)線依舊是傳統(tǒng)的自動(dòng)流水線,改造時(shí)間極為漫長(zhǎng),企業(yè)不得不推遲發(fā)布時(shí)間,被對(duì)手搶了先機(jī),原本的市場(chǎng)份額丟了許多。

而如果是成熟的人形機(jī)器人,這種事情就很好處理——因?yàn)槿S的人形機(jī)器人是沒(méi)必要展開(kāi)那么多二維動(dòng)作的,改造生產(chǎn)線的必要性也就沒(méi)有那么高。

甚至,對(duì)于人形機(jī)器人來(lái)說(shuō),生產(chǎn)流程改造什么的,很大程度上在軟件層面上就可以解決——幾個(gè)程序員就能搞定的事兒,沒(méi)必要停機(jī)。

基于上述種種優(yōu)勢(shì),我們有理由認(rèn)為:對(duì)于未來(lái)的制造業(yè)而言,人形機(jī)器人是不可缺少的一環(huán)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

奧迪一汽已經(jīng)開(kāi)始讓人形機(jī)器人進(jìn)廠了

打開(kāi)網(wǎng)易新聞 查看精彩圖片

人形機(jī)器人的成本,阻礙了推進(jìn)

雖然人形機(jī)器人的前景遠(yuǎn)大,可眼前的問(wèn)題簡(jiǎn)單卻又難以跨越:

三個(gè)字,不賺錢(qián)。

說(shuō)“不賺錢(qián)”其實(shí)有點(diǎn)不全面,現(xiàn)在靠人形機(jī)器人賺錢(qián)的路子倒也有,只是匹配不了這么高的價(jià)值——在當(dāng)下這個(gè)階段,出租機(jī)器人,讓這些機(jī)器人去參加展覽、演出、當(dāng)吉祥物,遠(yuǎn)比讓他們進(jìn)工廠打螺絲賺得多——官方定價(jià)9.9萬(wàn)元的宇樹(shù)G1機(jī)器人,在二手交易平臺(tái)的租賃價(jià)格最高一度達(dá)到每天1.5萬(wàn)元,目前依舊穩(wěn)定在8000元左右,并且供不應(yīng)求。

某種程度上,這種“提供情緒價(jià)值”的吉祥物表演階段也是機(jī)器人發(fā)展的必經(jīng)之路了——1973年日本早稻田大學(xué)就已經(jīng)開(kāi)發(fā)出了全尺寸的人形機(jī)器人Wabot-1,本田也在1986年開(kāi)始研發(fā)機(jī)器人的雙足結(jié)構(gòu),后期更是推出了Asimo機(jī)器人。日本人雖然起了個(gè)大早,但最終也沒(méi)有攻克成本問(wèn)題——Asimo的租金每年高達(dá)2000萬(wàn)日元,提供情緒價(jià)值都太貴了,只能讓本田自己放在展會(huì)上秀一下肌肉。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

而后面波士頓動(dòng)力的阿特拉斯、特斯拉的擎天柱也是一樣,雖然技術(shù)上都有不小突破,但連大規(guī)模商用的邊都摸不到

由此可見(jiàn),成本降不下來(lái),人形機(jī)器人就沒(méi)有普及的可能。

對(duì)于人形機(jī)器人來(lái)說(shuō),其發(fā)展規(guī)律一定是先進(jìn)廠打工,再到尋常百姓家里干活兒。原因很簡(jiǎn)單,1000萬(wàn)砸在工廠里很多時(shí)候也就是聽(tīng)個(gè)響,甚至不夠建一條產(chǎn)線,但對(duì)消費(fèi)者來(lái)說(shuō)這就是天文數(shù)字。而且工業(yè)場(chǎng)景比起家里還是簡(jiǎn)單、單調(diào)太多了,短期內(nèi)更適合還沒(méi)有進(jìn)化到完全體的人形機(jī)器人發(fā)揮作用。

只不過(guò),以目前的情況來(lái)看,今天的機(jī)器人哪怕是進(jìn)廠,成本也過(guò)于高昂了些。

一家工廠購(gòu)買(mǎi)機(jī)器人,大概率是要求人形機(jī)器人的購(gòu)買(mǎi)、折舊、維護(hù)等綜合成本小于雇傭人類工人。但當(dāng)下人形機(jī)器人的價(jià)格比起用工成本還是太高了——能上產(chǎn)線的機(jī)器人,價(jià)格在幾十萬(wàn)到數(shù)百萬(wàn),不把這個(gè)價(jià)格打下來(lái),機(jī)器人進(jìn)廠打工就只能存在于PPT上。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

人形機(jī)器人這么高的成本是怎么來(lái)的?

制造成本是一方面,但真正阻擋人形機(jī)器人進(jìn)一步發(fā)展的,終究還是訓(xùn)練成本。

2013年波士頓動(dòng)力的阿特拉斯就已經(jīng)在機(jī)械性能上做到了相當(dāng)高的程度,足以完成許多高難度動(dòng)作。但在軟件層上,阿特拉斯只能根據(jù)預(yù)先設(shè)定的“行為庫(kù)”里的動(dòng)作進(jìn)行運(yùn)動(dòng)。

強(qiáng)如阿特拉斯,也只會(huì)那么幾種姿勢(shì)而已。

阻擋阿特拉斯更進(jìn)一步的,表面上看是動(dòng)作的靈活與豐富,本質(zhì)上其實(shí)是數(shù)據(jù)和算法——人形機(jī)器人想要學(xué)會(huì)和人一樣做事情,數(shù)據(jù)和算法是相當(dāng)重要的。我們能看到的是機(jī)器人在前臺(tái)的表演,看不到的是背后的數(shù)據(jù)和訓(xùn)練。

隨便一個(gè)簡(jiǎn)單的動(dòng)作,哪怕只是撿起一個(gè)東西,背后就需要采集上百條高質(zhì)量的數(shù)據(jù)。如果想讓機(jī)器人在工廠里發(fā)揮作用,那數(shù)據(jù)條數(shù)是千億起步。

以特斯拉的Optimus(擎天柱)機(jī)器人訓(xùn)練為例——為了訓(xùn)練它,特斯拉專門(mén)聘請(qǐng)了幾十位動(dòng)作捕捉人員,要求他們每天都要走七個(gè)小時(shí),以保證能給機(jī)器人喂足夠多的數(shù)據(jù)。但這其實(shí)遠(yuǎn)遠(yuǎn)不夠,因?yàn)槿绻胱寵C(jī)器人能在工廠里干活兒,訓(xùn)練數(shù)據(jù)的時(shí)長(zhǎng)在百萬(wàn)小時(shí),總成本五億美元起步且不保證100%成功。

要注意,這還只是機(jī)器人廠商自己組織的訓(xùn)練,某種程度上只能說(shuō)是“基礎(chǔ)課”。而最終投入實(shí)用,不同工廠、不同崗位的行動(dòng)自然也不同,機(jī)器人還得在補(bǔ)修“專業(yè)課”。而更進(jìn)階的“專業(yè)課”學(xué)費(fèi),那就要購(gòu)買(mǎi)機(jī)器人的工廠來(lái)自己支付了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

不難想象,面對(duì)現(xiàn)階段如此高昂的機(jī)器人訓(xùn)練成本,工廠們大概率是不愿意買(mǎi)單的。

畢竟,人形機(jī)器人的自動(dòng)控制可比自動(dòng)駕駛難太多了,不僅需要考慮水平面上的運(yùn)動(dòng)軌跡,還需要考慮三維空間里的物體運(yùn)動(dòng)。如果只是依靠人類的遙控和動(dòng)作捕捉,根本就沒(méi)辦法提供足夠的數(shù)據(jù)。

谷歌當(dāng)初在一個(gè)廚房的場(chǎng)景里死磕了17個(gè)月,最后也就采集了13萬(wàn)條數(shù)據(jù),機(jī)器人在這個(gè)熟悉的環(huán)境里表現(xiàn)得非常優(yōu)秀,但只要換個(gè)環(huán)境,立刻就崩盤(pán)了——成功率從97%暴跌到了30%。

過(guò)少的數(shù)據(jù),導(dǎo)致現(xiàn)在人形機(jī)器人的功能不能“泛化”,不能適應(yīng)場(chǎng)景的切換。

所以,對(duì)于當(dāng)前階段人形機(jī)器人的發(fā)展來(lái)說(shuō),最急需解決的就是訓(xùn)練成本問(wèn)題——如何找到一種高效的訓(xùn)練方法,使得人形機(jī)器人可以低成本、快速掌握崗位所需的諸多技能。

而這,恰好就撞到了各大企業(yè)的槍口上。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

大廠們正在大力投入機(jī)器人

人形機(jī)器人的核心系統(tǒng),大概可以分成“大腦”“小腦”“肢體”三部分,“大腦”負(fù)責(zé)的是讓機(jī)器人理解指令、規(guī)劃行動(dòng);“小腦”負(fù)責(zé)根據(jù)規(guī)劃控制動(dòng)作;“肢體”則是各種機(jī)械結(jié)構(gòu)來(lái)具體執(zhí)行動(dòng)作。

或者,你也可以把大腦小腦統(tǒng)一歸結(jié)為上半身,肢體運(yùn)動(dòng)什么的統(tǒng)一歸結(jié)為下半身。

宇樹(shù)、眾擎這些新銳的機(jī)器人企業(yè),

有一個(gè)算一個(gè),其實(shí)研究的都是“下半身”。

而真正能讓機(jī)器人發(fā)揮出強(qiáng)大威力的,

還得是“上半身”。

而不論是“大腦”“小腦”,其實(shí)最后歸根結(jié)底,都還是要靠AI實(shí)現(xiàn)的——這恰恰就是中國(guó)科技企業(yè)的優(yōu)勢(shì)領(lǐng)域了。

實(shí)際上,中國(guó)的科技企業(yè),從阿里、騰訊到京東、美團(tuán),從華為、小米到大疆、比亞迪、塞力斯......有一個(gè)算一個(gè),都已經(jīng)在布局人形機(jī)器人了,區(qū)別只在于具體以什么樣的形式進(jìn)行布局。

像阿里、百度、騰訊這些大公司,雖然都開(kāi)始布局這個(gè)領(lǐng)域,但基本上沒(méi)有自己動(dòng)手造機(jī)器人的身體,而是更愿意掏錢(qián)投資相關(guān)企業(yè),或者利用自己擅長(zhǎng)的數(shù)據(jù)技術(shù),專門(mén)研究機(jī)器人的"大腦"——也就是那些復(fù)雜的算法和模型。

說(shuō)白了,這些互聯(lián)網(wǎng)公司更看重的是機(jī)器人的"軟件"部分,而不是"硬件"部分。他們覺(jué)得,與其費(fèi)勁去造機(jī)器人的外殼和零件,不如專注于讓機(jī)器人變得更聰明、更智能。這些互聯(lián)網(wǎng)公司現(xiàn)在就開(kāi)始布局,為未來(lái)做準(zhǔn)備。不過(guò),他們的做法更像是"幕后軍師",而不是"前線戰(zhàn)士"。

不過(guò),值得一提的是,當(dāng)前互聯(lián)網(wǎng)巨頭們?cè)谌诵螜C(jī)器人領(lǐng)域的目光主要還是聚焦于通用的大模型上?,F(xiàn)在技術(shù)還不能讓機(jī)器人像人類一樣直接感知周?chē)h(huán)境并自主做出決策和行動(dòng),它們更多是依賴外部設(shè)備來(lái)獲取信息。

國(guó)內(nèi)幾大互聯(lián)網(wǎng)公司,比如百度、阿里、騰訊,都推出了自己的多模態(tài)大模型,比如百度的“文心”、阿里的“通義”、騰訊的“混元”。這些模型雖然能處理多種類型的數(shù)據(jù),但還做不到讓機(jī)器人“活”起來(lái),真正與環(huán)境互動(dòng)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

不過(guò),國(guó)內(nèi)企業(yè)也在努力向“具身智能”方向發(fā)展,也就是讓機(jī)器人擁有更接近人類的感知和行動(dòng)能力。

以字節(jié)為例,字節(jié)跳動(dòng)在機(jī)器人領(lǐng)域的探索從2020年就開(kāi)始了,他們利用自己在互聯(lián)網(wǎng)行業(yè)積累的數(shù)據(jù)優(yōu)勢(shì),開(kāi)發(fā)了各種大模型。2024年,字節(jié)還發(fā)布了GR-2具身大模型——GR-2具身大模型的亮點(diǎn)在于它像嬰兒一樣學(xué)習(xí)復(fù)雜任務(wù)。

預(yù)訓(xùn)練階段,它“觀看”了3800萬(wàn)個(gè)互聯(lián)網(wǎng)視頻和500億個(gè)tokens,涵蓋家庭、戶外等場(chǎng)景,具備多任務(wù)學(xué)習(xí)和環(huán)境適應(yīng)能力。微調(diào)階段,通過(guò)機(jī)器人軌跡優(yōu)化視頻生成和動(dòng)作預(yù)測(cè),展現(xiàn)出強(qiáng)大的多任務(wù)學(xué)習(xí)能力,在100多個(gè)任務(wù)中平均成功率高達(dá)97.7%。

阿里通過(guò)“通義千問(wèn)”大模型成功將AI技術(shù)應(yīng)用于工業(yè)機(jī)器人,Qwen2系列模型開(kāi)源后下載量超4000萬(wàn),衍生模型達(dá)5萬(wàn),并達(dá)成千萬(wàn)級(jí)商業(yè)訂單。阿里積極投資AI大模型企業(yè),覆蓋月之暗面、MiniMax等頭部項(xiàng)目。2024年5月,阿里通過(guò)“杭州灝月”增持人形機(jī)器人企業(yè)逐際動(dòng)力,成為其第二大股東,強(qiáng)調(diào)技術(shù)落地與盈利性。

小米則不走尋常路,自主研發(fā)人形機(jī)器人。2022年推出首款全棧仿生機(jī)器人Cyber One,標(biāo)志著小米進(jìn)軍人形機(jī)器人領(lǐng)域。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

雖未量產(chǎn),但Cyber One已逐步融入小米自有制造系統(tǒng)。2024年6月,小米機(jī)器人公司遷至亦莊工廠,Cyber One開(kāi)始分階段落地,向特斯拉那樣的工業(yè)制造路線靠攏。

野心最大的,也許就是騰訊了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

別說(shuō)這些互聯(lián)網(wǎng)企業(yè)了,車(chē)企甚至都開(kāi)始入局了。

2024年,車(chē)企紛紛進(jìn)軍人形機(jī)器人領(lǐng)域,廣汽推出Go Mate,小鵬發(fā)布Iron,小米有Cyber One,奇瑞有Mornine,比亞迪有“堯舜禹”。就在這兩天,靠著問(wèn)界火起來(lái)的塞力斯也加入了戰(zhàn)局,布局方式包括但不限于投資(如吉利)、自研(小鵬、小米、廣汽)和合作開(kāi)發(fā)(奇瑞)。

其實(shí)這也很好理解,車(chē)企在人形機(jī)器人領(lǐng)域具有天然優(yōu)勢(shì),因其與自動(dòng)駕駛技術(shù)相似,涉及“感知+決策+執(zhí)行”。AI芯片、電機(jī)、傳感器等技術(shù)可直接復(fù)用,自有工廠則為機(jī)器人落地提供了理想場(chǎng)景。跨界角逐已成必然趨勢(shì)。

就在今天,3月26日,一汽奧迪宣布國(guó)產(chǎn)機(jī)器人開(kāi)始進(jìn)廠打工,vivo也官宣成立機(jī)器人實(shí)驗(yàn)室。

總而言之就是,人形機(jī)器人已經(jīng)成功勾引到了中國(guó)幾乎所有上臺(tái)面的大型科技企業(yè)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

結(jié)尾:人形機(jī)器人

依舊是中美之間的競(jìng)賽

科技的發(fā)展,是有規(guī)律可循的。

這就像是游戲里的科技樹(shù),你必須點(diǎn)亮前置科技,才能點(diǎn)亮后面的科技。

人形機(jī)器人的前置科技是AI,AI的前置科技是互聯(lián)網(wǎng)。

日本雖然是最先開(kāi)始人形機(jī)器人探索的國(guó)家,但很遺憾,日本的人形機(jī)器人從始至終就沒(méi)有和智能化沾邊——因?yàn)槿毡救藳](méi)有點(diǎn)亮互聯(lián)網(wǎng)和AI的科技樹(shù),只能在機(jī)電領(lǐng)域死磕。

但中美兩國(guó)則不同,互聯(lián)網(wǎng)、AI都是中美兩國(guó)的優(yōu)勢(shì)領(lǐng)域,所以人形機(jī)器人最終的競(jìng)爭(zhēng),也一定是中美兩國(guó)企業(yè)之間的對(duì)轟。

美國(guó)那邊有波士頓動(dòng)力、有特斯拉、有FigureAI,我們這邊有宇樹(shù)、智元、眾擎、優(yōu)必選......實(shí)際上,全球150多家機(jī)器人企業(yè),超過(guò)80家都在國(guó)內(nèi),剩下的70幾家不用想,基本也在北美了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

今年往后的幾個(gè)月,中美兩國(guó)的人形機(jī)器人企業(yè)一定都會(huì)整出來(lái)各種狠活兒,因?yàn)槿谫Y規(guī)模擺在這,各路資本都已經(jīng)開(kāi)始投資人形機(jī)器人了。

在我看來(lái),中國(guó)一定會(huì)率先在人形機(jī)器人上做出實(shí)質(zhì)性的突破——原因無(wú)他,因?yàn)檎撈鸸I(yè)數(shù)據(jù),論起工業(yè)場(chǎng)景,誰(shuí)又能和世界第一工業(yè)國(guó)一較高下呢?

打開(kāi)網(wǎng)易新聞 查看精彩圖片

·····End·····