人類(lèi)正在迎來(lái)人工智能領(lǐng)域的爆炸式更新,技術(shù)向未知拓展的每一步,幾乎都引起驚人的關(guān)注度。
在人工智能邊界擴(kuò)張的過(guò)程中,重要賽道的技術(shù)路線(xiàn)創(chuàng)新與分歧并存。技術(shù)先鋒者的判斷和選擇,影響著眾多跟隨者的腳步。
過(guò)去一年,機(jī)器之心獨(dú)家率先將月之暗面、生數(shù)科技、愛(ài)詩(shī)科技、無(wú)問(wèn)芯穹等優(yōu)秀公司介紹給大家,為他們?cè)诨ヂ?lián)網(wǎng)世界留下了第一份 “萬(wàn)字訪(fǎng)談底稿”。在技術(shù)路線(xiàn)尚未收斂的階段,我們看到了到真正擁有信念、勇氣以及系統(tǒng)化認(rèn)知的 AI 創(chuàng)業(yè)者的引領(lǐng)力量。
因此,我們推出 “AI Pioneers” 的專(zhuān)欄,希望繼續(xù)尋找和紀(jì)錄 AGI 時(shí)代人工智能各細(xì)分賽道具有領(lǐng)袖氣質(zhì)的創(chuàng)業(yè)者,介紹 AI 賽道最出眾、高潛的創(chuàng)業(yè)公司,分享他們?cè)?AI 領(lǐng)域最前沿、鮮明的認(rèn)知。
作者:姜菁玲
機(jī)器之心報(bào)道
即使年輕的學(xué)術(shù)天才已成為當(dāng)下AGI公司創(chuàng)始人的主流背景之一,2000年出生的楊豐瑜,還是年輕得讓人意外。
本科密歇根大學(xué)計(jì)算機(jī)專(zhuān)業(yè),耶魯大學(xué)計(jì)算機(jī)專(zhuān)業(yè)博士生,年僅23歲的楊豐瑜,在去年開(kāi)始了自己的具身智能機(jī)器人事業(yè)。
2024年,由他創(chuàng)辦的UniX AI具身智能公司,在五個(gè)月內(nèi)完成了一款輪式人形機(jī)器人的研發(fā)制造,這款帶有「餐后清潔」以及「洗衣服」等功能的機(jī)器人將于九月開(kāi)始量產(chǎn),并對(duì)外銷(xiāo)售。
在很多具身智能機(jī)器人仍然停留在實(shí)驗(yàn)室的階段,這是一個(gè)很快的商業(yè)化速度。在蘇州,UniX AI公司的機(jī)器人量產(chǎn)工廠已經(jīng)超過(guò)兩千五百平。
這家在去年幾乎沒(méi)人聽(tīng)說(shuō)過(guò)的公司,在大半年內(nèi)網(wǎng)羅了多位機(jī)器人行業(yè)內(nèi)的資深技術(shù)人才?!赣蓄^部服務(wù)機(jī)器人的研發(fā)總監(jiān)幫我們做底盤(pán),也有一些頭部的人形機(jī)器人公司頂尖人才在負(fù)責(zé)我們的硬件」。2024年7月,上海交大著名機(jī)器人專(zhuān)家王賀升教授,宣布正式加入U(xiǎn)niX AI擔(dān)任首席科學(xué)家。
在UniX AI釋放出的首支技術(shù)展示視頻中,名為Wanda的輪式人形機(jī)器人能夠完成抓起豆腐、協(xié)助分類(lèi)衣物、將衣物拿到洗衣機(jī)清洗等任務(wù)。當(dāng)下具身智能公司難以解決的「柔性任務(wù)」問(wèn)題,UniX AI似乎已經(jīng)找到解決方案。
「我不覺(jué)得年輕有什么不好,從技術(shù)層面來(lái)講,當(dāng)下很多新技術(shù)、新產(chǎn)品,很多是由擁有深厚學(xué)術(shù)背景的年輕人創(chuàng)造的」,令我們有些意外的是,作為00后,楊豐瑜本人在談吐中表現(xiàn)出超越年齡的成熟,對(duì)于公司管理和具身智能的技術(shù)階段擁有非常清晰的認(rèn)知。
我們對(duì)UniX AI的好奇集中在,一個(gè)在創(chuàng)投圈幾乎沒(méi)有任何消息的具身智能公司,為何能做到如此快的發(fā)展速度;作為極少的由00后操刀建立的具身智能公司,UniX AI如何實(shí)現(xiàn)從0到1的發(fā)展?UniX AI的具身智能終局路線(xiàn)圖又是什么樣的?
帶著這些問(wèn)題,機(jī)器之心與楊豐瑜展開(kāi)了他創(chuàng)業(yè)以來(lái)的第一次公開(kāi)媒體對(duì)話(huà)。
耶魯00后
投身具身智能創(chuàng)業(yè)
機(jī)器之心:你現(xiàn)在已經(jīng)畢業(yè)了嗎?
楊豐瑜:我是本科直博到的耶魯,博士畢業(yè)的論文要求我基本都達(dá)到了,就拿今年來(lái)說(shuō)吧,我中了4篇CVPR,加上其他,總共有十多篇人工智能和機(jī)器人的頂會(huì)文章。
機(jī)器之心:你的精力很旺盛。
楊豐瑜:(笑),經(jīng)常熬夜到凌晨三點(diǎn)半,前段時(shí)間還去打吊針。主要是因?yàn)閳F(tuán)隊(duì)在一起,經(jīng)常不看手表,一抬頭就已經(jīng)很晚了。
機(jī)器之心:是什么時(shí)候開(kāi)始想到要?jiǎng)?chuàng)業(yè)的?
楊豐瑜:我一直認(rèn)為創(chuàng)業(yè)是“天時(shí)地利人和”。
去年我們看到感知層面在技術(shù)上有很大進(jìn)步,包括視覺(jué)、語(yǔ)言模型和觸覺(jué)等多模態(tài)的一些大模型或基座模型都有了很大的發(fā)展,這讓我們看到了實(shí)現(xiàn)目標(biāo)的可能性。另外國(guó)家也有一系列的支持政策推出,為創(chuàng)業(yè)提供了一個(gè)良好環(huán)境。這是“天時(shí)”。
“地利”:毋庸置疑,通用人形機(jī)器人是繼新能源汽車(chē)之后的下一個(gè)發(fā)展方向,中國(guó)在供應(yīng)鏈方面有著無(wú)可比擬的優(yōu)勢(shì),而且長(zhǎng)三角這邊的高科技人才也非常多。
一開(kāi)始,我們做了一些調(diào)研,去弄清楚目前機(jī)器人行業(yè)的工程化水平進(jìn)展到哪個(gè)階段、市場(chǎng)需求在哪里、上一代機(jī)器人解決了哪些問(wèn)題以及它未來(lái)的機(jī)會(huì)在哪里?
能夠成事,關(guān)鍵還是找到對(duì)的人。今年,我們正式組建團(tuán)隊(duì),快速集結(jié)了很多方面的專(zhuān)家,有頭部掃地機(jī)器人的研發(fā)總監(jiān),也有一些頭部人形機(jī)器人公司頂尖人才,負(fù)責(zé)我們的硬件。在算法層面,我在美國(guó)以及歐洲招募了一批人才,包括我的一些同學(xué)、師兄,這是“人和”。
作為創(chuàng)始人和CEO,最重要的是集合資源。UniX AI是一個(gè)全球化的公司,把全世界不同國(guó)家在機(jī)器人軟件、硬件、供應(yīng)鏈的優(yōu)勢(shì)結(jié)合起來(lái);同時(shí)我們有國(guó)際化的規(guī)劃,通過(guò)一年、三年、五年計(jì)劃的不斷努力,實(shí)現(xiàn)Robots For All的公司愿景。
機(jī)器之心:簡(jiǎn)單介紹一下你的學(xué)術(shù)經(jīng)歷吧
楊豐瑜:小學(xué)到高中是在國(guó)內(nèi),本科去密歇根大學(xué)讀了計(jì)算機(jī)專(zhuān)業(yè)。一開(kāi)始接觸的是視覺(jué)和機(jī)器學(xué)習(xí),后來(lái)在導(dǎo)師「多模態(tài)學(xué)習(xí)」的影響下,開(kāi)始進(jìn)行視觸覺(jué)的研究。
本科期間發(fā)表了5篇機(jī)器人視觸覺(jué)論文,其中“Touch and Go: Learning from Human-Collected Vision and Touch”是世界上現(xiàn)今最大的視觸覺(jué)傳感數(shù)據(jù)集,被人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的頂級(jí)會(huì)議NuerIPS接收。
在另外一個(gè)工作里,我們第一次引入diffusion model完成了對(duì)視覺(jué)和觸覺(jué)之間的相互轉(zhuǎn)化,成果被ICCV接收。
對(duì)于機(jī)器人來(lái)說(shuō),觸覺(jué)很重要。一件衣服,是滌綸、棉紡還是絲,靠肉眼不太能夠觀察得出,只有真正摸上去,才能分辨不一樣的質(zhì)地。另外在一些精細(xì)活動(dòng)上,比如將充電線(xiàn)插入充電口,也需要通過(guò)觸覺(jué)不斷調(diào)整,單靠視覺(jué)無(wú)法完成。
機(jī)器之心:然后你就來(lái)到了耶魯。
楊豐瑜:因?yàn)樵跈C(jī)器人視觸覺(jué)方面的一些工作,特別是視觸覺(jué)的轉(zhuǎn)化和在大語(yǔ)言模型中的泛化運(yùn)用,我獲得了北美計(jì)算機(jī)協(xié)會(huì)杰出本科科學(xué)家稱(chēng)號(hào),是學(xué)校有史以來(lái)第一人。最終選擇耶魯大學(xué)進(jìn)行博士深造。
在這期間,我陸續(xù)發(fā)表了一些論文,其中《Binding touch to everything: Learning unified multimodal tactile representations》(CVPR, 2024, pp.26340-26353),在這篇論文中,我提出了世界首個(gè)適用于多款不同觸覺(jué)傳感器的觸覺(jué)大模型 UniTouch,適用于與視覺(jué)、語(yǔ)言和聲音等多種模態(tài)相連的基于視覺(jué)的觸覺(jué)傳感器。
另外一篇論文《Tactile-Augmented Radiance Fields》(CVPR, 2024, pp.26529-26539),則建立了世界上第一個(gè)可以在場(chǎng)景級(jí)泛化的3D視觸覺(jué)模型TARF,UniX AI人形機(jī)器人的泛化能力也是基于該模型。
機(jī)器之心:你覺(jué)得00后的身份對(duì)你來(lái)講是更有利還是更有弊?
楊豐瑜:創(chuàng)業(yè)公司,創(chuàng)始人是靈魂。很多人會(huì)覺(jué)得我很年輕,但我覺(jué)得00后的身份不是問(wèn)題。
從技術(shù)層面講,在迎接這一輪的科技變革和賽道創(chuàng)新的浪潮中,年輕人具有非常強(qiáng)的推動(dòng)作用。很多新技術(shù)、新產(chǎn)品是由當(dāng)下的年輕人創(chuàng)造的,特別是高科技行業(yè),準(zhǔn)入門(mén)檻相對(duì)較高。Sora核心團(tuán)隊(duì)的成員之一也是我同學(xué),他在密歇根大學(xué)時(shí)就展現(xiàn)出了很強(qiáng)的技術(shù)能力。
從認(rèn)知和經(jīng)驗(yàn)層面講,我覺(jué)得快速學(xué)習(xí)、快速糾錯(cuò)也是一種路徑。另外是個(gè)性,要肯堅(jiān)持有韌性,想盡一切辦法,有“逢山開(kāi)路,遇水搭橋”的精神,畢竟創(chuàng)業(yè)最后都是拿結(jié)果說(shuō)話(huà)。
當(dāng)然,UniX AI團(tuán)隊(duì)中也有很多有經(jīng)驗(yàn)的專(zhuān)家,他們?cè)诮Y(jié)構(gòu)、電子等方面有豐富的從業(yè)經(jīng)驗(yàn),我們之間有效配合,才能在短時(shí)間內(nèi)推出我們的產(chǎn)品。
視觸覺(jué)+操作
提升機(jī)器人可泛化能力
機(jī)器之心:觸覺(jué)的提升為什么對(duì)機(jī)器人是重要的?
楊豐瑜:人是一個(gè)多感官動(dòng)物,你的行動(dòng)決策通常是多個(gè)感官共同傳遞過(guò)來(lái)的信息綜合影響,智能機(jī)器人理論上也是這樣。
觸覺(jué)是最重要的感官信息之一,跟視覺(jué)反饋相比,它產(chǎn)生在機(jī)器人與環(huán)境交互之后,而視覺(jué)反饋是在之前。當(dāng)機(jī)器人抓取一個(gè)物體時(shí),物體發(fā)生了形變,本質(zhì)上,這個(gè)交互動(dòng)作發(fā)生后,機(jī)器人獲得的增量信息都來(lái)自于觸覺(jué)——它摸起來(lái)是怎樣的。
擁有觸覺(jué)信息能夠讓機(jī)器人在一些更復(fù)雜更細(xì)膩的任務(wù)上表現(xiàn)得更好,大大提高抓取任務(wù)的成功率,尤其是在柔性物體的抓取中,觸覺(jué)的作用更加明顯,可以說(shuō)是從基本不可能完成任務(wù)到能夠完成任務(wù)的質(zhì)的提升。
比如,我們的輪式人形機(jī)器人Wanda已經(jīng)實(shí)現(xiàn)捏雞蛋、抓豆腐、洗衣服等任務(wù),純靠視覺(jué)去做,機(jī)器人得不到反饋,是很難執(zhí)行下來(lái)的。
為什么現(xiàn)在機(jī)器人主要依靠視覺(jué)做判斷,是因?yàn)橐曈X(jué)方面的數(shù)據(jù)相較于其他,是最直接、容易獲取且被訓(xùn)練起來(lái)的,有大量數(shù)據(jù)可以用。但是在機(jī)器人往具身方向更進(jìn)一步去走的時(shí)候,僅僅依靠視覺(jué)是肯定不夠的。
作為一種依賴(lài)交互產(chǎn)生的感官信息,能夠?qū)⒂|覺(jué)信息合理運(yùn)用的意義還在于,機(jī)器人能夠逐步在與世界的真實(shí)交互中不斷學(xué)習(xí),變得更加可用和泛化。
機(jī)器之心:為什么加入觸覺(jué)后,機(jī)器人對(duì)柔性物體的控制水平會(huì)提升,原理是什么?
楊豐瑜:原理主要在于柔性物體與剛性物體在抓取和操作時(shí)有很大的不同。剛性物體在觸碰前后,其物理形狀基本不會(huì)改變,因此通過(guò)視覺(jué)觀察,在抓取時(shí)相對(duì)容易判斷。然而,柔性物體在抓取之前或操作之前,通過(guò)觀察很難確定與它接觸后會(huì)發(fā)生什么情況,因?yàn)樵谧ト∵^(guò)程中會(huì)出現(xiàn)大量的遮擋和形變,而這些形變通過(guò)視覺(jué)是很難準(zhǔn)確預(yù)測(cè)的。
例如,當(dāng)拿一張紙巾時(shí),一旦將紙巾握到手里面,就會(huì)完全遮擋住視線(xiàn),此時(shí)視覺(jué)幾乎無(wú)法提供有效的信息來(lái)判斷如何抓取或操作。在這種情況下,就只能依靠觸覺(jué)等物理信息來(lái)完成感知。
機(jī)器之心:為什么好像很多時(shí)候我也不需要去嘗試抓一下物體,我就知道怎么抓。
楊豐瑜:那是因?yàn)槟阕鳛橐粋€(gè)人類(lèi)來(lái)說(shuō),已經(jīng)融合得很好了,以至于你不知道你用了觸覺(jué)信息在這里面。你已經(jīng)積累了二十多年的觸覺(jué)數(shù)據(jù),所以你不知道是哪一種感官支持你讓你去完成了這個(gè)任務(wù)。
機(jī)器之心:對(duì)大部分機(jī)器人任務(wù)來(lái)說(shuō),不同感官的貢獻(xiàn)比會(huì)有什么區(qū)別?現(xiàn)階段,觸覺(jué)的優(yōu)先級(jí)有多高?
楊豐瑜:對(duì)于大部分機(jī)器人的任務(wù)來(lái)說(shuō),不同感官在感知、推理決策和行動(dòng)這三個(gè)步驟中的貢獻(xiàn)比例有所不同。
在感知層面上,初期主要依靠視覺(jué)和點(diǎn)云來(lái)獲取全局信息,比如知道整個(gè)家的布局、水在哪里等。目前,通過(guò)視覺(jué)大模型和3D大模型來(lái)感知全局信息的問(wèn)題已基本解決。
在決策層面上,主要依靠語(yǔ)言引入人類(lèi)的先驗(yàn)知識(shí)。例如,機(jī)器人接到從冰箱拿水的指令后,能進(jìn)行任務(wù)拆解,知道第一步打開(kāi)冰箱,第二步拿水,第三步關(guān)冰箱,這些先驗(yàn)知識(shí)來(lái)自大量的互聯(lián)網(wǎng)數(shù)據(jù)。
在行動(dòng)層面上,視覺(jué)可以幫助機(jī)器人確定抓取的位置,但在確定抓取力度等方面,觸覺(jué)信息起著重要作用。比如在有遮擋的情況下,像拿豆腐時(shí),視覺(jué)難以準(zhǔn)確判斷抓取方式,而觸覺(jué)能提供關(guān)鍵信息,幫助機(jī)器人完成精確抓取。
此外,觸覺(jué)在一些精細(xì)力控的場(chǎng)景,如捏雞蛋、抓豆腐等,以及在一些需要判斷物體形變和力的反饋的場(chǎng)景中,發(fā)揮著重要作用。
總的來(lái)說(shuō),不同感官的貢獻(xiàn)比因任務(wù)而異,在一些剛性物體的抓取中,視覺(jué)可能占比較高;而在很多柔性物體的抓取中,觸覺(jué)的作用更為關(guān)鍵,甚至可以說(shuō)是從基本無(wú)法完成任務(wù)到能夠完成任務(wù)的質(zhì)的提升。
機(jī)器之心:觸覺(jué)這塊有足夠高的壁壘嗎?落地到機(jī)器人產(chǎn)品里有什么難點(diǎn)?
楊豐瑜:我認(rèn)為相對(duì)來(lái)說(shuō)是比較高的,在2023年之前,觸覺(jué)一直是一個(gè)非常小眾的模態(tài),與視覺(jué)和聽(tīng)覺(jué)相比,從事觸覺(jué)相關(guān)工作的人非常少。
在開(kāi)展觸覺(jué)相關(guān)工作的初期,傳感器是最大的難題。當(dāng)時(shí),全世界從事數(shù)據(jù)相關(guān)工作的人并不多,如何制作傳感器是一個(gè)關(guān)鍵問(wèn)題。
其次,是如何解析觸覺(jué)信息的問(wèn)題,這涉及到算法和數(shù)據(jù)兩個(gè)層面。數(shù)據(jù)層面,此前世界上絕大多數(shù)觸覺(jué)傳感的具體數(shù)據(jù)并不公開(kāi),這可能是由于許多機(jī)器人結(jié)合的特殊性或其他原因?qū)е?,使得機(jī)器人領(lǐng)域的數(shù)據(jù)公開(kāi)程度不如視覺(jué)領(lǐng)域。因此,我們不斷解決數(shù)據(jù)集的問(wèn)題,致力于推動(dòng)全世界觸覺(jué)傳感數(shù)據(jù)集的不斷公開(kāi)。
在算法層面,觸覺(jué)與視覺(jué)存在差異,其中包含許多物理的先驗(yàn)知識(shí)。例如,通過(guò)傳感器上的marker可以判斷受力情況,但這些信息不像視覺(jué)信息那樣易于解釋和識(shí)別。
當(dāng)時(shí)還進(jìn)行過(guò)一個(gè)實(shí)驗(yàn),結(jié)果表明生成的觸覺(jué)信號(hào)讓人分辨起來(lái)非常困難。因?yàn)槿绻藳](méi)有經(jīng)過(guò)一些特定的訓(xùn)練,很難分辨出每一種東西的觸覺(jué)傳感信號(hào)。我們也在積極努力降低這一壁壘,推動(dòng)學(xué)術(shù)界更多的人參與其中,以促進(jìn)整個(gè)觸覺(jué)域的發(fā)展與進(jìn)步。
機(jī)器之心:如果說(shuō),觸覺(jué)信息不僅面臨現(xiàn)存數(shù)據(jù)量少的問(wèn)題,大規(guī)模采集成本也很高,那怎么去做到Scale up?
楊豐瑜:我們之前做的工作其實(shí)就是嘗試解決這個(gè)問(wèn)題,如何在大規(guī)模采集難以實(shí)現(xiàn)的情況下做到Scale up:
第一步,我們把視覺(jué)和觸覺(jué)打通,通過(guò)視覺(jué)來(lái)預(yù)測(cè)觸覺(jué),甚至在沒(méi)有觸覺(jué)采集的場(chǎng)景中,利用視覺(jué)和語(yǔ)言等信息來(lái)推測(cè)觸覺(jué)信號(hào)。
比如,采集了同類(lèi)型同材料的桌子的觸覺(jué)信息后,到新的家庭或辦公室場(chǎng)景中,即使沒(méi)有實(shí)際觸摸過(guò)過(guò)新的桌子,也能通過(guò)視覺(jué)和語(yǔ)言信息推測(cè)其觸覺(jué)信號(hào)。這樣的話(huà),我們可以做到即使沒(méi)有真正物理的接觸,也能夠擴(kuò)大可用數(shù)據(jù)集。但是這種方式可能跟真實(shí)信號(hào)有一些出入,因?yàn)檫@是預(yù)測(cè)的。
第二,我們不斷推動(dòng)觸覺(jué)數(shù)據(jù)集的公開(kāi)。通過(guò)公開(kāi)數(shù)據(jù)集,可以讓更多人參與到觸覺(jué)領(lǐng)域的研究和發(fā)展中,從而促進(jìn)整個(gè)領(lǐng)域的進(jìn)步。
第三,在算法層面上,我們努力降低觸覺(jué)信息識(shí)別的門(mén)檻。例如,通過(guò)在傳感器上添加標(biāo)記(marker),并發(fā)現(xiàn)標(biāo)記在受到不同力時(shí)的變化規(guī)律,從而利用這些物理的先驗(yàn)知識(shí)來(lái)更好地解析觸覺(jué)信息。
第四,致力于將不同的信息,如視覺(jué)、觸覺(jué)、語(yǔ)言等多模態(tài)信息結(jié)合在一起,以完成各種任務(wù)。通過(guò)多模態(tài)信息的融合,可以在一定程度上彌補(bǔ)觸覺(jué)數(shù)據(jù)量少的不足,提高模型的泛化能力和適應(yīng)性。
機(jī)器之心:大規(guī)模采集是否可以實(shí)現(xiàn),需要什么條件?
楊豐瑜:我認(rèn)為這其實(shí)是整個(gè)具身智能發(fā)展的瓶頸,我個(gè)人認(rèn)為可以實(shí)現(xiàn)大規(guī)模采集,但這里有一個(gè)商業(yè)化的過(guò)程。
當(dāng)機(jī)器人走進(jìn)千家萬(wàn)戶(hù),有一定量的時(shí)候,你就能收集到足夠多的數(shù)據(jù),支持更多的場(chǎng)景來(lái)做一些泛化。當(dāng)然你不可能永遠(yuǎn)采到每一個(gè)點(diǎn),所以「大規(guī)?!惯@個(gè)命題會(huì)一直存在。那機(jī)器學(xué)習(xí)的本質(zhì)就是通過(guò)稀疏的采樣,實(shí)現(xiàn)稠密分布的一個(gè)模擬擬合和預(yù)測(cè)。
在數(shù)據(jù)這方面,我們并不排斥模擬,但我覺(jué)得一定量的真機(jī)數(shù)據(jù)是實(shí)現(xiàn)具身智能的必要條件。
機(jī)器之心:觸覺(jué)大模型有哪些關(guān)鍵的技術(shù)指標(biāo)?
楊豐瑜:觸覺(jué)大模型跟任何大模型一樣,在不同的下游任務(wù)里面都有一些指標(biāo)。我?guī)ьI(lǐng)團(tuán)隊(duì)構(gòu)建的世界上現(xiàn)存最大的視觸覺(jué)數(shù)據(jù)集Touch and go,是全世界機(jī)器人視觸覺(jué)預(yù)訓(xùn)練模型重要通用基準(zhǔn)之一。
具身智能機(jī)器人Wanda
九月開(kāi)始量產(chǎn)
機(jī)器之心:決定創(chuàng)業(yè)之后,打算做一個(gè)怎樣的具身智能公司?
楊豐瑜:創(chuàng)業(yè)的本質(zhì)是為社會(huì)創(chuàng)造價(jià)值。UniX AI是世界上少數(shù)幾家把C端定為第一戰(zhàn)略的具身智能機(jī)器人公司。
TO C雖然有很長(zhǎng)的一段路要走,但背后的潛力是巨大的。從產(chǎn)業(yè)層面講,人形機(jī)器人已經(jīng)進(jìn)入硬件+AI的技術(shù)融合期,發(fā)展飛速,越來(lái)越具備實(shí)用性。而且我樂(lè)觀估計(jì),這個(gè)融合進(jìn)程要比原先業(yè)內(nèi)人士預(yù)估的要快很多。
人口老齡化,出生率低下,勞動(dòng)力短缺……這些都是全世界面臨的問(wèn)題。企業(yè)的責(zé)任是要為社會(huì)解決問(wèn)題,這是UniX AI的機(jī)會(huì)點(diǎn)和價(jià)值點(diǎn),也是我創(chuàng)業(yè)的初心?,F(xiàn)在這個(gè)賽道大致的落地路徑基本上是工業(yè)——商業(yè)——家庭,我們會(huì)覆蓋商業(yè)和家庭,這也是服務(wù)TO C用戶(hù)的主要場(chǎng)景。
UniX AI的愿景是Robots For All,打造通用的人形機(jī)器人,在運(yùn)動(dòng)能力與智慧程度方面都做到領(lǐng)先,實(shí)現(xiàn)體力勞動(dòng)和智能陪伴。
機(jī)器之心:為什么一開(kāi)始選擇家庭場(chǎng)景去做?
楊豐瑜:事實(shí)上我們不只局限于家庭場(chǎng)景,我們也做泛商業(yè)的場(chǎng)景,比如辦公室等。
To B 場(chǎng)景從技術(shù)上來(lái)說(shuō)相對(duì)難度低一些,重復(fù)率高,對(duì)泛化性要求沒(méi)有那么高。但To B的場(chǎng)景往往是強(qiáng)替代邏輯,這就對(duì)機(jī)器人的速度、操作準(zhǔn)確率要求會(huì)非常高。
家庭場(chǎng)景很復(fù)雜,千變?nèi)f化,每個(gè)家都是一個(gè)小生態(tài),要求機(jī)器人具備很強(qiáng)的泛化能力。這當(dāng)然對(duì)我們的產(chǎn)品提出了更高的要求。同時(shí),我們?cè)诩彝?chǎng)景中也會(huì)有很多L2級(jí)別的功能,更多地提升了產(chǎn)品在復(fù)雜場(chǎng)景的適應(yīng)性和可玩性。
總的來(lái)說(shuō),我們的技術(shù)棧無(wú)論是 To B 還是 To C,都能覆蓋。做好了家庭場(chǎng)景,我覺(jué)得其他場(chǎng)景都能游刃有余。從最難的骨頭開(kāi)始啃,一方面體現(xiàn)了UniX AI的技術(shù)實(shí)力,一方面也是我們切入市場(chǎng)的戰(zhàn)略路徑。
機(jī)器之心:像類(lèi)似工廠這樣的To B場(chǎng)景也會(huì)去做嗎?
楊豐瑜:我們對(duì)所有場(chǎng)景都不排斥,UniX AI的模塊化硬件方案相對(duì)來(lái)說(shuō)可以適配很多不同的場(chǎng)景。同時(shí),我們有一套感知和操作解耦的運(yùn)動(dòng)基元算法可以最大程度地利用數(shù)據(jù),我們對(duì)場(chǎng)景的遷移性會(huì)非常強(qiáng)。雖然每一款產(chǎn)品都有其邊界,我們?cè)敢庠诟鞣N場(chǎng)景中進(jìn)行嘗試和拓展。我們也在跑通一些重要的商業(yè)場(chǎng)景,幫助到消費(fèi)者。
機(jī)器之心:所謂的供應(yīng)鏈成本優(yōu)勢(shì)是什么?
楊豐瑜:我們團(tuán)隊(duì)中有一批經(jīng)驗(yàn)豐富的供應(yīng)鏈管理專(zhuān)家,他們掌握量產(chǎn)級(jí)的成本控制方法,并能將其應(yīng)用到機(jī)器人供應(yīng)鏈中。雖然機(jī)器人行業(yè)目前尚未大規(guī)模卷價(jià)格,但我們從一開(kāi)始就按照量產(chǎn)級(jí)來(lái)控制成本,以確保產(chǎn)品能達(dá)到消費(fèi)者可接受的價(jià)格。我們有信心通過(guò)有效的成本控制,使產(chǎn)品在價(jià)格上具有極強(qiáng)競(jìng)爭(zhēng)力,為公司發(fā)展提供有力支持。
機(jī)器之心:即將推出的產(chǎn)品價(jià)格在什么區(qū)間?
楊豐瑜:這個(gè)現(xiàn)在我不是很方便披露,但我可以保證,一定是一個(gè)很驚喜的價(jià)格。
機(jī)器之心:你們打算怎么走向終局?
楊豐瑜:我們走向終局的邏輯很簡(jiǎn)單,需要一定量的高質(zhì)量真實(shí)數(shù)據(jù)。關(guān)鍵就在于如何獲取這些數(shù)據(jù),比如拿自動(dòng)駕駛舉例,特斯拉的FSD能夠走到終局,是因?yàn)榛?到8年時(shí)間,不斷有車(chē)子在路上跑并收集數(shù)據(jù)。
機(jī)器人行業(yè)有所不同,大家期望機(jī)器人能夠自動(dòng)干點(diǎn)事兒。我們首先開(kāi)發(fā)出若干單點(diǎn)場(chǎng)景的功能,讓大家覺(jué)得機(jī)器人有用或好玩,而且在消費(fèi)能力承受范圍內(nèi),這樣大家才會(huì)愿意購(gòu)買(mǎi)。
我們的供應(yīng)鏈有優(yōu)勢(shì),能把價(jià)格降下來(lái),這是很關(guān)鍵的一點(diǎn)。通過(guò)用戶(hù)的不斷反饋,我們不斷優(yōu)化迭代產(chǎn)品,最終打造出通用的具身智能機(jī)器人。
機(jī)器之心:機(jī)器人量產(chǎn)的難度和意義在哪里?
楊豐瑜:做DEMO其實(shí)很容易,只要在實(shí)驗(yàn)室做出來(lái)一臺(tái),就是成功。量產(chǎn)的難度,在于不是一臺(tái),而是一百臺(tái)、一千臺(tái)真正進(jìn)入到用戶(hù)家中,考驗(yàn)產(chǎn)品的數(shù)據(jù)安全性、操作穩(wěn)定性、底層控制可靠性,背后需要強(qiáng)大的售后團(tuán)隊(duì)和不斷迭代的技術(shù)團(tuán)隊(duì)。另外工藝也很重要,這也是考驗(yàn)量產(chǎn)能力的重要指標(biāo)。
它的意義當(dāng)然毋庸置疑,一方面體現(xiàn)出供應(yīng)鏈的競(jìng)爭(zhēng)力,一方面展現(xiàn)了技術(shù)的成熟度。誰(shuí)是第一個(gè)吃螃蟹的人?誰(shuí)又吃得又快又好?另外,量產(chǎn)可以得到一定的先發(fā)優(yōu)勢(shì)。
機(jī)器之心:決定創(chuàng)業(yè)以后,初始團(tuán)隊(duì)構(gòu)建思路和團(tuán)隊(duì)組建情況目前大概是怎樣的?
楊豐瑜:從0-1,初創(chuàng)團(tuán)隊(duì)很重要。我做事習(xí)慣先有頂層規(guī)劃,再慢慢部署到每個(gè)層級(jí),像瀑布流一樣,從上往下。先找到最核心的關(guān)鍵人,干起來(lái)之后,再向下延伸不斷完善團(tuán)隊(duì),讓整個(gè)輪子轉(zhuǎn)起來(lái)。
從去年年底到現(xiàn)在,我們的團(tuán)隊(duì)發(fā)展非常快,已經(jīng)迭代了三代產(chǎn)品。目前團(tuán)隊(duì)規(guī)模已經(jīng)初具規(guī)模,但后期我們還會(huì)根據(jù)需要,不斷調(diào)整和完善,讓公司的競(jìng)爭(zhēng)力愈來(lái)愈強(qiáng)。
獲取人才這件事,是創(chuàng)業(yè)公司最重要的事情之一,我們公司大部分的人才我都親自看過(guò)面過(guò)。很多時(shí)候,CEO不僅是首席執(zhí)行官,更是“首席意義官”,需要跟同行者解釋我們做的事情,它的價(jià)值和意義在哪里。讓他們認(rèn)同,一起上路,這非常重要。
同時(shí),這個(gè)階段我的管理半徑很大,管理的顆粒度也很細(xì),非常辛苦但很有必要。只有當(dāng)自己全盤(pán)掌握,確認(rèn)公司前進(jìn)方向正確和穩(wěn)定之后,才能花更多時(shí)間在別的方面。
機(jī)器之心:你怎么吸引這些人才?
楊豐瑜:本質(zhì)上吸引大家的,還是如何走向具身智能終局這個(gè)路徑,除此之外是怎么做的問(wèn)題。
我們有幾個(gè)亮點(diǎn),第一有非常強(qiáng)的供應(yīng)鏈成本優(yōu)勢(shì),其次我們團(tuán)隊(duì)的執(zhí)行力很強(qiáng),迭代速度非常快,很多候選人可能第一次知道我們時(shí),覺(jué)得我們不過(guò)爾爾,但幾周后再來(lái),發(fā)現(xiàn)場(chǎng)景已經(jīng)跑通了,進(jìn)展很快。我們也有一些國(guó)內(nèi)頂尖機(jī)器人公司的人才,主動(dòng)要求加入進(jìn)來(lái)。
機(jī)器之心:目前的資金來(lái)源是?
楊豐瑜:我們會(huì)在合適的時(shí)候統(tǒng)一披露。
機(jī)器之心:是否有外部融資計(jì)劃?
楊豐瑜:目前投資人反饋非常踴躍,歡迎和我們有共同通用具身智能愿景的投資人,和我們長(zhǎng)期走下去。
機(jī)器之心:再詳細(xì)介紹一下你們即將推出的產(chǎn)品,以及未來(lái)的市場(chǎng)計(jì)劃?
楊豐瑜:我們即將量產(chǎn)的機(jī)器人叫Wanda,是一款輪式人形雙臂機(jī)器人。在我們發(fā)布的首支技術(shù)視頻中,大家可以看到它的一些功能特點(diǎn),但這不是全部,等到九月份我們面向消費(fèi)者公開(kāi)發(fā)售的時(shí)候,會(huì)有更多驚喜細(xì)節(jié)。
最終,UniX AI希望交付給消費(fèi)者的產(chǎn)品,是一款通用的具身智能機(jī)器人,不僅服務(wù)于家庭,更可以陪伴人們?nèi)ネ喔h(yuǎn)的地方,提供更多的功能,這需要我們?cè)诩夹g(shù)上不斷發(fā)展,也需要公司和用戶(hù)之間的協(xié)同共創(chuàng)。不積跬步無(wú)以至千里,那我們先從第一步開(kāi)始。
熱門(mén)跟貼