機器人前瞻(公眾號:robot_pro)編譯   江宇編輯  漠影
打開網(wǎng)易新聞 查看精彩圖片
機器人前瞻(公眾號:robot_pro)編譯 江宇編輯 漠影

機器人前瞻4月30日消息,初創(chuàng)公司Dyna Robotics Inc.正式公布其自主研發(fā)的人工智能模型DYNA-1,專為驅(qū)動機器人而設(shè)計。

DYNA-1模型的發(fā)布,距離Dyna Robotics Inc.成立僅一個月。Dyna在創(chuàng)立時,即獲得由CRV和First Round Capital領(lǐng)投的2350萬美元種子輪融資。Dyna的首席執(zhí)行官林登·高(Lindon Gao)曾創(chuàng)立零售科技公司Caper Inc.,該公司開發(fā)了商店無人結(jié)賬系統(tǒng),并于2021年被Instacart以3.5億美元收購。

Dyna正在開發(fā)一套自動化系統(tǒng),包含并排放置的兩個機械臂,旨在為餐廳、雜貨店等企業(yè)實現(xiàn)重復(fù)性任務(wù)的自動化。如今發(fā)布的DYNA-1模型正是為這些機械臂提供智能支持的核心技術(shù)。

為實現(xiàn)經(jīng)濟效益,機器人需長時間穩(wěn)定執(zhí)行相同任務(wù)。

Dyna指出,許多搭載現(xiàn)有AI模型的機器人,在數(shù)小時運行后易出現(xiàn)錯誤,需人工干預(yù)解決,這不僅增加維護成本,還會因機器人停機導(dǎo)致產(chǎn)量下降。

Dyna宣稱,DYNA-1在長時間運行中的可靠性遠超傳統(tǒng)算法。在一項內(nèi)部測試中,搭載DYNA-1的機械臂在24小時內(nèi)折疊了超過700張餐巾,準確率高達99.4%,且無需任何人工干預(yù)。

打開網(wǎng)易新聞 查看精彩圖片

Dyna在博客中表示:“餐巾折疊涉及一系列獨特挑戰(zhàn),包括從一疊餐巾中精確抽取單張餐巾,以及在意外拉出多張餐巾時進行恢復(fù)的能力?!?/p>

DYNA-1的開發(fā)采用了行業(yè)標準的強化學(xué)習(xí)方法。在強化學(xué)習(xí)中,工程師為AI設(shè)定與實際應(yīng)用相似的訓(xùn)練任務(wù),每次任務(wù)完成后,模型會收到反饋以優(yōu)化性能,通常通過一種稱為“獎勵模型”的算法生成。

“獎勵模型”的核心在于評估AI完成任務(wù)的準確性,并據(jù)此提供反饋,進而提升模型表現(xiàn)。

為提升DYNA-1的性能,Dyna開發(fā)了一款定制化獎勵模型。相較于現(xiàn)有算法,該模型在評估AI是否準確完成訓(xùn)練任務(wù)方面表現(xiàn)更優(yōu),從而提供更高質(zhì)量的反饋,進一步增強DYNA-1的性能。

打開網(wǎng)易新聞 查看精彩圖片

▲“獎勵模型”進度估算

此外,DYNA-1展現(xiàn)了技能遷移能力。內(nèi)部測試顯示,其在餐巾折疊訓(xùn)練中獲得的技能可部分應(yīng)用于其他復(fù)雜操作任務(wù),如衣物折疊和杯子填充。

打開網(wǎng)易新聞 查看精彩圖片

▲搭載DYNA-1的機器人進行杯子填充任務(wù)

搭載DYNA-1的機器人還能在無需大量手動重新配置的情況下,適應(yīng)新環(huán)境。

在訓(xùn)練過程中,DYNA-1在定制化“獎勵模型”的指導(dǎo)下,執(zhí)行大量任務(wù),并學(xué)習(xí)不同動作的效果與結(jié)果。Dyna團隊表示:“通過長時間的運行,DYNA-1積累了豐富的動作經(jīng)驗,能夠理解每種動作可能帶來的后果。這種經(jīng)驗使DYNA-1無需為特定客戶環(huán)境進行額外的預(yù)訓(xùn)練,就能直接在實際場景中成功完成餐巾折疊任務(wù)。”

傳統(tǒng)上,由AI驅(qū)動的機器人價格昂貴,通常高達數(shù)十萬美元。Dyna計劃,以遠低于市場平均價格的策略銷售其硬件。據(jù)《財富》雜志2025年3月報道,Dyna的目標是將機器人硬件價格顯著降低到傳統(tǒng)市場價格的一個數(shù)量級以下。

此次DYNA-1的發(fā)布標志著Dyna Robotics在機器人自動化領(lǐng)域的進展,其高可靠性、低成本的解決方案有望為餐飲和零售行業(yè)帶來改變。

來源:siliconangle