作為機器人領域的頂級期刊,《International Journal of Robotics Research》(IJRR)長期以來發(fā)表著機器人技術領域的高質(zhì)量研究成果,以其嚴格的審稿標準和跨學科研究特色,成為反映機器人技術前沿趨勢的重要平臺。本期精選了三月份發(fā)表的六篇重磅研究,帶您了解四足機器人、軟體機器人、水下機器人、仿生飛行器、機器人遷移學習和位姿估計等領域的最新突破。參考文獻在文章末尾。
▍四足機器人控制的突破性范式
《Contact-implicit Model Predictive Control: Controlling diverse quadruped motions without pre-planned contact modes or trajectories》-韓國科學技術院、麻省理工學院
四足機器人在復雜環(huán)境中的運動規(guī)劃一直是機器人控制領域的重大挑戰(zhàn)。傳統(tǒng)方法通常依賴預定義的接觸模式和軌跡,這嚴重限制了機器人適應未知環(huán)境的能力,尤其是在面對非周期性、不對稱的動態(tài)任務時表現(xiàn)欠佳。
韓國科學技術院和麻省理工學院的聯(lián)合研究團隊針對這一難題,提出了一種革命性的控制方法——接觸隱式MPC(Contact-Implicit Model Predictive Control)框架。這一方法最大的突破在于,它使四足機器人能夠在沒有預定義接觸模式的情況下,自主發(fā)現(xiàn)并執(zhí)行最優(yōu)的運動策略。

傳統(tǒng)基于模型預測控制(MPC)的方法雖然能夠進行在線優(yōu)化,但通常假設固定的接觸序列,主要優(yōu)化地面反作用力或關節(jié)力矩軌跡,難以動態(tài)調(diào)整接觸模式。而接觸隱式MPC框架則采用了硬接觸模型(Hard Contact Model),結合線性互補約束(Linear Complementarity Constraint),通過優(yōu)化狀態(tài)軌跡、控制輸入和接觸力,自動探索最優(yōu)接觸模式,實現(xiàn)了真正的自適應控制。
研究的一個關鍵創(chuàng)新是引入了平滑梯度方法,有效解決了傳統(tǒng)嚴格互補約束(Strict Complementarity Constraints)優(yōu)化中容易卡在初始接觸模式的問題。團隊提出的基于放松互補約束(Relaxed Complementarity Constraints)的梯度計算方法,使優(yōu)化過程能夠平滑地過渡到新的接觸模式,大幅提升了計算穩(wěn)定性和收斂性。
另一項技術創(chuàng)新是采用多重射擊變體DDP(Multiple Shooting DDP)替代傳統(tǒng)單射擊方法。在硬接觸動力學系統(tǒng)中,單射擊方法容易因初始狀態(tài)偏差導致優(yōu)化失敗,而多重射擊DDP顯著增強了優(yōu)化穩(wěn)定性,確保接觸模式在不同初始狀態(tài)下保持一致性。

研究團隊在仿真環(huán)境和真實四足機器人平臺上進行了全面驗證。在仿真實驗中,接觸隱式MPC在前肢抬起(front-leg rearing)任務中展現(xiàn)出色表現(xiàn),機器人能夠自主發(fā)現(xiàn)最佳接觸模式,無需人為設定前肢接觸狀態(tài)。在向前小跑(forward trot)任務中,機器人在無預定義步態(tài)的情況下,自然學會了交替抬腿的步態(tài)模式,并能自動調(diào)整步態(tài)以適應不同地形。
最具說服力的是真實機器人測試結果。研究團隊使用重達45公斤的HOUND四足機器人(KAIST研發(fā))進行實驗,在40Hz的控制頻率下實現(xiàn)了接觸隱式MPC的在線優(yōu)化。在前肢抬起測試中,機器人能夠自動調(diào)整姿態(tài),使重心保持在支撐面內(nèi),采用平滑梯度優(yōu)化的成功率比傳統(tǒng)剛性優(yōu)化提高了30%。在步態(tài)發(fā)現(xiàn)測試中,機器人能夠從隨機初始步態(tài)自動調(diào)整到最優(yōu)步態(tài),包括對角步態(tài)(trot)和交替步態(tài)(pacing)。引入步態(tài)對稱性成本后,步態(tài)穩(wěn)定性提高了50%,證明了該方法在動態(tài)環(huán)境中的適應能力。
這項研究為四足機器人控制開辟了全新范式,突破了傳統(tǒng)控制方法對預定義接觸模式的依賴,實現(xiàn)了真正的自適應動態(tài)控制。未來,研究團隊計劃將該方法應用于更復雜的環(huán)境,如崎嶇地形和樓梯攀爬;優(yōu)化實時計算性能,提高控制頻率;并探索將接觸隱式優(yōu)化與深度強化學習相結合,進一步提升機器人的環(huán)境適應能力和任務執(zhí)行能力。
▍軟體機器人控制的創(chuàng)新性進展
《A Koopman-based residual modeling approach for the control of a soft robot arm》-密歇根大學、哈佛大學

軟體機器人因其柔性材料特性,在安全性和適應性方面優(yōu)于傳統(tǒng)剛性機器人,特別適合在不確定環(huán)境中操作及與人類進行物理交互。然而,這種優(yōu)勢也帶來了建模與控制的極大挑戰(zhàn)——軟體機器人的無限維變形特性使得傳統(tǒng)基于剛性體動力學的控制策略難以適用。
密歇根大學和哈佛大學的研究團隊直面這一挑戰(zhàn),提出了一種基于殘差建模(Residual Modeling)的Koopman方法。Koopman算子理論允許將非線性系統(tǒng)投影到高維線性空間,但現(xiàn)有基于數(shù)據(jù)驅(qū)動的Koopman方法需要大量實驗數(shù)據(jù),且難以泛化。該團隊的創(chuàng)新在于巧妙融合了物理建模與數(shù)據(jù)驅(qū)動方法:首先使用物理建模構建理想化的Koopman模型,然后通過數(shù)據(jù)驅(qū)動方法學習物理模型未能準確描述的動態(tài)殘差,最終形成一個更精準且計算高效的綜合模型。
這種混合方法既保留了物理模型的泛化能力,又利用數(shù)據(jù)驅(qū)動方法彌補了物理模型的不足。通過Koopman算子將非線性動力學轉(zhuǎn)換為有限維線性表示,研究者們成功實現(xiàn)了線性控制方法(如模型預測控制MPC)在軟體系統(tǒng)中的應用。
研究團隊在多個系統(tǒng)上驗證了該方法的有效性。在Van der Pol振子系統(tǒng)中,殘差Koopman模型的誤差比物理模型降低了8%,比純數(shù)據(jù)驅(qū)動模型低28%。在倒立擺推車系統(tǒng)中,殘差模型的誤差為0.33,比純數(shù)據(jù)驅(qū)動模型的0.41降低了18%。
最精彩的部分是在真實軟體機械臂上的驗證實驗。在訓練數(shù)據(jù)較少的情況下,殘差Koopman模型的誤差僅為0.07m,比物理模型的0.14m和數(shù)據(jù)驅(qū)動模型的0.21m分別降低了52%和67%。在軌跡跟蹤任務中,殘差Koopman結合MPC控制器的表現(xiàn)遠超其他方法——數(shù)據(jù)驅(qū)動MPC完全失效,物理模型MPC表現(xiàn)尚可但誤差較大,而殘差Koopman MPC的誤差最小,平均降低了2.5倍。
研究團隊還進行了功能性測試,展示了軟體機器人在抓取與放置任務中的能力。機械臂能夠?qū)⒙萁z刀、膠帶、廢紙等物品正確放入指定位置,即使遭遇障礙物仍能調(diào)整姿態(tài)完成任務。在書寫任務中,機械臂在不同位置的白板上成功書寫字母"H",展現(xiàn)了軟體機器人柔性與先進控制技術結合的強大潛力。

這項研究為軟體機器人控制開辟了新途徑,未來有望應用于在線學習實現(xiàn)實時模型優(yōu)化,并與非線性控制策略(如強化學習)結合,進一步提高軟體機器人在復雜環(huán)境中的適應能力。研究成果也可能擴展至水下軟體機器人、仿生機器人和醫(yī)療康復機器人等廣泛應用領域。
▍水下機器人自適應控制新思路
《Sim-to-real transfer of adaptive control parameters for AUV stabilisation under current disturbance》-弗林德斯大學、CNRS

自主水下機器人(AUVs)在海洋探索、目標跟蹤和管道檢測等任務中應用廣泛,但在實際海洋環(huán)境中,復雜多變的海流擾動嚴重影響其控制精度和穩(wěn)定性。傳統(tǒng)基于模型的控制方法(如PID控制)在面對非線性海流干擾時表現(xiàn)有限,難以動態(tài)適應變化的水下環(huán)境。
弗林德斯大學與CNRS的研究團隊針對這一挑戰(zhàn),提出了一種創(chuàng)新的控制方案——結合最大熵深度強化學習(Maximum Entropy DRL)與經(jīng)典模型控制的自適應控制架構。深度強化學習為AUV控制提供了新思路,能夠通過學習自主適應海流擾動,但DRL方法通常在模擬環(huán)境中訓練,直接遷移到真實環(huán)境時會遇到分布偏移(distribution shift)問題。
研究的最大創(chuàng)新在于解決了"仿真到現(xiàn)實"(Sim-to-Real Transfer)遷移的難題。團隊采用了生物啟發(fā)經(jīng)驗回放機制(BIER)和增強域隨機化(Domain Randomisation)技術。BIER使用雙記憶緩沖區(qū)存儲高質(zhì)量的狀態(tài)-動作對,提高訓練穩(wěn)定性;增強域隨機化則通過在不同海流環(huán)境中訓練,使AUV策略具備更好的泛化能力。這些方法結合起來,顯著提高了控制策略在真實環(huán)境中的適應能力。
控制架構方面,研究團隊將深度強化學習與傳統(tǒng)PID控制巧妙融合,通過自適應極點配置(Adaptive Pole-Placement)優(yōu)化PID控制器的增益參數(shù)。DRL模塊負責學習最優(yōu)的控制參數(shù)調(diào)整策略,使AUV能夠根據(jù)當前海流狀況實時優(yōu)化控制效果。
仿真訓練采用基于Gazebo的UUV模擬器,考慮真實水動力學效應,使用最大熵SAC算法(Soft Actor-Critic with Automatic Temperature Adjustment)結合自適應參數(shù)噪聲探索策略??刂撇呗越?jīng)過5000個仿真訓練回合后穩(wěn)定收斂,控制效果的均方根誤差(RMSE)相較于傳統(tǒng)PID控制降低了28%。

在真實環(huán)境測試中,研究團隊使用BlueROV 2 Heavy平臺在水池環(huán)境中進行實驗,通過水流推進器模擬不同強度和方向的海流擾動。在無海流干擾的基礎測試中,DRL自適應控制與傳統(tǒng)PID控制表現(xiàn)相當,但在變速海流環(huán)境和隨機海流擾動測試中,差距顯著擴大——最大熵DRL控制方法比傳統(tǒng)PID控制提高了3倍的控制精度!即使在極端擾動條件下,DRL控制策略仍能保持較好的控制性能,而傳統(tǒng)PID方法則表現(xiàn)出較大誤差。
這項研究不僅提供了一種水下機器人控制的新思路,也為其他受環(huán)境擾動影響的機器人系統(tǒng)提供了借鑒。未來,研究團隊計劃進一步優(yōu)化SAC算法提高控制穩(wěn)定性,將該方法擴展到更多AUV任務如自主探測、目標跟蹤和協(xié)同控制,并結合視覺或聲吶傳感器,提高AUV對環(huán)境的感知能力,實現(xiàn)更智能的海洋探索和監(jiān)測。
▍仿蝙蝠動態(tài)變形翼飛行器的創(chuàng)新設計
《A morphology-centered view towards describing bats dynamically versatile wing conformations》-加州理工學院、東北大學
蝙蝠的飛行能力一直是仿生機器人研究的圣杯之一。這些夜行哺乳動物能夠通過高度靈活的翼膜執(zhí)行令人驚嘆的空中機動,產(chǎn)生周期性空氣射流,形成脈動尾跡結構,從而實現(xiàn)卓越的敏捷性和飛行效率。然而,將這種動態(tài)翼變形能力遷移到微型飛行器(MAVs)上一直面臨巨大挑戰(zhàn)。
加州理工學院和東北大學的研究團隊針對這一困境,提出了一種革命性的設計理念——"以形態(tài)為中心"(Morphology-Centered)的飛行器設計方法。與傳統(tǒng)設計思路不同,該方法將硬件結構本身視為一種計算資源,通過拓撲優(yōu)化和執(zhí)行器分布優(yōu)化,使飛行器結構不僅承載組件,還能執(zhí)行計算任務。這一理念被稱為"計算結構"(Computational Structures),它巧妙地減少了對高功率執(zhí)行器和傳感器的依賴。

研究團隊基于這一理念開發(fā)了名為"Aerobat"的原型機,其核心設計目標包括兩個方面:使用有限的高功率執(zhí)行器生成基礎飛行動作模式(Gait Generation),同時利用低功率執(zhí)行器進行微調(diào)(Gait Regulation)。這種多層級控制架構使得Aerobat能夠在結構層面實現(xiàn)類似蝙蝠的動態(tài)翼變形。
研究者們還提出了一種約束動力學模型(Constrained Dynamics),在有限執(zhí)行器條件下實現(xiàn)翼展調(diào)節(jié),極大提高了飛行穩(wěn)定性。最令人印象深刻的是,團隊開發(fā)了基于翼表面積最大化和翼升時間最小化的氣動力增強機制:通過優(yōu)化下?lián)]拍(downstroke)階段的翼表面積,最大化升力輸出;通過減少上揮拍(upstroke)時間,最小化負升力對飛行效率的影響。
在模擬實驗中,研究團隊采用非穩(wěn)態(tài)升力線理論(Unsteady Lifting Line Theory)和瓦格納函數(shù)(Wagner Function)構建了高精度的空氣動力學模型,系統(tǒng)性地優(yōu)化了翼形結構參數(shù),包括翼展、翼弦長和掃掠角,在提升升力和降低阻力之間找到了最佳平衡點。
真實環(huán)境測試表明,Aerobat在無繩狀態(tài)下(Untethered)成功實現(xiàn)了穩(wěn)定懸停,即使在狹小空間內(nèi)也能保持精確的位置控制。飛行模式驗證實驗展示了Aerobat利用少量高功率執(zhí)行器生成基礎飛行動作,并通過多個低功率執(zhí)行器實現(xiàn)精細調(diào)節(jié)的能力。空氣動力學增強實驗則驗證了優(yōu)化翼形在下?lián)]拍階段提升氣動力輸出,在上揮拍階段減少阻力的預期效果。

這項研究不僅推進了仿生飛行領域的技術邊界,更為未來微型飛行器設計提供了全新思路。"計算結構"的概念打破了傳統(tǒng)飛行器設計中結構與控制分離的思維定式,開創(chuàng)了一種硬件層面的智能控制范式。未來,研究團隊計劃進一步優(yōu)化控制策略,提高復雜環(huán)境適應能力,探索多飛行器協(xié)同飛行模式,并將這種設計理念拓展至其他仿生飛行器,如鳥類啟發(fā)的可變翼MAV。
▍機器人遷移學習的全面分析與展望
《Transfer learning in robotics: An upcoming breakthrough? A review of promises and challenges》-卡爾斯魯厄理工學院等多機構合作研究

人類能夠輕松將認知和運動技能遷移到新環(huán)境和任務中,而機器人系統(tǒng)的遷移能力卻相對薄弱,這嚴重限制了其在真實世界中的應用范圍。遷移學習(Transfer Learning, TL)作為解決這一問題的關鍵技術,近年來在機器人領域引起了廣泛關注。
來自卡爾斯魯厄理工學院、瑞典皇家理工學院、約瑟夫·斯特凡研究所、洛桑聯(lián)邦理工學院和盧布爾雅那大學的研究團隊合作完成了這項全面綜述研究,首次為機器人遷移學習領域建立了統(tǒng)一的定義和分類框架。研究團隊以機器人(Robot)、任務(Task)和環(huán)境(Environment)作為三大關鍵維度,提出了五種基本遷移模式:
1.機器人遷移(Robot Transfer):將同一任務在不同機器人之間遷移,如將抓取技能從一個機械臂遷移到另一個不同結構的機械臂。
2.環(huán)境遷移(Environment Transfer):將同一任務在不同環(huán)境中遷移,最典型的例子是從模擬環(huán)境遷移到現(xiàn)實世界(Sim-to-Real)。
3.任務遷移(Task Transfer):同一機器人在不同任務之間遷移技能,如將抓取技能遷移到組裝任務。
4.雙模式遷移(Dual-Mode Transfer):同時跨越兩個維度,如機器人和任務或任務和環(huán)境同時變化。
5.三模式遷移(Triple-Mode Transfer):最復雜的情況,機器人、任務和環(huán)境三者都不同的情況下進行遷移。

研究團隊通過分析近年ICRA和IROS會議上的論文發(fā)現(xiàn),遷移學習相關研究呈現(xiàn)爆發(fā)式增長趨勢。其中,模仿學習和行為克隆研究最早興起并已廣泛應用;Sim-to-Real遷移和域適應近年來獲得更多關注;而任務遷移仍是研究的薄弱環(huán)節(jié),表明跨任務泛化仍是一個待解決的重大挑戰(zhàn)。
論文詳細分析了當前機器人遷移學習的成功案例。在Sim-to-Real遷移中,域隨機化(Domain Randomization)方法使機器人在模擬環(huán)境中的訓練成果能夠泛化到現(xiàn)實世界,例如四足機器人控制和機械臂抓取任務中取得了顯著成功。在任務遷移方面,研究表明機器人可以在投擲任務和抓取任務之間部分共享策略,但仍需要任務調(diào)整機制來適應新任務的特殊要求??鐧C器人遷移則展示了人形機器人和機械臂可以通過運動重定向(Motion Retargeting)共享操作策略,盡管形態(tài)差異帶來了運動學約束上的挑戰(zhàn)。
研究團隊特別強調(diào)了負遷移(Negative Transfer)的風險。當兩個任務、環(huán)境或機器人之間的相似性不足時,遷移可能會降低而非提高性能。例如,將雙臂機器人操作策略直接應用于單臂機器人時,可能導致執(zhí)行失敗。為應對這一挑戰(zhàn),團隊提出了量化遷移質(zhì)量和遷移誤差的標準體系。
未來研究方向方面,論文指出了三個關鍵挑戰(zhàn):建立跨抽象層級的通用表示方法,從低級控制(如關節(jié)角度)到高級任務(如自然語言指令);開發(fā)通用的遷移評估標準,包括遷移誤差度量和遷移成功率;探索大規(guī)模預訓練模型在機器人遷移學習中的應用潛力,如基于Transformer的機器人控制模型。
這篇綜述性研究不僅梳理了機器人遷移學習的研究現(xiàn)狀,更為該領域的未來發(fā)展提供了清晰路線圖,展現(xiàn)了未來機器人系統(tǒng)可能實現(xiàn)的靈活學習和適應能力。
▍旋轉(zhuǎn)與位姿估計的突破性算法
《Certifiably optimal rotation and pose estimation based on the Cayley map》-多倫多大學
在機器人導航、計算機視覺和傳感融合領域,準確估計物體旋轉(zhuǎn)和位姿一直是個核心挑戰(zhàn)。傳統(tǒng)方法往往陷入局部最優(yōu)解,在噪聲數(shù)據(jù)面前顯得脆弱不堪。多倫多大學的研究團隊針對這一問題,帶來了一場算法突破。
研究者們注意到,現(xiàn)有凸松弛方法大多基于矩陣von Mises-Fisher分布,假設旋轉(zhuǎn)誤差是各向同性的,這種假設在許多應用場景下并不成立。為突破這一限制,團隊提出了基于Cayley映射的全局優(yōu)化框架,這一方法巧妙地將非凸的旋轉(zhuǎn)估計問題轉(zhuǎn)化為二次約束二次規(guī)劃(QCQP),再松弛為半定規(guī)劃(SDP),從而實現(xiàn)全局最優(yōu)求解。
Cayley映射相比傳統(tǒng)使用的指數(shù)映射有何優(yōu)勢?研究表明,Cayley Map具有更簡單的代數(shù)結構,在計算上比指數(shù)映射更高效,并且在小角度誤差情況下表現(xiàn)與指數(shù)映射相近。這種數(shù)學技巧使得優(yōu)化問題更易于轉(zhuǎn)換并求解,同時保持了幾何意義的完整性。
最令人印象深刻的是該方法的廣泛適用性,包括:旋轉(zhuǎn)平均(多個旋轉(zhuǎn)測量的最優(yōu)合成)、位姿平均(多個位姿測量的最優(yōu)合成)、離散時間軌跡估計(基于多個測量點重建剛體軌跡)和連續(xù)時間軌跡估計(結合高斯過程進行軌跡平滑)。研究團隊還通過引入冗余約束提高了SDP松弛的緊致性,確保解的全局最優(yōu)性。

實驗結果表明,在旋轉(zhuǎn)平均任務中,SDP方法在98%的情況下找到全局最優(yōu)解,而傳統(tǒng)局部方法在高噪聲環(huán)境下頻繁陷入局部最優(yōu)。在位姿平均實驗中,SDP求解的最優(yōu)解誤差比局部方法降低了40%以上。對于離散時間軌跡估計,局部方法在45%的情況下陷入局部最優(yōu),而SDP方法在100%試驗中找到全局最優(yōu)解。
計算成本是這種方法的挑戰(zhàn)——SDP在10個旋轉(zhuǎn)變量時的求解時間為0.35秒,而局部方法約為0.0012秒。在軌跡估計任務中,SDP約需14.32秒,遠高于局部方法的0.1574秒。但在精度至關重要的應用中,這種"確保全局最優(yōu)"的特性彌足珍貴。
未來,該團隊計劃進一步優(yōu)化SDP計算效率,使其適用于更大規(guī)模的位姿估計問題,并探索在實時SLAM系統(tǒng)中的應用,實現(xiàn)高精度、全局最優(yōu)的地圖構建。結合深度學習或強化學習優(yōu)化Cayley映射模型,提升旋轉(zhuǎn)和位姿估計的適應性,也是一個充滿潛力的方向。
▍結語
IJRR三月份的這六篇重磅論文充分展示了機器人技術在多個前沿領域的最新突破。從全局最優(yōu)的位姿估計到軟體機器人的混合建模,從水下機器人的自適應控制到仿生飛行器的形態(tài)優(yōu)化,從機器人遷移學習的系統(tǒng)框架到四足機器人的接觸隱式控制,這些研究不僅推動了理論創(chuàng)新,更為實際應用提供了可靠解決方案。
這些技術的共同特點是跨學科融合和技術創(chuàng)新,包括將先進數(shù)學理論應用于工程實踐、結合物理模型與數(shù)據(jù)驅(qū)動方法、引入生物啟發(fā)機制、建立系統(tǒng)化的知識遷移框架、以及開發(fā)不依賴預定義規(guī)則的自適應控制策略。這些創(chuàng)新共同推動著機器人技術向更加智能、靈活和自適應的方向發(fā)展。
如果您對這些研究感興趣,歡迎深入閱讀原論文(下方為相關信息),探索機器人技術的更多可能!
[1] Kim, Gijeong, et al. "Contact-implicit Model Predictive Control: Controlling diverse quadruped motions without pre-planned contact modes or trajectories." The International Journal of Robotics Research (2024): 02783649241273645
[2] Bruder, Daniel, David Bombara, and Robert J. Wood. "A Koopman-based residual modeling approach for the control of a soft robot arm." The International Journal of Robotics Research (2024): 02783649241272114.
[3] Chaffre, Thomas, et al. "Sim-to-real transfer of adaptive control parameters for AUV stabilisation under current disturbance." The International Journal of Robotics Research (2024): 02783649241272115.
[4] Sihite, Eric, and Alireza Ramezani. "A morphology-centered view towards describing bats dynamically versatile wing conformations." The International Journal of Robotics Research (2024): 02783649241272132.
[5] Jaquier, Noémie, et al. "Transfer learning in robotics: An upcoming breakthrough? A review of promises and challenges." The International Journal of Robotics Research (2023): 02783649241273565.
[6] Barfoot, Timothy D., Connor Holmes, and Frederike Dümbgen. "Certifiably optimal rotation and pose estimation based on the Cayley map." The International Journal of Robotics Research (2024): 02783649241269337.
熱門跟貼