人工智能的蓬勃發(fā)展,離不開數(shù)據(jù)這一核心支柱。

近年來,隨著人工智能技術的廣泛應用,以數(shù)據(jù)為核心的系統(tǒng)表征方法迅速滲透到控制領域,控制系統(tǒng)的設計方法正迎來一場從模型驅(qū)動向數(shù)據(jù)驅(qū)動的范式變革,即從傳統(tǒng)的模型驅(qū)動控制(modelic control,即model-driven control)到數(shù)據(jù)驅(qū)動控制(datatic control,即data-driven control)。

對于控制系統(tǒng)而言,系統(tǒng)的穩(wěn)定性、可控性及標準型是控制理論的基本問題。數(shù)據(jù)驅(qū)動控制不依賴于被控對象的數(shù)學模型,而是直接通過輸入/輸出(I/O,Input /Output)數(shù)據(jù)與控制器連接,并根據(jù) I/O 數(shù)據(jù)對系統(tǒng)狀態(tài)進行調(diào)整。

其優(yōu)點是控制器的設計不依賴于復雜的系統(tǒng)模型,但卻無法保證控制系統(tǒng)的穩(wěn)定性和魯棒性。因此,需要構建基于數(shù)據(jù)的控制性能定義和分析方法,以進一步完善數(shù)據(jù)驅(qū)動控制的理論框架。

近年,清華大學李升波教授課題組在數(shù)據(jù)驅(qū)動控制系統(tǒng)(datatic control system)的特性分析方面,取得了一系列原創(chuàng)性理論成果 [1-3]。

該研究團隊借鑒傳統(tǒng)控制理論的基礎理論,提出了一套全新的數(shù)據(jù)驅(qū)動分析框架,包括系統(tǒng)數(shù)據(jù)描述方式的特點與制約、用于穩(wěn)定性檢驗的 η-檢驗算法、從“精確可控性”到“微域可控性”概念拓展,用于可控性檢驗的 MECS 算法,以及用于訓練算法性能提升的數(shù)據(jù)描述標準型等。

圖丨李升波教授(來源:課題組)?
打開網(wǎng)易新聞 查看精彩圖片
圖丨李升波教授(來源:課題組)?

具體來說:

  • 系統(tǒng)穩(wěn)定性方面,提出了首個適用于數(shù)據(jù)驅(qū)動控制系統(tǒng)的穩(wěn)定性判定算法 η-檢驗,解決了數(shù)據(jù)描述方式空間不連續(xù)造成的穩(wěn)定性判定難題:利用系統(tǒng)動力學的利普希茨連續(xù)性(Lipschitz continuity),將離散數(shù)據(jù)點上的狀態(tài)轉(zhuǎn)移信息延拓到未知的連續(xù)空間,并據(jù)此計算出李雅普諾夫(Lyapunov)函數(shù)的導數(shù)上界,從而判定系統(tǒng)的李雅普諾夫穩(wěn)定性。
  • 數(shù)據(jù)標準型方面,提出了一種基于數(shù)據(jù)的系統(tǒng)描述新形式,每個標準形式的樣本由轉(zhuǎn)移和屬性組成,分別用于描述系統(tǒng)變化規(guī)律和人為定義特征。適當增加的屬性組分,不僅便于提升系統(tǒng)描述的準確性,還能提升最優(yōu)控制策略的訓練效率,為數(shù)據(jù)驅(qū)動控制算法的高效實現(xiàn)提供新的思路。
  • 系統(tǒng)可控性方面,提出了用于數(shù)據(jù)驅(qū)動控制系統(tǒng)的“微域可控性”概念,將傳統(tǒng)的點對點可控性拓展到點對區(qū)域的形式,進而將狀態(tài)轉(zhuǎn)移信息從離散數(shù)據(jù)點延拓到數(shù)據(jù)點之間的連續(xù)空間中。基于這一原理,該研究團隊提出了首個數(shù)據(jù)驅(qū)動控制系統(tǒng)的可控性檢驗算法 MECS(maximum expansion of controllable subset),通過樹搜索迭代尋找系統(tǒng)的微域可控狀態(tài)。

這三項研究成果既具有聯(lián)系又互為補充,通過重新定義數(shù)據(jù)驅(qū)動系統(tǒng)的穩(wěn)定性、標準及可控性,為分析該類系統(tǒng)的特性提供了核心算法和實用工具,這對數(shù)據(jù)驅(qū)動控制器的綜合設計具有重要的指導意義。

打開網(wǎng)易新聞 查看精彩圖片

人工智能如何賦能自動控制?

自動控制技術的發(fā)展,與社會的進步息息相關。

第一次工業(yè)革命通過普及機械化技術,為后來的自動化奠定了基礎。第二次工業(yè)革命通過電氣化和通信技術,初步實現(xiàn)了模擬自動化。

在第三次工業(yè)革命中,借助于計算機與半導體技術,通過數(shù)字信號實現(xiàn)自動化的技術趨于成熟。進入第四次工業(yè)革命后,以人工智能為核心技術,融合大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)等技術,實現(xiàn)了從感知到?jīng)Q策的智能飛躍。

自動控制領域的理論發(fā)展歷史悠久,在傳統(tǒng)的模型驅(qū)動控制范式下,已形成了一套全面且普適的基礎理論。

然而,在人工智能時代,自動控制系統(tǒng)的設計范式已發(fā)生變革,從使用傳遞函數(shù)、狀態(tài)空間為基礎的控制器設計與優(yōu)化,過渡到使用數(shù)據(jù)訓練和優(yōu)化以參數(shù)化函數(shù)為基礎的控制器。

李升波指出,“以自動駕駛領域為例,由于車輛模型非線性,車輛之間交互隨機,車輛行駛場景復雜,很難使用一個特定的動力學模型對其進行精確描述。因此,自動駕駛的感知、決策和規(guī)劃在數(shù)據(jù)驅(qū)動范式下進行研究會有更好的效果。”

正是由于傳統(tǒng)的模型驅(qū)動方法依賴于建模的精確性,導致復雜系統(tǒng)的建模變得困難,因此直接利用系統(tǒng)生成的數(shù)據(jù)來設計控制器,成為人工智能范式下自動控制領域研究的關鍵方向。

圖丨模型驅(qū)動范式控制與數(shù)據(jù)驅(qū)動范式控制(來源:課題組)
打開網(wǎng)易新聞 查看精彩圖片
圖丨模型驅(qū)動范式控制與數(shù)據(jù)驅(qū)動范式控制(來源:課題組)

由于模型驅(qū)動范式與數(shù)據(jù)驅(qū)動范式之間存在顯著的差別,因此到目前為止,數(shù)據(jù)驅(qū)動范式下的控制理論體系尚未完全建立,且無法直接用模型驅(qū)動的理論進行遷移。

首先,模型驅(qū)動范式理論使用模型來描述,在復雜系統(tǒng)下存在建模誤差,而數(shù)據(jù)驅(qū)動范式則通過離散的狀態(tài)轉(zhuǎn)移數(shù)據(jù)點對系統(tǒng)進行精確描述,但數(shù)據(jù)點之間存在著間隙,這導致數(shù)據(jù)點之間的系統(tǒng)信息無法直接得到。

其次,在理論層面,傳統(tǒng)模型驅(qū)動范式下的控制算法設計以矩陣分析為基礎,而數(shù)據(jù)驅(qū)動范式下的算法以迭代優(yōu)化理論為基礎。

除此之外,二者的控制策略承載體也存在差距,前者依賴于顯式的控制方程 (如黎卡提方程),而后者依賴于參數(shù)化的神經(jīng)網(wǎng)絡。

綜上所述,傳統(tǒng)模型驅(qū)動范式下的基礎理論在數(shù)據(jù)驅(qū)動范式下并不適用。因此,如何在數(shù)據(jù)驅(qū)動范式下建立系統(tǒng)的標準型、穩(wěn)定性判定和可控性判定等基礎理論,成為數(shù)據(jù)驅(qū)動范式下首先需要回答的問題。

(來源:課題組)
打開網(wǎng)易新聞 查看精彩圖片
(來源:課題組)
打開網(wǎng)易新聞 查看精彩圖片

穩(wěn)定性:系統(tǒng)描述從離散數(shù)據(jù)點到連續(xù)空間的延拓

系統(tǒng)的穩(wěn)定性是控制器設計的首要考量因素,穩(wěn)定性判定理論是閉環(huán)控制的基石。

在模型驅(qū)動的控制系統(tǒng)中,穩(wěn)定性判定理論已較為成熟。早期的理論包括勞斯-赫爾維茨(Routh-Hurwitz)判據(jù)和奈奎斯特(Nyquist)判據(jù),它們是經(jīng)典控制理論的重要基礎。

此后,由俄國數(shù)學家亞歷山大·米哈伊洛維奇·李雅普諾夫(Aleksandr Mikhailovich Lyapunov)提出的李雅普諾夫穩(wěn)定性及其判定理論是應用最為廣泛的穩(wěn)定性理論,這也為現(xiàn)代控制理論的崛起奠定了基礎。

模型驅(qū)動的穩(wěn)定性判定理論依賴已知的系統(tǒng)動力學模型。例如,判定李雅普諾夫穩(wěn)定性需要利用動力學模型計算連續(xù)空間中,李雅普諾夫函數(shù)對時間的導數(shù)。

然而,在數(shù)據(jù)驅(qū)動的控制系統(tǒng)中,數(shù)據(jù)點只能提供空間上離散的系統(tǒng)描述,因此數(shù)據(jù)點之間的描述缺失導致模型驅(qū)動的穩(wěn)定性判定理論不適用于數(shù)據(jù)驅(qū)動的系統(tǒng)。

為解決該問題,研究人員提出首個適用于數(shù)據(jù)驅(qū)動控制系統(tǒng)的穩(wěn)定性判定算法 η-檢驗。

這一算法的基本原理是利用系統(tǒng)動力學的利普希茨連續(xù)性,將數(shù)據(jù)點上的狀態(tài)轉(zhuǎn)移信息延拓到未知區(qū)域,并據(jù)此計算出李雅普諾夫函數(shù)的導數(shù)上界,從而判定系統(tǒng)的李雅普諾夫穩(wěn)定性。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

實驗表明,η-檢驗算法能夠準確判定數(shù)據(jù)驅(qū)動控制系統(tǒng)的穩(wěn)定性、不穩(wěn)定性和臨界穩(wěn)定性。該研究為數(shù)據(jù)驅(qū)動系統(tǒng)的穩(wěn)定性判定提供了有效方法。

該工作的第一作者、清華大學博士生楊雨杰表示:“如果有了數(shù)據(jù)驅(qū)動的系統(tǒng)穩(wěn)定性判定算法,就可以僅依賴數(shù)據(jù),在將控制器應用于實際系統(tǒng)之前,事先判斷出其穩(wěn)定性。這對數(shù)據(jù)驅(qū)動控制算法的設計具有重要的指導意義?!?/p>

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

日前,相關論文以《關于數(shù)據(jù)驅(qū)動控制系統(tǒng)的穩(wěn)定性》(On the Stability of Datatic Control Systems)為題發(fā)表在預印本網(wǎng)站arXiv上 [1]。

圖丨相關論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
圖丨相關論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片

標準型:數(shù)據(jù)驅(qū)動算法效率的新方向

標準型是數(shù)據(jù)描述方式的一個新問題,對后續(xù)算法的效率具有重要影響。

以強化學習為例,訓練算法往往涉及大量的迭代計算,如果沒有關注數(shù)據(jù)樣本的內(nèi)在特性(例如因果性、局部性等),往往導致每步訓練迭代都會重復計算一些所需信息(例如各樣本之間的范數(shù)距離等),增加了不必要的計算負擔。

該研究工作的第一作者、清華大學博士生占國建解釋說:“因果性是指狀態(tài)轉(zhuǎn)移與控制動作的動態(tài)依賴性,每一步的動作都影響了下一步的狀態(tài),而下一步的狀態(tài)又決定了未來的狀態(tài),這種因果關系鏈貫穿于整個狀態(tài)轉(zhuǎn)移和控制動作的序列。局部性是指每步的控制動作至多依賴于有限的歷史交互信息,這允許了在線采樣過程高效計算與存儲訓練所需的信息?!?/p>

利用數(shù)據(jù)樣本的這兩個內(nèi)在特性,研究人員為數(shù)據(jù)驅(qū)動控制系統(tǒng)提出了“數(shù)據(jù)標準型”的全新概念。

每個數(shù)據(jù)樣本由轉(zhuǎn)移和屬性兩個部分組成,其中轉(zhuǎn)移用于描述系統(tǒng)的變化規(guī)律,屬性用于描述人為定義的特征。適當增加的屬性組分不僅可以輔助系統(tǒng)描述,還能為控制器的訓練提供便利并提高效率。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

實驗表明,采用標準形式的數(shù)據(jù)可以將控制器的訓練時間從 21 小時縮短至 7 小時,效率提高近 3 倍,同時顯著減少了訓練中的不穩(wěn)定現(xiàn)象。

李升波表示:“研究提出的數(shù)據(jù)標準型用少量的存儲空間換取了顯著的時間優(yōu)勢,填補了基于數(shù)據(jù)的系統(tǒng)描述標準形式的空缺,為提高數(shù)據(jù)驅(qū)動算法效率提供了新的方向?!?/strong>

前不久,相關論文以《控制系統(tǒng)的數(shù)據(jù)描述標準型》(Canonical Form of Datatic Description in Control Systems)為題發(fā)表在預印本網(wǎng)站arXiv上 [2]。

圖丨相關論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
圖丨相關論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片

可控性:將定義從“點對點”擴展為“點對區(qū)域”

可控性是控制系統(tǒng)的一項基本屬性,判斷一個系統(tǒng)是否具有可控制性是控制理論研究的核心問題之一。在模型驅(qū)動的系統(tǒng)中,已有廣泛的研究關注可控性判定理論。

該研究工作的作者之一、清華大學博士生陶樂天表示,盡管模型驅(qū)動的控制系統(tǒng)在可控性檢驗的理論方面已經(jīng)趨近成熟,但由于數(shù)據(jù)驅(qū)動的控制系統(tǒng)只能依賴于離散的數(shù)據(jù)點,這限制了對系統(tǒng)行為的完整描述。因此,傳統(tǒng)基于模型的可控性檢驗方法對于數(shù)據(jù)驅(qū)動的控制系統(tǒng)來說并不適用。

為解決上述問題,研究人員第一次提出“微域可控性”概念和其檢驗方法,用于解決數(shù)據(jù)驅(qū)動控制系統(tǒng)空間描述不完整的可控性檢驗難題。

傳統(tǒng)的可控性是指系統(tǒng)狀態(tài)能在有限時間內(nèi)從任何初始點精確地轉(zhuǎn)移到目標狀態(tài),又稱精確可控性。

與之不同,微域可控性將精確的點對點可控性延伸至點對區(qū)域的形式,關注系統(tǒng)狀態(tài)是否能夠轉(zhuǎn)移到目標狀態(tài)附近的一個小鄰域內(nèi)。這一概念將狀態(tài)轉(zhuǎn)移信息從離散的數(shù)據(jù)點,擴展到數(shù)據(jù)點之間的連續(xù)空間中。

圖丨微域可控性與精確可控性的區(qū)別(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
圖丨微域可控性與精確可控性的區(qū)別(來源:arXiv)

基于微域可控性的定義,研究人員提出了首個適用于一般非線性數(shù)據(jù)驅(qū)動控制系統(tǒng)的可控性檢驗算法——MECS。該算法通過對可控狀態(tài)樹進行搜索,迭代進行選擇、擴展、評估、修剪四個步驟,從而尋找最大可控集。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

實驗結果表明,MECS 算法僅通過數(shù)據(jù)就能判定數(shù)據(jù)集中的微域可控狀態(tài),進而檢驗系統(tǒng)的可控性。

“有了微域可控性的概念,我們就可以純粹靠數(shù)據(jù)來檢驗一個系統(tǒng)對象是否具有可控性,而在此之前這是無法實現(xiàn)的。之前的方法需要先建立一個顯式的系統(tǒng)動力學模型,然后再依據(jù)該模型來檢驗系統(tǒng)的可控性。很明顯,如果模型不準確,系統(tǒng)的可控性檢驗也是不準確的?!痹摴ぷ鞯墓餐芯空?、清華大學博士生楊雨杰說。

近日,相關論文以《非線性數(shù)據(jù)驅(qū)動控制系統(tǒng)的可控性檢驗》(Controllability Test for Nonlinear Datatic Systems)為題發(fā)表在預印本網(wǎng)站arXiv上 [3]。

圖丨相關論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
圖丨相關論文(來源:arXiv)

穩(wěn)定性、標準型和可控性是控制系統(tǒng)研究的基石,在數(shù)據(jù)驅(qū)動的系統(tǒng)描述范式下,這些概念得到了進一步的完善和發(fā)展。

李升波及其課題組的研究生們通過深入研究這三個核心問題的本質(zhì)屬性,構建了一套全新的數(shù)據(jù)驅(qū)動分析框架,為未來“人工智能+自動控制”領域的交叉研究奠定了重要基礎。

打開網(wǎng)易新聞 查看精彩圖片

端到端自動駕駛:數(shù)據(jù)驅(qū)動控制范式的典型應用

自動駕駛技術是人工智能領域的一大突破,具有提升日常出行安全性、效率性和便捷性的巨大潛力。

然而,傳統(tǒng)方法往往依賴于精確模型和人工規(guī)則,難以利用數(shù)據(jù)實現(xiàn)性能提升,在面對未知或復雜交通場景時智能性受到限制,通常只能實現(xiàn) L1 或 L2 級輔助駕駛功能。

相比之下,端到端自動駕駛系統(tǒng)通過全模塊神經(jīng)網(wǎng)絡化,直接利用高維特征向量,實現(xiàn)原始感知數(shù)據(jù)到車輛控制指令的信息傳遞。

這不僅顯著減少了從傳感器到執(zhí)行器的信息損失,而且還給系統(tǒng)賦予了數(shù)據(jù)驅(qū)動的閉環(huán)迭代能力,為實現(xiàn)更高級別自動駕駛開辟了新路徑。

實現(xiàn)安全高效端到端自動駕駛系統(tǒng)的一個核心挑戰(zhàn)是:如何對該類數(shù)據(jù)驅(qū)動的系統(tǒng)進行標準形式的描述,并在確保系統(tǒng)穩(wěn)定性和可控性的前提下實現(xiàn)性能的持續(xù)提升。

此前,該領域研究尚未得到充分探索。李升波課題組構建的數(shù)據(jù)驅(qū)動分析框架成功填補了這一空白,為端到端自動駕駛技術提供了核心理論支持。

通過深入研究和應用這一理論框架,該團隊成功開發(fā)了國內(nèi)首套端到端自動駕駛系統(tǒng) iDrive,涵蓋了“感知-預測-決控”的全鏈路環(huán)節(jié),并率先完成了中國城市工況的開放道路驗證。

該系統(tǒng)由三個數(shù)據(jù)訓練完成的基座模型組成:感知基座模型、預測基座模型和決控基座模型,是一個典型的“三段式”端到端自動駕駛系統(tǒng)。

(來源:課題組)
打開網(wǎng)易新聞 查看精彩圖片
(來源:課題組)

“我們秉持螞蟻搬家的精神,從理論、算法、工具鏈到應用驗證,逐一構建了端到端自動駕駛系統(tǒng)研發(fā)的完備體系?!边@一研究工作的參與者、清華大學博士生呂堯如是說。

他指出,為支撐系統(tǒng)開發(fā),課題組還提出了綜合性能排名國際第一的強化學習算法(DSAC,Distributional Soft Actor-Critic),構建了時空分離的交通參與者行為預測模型(SEPT,Scene Encoding Predictive Transformer),研發(fā)了具備自主知識產(chǎn)權的最優(yōu)策略強化學習求解器(GOPS,General Optimal control Problem Solver)和大規(guī)模自動駕駛訓練軟件(LasVSim,Large Scale autonomous Vehicle Simulator)。

參考資料:

1. Yujie Yang, Zhilong Zheng, Shengbo Eben Li. On the stability of datatic control systems.arXiv:2401.16793, 2024.

2.Guojian Zhan, Ziang Zheng, Shengbo Eben Li. Canonical Form of Datatic Description in Control Systems.arXiv:2403.01768, 2024.

3.Yujie Yang, Letian Tao, Likun Wang, Shengbo Eben Li. Controllability Test for Nonlinear Datatic Systems.arXiv:2405.09317,2024.

4. Hyungjin Choi, Umesh Vaidya, Yongxin Chen.A Convex Data-Driven Approach for Nonlinear Control Synthesis.Mathematics2021, 9(19), 2445.

5. Derong Liu, Pengfei Yan,Qinglai Wei. Data-Based Controllability and Observability Analysis of Linear Discrete-Time Systems.Information Sciences288, 20, 2014, 314-329.

6. Henk J. van Waarde, Jaap Eising, Harry L. Trentelman, M. Kanat Camlibel. Data informativity: a new perspective on data-driven analysis and control.arXiv:1908.00468, 2019.

7.https://www.tsinghua.edu.cn/info/1175/110869.htm

運營/排版:何晨龍