在人類科學(xué)史上,不同科學(xué)家對同一現(xiàn)象常常提出不同的理論解釋。牛頓和萊布尼茨各自獨立發(fā)明了微積分,愛因斯坦和玻爾關(guān)于量子力學(xué)的解釋存在分歧。而如今,人工智能也日益成為科學(xué)研究的重要工具,它們不僅能協(xié)助科學(xué)家進行研究,甚至也能自行學(xué)習(xí)新的知識。那么,當兩個 AI 模型面對相同的科學(xué)任務(wù)時,它們是否會得出相同的理解,形成同一種理論呢?
來自美國麻省理工學(xué)院物理系和人工智能與基礎(chǔ)交互研究所(Institute of Artificial Intelligence and Fundamental Interactions)團隊的一項研究,給這個問題作出了回答。
相關(guān)論文以《兩個 AI 科學(xué)家會達成一致嗎?》(Do Two AI Scientists Agree?)為題發(fā)表在預(yù)印本平臺arXiv上。


MASS:模擬 AI 科學(xué)家的學(xué)習(xí)之路
為了探索 AI 如何學(xué)習(xí)物理理論,研究人員開發(fā)了一種稱為 MASS(多物理 AI 標量科學(xué)家,Multiple AI Scalar Scientists)的新型神經(jīng)網(wǎng)絡(luò)架構(gòu)。
MASS 框架的設(shè)計靈感來源于物理學(xué)中的一個基本原理——最小作用量原理。這個原理表明,物理系統(tǒng)的演化路徑總是使其某個稱為“作用量”的標量函數(shù)取最小值,這個標量函數(shù)通常與系統(tǒng)的拉格朗日量(Lagrangian)或哈密頓量(Hamiltonian)相關(guān)。許多基礎(chǔ)物理理論都可以從這樣一個標量函數(shù)出發(fā),通過特定的數(shù)學(xué)運算(如求導(dǎo))推導(dǎo)出系統(tǒng)的運動方程。

傳統(tǒng)的物理學(xué)神經(jīng)網(wǎng)絡(luò),如哈密頓神經(jīng)網(wǎng)絡(luò)(HNN, Hamiltonian Neural Network)或拉格朗日神經(jīng)網(wǎng)絡(luò)(LNN, Lagrangian Neural Network),通常將特定的運動方程(如哈密頓方程或歐拉-拉格朗日方程)硬編碼到網(wǎng)絡(luò)結(jié)構(gòu)中,然后讓網(wǎng)絡(luò)專注于學(xué)習(xí)標量函數(shù)本身。但 MASS 框架采取了更為靈活和通用的策略。它不僅為每個待研究的物理系統(tǒng)學(xué)習(xí)一個獨立的標量函數(shù),我們稱之為 S,這代表了對該系統(tǒng)內(nèi)在規(guī)律的初步假設(shè)。
更關(guān)鍵的是,MASS 還擁有一個跨所有系統(tǒng)共享的“理論評估層”。這個共享層是整個架構(gòu)的核心,它負責(zé)學(xué)習(xí)如何從標量函數(shù) S 及其對系統(tǒng)坐標(如位置、速度或動量)的各階導(dǎo)數(shù)中,推導(dǎo)出系統(tǒng)的運動方程。
這種設(shè)計賦予了 MASS 學(xué)習(xí)“元理論”的能力,即學(xué)習(xí)推導(dǎo)物理定律本身規(guī)則的能力,而不是僅僅學(xué)習(xí)某個特定定律的具體形式。整個工作流程模擬了人類科學(xué)家的研究過程。首先,MASS 接收來自不同物理系統(tǒng)的觀測數(shù)據(jù),例如物體的運動軌跡或狀態(tài)演化,這相當于數(shù)據(jù)輸入階段。
接著,對每個系統(tǒng),MASS 內(nèi)部的一個獨立子網(wǎng)絡(luò)學(xué)習(xí)其特定的標量函數(shù) S,這可以看作是假設(shè)形成的過程。隨后,共享的最終層介入進行理論評估,它對學(xué)習(xí)到的各個標量函數(shù) S 進行求導(dǎo)等一系列數(shù)學(xué)運算,并結(jié)合可學(xué)習(xí)的權(quán)重,推斷出描述系統(tǒng)行為的統(tǒng)一控制方程。這一步驟強制要求 AI 用一套融貫的“理論框架”來解釋所有觀察到的系統(tǒng)。
最后是改進與泛化階段,模型將其推斷出的運動或狀態(tài)變化與真實的觀測數(shù)據(jù)進行比較,計算誤差,并通過反向傳播算法調(diào)整網(wǎng)絡(luò)的所有參數(shù)(包括學(xué)習(xí)標量函數(shù)的子網(wǎng)絡(luò)和學(xué)習(xí)理論規(guī)則的共享層)。這個過程不斷迭代,目標是優(yōu)化出一個單一的理論體系,使其能同時且準確地描述多個不同的物理系統(tǒng)。
通過訓(xùn)練多個具有不同隨機初始化的 MASS 模型,研究人員得以模擬不同的 AI 科學(xué)家群體,并細致觀察它們學(xué)習(xí)到的標量函數(shù) S 以及最終推導(dǎo)出的理論有何異同。

從簡諧振子到混沌雙擺
研究團隊使用 MASS 進行了大量受控實驗。他們首先從經(jīng)典力學(xué)中最基礎(chǔ)的模型開始,如簡諧振子(Simple harmonic oscillator)和單擺(Simple pendulum),然后逐步引入更復(fù)雜的系統(tǒng),包括開普勒問題(Kepler problem,描述行星運動)、相對論性諧振子,甚至是一些研究人員設(shè)計的、沒有標準物理解釋的“合成”勢能系統(tǒng)(Synthetic potentials)。
為了模擬多個獨立科學(xué)家的情景,研究人員使用不同的隨機“種子”(seeds)來初始化多個 MASS 模型實例,然后讓它們學(xué)習(xí)相同的數(shù)據(jù)集。他們仔細追蹤了模型的訓(xùn)練過程、最終學(xué)習(xí)到的理論(通過分析最終層輸出的數(shù)學(xué)表達式和內(nèi)部激活 activations)以及這些理論之間的相似性。
在 AI 學(xué)習(xí)的初級階段,當它只面對一個非常簡單的系統(tǒng)時,比如簡諧振子,它確實能夠非常準確地預(yù)測系統(tǒng)的行為。然而,當研究人員深入剖析其內(nèi)部形成的“理論”時,發(fā)現(xiàn)情況并不簡單。AI 有時會學(xué)到一種包含大量數(shù)學(xué)項的復(fù)雜表達,其復(fù)雜程度遠超標準物理理論描述該系統(tǒng)所需。
更有意思的是,不同的 AI,僅僅因為初始隨機種子的不同,就可能學(xué)到形式上略有差異的標量函數(shù) S,盡管這些不同的函數(shù)都能最終導(dǎo)出正確的預(yù)測結(jié)果。在這個階段,一些 AI 學(xué)習(xí)到的理論在形式上更接近物理學(xué)中的哈密頓描述(這是一種側(cè)重于能量守恒的視角,通常表達為系統(tǒng)動能與勢能之和)。

研究中最關(guān)鍵發(fā)現(xiàn)來自于逐步增加學(xué)習(xí)任務(wù)復(fù)雜性的過程。當研究人員要求 AI 不再只解釋單一系統(tǒng),而是要同時理解并解釋簡諧振子、單擺、開普勒問題等多個不同物理系統(tǒng)時,情況發(fā)生了很大變化。那些原先僅在簡單系統(tǒng)上有效、可能包含冗余信息或甚至是“錯誤”假設(shè)的理論開始暴露出局限性,它們無法同時滿足來自多個系統(tǒng)的新數(shù)據(jù)約束。
這個過程非常像自然選擇:只有那些更具普適性、更能抓住物理本質(zhì)的理論,才能在更廣泛、更多樣的物理現(xiàn)象面前“存活”下來并得到強化。一個有力的證據(jù)是,隨著 AI 需要學(xué)習(xí)的物理系統(tǒng)數(shù)量的增加,其理論中“顯著項”(即對最終預(yù)測結(jié)果貢獻最大的那些數(shù)學(xué)項)的數(shù)量呈現(xiàn)出顯著減少的趨勢。這清晰地表明,AI 在面對更豐富、更復(fù)雜的數(shù)據(jù)挑戰(zhàn)時,傾向于主動尋找更簡潔、更核心、更具統(tǒng)一性的解釋。

隨著系統(tǒng)復(fù)雜度的進一步提升,特別是當引入那些在廣義坐標(Generalized Coordinates)下描述更為復(fù)雜的系統(tǒng)時,AI 學(xué)習(xí)到的理論展現(xiàn)出一種明確的轉(zhuǎn)變趨勢。它們明顯地從早期類似哈密頓量的形式,逐漸轉(zhuǎn)向了更接近拉格朗日量(Lagrangian)的形式。拉格朗日量在物理學(xué)中通常表達為系統(tǒng)動能與勢能之差。
研究人員通過多種方法交叉驗證了這一重要發(fā)現(xiàn)。一種方法是直接擬合:他們將 AI 學(xué)習(xí)到的標量函數(shù) S,分別與理論上的拉格朗日量 L 和哈密頓量 H 進行線性擬合,考察其形式是否符合(其中 T 為動能,V 為勢能)。結(jié)果一致顯示,在經(jīng)過復(fù)雜系統(tǒng)訓(xùn)練后,絕大多數(shù) AI 學(xué)到的 S 都滿足擬合系數(shù) c1 和 c2 符號相反(這恰好對應(yīng)了拉格朗日 L=T–V 的形式),而不是符號相同(對應(yīng)哈密頓 H=T+V 的形式)。
另一種方法是進行激活分析:研究人員運用主成分分析(PCA, Principal Component Analysis)等降維技術(shù)來處理 AI 最終層的神經(jīng)元激活值。他們發(fā)現(xiàn),盡管不同 AI 實例(不同種子)的內(nèi)部激活模式可能千差萬別,具體數(shù)值差異很大,但它們最主要的激活成分(通常能解釋超過 90% 的方差)之間卻具有極高的相關(guān)性(correlation),其相關(guān)系數(shù)常常非常接近 1 或者-1(-1 的情況表示一個簡單的符號反轉(zhuǎn),即所謂的“宇稱翻轉(zhuǎn)”(parity flip,在物理意義上通常不改變理論本質(zhì))。這有力地表明,在功能層面上,不同的 AI 科學(xué)家最終就物理規(guī)律的核心數(shù)學(xué)表達達成了一種高度的功能性一致。

此外,研究者還設(shè)計了約束優(yōu)化實驗:他們設(shè)定了一個優(yōu)化目標,強制要求 AI 的最終輸出必須能夠由拉格朗日理論框架下的兩個關(guān)鍵數(shù)學(xué)項 (S?1??S?和-S?1??S??y) 進行線性組合來精確重構(gòu)。結(jié)果發(fā)現(xiàn),在這種嚴格約束下,重構(gòu)的擬合效果非常好,R2 值(決定系數(shù),衡量擬合優(yōu)度)極高。這從另一個角度證明了,AI 在復(fù)雜動力學(xué)問題上學(xué)習(xí)到的內(nèi)在關(guān)系,確實是遵循了拉格朗日理論的框架。

那么,為什么 AI 會表現(xiàn)出對拉格朗日描述的偏愛呢?研究者推測,這可能與拉格朗日形式本身的數(shù)學(xué)特性有關(guān)。拉格朗日力學(xué)在處理廣義坐標系時展現(xiàn)出更強的普適性和形式上的簡潔性,而哈密頓形式則通常需要依賴更嚴格定義的“正則坐標”。當提供給 AI 的訓(xùn)練數(shù)據(jù)是以通用坐標形式給出時,AI 自然會傾向于學(xué)習(xí)并采用那個更直接適用、約束更少的拉格朗日框架。
最后,為了驗證這種方法的潛力,研究團隊還將 MASS 應(yīng)用于更高維度的挑戰(zhàn),即二維的混沌雙擺(Double pendulum)問題。眾所周知,雙擺系統(tǒng)以其復(fù)雜的混沌行為而聞名。實驗結(jié)果顯示,即使研究人員沒有在 MASS 架構(gòu)中預(yù)先植入用于強制能量守恒的歐拉-拉格朗日方程(Euler-Lagrange equations),MASS 模型也能夠通過學(xué)習(xí)數(shù)據(jù),相當準確地掌握并復(fù)現(xiàn)雙擺那看似無序的復(fù)雜混沌軌跡。更重要的是,在模擬過程中,系統(tǒng)的總能量漂移非常小,顯示出良好的物理守恒性。這個成功的案例證明 MASS 方法不僅局限于簡單系統(tǒng),而且有潛力被擴展到更高維度、更接近現(xiàn)實世界復(fù)雜性的物理問題研究中。


“兩個 AI 科學(xué)家會達成一致嗎?”
那么,回到最初的問題:兩個 AI 科學(xué)家會達成一致嗎?這項研究給出的答案是:在很大程度上是的,尤其是在它們面對足夠豐富、多樣化且具有挑戰(zhàn)性的證據(jù)時。盡管由于隨機性的影響,它們的內(nèi)部實現(xiàn)細節(jié)(例如具體的神經(jīng)網(wǎng)絡(luò)權(quán)重數(shù)值)可能千差萬別,就像不同的人類科學(xué)家可能有不同的思考路徑,但它們最終收斂到的核心物理理論,以及它們傾向于使用的描述該理論的數(shù)學(xué)框架(特別是對拉格朗日描述的偏愛),表現(xiàn)出高度的一致性。
而且研究結(jié)果也突出強調(diào)了拉格朗日力學(xué)在描述經(jīng)典系統(tǒng)方面可能具有的某種更深層次的核心地位,至少從 AI 通過數(shù)據(jù)學(xué)習(xí)的視角來看是如此。同時,MASS 的成功,或許也能為未來構(gòu)建可自主發(fā)現(xiàn)全新物理理論的系統(tǒng)提供一點啟示。
研究人員也提出了幾個值得進一步探索的方向,包括探索坐標選擇的影響、修改損失函數(shù)以研究不同理論的學(xué)習(xí)機制、嘗試不同的模型架構(gòu),以及如何有效擴展模型解決更高維問題。
團隊希望,他們的工作不僅僅是講述一個關(guān)于哈密頓與拉格朗日兩種理論在 AI 學(xué)習(xí)中競爭與選擇的有趣故事,更能為未來構(gòu)建功能更強大、同時又保持可解釋性的下一代 AI 科學(xué)家鋪平道路。
參考資料:
1.https://arxiv.org/abs/2504.02822
運營/排版:何晨龍
熱門跟貼