AI Agent 也能做量子物理實(shí)驗(yàn)了!

近日,英國牛津大學(xué)曹舒翔博士使用基于大模型的 AI Agent,成功地讓真人實(shí)驗(yàn)人員告別了繁瑣重復(fù)的實(shí)驗(yàn)工作。具體來說,曹舒翔博士和合作者所搭建的 Agent 能夠理解科研人員使用自然語言所描述的實(shí)驗(yàn)過程和實(shí)驗(yàn)?zāi)繕?biāo),結(jié)合它自帶的知識庫,自行完成量子物理實(shí)驗(yàn)的設(shè)計(jì)、執(zhí)行和數(shù)據(jù)分析。

圖 | 曹舒翔(來源:曹舒翔)
打開網(wǎng)易新聞 查看精彩圖片
圖 | 曹舒翔(來源:曹舒翔)

他們把這套系統(tǒng)部署在了自己的超導(dǎo)量子計(jì)算實(shí)驗(yàn)平臺上,成功實(shí)現(xiàn)了單比特和兩比特量子門的自動校準(zhǔn)。而且,Agent 可以根據(jù)科研需要在量子計(jì)算機(jī)上生成量子態(tài)并進(jìn)行分析。在這個(gè)案例展示之中,最復(fù)雜的部分是兩比特門的自動校準(zhǔn)。而本次設(shè)計(jì)的 Agent 在沒有人為干預(yù)的情況下,進(jìn)行了大約 3 個(gè)小時(shí)的自動實(shí)驗(yàn),并成功找到多組可以實(shí)現(xiàn)兩比特門的參數(shù)組合。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

相比其他的工作,曹舒翔博士和合作者所搭建的 Agent 針對實(shí)驗(yàn)物理學(xué)研究場景實(shí)現(xiàn)了三個(gè)功能:

第一,Agent 能夠根據(jù)科研人員提出的實(shí)驗(yàn)描述和實(shí)驗(yàn)?zāi)繕?biāo),設(shè)計(jì)出全部的實(shí)驗(yàn)步驟,并把實(shí)驗(yàn)步驟轉(zhuǎn)換為一個(gè)“狀態(tài)機(jī)”,即無論是實(shí)驗(yàn)成功還是實(shí)驗(yàn)失敗,Agent 都能知道下一步該做什么。在這種情況下,Agent 自動規(guī)劃的工作流程更加可靠,要么能夠工作到實(shí)驗(yàn)成功完成,要么會在進(jìn)入無法恢復(fù)的不得已狀態(tài)下向科研人員求助。

第二,Agent 能夠動態(tài)分析并理解已經(jīng)存在的操作儀設(shè)備的代碼庫,將每一步實(shí)驗(yàn)通過這些代碼庫實(shí)現(xiàn)出來。實(shí)驗(yàn)人員可以隨時(shí)向代碼庫中修改或添加新的儀器操作接口增強(qiáng) Agent 的實(shí)驗(yàn)?zāi)芰Α?/p>

第三,在每一個(gè)實(shí)驗(yàn)完成之后,Agent 能夠自行分析實(shí)驗(yàn)數(shù)據(jù),借此判斷這次實(shí)驗(yàn)是否成功達(dá)到預(yù)期目的。如果不成功,它會先判斷是否需要重新調(diào)整參數(shù);如果需要,它將自行調(diào)整參數(shù)。與此同時(shí),在這一步的結(jié)果會返回給“狀態(tài)機(jī)”并驅(qū)動“狀態(tài)機(jī)”的運(yùn)行。

要實(shí)現(xiàn)以上的功能,需要讓大模型掌握整個(gè)實(shí)驗(yàn)所需的知識。曹舒翔和所在團(tuán)隊(duì)設(shè)計(jì)的 Agent,相比此前已有系統(tǒng)有著三個(gè)重要改進(jìn)。

首先,Agent 能夠根據(jù)知識把實(shí)驗(yàn)步驟轉(zhuǎn)化為“狀態(tài)機(jī)”,并讓大模型來決定狀態(tài)的更新和跳轉(zhuǎn)。曹舒翔表示通過本次研究,他們證明使用“狀態(tài)機(jī)”可以成功穩(wěn)定的實(shí)現(xiàn)復(fù)雜實(shí)驗(yàn)流程的自動化。

其次,Agent 能將知識同時(shí)從代碼和文檔里提取出來,并能進(jìn)行結(jié)構(gòu)化的整理和存儲。在進(jìn)行實(shí)驗(yàn)設(shè)計(jì)或代碼生成時(shí),Agent 可以進(jìn)行高效快速的查詢,并能翻譯成實(shí)驗(yàn)?zāi)_本代碼。相比直接生成大段的代碼,這一方案更加符合自動化實(shí)驗(yàn)的場景,且具有較好的穩(wěn)定性。

再次,在曹舒翔等人所打造的知識庫之中,包含了圖片的多模態(tài)數(shù)據(jù),他們還通過引入小樣本學(xué)習(xí),并使用多模態(tài)大模型針對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行解讀。借此發(fā)現(xiàn),很多實(shí)驗(yàn)很難僅僅通過自然語言來對實(shí)驗(yàn)成功與否進(jìn)行精確描述。而該團(tuán)隊(duì)先給模型展示一些成功和失敗的案例圖片,再把采集到的數(shù)據(jù)轉(zhuǎn)化為圖片并讓模型進(jìn)行分析,借此極大提升了模型準(zhǔn)確率。

總的來說,Agent 可以極大降低超導(dǎo)量子計(jì)算平臺的實(shí)驗(yàn)成本,并能把科研人員從技術(shù)細(xì)節(jié)和工程細(xì)節(jié)中解放出來。同時(shí),曹舒翔認(rèn)為本次解決方案的適用范圍非常廣泛,不僅能用于量子計(jì)算,也能用于其他類型的科學(xué)研究,甚至能用于工業(yè)和服務(wù)業(yè)的復(fù)雜自動化場景中。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

據(jù)了解,曹舒翔本科畢業(yè)于浙江大學(xué)竺可楨學(xué)院,并在畢業(yè)后到牛津大學(xué)攻讀博士。在此期間,由他聯(lián)合創(chuàng)立的量子人工智能公司 Rahko 于 2022 年被美國生物技術(shù)公司 Odyssey Therapeutics 收購。曹舒翔目前在牛津大學(xué)從事博士后研究,主要研究 AI 在科研領(lǐng)域可能的運(yùn)用場景。該研究的共同一作張子健來自加拿大多倫多大學(xué)的 Alan Aspuru-Guzik 課題組,他的研究專注于 AI Agent 的知識表示和人機(jī)交互。

曹舒翔表示,本次研究受到了早期 GPT Agent 工作 AutoGPT 的啟發(fā)。最早的 AutoGPT 能在給定一個(gè)任務(wù)目標(biāo)之后,一步一步地實(shí)現(xiàn)目標(biāo),并能使用搜索引擎和文件創(chuàng)建等簡單的工具。

在本次研究之中,曹舒翔等人先是開展了一些預(yù)實(shí)驗(yàn),比如讓一些早期 Agent 直接控制量子計(jì)算設(shè)備。但是,實(shí)驗(yàn)效果卻是差強(qiáng)人意,主要是因?yàn)槟P蜔o法了解他們的實(shí)驗(yàn)要求,只能照貓畫虎地進(jìn)行“看似有用實(shí)則無用”的操作。在曹舒翔等人看來,這其實(shí)就是模型在沒有知識儲備的情況下進(jìn)行的“敷衍”。

后來,領(lǐng)域內(nèi)的其他團(tuán)隊(duì)開始使用更復(fù)雜的檢索增強(qiáng)生成(RAG,Retrieval-Augmented Generation)方法,來將具體場景的知識提供給模型,借此來增強(qiáng)模型的能力。

后來,曹舒翔等人調(diào)研了很多其他 Agent 的實(shí)現(xiàn)方法,借此提出一種適合該團(tuán)隊(duì)研究場景的解決方案。與此同時(shí),他們提出一個(gè)針對實(shí)驗(yàn)知識進(jìn)行整理和存儲的方案,即通過撰寫結(jié)構(gòu)化文檔的方式,不僅能讓大模型進(jìn)行快速索引并查找到相關(guān)內(nèi)容,還能為人類進(jìn)行分析和閱讀。

通過以上方案,讓模型擁有了使用量子實(shí)驗(yàn)設(shè)備的能力。在接下來的研究中 Agent 首先在模擬構(gòu)建的量子計(jì)算設(shè)備測試環(huán)境中進(jìn)行了進(jìn)行交互,驗(yàn)證了準(zhǔn)確性后在真實(shí)量子計(jì)算設(shè)備上進(jìn)行了驗(yàn)證。

期間,該團(tuán)隊(duì)測試了很多方案。例如,在最早的方案之中他們并沒有引入“狀態(tài)機(jī)”,而是讓模型直接生成長腳本并完成實(shí)驗(yàn),但是他們發(fā)現(xiàn),目前的模型還不足以直接完成這類復(fù)雜任務(wù)。

于是,他們通過引入更多的 Agent 并把任務(wù)加以細(xì)分,借此找到了每個(gè)功能的最佳實(shí)現(xiàn)方法,并將它們進(jìn)行整合,進(jìn)而在真實(shí)量子計(jì)算機(jī)上成功完成測試。

但是,測試中他們發(fā)現(xiàn)此前構(gòu)建的系統(tǒng)穩(wěn)定性欠佳,原因是大模型很難去解讀實(shí)驗(yàn)數(shù)據(jù)。由于這些數(shù)據(jù)是模型完全沒有見過的,因此通過語言描述很難進(jìn)行準(zhǔn)確區(qū)分。

為此,他們嘗試了很多方法,包括直接分析文字?jǐn)?shù)據(jù)、讓模型自己寫代碼進(jìn)行數(shù)據(jù)分析并解讀分析結(jié)果等。最后,他們發(fā)現(xiàn)最穩(wěn)定和最實(shí)用的方案是:使用小樣本學(xué)習(xí)配合多模態(tài)的方式,來教會模型卻解讀數(shù)據(jù)。

完成以上步驟之后,他們使用大模型針對量子計(jì)算機(jī)進(jìn)行自動校準(zhǔn)的復(fù)雜實(shí)驗(yàn),成功校準(zhǔn)了單比特門和兩比特門,同時(shí)展示了模型根據(jù)真人科研人員指令快速構(gòu)建新實(shí)驗(yàn)的能力。

(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
(來源:arXiv)

日前,相關(guān)論文以《應(yīng)用于量子計(jì)算的自動化實(shí)驗(yàn)室智能體》(Agents for self-driving laboratories applied to quantum computing)為題發(fā)表在預(yù)印本網(wǎng)站arXiv上 [1]。同時(shí),曹舒翔博士在 2025 年美國物理學(xué)會全球峰會上(APS Global Summit 2025)以《利用基于知識的 AI 智能體實(shí)現(xiàn)實(shí)驗(yàn)自動化:超導(dǎo)量子處理器案例研究》(Automating Experiments with Knowledge-Based AI Agents: A Case Study in Superconducting Quantum Processors)對相關(guān)工作進(jìn)行了匯報(bào) [2]。

圖 | 相關(guān)論文(來源:arXiv)
打開網(wǎng)易新聞 查看精彩圖片
圖 | 相關(guān)論文(來源:arXiv)

未來,曹舒翔等人將研究如何讓參數(shù)更小的模型來驅(qū)動他們所搭建的Agent。該團(tuán)隊(duì)目前的 Agent 框架尚未涉及到針對模型的微調(diào),這就要求驅(qū)動這個(gè)框架的模型的本身能力必須足夠好。比如,目前得使用 GPT-4、Claude-3-Opus 等模型才能產(chǎn)生比較穩(wěn)定的效果。所以,未來他們將通過微調(diào)方式或蒸餾方式來使用參數(shù)更小的模型,以及降低框架所需要的推理開銷。

圖 | 美國物理學(xué)會全球峰會(來源:曹舒翔)
打開網(wǎng)易新聞 查看精彩圖片
圖 | 美國物理學(xué)會全球峰會(來源:曹舒翔)

同時(shí),他們還將增強(qiáng)模型對于科學(xué)數(shù)據(jù)的理解。目前,該團(tuán)隊(duì)將掃描到的結(jié)果生成為一張帶有坐標(biāo)系的二維圖片,盡管模型可以識別出圖片中科研人員感興趣,并希望更進(jìn)一步進(jìn)行精細(xì)掃描研究的部分,但卻不能準(zhǔn)確指出具體的參數(shù)范圍。因此,他們將進(jìn)一步研究能夠處理科學(xué)任務(wù)的多模態(tài)模型。

最后,他們將通過尋找合適的優(yōu)化方法,來讓模型更高效地部署到邊緣計(jì)算設(shè)備上,從而讓本次案能夠適用于更多應(yīng)用場景。

參考資料:

1.https://arxiv.org/pdf/2412.07978

2.https://summit.aps.org/events/MAR-G18/4

運(yùn)營/排版:何晨龍