(來源:MIT News)
打開網(wǎng)易新聞 查看精彩圖片
(來源:MIT News)

尋找具備研發(fā)新藥物和新材料所需特性分子的過程既繁瑣又昂貴,需要耗費大量計算資源,研究人員往往要花費數(shù)月時間,才能在浩如煙海的候選分子中篩選出數(shù)量有限的目標分子。

像 ChatGPT 這樣的大語言模型有望簡化這一流程,然而,讓大語言模型像理解句子中的單詞那樣理解和推理構(gòu)成分子的原子與化學鍵卻存在技術壁壘。

近期,麻省理工學院和 MIT-IBM 沃森人工智能實驗室的研究人員開發(fā)出一種頗具前景的方法,利用基于圖的模型(Graph-based Model)來增強大語言模型(這些模型專為生成和預測分子結(jié)構(gòu)而設計)。

該方法通過基礎大語言模型解析用戶自然語言需求后,能在分子設計、原理闡釋及合成路線規(guī)劃等環(huán)節(jié)智能切換 AI 模塊。

它將文本、圖形和合成步驟生成交織在一起,把單詞、圖形和反應整合為一個通用詞匯表,供大語言模型使用,實現(xiàn)多模態(tài)信息無縫銜接。

與現(xiàn)有的基于大語言模型的方法相比,這種多模態(tài)技術生成的分子更符合用戶設定的規(guī)格,有效合成方案成功率從 5% 提升至 35%

該方法的效果優(yōu)于規(guī)模比它大 10 倍以上、僅使用文本表示來設計分子和合成路線的大語言模型,這表明多模態(tài)融合是新系統(tǒng)成功的關鍵。

“這有望成為一個‘端到端’的解決方案,能實現(xiàn)分子設計與合成全過程的自動化。如果大語言模型能在幾秒鐘內(nèi)給出答案,將為制藥公司節(jié)省大量時間。”麻省理工學院研究生、該技術論文的合作者 Michael Sun 說道。

這項研究成果將在國際學習表征會議上發(fā)表。論文的合作者還包括圣母大學研究生 Gang Liu、麻省理工學院電氣工程與計算機科學教授 Wojciech Matusik,以及 MIT-IBM 沃森人工智能實驗室資深科學家 Jie Chen。這項研究部分由美國國家科學基金會、海軍研究辦公室以及 MIT-IBM 沃森人工智能實驗室資助。

打開網(wǎng)易新聞 查看精彩圖片

優(yōu)勢互補

大型語言模型并非為理解化學的微妙之處而設計,這也是它們難以進行逆向分子設計的原因之一。逆向分子設計是指識別具有特定功能或特性的分子結(jié)構(gòu)的過程。

大語言模型將文本轉(zhuǎn)換為一種名為標記的表示形式,用于按順序預測句子中的下一個單詞。但分子是由原子和化學鍵組成的“圖形結(jié)構(gòu)”,不存在特定順序,這使得它們很難編碼為順序文本。

另一方面,基于圖的模型將原子和分子鍵表示為圖形中相互連接的節(jié)點和邊。盡管這些模型在逆向分子設計中應用廣泛,但它們需要復雜的輸入,無法理解自然語言,且生成的結(jié)果可能難以解釋。

麻省理工學院的研究人員將大語言模型與基于圖的模型整合到一個統(tǒng)一框架中,實現(xiàn)了優(yōu)勢互補。

Llamole(Large Language Model for Molecule Discovery,分子發(fā)現(xiàn)大型語言模型)利用基礎大語言模型作為“智能調(diào)度員”,理解用戶的查詢,即用戶用通俗語言對具有特定屬性分子的需求。

例如,用戶在尋找一種分子量為 209、具有特定鍵特性,且能穿透血腦屏障并抑制 HIV 的分子。

當大語言模型響應用戶查詢預測文本時,系統(tǒng)會通過獨特的“觸發(fā)令牌”機制,在三大功能模塊間智能切換:1、結(jié)構(gòu)生成模塊(基于圖擴散模型,根據(jù)輸入條件構(gòu)建分子骨架);2、語義轉(zhuǎn)換模塊(通過圖神經(jīng)網(wǎng)絡將分子結(jié)構(gòu)重新編碼為大語言模型可理解的詞元);3、合成規(guī)劃模塊(根據(jù)中間體結(jié)構(gòu)預測反應路徑,逆向推導從基礎原料到目標分子的完整合成方案)。

“這樣做的精妙之處在于模塊間的信息閉環(huán),大語言模型在激活特定模塊前生成的所有內(nèi)容,都會輸入到該模塊中。該模塊會以與之前一致的方式進行工作?!盡ichael Sun 說道,“同樣,每個模塊的輸出都會經(jīng)過編碼,并反饋到大語言模型的生成過程中,這樣大語言模型就能了解每個模塊的作用,并繼續(xù)根據(jù)這些數(shù)據(jù)預測標記?!?/p>

打開網(wǎng)易新聞 查看精彩圖片

更優(yōu)、更簡單的分子結(jié)構(gòu)

最終,Llamole 會輸出分子結(jié)構(gòu)圖像、分子文本描述以及分步合成計劃,該計劃詳細說明了如何合成分子,包括具體的化學反應。

在設計符合用戶規(guī)格分子的實驗中,Llamole 的表現(xiàn)優(yōu)于 10 種標準大語言模型、4 種微調(diào)大語言模型,以及最先進的特定領域方法。同時,它通過生成更高質(zhì)量的分子,將逆合成規(guī)劃成功率從 5% 提升至 35%,這意味著這些分子結(jié)構(gòu)更簡單,構(gòu)建模塊成本更低。

“大語言模型自身很難確定如何合成分子,因為這需要大量多步驟規(guī)劃。我們的方法能生成更優(yōu)且更易合成的分子結(jié)構(gòu)?!盙ang Liu 說道。

為了訓練和評估 Llamole,研究人員從頭構(gòu)建了兩個數(shù)據(jù)集,因為現(xiàn)有的分子結(jié)構(gòu)數(shù)據(jù)集細節(jié)不足。他們用 AI 生成的自然語言描述和自定義描述模板,對數(shù)十萬個專利分子進行了擴充。

他們?yōu)槲⒄{(diào)大語言模型構(gòu)建的數(shù)據(jù)集包含與 10 種分子特性相關的模板,因此 Llamole 的一個局限在于,它被訓練為僅考慮這 10 種數(shù)值特性來設計分子。

在未來的研究中,研究人員希望擴展 Llamole 的功能,使其能夠考慮任何分子特性。此外,他們還計劃改進圖形模塊,提高 Llamole 的逆合成成功率。

從長遠來看,他們希望利用這種方法拓展應用范圍,超越分子領域,創(chuàng)建能處理其他圖基數(shù)據(jù)的多模態(tài)大語言模型,例如電網(wǎng)中的互連傳感器數(shù)據(jù)或金融市場中的交易數(shù)據(jù)。

“Llamole 展示了將大型語言模型用作處理文本描述之外復雜數(shù)據(jù)的接口的可行性,我們預計它們將成為與其他 AI 算法交互以解決各類圖形問題的基礎?!盝ie Chen 說道。

https://news.mit.edu/2025/could-llms-help-design-our-next-medicines-and-materials-0409