打開網(wǎng)易新聞 查看精彩圖片

編輯 | 蘿卜皮

原子結(jié)構(gòu)的高分辨率可視化對于理解材料微觀結(jié)構(gòu)與宏觀性質(zhì)之間的關(guān)系具有重要意義。然而,在原子分辨率顯微鏡中,快速、準(zhǔn)確、穩(wěn)健地自動(dòng)解析復(fù)雜模式的方法仍然難以實(shí)現(xiàn)。

北京大學(xué)、廈門大學(xué)、中南大學(xué)以及深勢科技等組成的研究團(tuán)隊(duì),提出了一種基于 Trident 策略增強(qiáng)的解纏結(jié)表示學(xué)習(xí)方法(生成模型)。該方法利用少量未標(biāo)記的實(shí)驗(yàn)圖像和大量低成本的模擬圖像來生成大量與實(shí)驗(yàn)結(jié)果非常相似的帶注釋的模擬數(shù)據(jù),從而產(chǎn)生高質(zhì)量、大容量的訓(xùn)練數(shù)據(jù)集。

基于殘差神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)推理模型,能精準(zhǔn)識(shí)別多種材料(如 MoS?、WS? 等)在范德華界面的復(fù)雜堆疊(stack)方式,無論是雙層還是三層結(jié)構(gòu),其層間滑移和旋轉(zhuǎn)的測量精度可達(dá)皮米級,且抗干擾能力強(qiáng),不受缺陷、成像噪聲或表面污染影響。

該模型不僅能捕捉堆疊模式的漸變過渡,還能區(qū)分頻域分析難以辨別的莫爾條紋,其高通量特性更揭示了范德華外延中多種熱力學(xué)穩(wěn)定構(gòu)型的共存規(guī)律。

該研究以「Auto-resolving the atomic structure at van der Waals interfaces using a generative model」為題,于 2025 年 3 月 25 日發(fā)布在《Nature Communications》。

打開網(wǎng)易新聞 查看精彩圖片

背景

二維范德華材料通過層間扭轉(zhuǎn)和滑移可調(diào)控莫爾超晶格,從而誘導(dǎo)超導(dǎo)性、鐵電性等新穎物性,雖然掃描透射電子顯微鏡(STEM)能夠解析其原子級結(jié)構(gòu),但傳統(tǒng)人工分析方法存在效率低、誤差大等瓶頸。

機(jī)器學(xué)習(xí)為此提供了新思路:無監(jiān)督學(xué)習(xí)可自動(dòng)聚類結(jié)構(gòu)特征但解釋性差,而監(jiān)督學(xué)習(xí)雖精度更高卻受限于標(biāo)注數(shù)據(jù)——實(shí)驗(yàn)數(shù)據(jù)標(biāo)注成本高昂,模擬數(shù)據(jù)則因與真實(shí)圖像的風(fēng)格差異導(dǎo)致質(zhì)量不足,這使得當(dāng)前方法僅能處理簡單的分類任務(wù)(如缺陷識(shí)別)。

然而,針對連續(xù)變化的復(fù)雜問題(如皮米級層間位移或轉(zhuǎn)角測量),現(xiàn)有方法仍面臨挑戰(zhàn),雖有人嘗試通過 CycleGAN 增強(qiáng)模擬數(shù)據(jù)的真實(shí)性,但其圖像內(nèi)容保真度不足。

因此,開發(fā)高效、高精度的監(jiān)督學(xué)習(xí)框架成為關(guān)鍵突破方向,需在數(shù)據(jù)質(zhì)量與規(guī)模之間取得平衡,并提升算法對噪聲、污染等實(shí)際條件的穩(wěn)健性,最終實(shí)現(xiàn)從「識(shí)別離散結(jié)構(gòu)」到「求解連續(xù)變量」的跨越,完成復(fù)雜堆疊模式的自動(dòng)化定量分析。

在最新的研究中,北京大學(xué)等機(jī)構(gòu)的研究人員開發(fā)了一種 Trident 策略增強(qiáng)的解纏結(jié)表示 (DR) 學(xué)習(xí)方法,該方法利用一小組未標(biāo)記的實(shí)驗(yàn) STEM 圖像和大量低成本模擬圖像來生成一個(gè)大型帶注釋的訓(xùn)練數(shù)據(jù)集,該數(shù)據(jù)集與實(shí)驗(yàn)圖像風(fēng)格非常相似,并且在風(fēng)格轉(zhuǎn)換后嚴(yán)格保持模擬圖像內(nèi)容,從而在訓(xùn)練數(shù)據(jù)的質(zhì)量和數(shù)量之間顯示出優(yōu)越的平衡。

然后利用殘差神經(jīng)網(wǎng)絡(luò)對這些高質(zhì)量的模擬圖像進(jìn)行結(jié)構(gòu)推理模型訓(xùn)練,以端到端的方式直接輸出多樣化復(fù)雜堆疊模式的層間滑移和旋轉(zhuǎn),精度達(dá)到皮米級。

模型概述

具體來說(下圖所示),該框架的第一步是通過解纏結(jié)表示圖像到圖像轉(zhuǎn)換(DRIT)算法訓(xùn)練生成模型,該算法可以生成高質(zhì)量的 STEM 模擬圖像。它是通過將軟件生成的低質(zhì)量、無噪聲模擬圖像中的結(jié)構(gòu)信息(例如原子的位置、亮度和大?。┡c實(shí)驗(yàn)圖像中的視覺風(fēng)格相結(jié)合來實(shí)現(xiàn)的。

打開網(wǎng)易新聞 查看精彩圖片

圖示:機(jī)器學(xué)習(xí)工作流程。(來源:論文)

第二步是定義滑移和扭曲堆疊的結(jié)構(gòu)描述符,以表示所有潛在的堆疊配置,然后在第一步通過訓(xùn)練有素的 DRIT 模型生成逼真的 STEM 模擬圖像。由此獲得了具有精確標(biāo)記且與實(shí)驗(yàn)圖像風(fēng)格相似度高的大型訓(xùn)練數(shù)據(jù)集,緩解了因 STEM 實(shí)驗(yàn)成本高以及逐個(gè)原子手動(dòng)標(biāo)記實(shí)驗(yàn)圖像效率低下而導(dǎo)致的數(shù)據(jù)稀缺問題?;贫询B的描述子是通過沿單層晶胞面內(nèi)兩個(gè)基矢量方向分解滑移矢量 D 得到的滑移坐標(biāo)(Da,Db),而對于扭曲堆疊,則應(yīng)用層間旋轉(zhuǎn)角 θ。

第三步,以 ResNet-50 架構(gòu)作為回歸網(wǎng)絡(luò)的主干,訓(xùn)練端到端的堆疊結(jié)構(gòu)識(shí)別模型。通過兩個(gè) ResNet 模型分別學(xué)習(xí)堆疊結(jié)構(gòu)標(biāo)簽,即(Da,Db)和 θ,與真實(shí)的STEM模擬圖像之間的關(guān)系,從而能夠從實(shí)驗(yàn)圖像中直接、準(zhǔn)確、高效地自動(dòng)解析范德華界面處的層間滑動(dòng)和扭曲。

整個(gè)工作流程的關(guān)鍵在于 DRIT 模型的訓(xùn)練,它決定著能否將大量、低成本但質(zhì)量較低的 STEM 模擬圖像成功轉(zhuǎn)化為結(jié)構(gòu)信息嚴(yán)格不變、視覺風(fēng)格與實(shí)驗(yàn)圖像高度相似的高質(zhì)量模擬圖像,從而為后續(xù)的監(jiān)督學(xué)習(xí)獲取大量的訓(xùn)練數(shù)據(jù)。

有兩點(diǎn)需要深入理解:一是選擇 DRIT 算法進(jìn)行風(fēng)格轉(zhuǎn)換的原因;二是需要對基本 DRIT 模型進(jìn)行修改才能更好地完成任務(wù)。

能力評估

該框架首先被用于解決滑移堆疊范德華雙層的原子 registries 問題,這些雙層具有旋轉(zhuǎn)排列的頂層和底層(無層間扭曲),但在層間滑動(dòng)中表現(xiàn)出亞埃級的差異,從而表現(xiàn)出各種物理特性。雖然不同滑移堆疊的結(jié)構(gòu)信息被編碼在其復(fù)制二維快速傅里葉變換(FFT)中,并且可以通過四維 STEM 布拉格干涉法等先進(jìn)的衍射技術(shù)來解析,但對實(shí)空間高分辨率 ADF-STEM 圖像進(jìn)行逐原子分析仍然是最簡單、最快捷的識(shí)別方法,而且對設(shè)備的要求也不高。

實(shí)驗(yàn)中觀察到雙層 ReS2 顯示出多樣化的滑移堆疊模式,因此研究人員選擇該測試案例來評估該框架的四種能力:(i)從原始 ADF-STEM 圖像中解析滑移堆疊配置,(ii)定量感知模式的細(xì)微結(jié)構(gòu)演變,(iii)準(zhǔn)確定位模式轉(zhuǎn)換界面,以及(iv)有效地對大量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析并為創(chuàng)新發(fā)現(xiàn)做出貢獻(xiàn)。

結(jié)果顯示,他們的推理模型可以快速計(jì)算出滑移矢量坐標(biāo),隨后將其自動(dòng)轉(zhuǎn)換為原子模型(底部面板),并根據(jù)專家知識(shí)和圖像模擬驗(yàn)證其正確性。

研究人員使用步長為 0.05 ? 的 DRIT 生成的雙層 ReS2 圖像作為測試數(shù)據(jù)集,并使用歐氏距離 ?D 來評估由步長范圍為 0.1 至 0.4 ?(以 0.1 為增量)的 DRIT 生成的圖像訓(xùn)練的不同推理模型推斷的滑移坐標(biāo)的準(zhǔn)確性。歐氏距離 ?D 表示如下:

打開網(wǎng)易新聞 查看精彩圖片

下圖中的箱線圖顯示,隨著步長的增加,平均 ?D 和對應(yīng)于中間 95% 數(shù)據(jù)的 ?D(箱上限)都在增加,這意味著模型精度下降??紤]到推理模型精度和訓(xùn)練成本之間的平衡,研究人員選擇 0.1 ? 的步長來構(gòu)建模擬圖像數(shù)據(jù)集,得到的平均 ?D 為 0.03 ?,95% 的推斷結(jié)果與真實(shí)值的偏差小于 0.05 ?,這足以應(yīng)對實(shí)驗(yàn)圖像,其空間分辨率為 ~0.7 ?。

打開網(wǎng)易新聞 查看精彩圖片

圖示:滑移堆疊范德華 (vdW) 雙層的自動(dòng)結(jié)構(gòu)分析。(來源:論文)

這個(gè)達(dá)到皮米級精度框架可以很容易地推廣到測量大面積 STEM 圖像中微弱的滑移堆疊位移。另外,當(dāng)實(shí)驗(yàn)圖像存在一定濃度缺陷或信噪比較低時(shí),該模型的推理精度仍然保持穩(wěn)健。

ML 框架還可以根據(jù) STEM 圖像捕獲的莫爾條紋直接解析范德華材料的扭曲角,這對于理解此類超晶格的結(jié)構(gòu)-性質(zhì)關(guān)系至關(guān)重要。

打開網(wǎng)易新聞 查看精彩圖片

圖示:滑移堆疊分析推理模型的穩(wěn)健性和普遍性。(來源:論文)

該模型可以很容易地推廣到滑移堆疊三層的結(jié)構(gòu)分析,在這種情況下,由于結(jié)構(gòu)復(fù)雜性的激增,人類專家只能通過反復(fù)試驗(yàn),就像玩拼圖游戲一樣,來推斷潛在的答案。

結(jié)語

總而言之,基于 Trident 策略增強(qiáng)的 DR 學(xué)習(xí)算法,解決了監(jiān)督學(xué)習(xí)中的一個(gè)關(guān)鍵問題,即如何輕松獲得高質(zhì)量、大量的訓(xùn)練數(shù)據(jù)。

利用 DRIT 生成的高質(zhì)量模擬圖像訓(xùn)練的結(jié)構(gòu)推斷模型可以根據(jù)不同堆疊方式(滑移和扭曲)、層數(shù)(雙層和三層)和成像狀態(tài)(缺陷率、信噪比、污染)的各種材料的 STEM 圖像中的堆疊模式直接、快速、準(zhǔn)確地確定范德華界面處的原子尺度結(jié)構(gòu),并有可能擴(kuò)展到其他復(fù)雜的微觀結(jié)構(gòu)分析。

ML 方法的自動(dòng)化和高通量處理能力引起了范德華外延模式的發(fā)現(xiàn),其中多種熱力學(xué)有利的滑移堆疊與幾乎連續(xù)的變化共存,展示了 ML 對知識(shí)涌現(xiàn)的貢獻(xiàn)。

這項(xiàng)工作擴(kuò)展了監(jiān)督學(xué)習(xí)的能力,從識(shí)別離散和簡單的微結(jié)構(gòu)到分析復(fù)雜且不斷變化的主題。機(jī)器學(xué)習(xí)方法在效率、準(zhǔn)確性和解決問題的復(fù)雜性方面表現(xiàn)出優(yōu)于人類專家的優(yōu)勢,這可能會(huì)徹底改變顯微鏡圖像中原子結(jié)構(gòu)的表征和解釋模式,為快速、準(zhǔn)確、自動(dòng)和基于統(tǒng)計(jì)的納米材料信息提取鋪平道路。

論文鏈接:https://www.nature.com/articles/s41467-025-58160-3