原標(biāo)題:機(jī)器學(xué)習(xí)算法可解析納米晶體結(jié)構(gòu)

科技日?qǐng)?bào)北京4月28日電 (記者張佳欣)據(jù)28日《自然·材料》雜志報(bào)道,美國(guó)哥倫比亞大學(xué)工程學(xué)院團(tuán)隊(duì)創(chuàng)建了一種機(jī)器學(xué)習(xí)算法,可以通過(guò)觀察納米晶體產(chǎn)生的圖案來(lái)推斷材料的原子結(jié)構(gòu)。該成果破解了困擾材料科學(xué)界一個(gè)世紀(jì)的納米晶體結(jié)構(gòu)解析難題,有望加速新藥研發(fā)、清潔能源材料開(kāi)發(fā)及文化遺產(chǎn)研究。

晶體學(xué)是理解幾乎所有材料特性的最有效方法。然而,傳統(tǒng)方法僅適用于毫米級(jí)完美晶體,面對(duì)由微小顆粒組成的粉末狀納米晶體時(shí),現(xiàn)有技術(shù)僅能獲得模糊的原子排列信息,導(dǎo)致諸多關(guān)鍵材料研究陷入停滯。

此次,研究團(tuán)隊(duì)利用4萬(wàn)個(gè)已知原子結(jié)構(gòu)對(duì)一個(gè)生成式人工智能(AI)模型進(jìn)行了訓(xùn)練,從而開(kāi)發(fā)出一個(gè)能夠從“失真數(shù)據(jù)”中還原原子結(jié)構(gòu)的智能系統(tǒng)。

具體而言,團(tuán)隊(duì)創(chuàng)建了一個(gè)包含4萬(wàn)個(gè)晶體結(jié)構(gòu)的數(shù)據(jù)集,并將原子位置打亂,使其看起來(lái)像是隨機(jī)排列的。隨后,他們訓(xùn)練了一個(gè)深度神經(jīng)網(wǎng)絡(luò),將這些幾乎隨機(jī)排列的原子與其對(duì)應(yīng)的X射線衍射圖案聯(lián)系起來(lái)。該網(wǎng)絡(luò)利用這些觀測(cè)結(jié)果對(duì)晶體進(jìn)行重建。最后,他們讓AI生成的晶體經(jīng)歷一個(gè)名為“里特維爾德精修”的過(guò)程,即根據(jù)衍射圖案,將晶體“微調(diào)”到接近最優(yōu)狀態(tài)。

盡管該算法的早期版本表現(xiàn)不佳,但最終它學(xué)會(huì)了比預(yù)期有效得多的晶體重建方法。該算法能夠從各種形狀的納米級(jí)晶體中確定原子結(jié)構(gòu),包括之前實(shí)驗(yàn)難以表征的樣本。

團(tuán)隊(duì)表示,這個(gè)AI模型也學(xué)會(huì)了自然界所允許的原子排列模式。這種模式識(shí)別能力預(yù)示著蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、藥物分子設(shè)計(jì)等領(lǐng)域?qū)⒂瓉?lái)范式轉(zhuǎn)變。

來(lái)源:科技日?qǐng)?bào)