生物醫(yī)藥科技大殺器!人工智能助力 結(jié)構(gòu)預(yù)測(cè)與蛋白質(zhì)設(shè)計(jì)

打開網(wǎng)易新聞 查看精彩圖片

DeepMind小組之所以能夠取得如此大的成功,和2024年諾貝爾化學(xué)獎(jiǎng)的兩位得主,有著最直接的關(guān)系。

2018年時(shí)候的第1代AlphaFold軟件,雖然已經(jīng)開始采用神經(jīng)網(wǎng)絡(luò),但是用的整體策略還是科學(xué)界最傳統(tǒng)的那些思路。直到2018年John Jumper入職谷歌,大刀闊斧的推翻了原有的整個(gè)架構(gòu),這才通過深度卷積神經(jīng)網(wǎng)絡(luò)和注意力模型,讓第2代AlphaFold軟件獲得了翻天覆地的提升。在此之后,隨著transformer和diffusion模型的不斷成熟,AlphaFold再次完成迭代,這才有了第3代軟件能夠在2埃實(shí)驗(yàn)誤差范圍內(nèi)準(zhǔn)確預(yù)測(cè)80%蛋白質(zhì)和配體復(fù)合物結(jié)構(gòu)的超強(qiáng)實(shí)力。兩埃有多大?它只有一個(gè)納米的20%,基本上就是一個(gè)鈉原子的半徑。這種準(zhǔn)確率,不管是做科研還是做藥物研發(fā),都?jí)蛴昧?。在這個(gè)過程中 DeepMind的領(lǐng)導(dǎo)者Demis Hassabis也絕對(duì)不能忽略,他不但本人就是人工智能方面的天才,還是搭建了整個(gè)AlphaFold 19人團(tuán)隊(duì)的靈魂人物。

隨著AlphaFold在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面取得巨大成功,他們的老對(duì)手華盛頓大學(xué)的戴維·貝克教授,通過在自己搭建的、被譽(yù)為全世界最懂生物學(xué)的RoseTTA Fold軟件系統(tǒng)里邊引入了transformer和diffusion模型,讓他們?cè)诘鞍踪|(zhì)折疊的反向問題即蛋白質(zhì)設(shè)計(jì)領(lǐng)域取得了舉世矚目的成功。蛋白質(zhì)折疊是給定氨基酸序列,預(yù)測(cè)空間結(jié)構(gòu),而蛋白質(zhì)設(shè)計(jì)是希望獲得某種結(jié)構(gòu),尋找相應(yīng)的氨基酸序列。戴維·貝克第一次實(shí)現(xiàn)了可以按照人類的需要,無(wú)中生有設(shè)計(jì)出全新蛋白質(zhì)分子。這些設(shè)計(jì)出來(lái)的分子不但能進(jìn)入生物體發(fā)揮各種預(yù)設(shè)的功能,甚至能夠像積木一樣實(shí)現(xiàn)自我組裝,在體內(nèi)體外拼出各種各樣的形狀。

打開網(wǎng)易新聞 查看精彩圖片

值得注意的是,中國(guó)科學(xué)家雖然是蛋白質(zhì)領(lǐng)域的后來(lái)者,但已經(jīng)做出了重要的貢獻(xiàn)。例如我的同事、中國(guó)科學(xué)技術(shù)大學(xué)生命科學(xué)與醫(yī)學(xué)部劉海燕教授,早在2022年就率先利用神經(jīng)網(wǎng)絡(luò)能量函數(shù),搭建了可以按指定主鏈結(jié)構(gòu)給出具體氨基酸序列的SCUBA模型(Nature 2022),成為最早把人工智能引入蛋白質(zhì)設(shè)計(jì)的先驅(qū)之一。2024年,通過引入深度學(xué)習(xí)算法,該模型升級(jí)為SCUBA-D(SCUBA-diffusion)模型,不但在擴(kuò)散模型訓(xùn)練中引入了對(duì)抗損失(adversarial loss), 能有效避免出現(xiàn)物理上不可行的結(jié)構(gòu),還因?yàn)椴恍枰褂靡延薪Y(jié)構(gòu)預(yù)測(cè)網(wǎng)絡(luò)進(jìn)行降噪,讓這個(gè)模型能跳出對(duì)已知天然結(jié)構(gòu)的偏好,更有機(jī)會(huì)設(shè)計(jì)出自然界中尚未發(fā)現(xiàn)的全新功能和結(jié)構(gòu)。這個(gè)領(lǐng)域目前發(fā)展十分蓬勃,各國(guó)科學(xué)家交替領(lǐng)先,中國(guó)大有可為。

打開網(wǎng)易新聞 查看精彩圖片

而這兩大類技術(shù)帶來(lái)的震撼,其實(shí)才剛剛開始,因?yàn)樗鼈円呀?jīng)引領(lǐng)著整個(gè)生命健康領(lǐng)域進(jìn)入了一個(gè)端到端的全新時(shí)代。