導(dǎo)讀
在華盛頓大學(xué)實(shí)驗(yàn)室的熒光顯微鏡下,人工設(shè)計(jì)的熒光素酶正穿透小鼠的深層組織,發(fā)出穿透力極強(qiáng)的生物熒光;
在多倫多的超級(jí)計(jì)算機(jī)中,算法正在解析單個(gè)細(xì)胞內(nèi)的基因表達(dá)密碼;
而在倫敦的DeepMind總部,AlphaFold模型正在以前所未有的精度解構(gòu)蛋白質(zhì)的三維迷宮。

在2024年的諾貝爾化學(xué)獎(jiǎng)?lì)C獎(jiǎng)典禮上,人工智能(AI)首次因其在生物學(xué)領(lǐng)域的突破性貢獻(xiàn)而登頂科學(xué)界的最高殿堂。David Baker、Demis Hassabis和John Jumper憑借AI驅(qū)動(dòng)的蛋白質(zhì)折疊與設(shè)計(jì)技術(shù)獲得榮耀。
由AI驅(qū)動(dòng)的生物學(xué)革命正在發(fā)生......
齊 萱 | 編譯
01
榮獲諾獎(jiǎng)的蛋白質(zhì)折疊和設(shè)計(jì)
2024年,AlphaFold幫助科學(xué)家解決了蛋白質(zhì)折疊和設(shè)計(jì)問(wèn)題,讓David Baker和Demis Hassabis、John Jumper獲得了諾貝爾化學(xué)獎(jiǎng),如今全球生物學(xué)家都在借助人工智能預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),并從頭設(shè)計(jì)新的蛋白質(zhì)。

諾貝爾獎(jiǎng)得主David Baker,利用深度學(xué)習(xí)模型創(chuàng)造出比天然蛋白更適合解決現(xiàn)代問(wèn)題的全新蛋白質(zhì)
我們回顧下蛋白質(zhì)折疊和設(shè)計(jì)的歷史,當(dāng)1994年首屆CASP競(jìng)賽啟動(dòng)時(shí),蛋白質(zhì)折疊預(yù)測(cè)領(lǐng)域還籠罩在‘序列決定結(jié)構(gòu)’的迷霧中。科學(xué)家們?cè)诎被嵝蛄信c三維構(gòu)象的黑暗中艱難前行。
1998年,David Baker團(tuán)隊(duì)開發(fā)了用于蛋白質(zhì)能量配置建模的Rosetta軟件,依賴物理能量計(jì)算,雖取得一定進(jìn)展,但效率低下。2008年,科學(xué)家甚至轉(zhuǎn)向眾包模式,開發(fā)了游戲Foldit,讓全球玩家手動(dòng)折疊蛋白質(zhì)。
轉(zhuǎn)折來(lái)到2018年的CASP13會(huì)議上——DeepMind開發(fā)的AlphaFold以中位數(shù)90 ?的預(yù)測(cè)精度橫空出世,在CASP13競(jìng)賽中以驚人的準(zhǔn)確度擊敗所有傳統(tǒng)方法,相當(dāng)于用計(jì)算鏡頭看清了蛋白質(zhì)分子的"量子舞步"。
兩年后, AlphaFold2更是將預(yù)測(cè)精度提升至原子級(jí)別,宣告蛋白質(zhì)折疊問(wèn)題“基本解決”。
AlphaFold的成功絕非偶然。它基于超過(guò)10萬(wàn)種已知蛋白質(zhì)的結(jié)構(gòu)數(shù)據(jù),在深度神經(jīng)網(wǎng)絡(luò)的34層矩陣中構(gòu)建出進(jìn)化規(guī)律與物理化學(xué)法則的交互圖譜。
這種“數(shù)據(jù)蒸餾”能力讓生物學(xué)家第一次擁有了“蛋白質(zhì)X光機(jī)”,能夠以前所未有的速度破解生命的基本構(gòu)件。
正如諾獎(jiǎng)得主David Baker所言:“我們現(xiàn)在能設(shè)計(jì)自然界從未存在過(guò)的蛋白質(zhì),就像用樂(lè)高積木搭建全新功能的分子機(jī)器?!?/p>
02
AI設(shè)計(jì)全新蛋白質(zhì)
AlphaFold的突破不僅在于“預(yù)測(cè)”,更在于“創(chuàng)造”。

人造蛋白質(zhì)
Baker實(shí)驗(yàn)室利用AI設(shè)計(jì)了超穩(wěn)定熒光素酶,其亮度是天然酶的10倍,可用于深層組織成像。這類‘從頭設(shè)計(jì)蛋白質(zhì)(de novo protein)’并非對(duì)自然的簡(jiǎn)單模仿,而是通過(guò)算法探索從未存在過(guò)的分子構(gòu)型,從而賦予蛋白質(zhì)全新功能。
傳統(tǒng)蛋白質(zhì)工程依賴試錯(cuò)法,耗時(shí)數(shù)年;而AI能在幾天內(nèi)生成數(shù)百萬(wàn)種候選結(jié)構(gòu),并篩選出最優(yōu)解。這種“計(jì)算優(yōu)先”的策略正在重塑藥物設(shè)計(jì)、酶工程和生物材料領(lǐng)域。
例如輝瑞利用AI加速KRAS抑制劑開發(fā),將原本需5000人年的工作量,壓縮至數(shù)月完成。
03
抗生素危機(jī)中的AI解藥
抗生素耐藥性危機(jī)迫在眉睫,而新藥研發(fā)卻陷入停滯。面對(duì)鮑曼不動(dòng)桿菌(
Acinetobacter baumannii)等“超級(jí)細(xì)菌”,麥克馬斯特大學(xué)的Jon Stokes團(tuán)隊(duì)開發(fā)了生成式AI模型SyntheMol。
這個(gè)“分子夢(mèng)想家”通過(guò)強(qiáng)化學(xué)習(xí),在虛擬化學(xué)空間中探索出能穿透細(xì)菌防御機(jī)制的全新化合物Halicin——一種對(duì)多重耐藥菌有效的非傳統(tǒng)抗生素,在體外實(shí)驗(yàn)中展現(xiàn)出對(duì)多種耐藥菌株的強(qiáng)效抑制活性。
AI制藥的核心優(yōu)勢(shì)在于打破人類思維定式,與傳統(tǒng)藥物發(fā)現(xiàn)動(dòng)輒十年的周期不同,AI在短短幾個(gè)月內(nèi)就生成了數(shù)十種候選分子。
傳統(tǒng)藥物設(shè)計(jì)受限于已知化學(xué)規(guī)則,而AI能發(fā)現(xiàn)反直覺(jué)的分子結(jié)構(gòu)。這種“計(jì)算優(yōu)先”的藥物研發(fā)模式正在重塑整個(gè)制藥工業(yè)。
例如Insilico Medicine利用AI設(shè)計(jì)的抗纖維化藥物,已進(jìn)入臨床試驗(yàn)階段,全程僅用18個(gè)月,成本降低90%。
04
人工神經(jīng)網(wǎng)絡(luò)模擬人腦學(xué)習(xí)機(jī)制
受人腦啟發(fā),人工神經(jīng)網(wǎng)絡(luò)(ANNs)發(fā)展迅速,這是一種包含多層互聯(lián)節(jié)點(diǎn)(神經(jīng)元)的機(jī)器學(xué)習(xí)模型,能夠處理復(fù)雜數(shù)據(jù)。
網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)通過(guò)加權(quán)輸入數(shù)據(jù)進(jìn)行數(shù)學(xué)運(yùn)算,并根據(jù)閾值決定是否將輸出傳遞至下一層??茖W(xué)家使用已知數(shù)據(jù)集訓(xùn)練ANN,使其通過(guò)對(duì)比預(yù)測(cè)結(jié)果與真實(shí)答案來(lái)優(yōu)化精度。
訓(xùn)練后的ANN可用于預(yù)測(cè)新數(shù)據(jù)集的結(jié)果。盡管存在局限性,但ANN能識(shí)別人類難以察覺(jué)的復(fù)雜數(shù)據(jù)模式,并自動(dòng)執(zhí)行繁瑣任務(wù),為研究者節(jié)省了不少時(shí)間。
05
語(yǔ)言模型解碼大腦奧秘
研究人員開發(fā)出能通過(guò)腦部MRI圖像解讀思維的類ChatGPT語(yǔ)言模型。
得克薩斯大學(xué)奧斯汀分校的Alexander Huth團(tuán)隊(duì)訓(xùn)練出“讀心”模型,能通過(guò)fMRI數(shù)據(jù)重建受試者聽到的句子,同時(shí)也揭示了人腦功能的奧秘。模型顯示,即使MRI掃描僅顯示前額葉皮層活躍,大腦所有區(qū)域都在使用與意義相關(guān)的信息。
這項(xiàng)技術(shù)不僅為失語(yǔ)癥患者帶來(lái)希望,更揭示了大腦語(yǔ)義處理的分布式特征。雖然目前模型尚不能跨主體通用,但隨著準(zhǔn)確性提升,專家建議對(duì)這類技術(shù)保持警惕。
06
AI預(yù)測(cè)單細(xì)胞基因表達(dá)
多倫多大學(xué)計(jì)算生物學(xué)家Bo Wang團(tuán)隊(duì)開發(fā)的單細(xì)胞生成預(yù)訓(xùn)練轉(zhuǎn)換器(scGPT),能比現(xiàn)有主流方法更有效地分析單細(xì)胞RNA測(cè)序數(shù)據(jù)。
該模型在預(yù)測(cè)基因擾動(dòng)影響方面也表現(xiàn)出更高準(zhǔn)確性。最初針對(duì)骨髓和免疫細(xì)胞訓(xùn)練的scGPT,現(xiàn)已適配多種細(xì)胞類型分析,有望在近期解答重要生物學(xué)問(wèn)題。
盡管AI在從腦科學(xué)研究到新型療法開發(fā)等生物學(xué)領(lǐng)域展現(xiàn)出巨大潛力,專家仍提醒需要謹(jǐn)慎使用,其成功有賴于專業(yè)知識(shí)的深度與廣度。
AI不僅是工具,更是新的“科研伙伴”——它能提出人類未曾設(shè)想的問(wèn)題,并給出超越經(jīng)驗(yàn)的答案。
如Baker所言:“我們不再只是生命的觀察者,而是成為生命的設(shè)計(jì)師。”這場(chǎng)由AI驅(qū)動(dòng)的生物學(xué)革命,終將重新定義生命新的可能性”。
參考資料
Artificial Intelligence in Biology: From Neural Networks to AlphaFold
https://www.the-scientist.com/artificial-intelligence-in-biology-from-artificial-neural-networks-to-alphafold-72435
青科沙龍線下活動(dòng)|人工智能與生物醫(yī)學(xué)創(chuàng)新
Deep Science預(yù)印本

熱門跟貼