十萬美元一個(gè)!人工智能出現(xiàn)以前,蛋白質(zhì)結(jié)構(gòu)實(shí)驗(yàn)有多貴?

打開網(wǎng)易新聞 查看精彩圖片

為了掌握這把能通往健康和長壽的鑰匙,科學(xué)家們一直在努力尋找各種方法。在實(shí)驗(yàn)層面上,我們可以用X射線晶體衍射、核磁共振波譜學(xué),還有冷凍電鏡三維重構(gòu)等方法,去解析蛋白質(zhì)的真實(shí)三維結(jié)構(gòu)。但是缺點(diǎn)就在于,它們又貴又慢。搞定一個(gè)蛋白質(zhì)結(jié)構(gòu),平均需要花費(fèi)10萬美元以及一個(gè)熟練科研工作者幾個(gè)月到幾年的時(shí)間。所以即使經(jīng)過四五十年的積累,全世界科學(xué)家解析的結(jié)構(gòu)總數(shù)也只達(dá)到23萬余條,而且其中還有很多是重復(fù)或者是相似的結(jié)構(gòu)。

打開網(wǎng)易新聞 查看精彩圖片

但是根據(jù)我們提過的安芬森法則,在給定的條件下,蛋白質(zhì)折疊之后的三維結(jié)構(gòu)是完全由氨基酸序列決定的。所以從理論上來說,只要找到了正確的方法,并且有足夠的算力,蛋白質(zhì)的結(jié)構(gòu)是完全可以通過計(jì)算得到的。

懷揣著美好的理想,一代又一代的計(jì)算生物學(xué)家,做出了大量的嘗試。有的采用的是同源結(jié)構(gòu)比對(duì)的策略,簡而言之就是照貓畫虎,通過和已有結(jié)構(gòu)比較,來推測一個(gè)新的蛋白質(zhì)大概會(huì)長什么樣子。但這種方法的缺點(diǎn)在于,對(duì)于沒有參考答案的、全新的蛋白質(zhì)結(jié)構(gòu)就無能為力。

而另外一些科學(xué)家追求的是完全依照物理學(xué)的定律和公式,去計(jì)算清楚每一個(gè)原子在整個(gè)折疊過程中的所有動(dòng)態(tài)變化。這樣的好處是可以真正理解蛋白質(zhì)折疊背后的原理,但壞處就是計(jì)算量極度龐大。

斯坦福大學(xué)的維賈伊·潘德(Vijay Pande)教授為了能夠匯集算力,曾經(jīng)發(fā)起過一個(gè)叫做 Folding@home的科學(xué)合作項(xiàng)目,希望利用所有項(xiàng)目參與者電腦中的冗余算力,一起來計(jì)算全新蛋白質(zhì)的折疊過程。如果你下載了他們的軟件,那么當(dāng)你的電腦熄屏的時(shí)候,你的電腦就在悄悄運(yùn)行蛋白質(zhì)折疊的計(jì)算。但哪怕匯集了數(shù)以百萬計(jì)的人的算力,真正在論文致謝中提到了Folding@home的也只有不到200篇文章,對(duì)整個(gè)結(jié)構(gòu)生物學(xué)領(lǐng)域產(chǎn)生的影響微乎其微。

這種停滯不前的局面,直到谷歌公司的AlphaFold系列軟件橫空出世,才終于被打破!