細胞是生命的基本單位,對于理解健康、衰老和疾病至關重要,也是藥物開發(fā)和合成生物學的重要工具。然而,基于細胞的實驗資源消耗大且易變,這導致了生物醫(yī)學研究中的可重復性問題。

雖然首個碳基細胞是經(jīng)過數(shù)十億年的進化才出現(xiàn)的,但首個硅基細胞的開發(fā)如今為科學界帶來了變革性的機遇。大約在 2000 年提出了虛擬細胞( virtual cell)或數(shù)字細胞( digital cell)的概念,最初依賴傳統(tǒng)的低通量生化實驗來量化特定生物過程中所涉及物質(zhì)的時空變化。這些早期模型采用微分方程和隨機模擬來模擬特定的細胞過程。開創(chuàng)性的全細胞虛擬模型,例如針對支原體、大腸桿菌和釀酒酵母的模型,主要基于先驗知識。然而,它們?nèi)狈脑O計的匹配擾動組學數(shù)據(jù)和時空成像數(shù)據(jù)。盡管這些早期模型具有開創(chuàng)性意義,但它們在全面捕捉活細胞的動態(tài)特性和復雜性方面存在局限性,這凸顯了對更全面的數(shù)據(jù)整合和先進建模方法的需求。

高通量技術人工智能(AI)的最新進展為更復雜的虛擬細胞模擬鋪平了道路。

2024 年 12 月,斯坦福大學Stephen Quake教授等人在Cell期刊發(fā)文,提出了人工智能虛擬細胞(AIVC)的概念【1】,該概念將人工智能與多模態(tài)數(shù)據(jù)相結合,以創(chuàng)建細胞功能的綜合計算模型。這些人工智能虛擬細胞有望實現(xiàn)精確且可擴展的計算機模擬實驗,有可能通過高通量模擬在某些情況下補充甚至取代傳統(tǒng)實驗,從而徹底改變生物醫(yī)學研究。

盡管人工智能虛擬細胞(AIVC)前景廣闊,但仍有一些關鍵問題懸而未決。正如細胞培養(yǎng)基滋養(yǎng)生物細胞一樣,什么樣的“培養(yǎng)基”才是培育這些數(shù)字實體的理想之選?我們應當優(yōu)先對哪些細胞類型進行虛擬培養(yǎng)?

解決這些問題對于充分發(fā)揮人工智能虛擬細胞(AIVC)在藥物開發(fā)、疾病建模和基礎生物學研究中的潛力至關重要。在我們即將邁入細胞建模這一新時代之際,科學界應當攜手合作,為人工智能虛擬細胞(AIVC)的開發(fā)和驗證制定標準及最佳實踐。

2025 年 3 月 25 日,西湖大學郭天南研究員在Cell Research期刊發(fā)表了題為: Grow AI virtual cells: three data pillars and closed-loop learning 的社論。

該文章提出,人工智能虛擬細胞(AIVC) 的演進和發(fā)展依賴于三個關鍵的數(shù)據(jù)支柱—— 先驗知識( priori knowledge)、靜態(tài)架構( static architecture)和動態(tài)狀態(tài)( dynamic states),這些數(shù)據(jù)支柱與深度學習算法 ( deep learning algorithms) 相結合,構成了 AIVC 發(fā)展的基礎。

打開網(wǎng)易新聞 查看精彩圖片
打開網(wǎng)易新聞 查看精彩圖片

此示意圖展示了發(fā)展 AIVC 的三大關鍵支柱:先驗知識、靜態(tài)架構和動態(tài)狀態(tài)。這些數(shù)據(jù)通過人工智能算法進行整合,以模擬細胞行為(例如大腸桿菌、酵母和各種細胞系等模式生物的模型),還展示了使用閉環(huán)主動學習系統(tǒng)的 AIVC 的發(fā)展演變。在這個先進的框架中,計算預測引導自動化實驗,尤其側重于擾動組學。

想象一下,在計算機中培育一個“虛擬細胞”,它能模擬真實細胞的生長、代謝甚至癌變過程,幫助科學家預測藥物效果、解析疾病機制。這個看似科幻的場景隨著人工智能(AI)的發(fā)展,正在變?yōu)楝F(xiàn)實。

傳統(tǒng)細胞實驗的困境:成本與不確定性的雙重挑戰(zhàn)

細胞是生命的基本單位,但傳統(tǒng)實驗面臨兩大難題:

資源消耗大:單次實驗需數(shù)周時間,且需要昂貴的試劑和精密儀器;

可重復性低:實驗受環(huán)境波動、操作差異影響,全球科研界正面臨“可重復性危機”。

AI虛擬細胞:邁向硅基生命之路

從 2000 年首個“虛擬細胞/數(shù)字細胞”概念到如今的人工智能虛擬細胞(AIVC),郭天南團隊提出了構建細胞“數(shù)字孿生”的三大核心支柱:

1、先驗知識:海量文獻的“智能熔爐”

整合百年生物醫(yī)學研究成果,包括 2.4 億篇論文,以及 3D 分子結構數(shù)據(jù)庫,這些人類已有的知識如同“細胞百科全書”,為 AI 提供基礎細胞生物學規(guī)律,就像 ChatGPT 學習了人類的所有文本,讓 AIVC 吸收所有細胞知識。

2、靜態(tài)架構:納米級細胞“全景地圖”

融合冷凍電鏡、超分辨顯微鏡、空間組學技術,繪制細胞器、蛋白網(wǎng)絡的精確三維結構,分辨率達 5-10 納米。

3、動態(tài)狀態(tài):捕捉生命的每一幀變化

追蹤細胞發(fā)育、癌變等過程的分子動態(tài);利用擾動技術(例如基因編輯、藥物刺激)生成大量數(shù)據(jù),訓練 AI 預測細胞行為。

技術突破:當多組學遇上深度學習

郭天南團隊進一步提出了“閉環(huán)學習”框架:

1、數(shù)據(jù)融合:Transformer 模型整合文本、影像、蛋白質(zhì)組數(shù)據(jù);

2、動態(tài)推演:Diffusion 模型模擬細胞狀態(tài)變遷,預測藥物干預效果;

3、自我進化:每次虛擬實驗結果反哺模型優(yōu)化,形成迭代升級。

未來應用:從精準醫(yī)療到合成生物學

1、藥物開發(fā):虛擬篩選抗癌藥組合,縮短研發(fā)周期;

2、疾病解密:模擬阿爾茨海默病蛋白異常聚集過程;

3、細胞工廠:設計高效生產(chǎn)胰島素的人工細胞。

結論與展望

在現(xiàn)代生物醫(yī)學研究的數(shù)字培養(yǎng)皿中創(chuàng)建和培育人工智能虛擬細胞(AIVC)時,我們必須仔細考慮滋養(yǎng)其生長的“養(yǎng)分”。文章中提出的先驗知識、靜態(tài)架構和動態(tài)狀態(tài)這三大數(shù)據(jù)支柱構成了這些計算機模擬實體的必要“培養(yǎng)基”。其中,基于擾動的組學數(shù)據(jù)——轉錄組學、蛋白質(zhì)組學和代謝組學——成為關鍵的“生長因子”。

為了高效生成如此豐富的擾動數(shù)據(jù),作者設想了閉環(huán)主動學習系統(tǒng)將成為下一個進化步驟。這些系統(tǒng)受自主化學實驗室的啟發(fā),將無縫整合人工智能驅(qū)動的預測與機器人實驗。就像一位技藝嫻熟的園丁,它們將識別知識空白,設計有針對性的實驗,并不斷深化我們對細胞復雜性的理解。從靜態(tài)模型到適應性、自我優(yōu)化的人工智能虛擬細胞的旅程,有望徹底改變藥物發(fā)現(xiàn)、疾病建模和基礎生物學研究。作者還提出了這一旅程中的低垂果實——創(chuàng)建并培育一個虛擬酵母細胞或許是一個可行的選擇。

當我們站在這一令人興奮的前沿之際,科學界的協(xié)同努力對于充分發(fā)揮人工智能虛擬細胞的潛力以及推動計算機模擬生命科學的未來至關重要。

https://www.cell.com/cell/fulltext/S0092-8674(24)01332-1

https://www.nature.com/articles/s41422-025-01101-y

來源:生物世界 編輯:王多魚

打開網(wǎng)易新聞 查看精彩圖片

全國衛(wèi)生產(chǎn)業(yè)企業(yè)管理協(xié)會轉化醫(yī)學產(chǎn)業(yè)分會(以下簡稱分會)是全國衛(wèi)生產(chǎn)業(yè)企業(yè)管理協(xié)會(以下簡稱總會)的分支機構。全國衛(wèi)生產(chǎn)業(yè)企業(yè)管理協(xié)會是由原國家衛(wèi)生部申報,國家民政部登記批準,1992年10月成立。由從事衛(wèi)生健康企事業(yè)單位和科研、管理等人員自愿結成的全國性、行業(yè)性、非營利性,具有獨立法人資格的國家一級社會團體。登記管理機關是國家民政部,黨建領導機關是中央和國家機關工作委員會,業(yè)務指導單位是國家衛(wèi)生健康委員會。協(xié)會宗旨:堅持“護佑健康、發(fā)展產(chǎn)業(yè)、誠信創(chuàng)新、服務社會”,推進衛(wèi)生健康事業(yè)、產(chǎn)業(yè)企業(yè)發(fā)展,為國家經(jīng)濟建設和人民健康服務。CCTMIS(全國衛(wèi)生產(chǎn)業(yè)企業(yè)管理協(xié)會轉化醫(yī)學產(chǎn)業(yè)分會)致力打造一個“產(chǎn)學研醫(yī)、協(xié)同創(chuàng)新”的平臺,目前協(xié)會有超過4000個會員,其中超過半數(shù)為臨床專家型醫(yī)生!