來源:央視新聞微信公眾號
陳潤生是我國非編碼基因研究的拓荒者,也是20世紀末至21世紀初全球規(guī)模最大的生命科學工程——“人類基因組計劃”的參與者。
很多人認識陳潤生是在一條熱傳的短視頻上。當DeepSeek成功崛起,很多人找出了兩年前他說的一句話,“堆積算力的盡頭是沙漠,不能夠一味地堆積芯片,而是應該開發(fā)底層創(chuàng)新。”
有人說當全球陷入算力競賽的時候,他成功預言了中國AI的破局之路,并不在芯片的數(shù)量,而在智算的密度。近日,總臺《吾家吾國》專訪中國科學院院士陳潤生,聽他講述他的科研人生。
在他的努力下,中國成為全球第六個
具備大規(guī)?;蚪M測序能力的國家
1964年,陳潤生畢業(yè)于中國科技大學生物物理系。上世紀80年代,正值中國改革開放之后首批大規(guī)模公派留學,他把目光投向了德國,因為那個時期德國在分子生物學和生物信息學上都處于國際的前沿。1985年,已經(jīng)44歲的他前往德國紐倫堡大學從事量子生物學的研究。
1990年,陳潤生在《自然》雜志上看到關于人類基因組計劃的論文后,敏銳地意識到基因組學將成為生命科學前沿的新課題。于是,他給基因組學的創(chuàng)導者詹姆斯?沃森寫信,很快收到美國人類基因組計劃辦公室的回信,并獲得了人類基因組工程第一個5年計劃文本。

當時,中國的生物信息學和基因組學研究正處于轉(zhuǎn)型階段。1992年,中國醫(yī)學遺傳學奠基人吳旻提交的《中國人類基因組計劃重大項目建議書》獲批,成為中國參與國際人類基因組計劃的原點。陳潤生得知消息后,立刻拜訪吳旻院士,并希望承擔兩項關鍵任務:拼接測序片段和尋找重要功能基因。

1999年,中國加入國際人類基因組計劃,負責完成人類三號染色體短臂約 3000萬個堿基對的測序任務,占整個計劃的1%。
這看似只有1%的工作量,實際操作起來困難重重。測序片段的拼接就像沒有模板的拼圖,每段長度僅約一千個堿基對,離完整拼接差距巨大。
面對這個難題,陳潤生團隊創(chuàng)新測序方法,最終提前兩年高質(zhì)量完成任務,中國成為全球第六個具備大規(guī)?;蚪M測序能力的國家。
發(fā)現(xiàn)97%的基因暗藏致病玄機
向世界開源64萬個非編碼分子信息
在研究過程中,陳潤生發(fā)現(xiàn)人類基因組中用于編碼蛋白質(zhì)的序列僅占2%—3%,其余97%都是非編碼序列,曾被認為是垃圾DNA,沒有生物學功能。
但陳潤生堅信這些序列絕非無用,于是帶領團隊專注研究非編碼區(qū)域。“我堅信那97%絕對有用,不可能進化幾十億年,最后進化出來97%是垃圾,這不合邏輯。”
他們以食管鱗癌等多種腫瘤患者的組織為研究對象,發(fā)現(xiàn)部分患者編碼蛋白質(zhì)的基因正常,但非編碼區(qū)域發(fā)生了變化,進而找到了許多與疾病相關的新位點。
從1993年開始,團隊建立超級檔案庫,整理、分類和存檔全世界科學家發(fā)現(xiàn)的64萬個非編碼分子信息。
陳潤生選擇開源這些信息,為全球科研人員提供研究基礎。他說,“科學是一個人類集成的貢獻,我們作為基礎研究人員,能提供我們的貢獻,這就足夠了?!?/p>
“不要簡單把AI當成工具
而應把它視作創(chuàng)新中心”
基因研究外,陳潤生也一直關注著大模型。早在上世紀八十年代末,他就運用人工神經(jīng)網(wǎng)絡來預測遺傳密碼中的編碼基因。對于生物信息學領域的研究者來說,各種方法都是相通且一脈相承的。他對DeepSeek等大模型發(fā)表看法,是長期在該領域深耕的必然結(jié)果。
如今,陳潤生團隊在生物信息學與醫(yī)學AI大模型方面積極探索,嘗試將中醫(yī)數(shù)據(jù)融合到模型中。
在他看來,雖然中醫(yī)和西醫(yī)對疾病的認知存在差異,但大模型可以提供一個融合的平臺,將這些不同的數(shù)據(jù)整合處理,更好地服務人類。
對于未來AI的發(fā)展,陳潤生期待AI能夠“涌現(xiàn)”出更多創(chuàng)新火花,他提出將人工智能作為新的創(chuàng)新中心。“我們不要把AI當成簡單的工具,而是把它作為人類新的創(chuàng)新中心,這樣能有更多創(chuàng)新的可能性。”
本文來源:央視新聞微信公眾號綜合《吾家吾國》
熱門跟貼