人類大腦是如何學(xué)習(xí)的?想要全面地回答這個(gè)問題并不容易。

人腦是目前已知最復(fù)雜的神經(jīng)網(wǎng)絡(luò),也是唯一能夠?qū)崿F(xiàn)復(fù)雜認(rèn)知功能的器官,它的神經(jīng)元多達(dá)數(shù)百億個(gè),并且每個(gè)神經(jīng)元都與數(shù)千乃至上萬(wàn)個(gè)其他神經(jīng)元形成連接網(wǎng)絡(luò)。

盡管科學(xué)家們一直在努力探索,但迄今為止人們對(duì)大腦的功能和信號(hào)傳遞機(jī)制尚未完全明晰。

美國(guó)著名物理學(xué)家理查德·費(fèi)曼(Richard Feynman)曾說(shuō)過,“如果我不能創(chuàng)造它,我就不能理解它(If I cannot create,I do not understand)。”

為進(jìn)一步理解大腦的工作原理,復(fù)旦大學(xué)馮建峰教授團(tuán)隊(duì)構(gòu)建了一個(gè)全人腦尺度大腦模擬平臺(tái)數(shù)字孿生腦(DTB,Digital Twin Brain),首次在世界上實(shí)現(xiàn)了對(duì) 860 億神經(jīng)元和百萬(wàn)億突觸的具有生物已知結(jié)構(gòu)的模擬。

數(shù)字孿生腦是通過計(jì)算機(jī)或芯片來(lái)實(shí)現(xiàn)的虛擬大腦,它能夠幫助研究人員理解信息如何在大腦中傳播和處理的過程。

大腦在臨界點(diǎn)附近的動(dòng)態(tài)行為,被認(rèn)為是其認(rèn)知功能的關(guān)鍵時(shí)空特性,這與大模型中經(jīng)常提到的 Scaling Law(縮放定律)有“異曲同工之妙”。

研究人員發(fā)現(xiàn),DTB 在規(guī)模與結(jié)構(gòu)方面越接近人類大腦時(shí),其在功能上表現(xiàn)出的現(xiàn)象也更接近真實(shí)人腦的認(rèn)知功能。

當(dāng)神經(jīng)元數(shù)量達(dá)到 50 億以上規(guī)模時(shí),會(huì)在數(shù)字孿生腦中觀察到人腦智能的涌現(xiàn)特征。

該研究有望為腦疾病的診療提供更好的策略,為生物實(shí)驗(yàn)提供平臺(tái),以及為發(fā)展類腦 AI 提供新的工具和理念。

圖丨馮建峰(來(lái)源:馮建峰)
打開網(wǎng)易新聞 查看精彩圖片
圖丨馮建峰(來(lái)源:馮建峰)

ARM 處理器硬件微型體系架構(gòu)原創(chuàng)者、英國(guó)曼徹斯特大學(xué)斯蒂芬·B·弗伯(Stephen B. Furber)教授對(duì)該研究評(píng)價(jià)稱:“我已經(jīng)深入了解了 DTB 團(tuán)隊(duì)的工作,他們有著很大的目標(biāo),通過基于生物數(shù)據(jù)的全腦計(jì)算模型的模擬和整合來(lái)探索類腦智能?!?/p>

在英國(guó)倫敦大學(xué)學(xué)院卡爾·J·弗里斯頓(Karl J. Friston)教授看來(lái),DTB 是“全球計(jì)算神經(jīng)科學(xué)和生物信息學(xué)領(lǐng)域最全面、技術(shù)原則最嚴(yán)謹(jǐn)和最重要的工作之一”。

圖丨期刊當(dāng)期封面(來(lái)源:National Science Review)
打開網(wǎng)易新聞 查看精彩圖片
圖丨期刊當(dāng)期封面(來(lái)源:National Science Review)

日前,相關(guān)論文以《通過模仿大腦休息和執(zhí)行任務(wù)狀態(tài)的類腦計(jì)算:擴(kuò)展和架構(gòu)》(Imitating and exploring human brain's resting and task-performing states via resembling brain computing: scaling and architecture)為題,以期刊封面形式發(fā)表在National Science Review[1]。

復(fù)旦大學(xué)盧文聯(lián)教授是第一作者,馮建峰教授擔(dān)任通訊作者。

圖丨相關(guān)論文(來(lái)源:National Science Review)
打開網(wǎng)易新聞 查看精彩圖片
圖丨相關(guān)論文(來(lái)源:National Science Review)
打開網(wǎng)易新聞 查看精彩圖片

解決 243 萬(wàn) Gbit 每秒海量信息傳遞擁堵問題

據(jù)悉,該研究由 20 多名成員組成的交叉團(tuán)隊(duì)共同完成,包括數(shù)學(xué)、神經(jīng)科學(xué)、計(jì)算機(jī)科學(xué)等。自 2018 年底,他們開始對(duì)數(shù)字孿生腦進(jìn)行探索,整個(gè)研究經(jīng)歷了近 6 年時(shí)間。

歐盟“未來(lái)新型旗艦技術(shù)項(xiàng)目人類腦計(jì)劃”首席科學(xué)家、法國(guó)艾克斯-馬賽大學(xué)維克托·吉爾薩(Viktor Jirsa)教授指出,模擬具有 860 億個(gè)神經(jīng)元的人腦,并處理與動(dòng)力學(xué)和參數(shù)空間相關(guān)的復(fù)雜性,是數(shù)學(xué)和計(jì)算機(jī)科學(xué)本身所面臨的一個(gè)挑戰(zhàn)。

在計(jì)算科學(xué)方面,想實(shí)現(xiàn)模擬如此大規(guī)模的神經(jīng)元,首先需要解決神經(jīng)元之間通訊量的挑戰(zhàn)。據(jù)課題組估算,860 億個(gè)神經(jīng)元之間的通訊量相當(dāng)于中國(guó)所有無(wú)線通訊總量的 30 倍。

為了解決該問題,研究人員使用了 14012 張圖形處理器(GPU,Graphics Processing Unit),最大程度為計(jì)算的可靠性和準(zhǔn)確性提供保障。

通過使用高性能計(jì)算系統(tǒng)和設(shè)計(jì)優(yōu)化路由,改進(jìn)了神經(jīng)元組的分布,從而解決了 243 萬(wàn) Gbit 每秒海量信息傳遞的擁堵問題。

(來(lái)源:National Science Review)
打開網(wǎng)易新聞 查看精彩圖片
(來(lái)源:National Science Review)

在數(shù)學(xué)方面,如何準(zhǔn)確地估計(jì)神經(jīng)元之間的連接權(quán)重,使得數(shù)字孿生腦的信號(hào)與人腦的信號(hào)盡可能相似,是研究中的關(guān)鍵難題之一。

英國(guó)皇家學(xué)會(huì)院士、2024 年諾貝爾物理學(xué)獎(jiǎng)得主杰弗里·辛頓(Geoffrey Hinton)此前在接受《麻省理工科技評(píng)論》采訪時(shí)曾指出,人腦的突觸參數(shù)高達(dá) 100 萬(wàn)億,比 GPT-3 的參數(shù)量(1750 億個(gè))還高出 1000 倍 [2]。

研究人員使用數(shù)據(jù)同化方法,從有限的數(shù)據(jù)中估計(jì)出神經(jīng)元之間的連接權(quán)重。“這種方法使我們能夠?qū)?shù)字孿生腦的信號(hào)與人腦靜息態(tài)信號(hào)之間的相似度提高到 93% 以上。”馮建峰說(shuō)。

(來(lái)源:National Science Review)
打開網(wǎng)易新聞 查看精彩圖片
(來(lái)源:National Science Review)

除了數(shù)學(xué)和計(jì)算科學(xué)上的挑戰(zhàn),該研究在生物學(xué)方面也經(jīng)歷了技術(shù)攻關(guān)。在靜息狀態(tài)下,數(shù)字孿生腦與大腦活動(dòng)的高相似度是在大腦處于完全放松、不做任何事情的狀態(tài)下實(shí)現(xiàn)的。

當(dāng)要求大腦執(zhí)行具體任務(wù),例如對(duì)某個(gè)圖像進(jìn)行評(píng)分或表達(dá)喜好時(shí),情況會(huì)變得更復(fù)雜。

這時(shí),大腦需要與外界環(huán)境進(jìn)行交互,接收輸入信息(如視覺圖像)。因此生物學(xué)方面的挑戰(zhàn)在于,如何將這些環(huán)境輸入有效地傳遞給數(shù)字孿生腦,使其能夠模擬人腦與環(huán)境的互動(dòng)。

馮建峰表示,這不僅要模擬大腦在靜息狀態(tài)下的活動(dòng),還要模擬大腦在執(zhí)行具體任務(wù)時(shí)的活動(dòng)。

其涉及到大腦如何利用環(huán)境信息來(lái)執(zhí)行任務(wù),即從“不做任何事情”到“做某件事情”的轉(zhuǎn)變,還涉及到對(duì)大腦功能更深層次的理解。

研究人員不僅整合了豐富的生物學(xué)知識(shí),還利用課題組通過掃描技術(shù)獲得的大腦內(nèi)部連接情況的實(shí)驗(yàn)數(shù)據(jù),以及神經(jīng)元數(shù)量等詳細(xì)信息。

他們運(yùn)用逆向工程計(jì)算方法,以確保模擬出的神經(jīng)元活動(dòng)模式能夠反映真實(shí)的大腦信號(hào)。

打開網(wǎng)易新聞 查看精彩圖片

為發(fā)展類腦 AI 提供新工具

在全球范圍內(nèi),虛擬腦孿生項(xiàng)目 EBRAINS 與該課題組構(gòu)建的數(shù)字孿生腦平臺(tái)類似,但前者只在宏觀的腦區(qū)水平實(shí)現(xiàn)了全腦模擬。

馮建峰表示:“我們的模型跨越了宏觀、介觀和微觀世界,實(shí)現(xiàn)了模擬包括神經(jīng)元之間的精細(xì)連接在內(nèi)的大腦復(fù)雜結(jié)構(gòu),并達(dá)到了神經(jīng)元水平。”

數(shù)字孿生腦平臺(tái)有望在以下三個(gè)領(lǐng)域發(fā)揮重要作用,具體來(lái)說(shuō):

第一,作為醫(yī)學(xué)平臺(tái)用于模擬各種復(fù)雜的腦疾病,如腦腫瘤、腦卒中、抑郁癥、精神分裂癥、老年癡呆癥等,從而幫助研究人員深入理解相關(guān)疾病的發(fā)病機(jī)制,并為治療方法的開發(fā)提供新思路。

馮建峰指出,通過數(shù)字孿生腦模擬患者的大腦活動(dòng),來(lái)預(yù)測(cè)腦腫瘤的生長(zhǎng)速度,可為手術(shù)或干預(yù)的最佳時(shí)機(jī)的選擇提供依據(jù)。

據(jù)悉,目前研究人員基于數(shù)字孿生腦技術(shù),已在 6 名抑郁癥患者的腦組織上進(jìn)行試驗(yàn)。通過對(duì)比模擬結(jié)果與實(shí)際大腦中的信號(hào),在抑郁癥患者的腦組織中模擬信號(hào)的準(zhǔn)確性能達(dá)到 90% 以上。

第二,作為生物平臺(tái),對(duì)斑馬魚(約 10 萬(wàn)個(gè)神經(jīng)元)、小鼠(約 7000 萬(wàn)個(gè)神經(jīng)元)、猴子(超過 60 億個(gè)神經(jīng)元)的大腦進(jìn)行模擬,從而替代部分真實(shí)的生物實(shí)驗(yàn),減少對(duì)動(dòng)物的傷害,有望用于藥物研發(fā)等生物科學(xué)領(lǐng)域。

例如,在研究中為模擬大腦的內(nèi)感受回路,驗(yàn)證靜息狀態(tài)活動(dòng)反映內(nèi)部身體狀態(tài)的假設(shè)。研究人員發(fā)現(xiàn),去除從初級(jí)視覺皮層到下游視覺通路的連接會(huì)顯著降低模型與生物大腦在海馬體的相似性,而對(duì)整個(gè)大腦的影響較小。

第三,作為通用人工智能平臺(tái),為開發(fā)類腦 AI 系統(tǒng)提供重要參考。

AI 的發(fā)展在很大程度上受人腦結(jié)構(gòu)和功能研究的啟發(fā)。通過模仿大腦的工作原理,AI 技術(shù)在許多方面取得了顯著的進(jìn)步,例如神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)、深度學(xué)習(xí)算法的開發(fā)以及自然語(yǔ)言處理等領(lǐng)域。

實(shí)現(xiàn)通用人工智能是人類未來(lái)的目標(biāo)之一,如果能夠精確地模擬人腦處理信息的方式,有望通過揭示其背后的機(jī)制,指導(dǎo)人們加速發(fā)展通用人工智能。

馮建峰指出,隨著技術(shù)的發(fā)展,未來(lái)人們或許會(huì)擁有三種類型的計(jì)算機(jī)。

一種是傳統(tǒng)計(jì)算機(jī),用于日常計(jì)算任務(wù)和數(shù)據(jù)處理;另一種是量子計(jì)算機(jī),用來(lái)幫助加速計(jì)算;還有一種是類腦計(jì)算機(jī),能夠幫助人類做出更加智能的決策。

打開網(wǎng)易新聞 查看精彩圖片

終極科學(xué)夢(mèng)想:真正地理解人腦

馮建峰教授本科畢業(yè)于北京大學(xué)數(shù)學(xué)系,并在該校概率統(tǒng)計(jì)系獲得碩士和博士學(xué)位?!拔沂菍W(xué)數(shù)學(xué)出身的,后來(lái)對(duì)生物產(chǎn)生了興趣,三十多年來(lái),我一直用數(shù)學(xué)方法研究神經(jīng)科學(xué)?!瘪T建峰表示。

他是在全球頂級(jí) AI 會(huì)議神經(jīng)信息處理系統(tǒng)大會(huì)(NeurIPS,Conference on Neural Information Processing Systems)上發(fā)表論文的首位中國(guó)學(xué)者。

1994 年,馮建峰在 NeurIPS 發(fā)表重要論文,對(duì)無(wú)監(jiān)督學(xué)習(xí)規(guī)則 Hebbian 學(xué)習(xí)進(jìn)行分析,為理解神經(jīng)網(wǎng)絡(luò)中的學(xué)習(xí)規(guī)則提供了重要的理論基礎(chǔ)。

此前,他曾在英國(guó)華威大學(xué)計(jì)算機(jī)科學(xué)系擔(dān)任講席教授。2015 年起,馮建峰擔(dān)任復(fù)旦大學(xué)類腦智能科學(xué)與技術(shù)研究院院長(zhǎng),目前,他還擔(dān)任上海數(shù)學(xué)中心首席教授兼任復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院院長(zhǎng)。

圖丨馮建峰課題組(來(lái)源:該團(tuán)隊(duì))
打開網(wǎng)易新聞 查看精彩圖片
圖丨馮建峰課題組(來(lái)源:該團(tuán)隊(duì))

數(shù)字孿生腦平臺(tái)的開發(fā)是向理解人腦邁出重要的一步,但馮建峰也指出,“我們的模擬速度比人腦正常運(yùn)行速度慢 70 倍,因此我們?cè)谟?jì)算模擬方面還有很大的提升空間。”

未來(lái),該課題組希望通過擴(kuò)大模擬規(guī)模和提高模擬精度,模擬超過人腦神經(jīng)元數(shù)量(例如 1000 億神經(jīng)元),探索超腦中可能出現(xiàn)的各種新現(xiàn)象,以增進(jìn)對(duì)大腦功能和智能行為的理解。

目前,研究人員也在探索利用數(shù)字孿生腦平臺(tái)對(duì)人腦過去狀態(tài)和未來(lái)可能出現(xiàn)的變化進(jìn)行模擬,從而幫助理解大腦的工作原理和發(fā)育過程。

“現(xiàn)在我們也在探索將數(shù)字孿生腦安裝在機(jī)器人上,真正地與環(huán)境發(fā)生作用的效果,以確定在自動(dòng)駕駛等工業(yè)界應(yīng)用的可能性?!瘪T建峰表示。

在該研究中另一個(gè)不可忽視的問題是,需要龐大計(jì)算資源的支持。因此,他們計(jì)劃在下個(gè)研究階段與斯蒂芬·B·弗伯(Stephen B. Furber)教授共同探索在神經(jīng)形態(tài)超級(jí)計(jì)算機(jī) SpiNNaker2 實(shí)現(xiàn)人腦模擬的可能性,硬件芯片的使用有望降低計(jì)算資源。

展望未來(lái),該團(tuán)隊(duì)希望將數(shù)字孿生腦開放為公共平臺(tái),讓全球的科學(xué)家都可以用起來(lái)。“腦科學(xué)是科學(xué)領(lǐng)域中最后的堡壘,而真正地理解人腦是我們的終極目標(biāo)?!瘪T建峰說(shuō)。

參考資料:

1.Lu,W. et al. Imitating and exploring human brain's resting and task-performing states via resembling brain computing: scaling and architecture.National Science Review11: 080(2024). https://doi.org/10.1093/nsr/nwae080

2.https://www.technologyreview.com/2020/11/03/1011616/ai-godfather-geoffrey-hinton-deep-learning-will-do-everything/

排版:劉雅坤、何晨龍