
來源:數(shù)字開物
3月25日,DeepMind 的聯(lián)合創(chuàng)始人兼CEO Demis Hassabis在劍橋大學發(fā)表演講,演講中分享了 DeepMind的歷程, DeepMind創(chuàng)立初被視為旨在構(gòu)建AGI的“阿波羅計劃”,還回顧了AI發(fā)展的兩種主要路徑,并將游戲作為AI試驗場,游戲領(lǐng)域的成功是手段而非目的,是為了開發(fā)能解決現(xiàn)實問題的通用算法。此外談論了谷歌 DeepMind 正在開發(fā)的 AI 工具如何能夠極大地加快從健康到環(huán)境等科學領(lǐng)域的發(fā)現(xiàn)。
Demis Hassabis表示,AI 發(fā)展的下一步是將 AlphaGo 所展現(xiàn)的那類基于智能體的模型(它們能在游戲等有限領(lǐng)域內(nèi)高效搜索并找到優(yōu)良解決方案)與 Gemini 這類更通用的模型相結(jié)合,將高效規(guī)劃和搜索能力與對世界廣泛理解的能力相結(jié)合。
任何在自然界中能夠生成或被發(fā)現(xiàn)的、具有真實物理結(jié)構(gòu)的模式,或許都能被像 AlphaFold 這樣的經(jīng)典學習算法高效地發(fā)現(xiàn)和建模。
DeepMind押注的方向是強化學習以及強化學習和深度學習的結(jié)合,深度學習用于對環(huán)境和世界建模,強化學習則用來制定計劃、尋找解決方案并在環(huán)境中行動。
以下是本次演講實錄
經(jīng)數(shù)字開物團隊編譯整理
能回到劍橋真是太好了。每次回到劍橋,都感覺像是回家一樣,心里暖暖的。特別是這座演講廳,我記得曾對朋友們說過,也許有一天我會回到這里做演講,宣布 AGI的到來,或許還會有一個機器人走上臺,震驚全場。今天我不會這么做,也許幾年后我會再回來,給大家?guī)砟菢拥难葜v。
對我而言,我的 AI 之旅始于游戲,特別是國際象棋,我從四歲開始下棋,這段經(jīng)歷引導我開始思考“思考”本身。我們的大腦是如何構(gòu)想出這些計劃和想法的?我們是如何解決問題的?又該如何改進?這讓我深深著迷,甚至可能比下棋本身更吸引我的是其背后的實際思維過程。
我第一次接觸計算機和 AI 就是通過國際象棋,當時我嘗試使用非常早期的國際象棋電腦,我想這就是我的第一臺象棋電腦。它們是實體棋盤,你必須實際按下棋盤上的方格來移動棋子。當然,我們本來應該用這些象棋電腦來訓練開局理論,學習更多國際象棋知識。但我記得當時我完全被一個事實迷住了:竟然有人能給這個看起來毫無生氣的塑料塊編程,讓它能和你對弈得如此出色。我當時真的非常好奇這是怎么做到的,怎么會有人能編出這樣的程序。后來在我十幾歲的時候,我自己用 Amiga 500 電腦做了實驗——那可是 80 年代末 90 年代初非常棒的一款家用電腦——并自己動手編寫了類似奧賽羅這種游戲的 AI 程序。那真是我第一次嘗到 AI 的滋味,從那一刻起我就被深深吸引了。因此,我很早就下定決心,要將我的整個職業(yè)生涯都投入到推動這項技術(shù)的前沿發(fā)展中去。
在 2010 年,我們在倫敦創(chuàng)立了 DeepMind。當時我們確實是把它看作一項旨在構(gòu)建 AGI的‘阿波羅計劃’——這是我們當時的想法。也就是一種真正通用的、能執(zhí)行人類所有認知能力的 AI。一個真正意義上的通用 AI 系統(tǒng)。實際上,這個想法真正源自圖靈和他的圖靈機,即一種能夠計算任何可計算之物的機器,正如圖靈通過其圖靈機所證明的那樣。這對我來說是重要的基礎(chǔ),也是我在劍橋的課堂上學到的核心內(nèi)容之一:計算機科學與計算理論的基石,這些都是由圖靈等人在 40 和 50 年代奠定的著名理論。
我們在 2010 年創(chuàng)立 DeepMind。令人感慨的是,這已經(jīng)是將近 15 年前了。但當時,幾乎沒什么人在研究 AI,這在幾乎人人都在談論 AI 的今天看來,簡直難以置信。僅僅十幾年間,AI 領(lǐng)域的發(fā)展速度之快令人驚嘆,而我們顯然也參與并推動了這段激動人心的旅程。
我們 DeepMind 從創(chuàng)立之初的使命是負責任地構(gòu)建 AI,以造福全人類。但我們最初的表述方式是分為兩步:第一步,解決智能;第二步,用智能解決一切其他問題。在 2010 年,這個想法聽起來非常大膽甚至有些不切實際。你可以想象,拿著這樣的使命去向風險投資人融資會是什么情景。這聽起來相當瘋狂。但我至今依然從根本上堅信這一點。而且我認為,越來越多的人開始意識到,以通用方式構(gòu)建的 AI,確實可能對幾乎所有領(lǐng)域帶來深刻的、變革性的影響。這顯然就是我們使命宣言的第二部分。對我而言,這意味著利用 AI 加速科學發(fā)現(xiàn)本身、推動醫(yī)學進步,并增進我們對周圍宇宙的理解。
回想我們剛創(chuàng)業(yè)時,或者說我在 90 年代在這里(劍橋)學習的時候,廣義上講,構(gòu)建 AI 主要有兩種路徑。一種是專家系統(tǒng)的路徑,也就是將解決方案直接預先編程到系統(tǒng)中。比如在 90 年代非常有名的、擊敗了國際象棋世界冠軍加里·卡斯帕羅夫 (Garry Kasparov) 的Deep Blue,這或許是專家系統(tǒng)的巔峰之作。但專家系統(tǒng)的問題在于它們無法處理預期之外的情況,這也是它們從未能真正擴展到完全通用智能的原因。如果發(fā)生了開發(fā)者沒有預先設定好的意外狀況,系統(tǒng)本身沒有任何機制能夠應對。它們的設計思路主要源于邏輯系統(tǒng),因此往往比較死板、脆弱,適應性差。
相比之下,現(xiàn)代方法則基于學習系統(tǒng)。這些系統(tǒng)能夠自主學習,直接從原始經(jīng)驗或數(shù)據(jù)中學習,遵循第一性原理。其靈感更多地來源于神經(jīng)科學。顯然,我們今天這類系統(tǒng)的潛力在于,它們有望超越我們這些程序員或系統(tǒng)設計者已有的知識范疇,解決我們還不知道答案的問題。
因此,在 2010 年代初,我們自然而然地從游戲入手。游戲在我生命中扮演了多重角色:首先,我用它訓練自己的思維;后來,我為電腦游戲開發(fā)游戲和 AI;最終,也是第三種方式,我們用游戲來訓練我們的AI系統(tǒng)。游戲是AI系統(tǒng)的絕佳試驗場。你可以從非常簡單的游戲開始,比如 70 年代的 Atari 游戲。而 DQN 這個系統(tǒng),是首個能夠直接從原始數(shù)據(jù)中學習的端到端學習系統(tǒng)。在 DQN 的案例中,輸入就是屏幕上的原始像素。系統(tǒng)沒有被告知任何關(guān)于游戲規(guī)則或其控制對象的信息。它唯一的目標就是基于輸入的視頻流(或者說像素流)來最大化游戲得分。
大約在 2013 年,我們用 DQN 掌握了各種不同的 Atari 游戲。之后,我們將這些系統(tǒng)進一步擴展,去挑戰(zhàn)我認為是游戲 AI 領(lǐng)域的終極難題:開發(fā)出能夠在圍棋這項運動上達到甚至超越世界冠軍水平的系統(tǒng)。圍棋,無疑是人類發(fā)明過的最復雜的游戲之一。要理解圍棋的復雜性,一個方法是看它的可能性:圍棋中可能的局面數(shù)量達到了10的170次方。這個數(shù)字遠超可觀測宇宙中的原子總數(shù)。這背后重要的一點是:你不可能用暴力窮舉的方法來制定圍棋策略。那是不可能的,計算上是完全不可行的,所以你必須采用更智能的方法。
然后在 2016 年,我們迎來了一個舉世矚目的時刻:在一場百萬美元的挑戰(zhàn)賽中,我們的程序 AlphaGo 擊敗了十次世界冠軍、韓國傳奇棋手李世石九段。全球有兩億人觀看了這場比賽。AlphaGo 不僅贏得了比賽,更重要的是,它甚至開創(chuàng)了全新的、原創(chuàng)的圍棋策略。要知道,圍棋已經(jīng)有數(shù)千年歷史,職業(yè)圍棋也發(fā)展了數(shù)百年,但 AlphaGo 仍然能發(fā)現(xiàn)人類從未見過的下法。
所以,這再次向我揭示了這類系統(tǒng)在發(fā)明和發(fā)現(xiàn)新知識方面的潛力。當然,當時我們談論的只是游戲領(lǐng)域的知識,但我的夢想顯然是將這種能力推廣到科學發(fā)現(xiàn)的所有領(lǐng)域。
那么這些系統(tǒng)是如何運作的呢?我們基本上是通過一套自我對弈機制來訓練這些神經(jīng)網(wǎng)絡 的。這實際上就是 AlphaGo 以及后續(xù)系統(tǒng),如 AlphaGo Zero 和 Alpha Zero 所采用的方法。這些后續(xù)系統(tǒng)將我們?yōu)閲彘_發(fā)的技術(shù)進行了泛化,能夠從零開始學習玩任何雙人游戲。初始時,系統(tǒng)是版本一,它對游戲幾乎一無所知,只了解規(guī)則,因此下棋是隨機的。然后,你讓這個系統(tǒng)與自身對弈大約 10 萬局。這 10 萬局游戲就產(chǎn)生了一個包含各種棋局位置的新數(shù)據(jù)庫?;谶@個數(shù)據(jù)庫,你訓練出第二個版本,即一個稍微改進了的模型,版本二。這個版本經(jīng)過訓練,能夠預測在任何給定棋局下最可能的著法,以及哪一方 (黑棋或白棋) 更可能從當前局面獲勝,還有他們獲勝的概率是多少。
接著,你可以用版本二與版本一對弈,進行例如 100 局的比賽。如果版本二以顯著優(yōu)勢勝出 (比如勝率達到 55%) ,就用版本二替換版本一,并用新的對局創(chuàng)建一個質(zhì)量更高的游戲數(shù)據(jù)庫。然后,你再訓練出版本三系統(tǒng)。如果你重復這個過程大約 17 到 18 次,系統(tǒng)就能在 24 小時甚至更短的時間內(nèi),從最初的隨機亂下,進化到第 17 或 18 版時,棋力超越世界冠軍的水平。所以,能親眼見證這個自我提升的過程在如此短的時間內(nèi)完成,是相當不可思議的。
那么,這些神經(jīng)網(wǎng)絡究竟在做什么呢?它們實際上是將圍棋那種極其龐大、難以處理的搜索空間(大約有 10 的 170 次方種可能性) ,壓縮到在幾分鐘計算時間內(nèi)就可以處理的規(guī)模。它是如何做到的呢?通過利用神經(jīng)網(wǎng)絡來有效地引導搜索機制,從而縮小搜索范圍。想象一下,所有可能的下法構(gòu)成一棵巨大的“可能性之樹”,樹上的每個節(jié)點代表一個圍棋棋局。神經(jīng)網(wǎng)絡的作用就是,讓你不必漫無目的地檢查所有可能性,而是引導你集中探索那些最有趣、最有價值的分支路線 。最后,當思考時間用盡時,你就選擇迄今為止看到的最佳、最有希望的那條路線。
這自然而然地引導我們,將這種能力應用于不僅僅是圍棋,而是任何雙人完美信息游戲 。令人驚訝的是,它甚至能夠在國際象棋領(lǐng)域發(fā)現(xiàn)全新的策略和風格??紤]到當時像 Stockfish 這樣的國際象棋程序已經(jīng)非常強大,這一點尤其了不起。而 Alpha Zero 當時竟然能在國際象棋上擊敗 Stockfish,這幾乎被認為是件不可能的事。Alpha Zero 不僅擊敗了 Stockfish更重要的是它下出了一些名局。在其中一盤最著名的對局的這個特定局面中,白方的 AlphaZero 正處于勝勢,因為它選擇了犧牲子力來換取機動性。大多數(shù)國際象棋計算機傾向于保全子力,而如果你懂國際象棋,你會看到圖中黑棋雖然子力占優(yōu),但棋子幾乎動彈不得,都被困在角落里。正是 AlphaZero 主動棄子,獲得了這種機動優(yōu)勢。對于人類特級大師和頂尖棋手而言,這種下法不僅非常有效,而且具有極高的審美價值,是一種優(yōu)美的棋風。
所以,AlphaZero 能夠發(fā)現(xiàn)這種全新的、動態(tài)的下棋方式,確實非常了不起。而當時的世界冠軍 Magnus Carlsen,在研究了 AlphaZero 的對局和相關(guān)書籍后將 AlphaZero 的許多思路融入了自己的棋風,并借此統(tǒng)治了國際象棋界將近十年。
所以,在 DeepMind 成立后的頭十年左右,我們在游戲人工智能領(lǐng)域取得了一系列里程碑式的突破。但當然,這些成就僅僅是我們實現(xiàn)更宏大目標的訓練場。玩游戲本身并非終點而是一種手段。我們的目的是創(chuàng)造出能夠廣泛應用于解決現(xiàn)實世界問題的算法。
那么,我們在現(xiàn)實世界中尋找哪些問題來應用這些技術(shù)呢?不僅僅是科學問題,也包括工業(yè)領(lǐng)域的問題。我們主要依據(jù)三個標準來判斷一個問題是否適合用我們最初為游戲開發(fā)的這類 AI 系統(tǒng)、理念和算法來解決。第一,我們尋找那些可以被描述為龐大的組合搜索空間 的問題。這類問題通常極其復雜,組合方式太多,無法通過暴力破解找到解決方案。但關(guān)鍵在于,其中可能存在某種潛在結(jié)構(gòu),我們的神經(jīng)網(wǎng)絡可以學習并利用這種結(jié)構(gòu)來高效地引導搜索。第二,我們尋找能夠用明確的目標函數(shù)或某種可優(yōu)化的度量來描述的問題。在游戲中,這很簡單,比如最大化得分或贏得比賽。但實際上,許多現(xiàn)實世界的問題也可以被簡化、歸結(jié)為幾個你希望最大化的度量或目標函數(shù)。
最后,第三個標準是,你需要有充足的數(shù)據(jù)或經(jīng)驗可供學習,并且需要有一個精確且高效的模擬器,以便生成更多的合成數(shù)據(jù)來補充你所擁有的真實數(shù)據(jù)。事實證明,如果你從這個角度審視,會發(fā)現(xiàn)有大量問題都符合這些標準,其中包含了科學領(lǐng)域的許多重要難題。對我而言,有一個問題一直縈繞在我心頭,實際上從我還在劍橋讀本科、初次接觸到它時就是如此,那就是蛋白質(zhì)折疊問題。對于不熟悉生物學和蛋白質(zhì)的朋友,我來簡單介紹一下。
蛋白質(zhì)至關(guān)重要,它們是生命的基石。生物體內(nèi)的幾乎所有功能,從神經(jīng)元放電到肌纖維收縮,都依賴于蛋白質(zhì)??梢哉f,正是蛋白質(zhì)使生命成為可能。那么,蛋白質(zhì)折疊問題其實很容易描述。基本上,蛋白質(zhì)由其基因序列 或遺傳序列所定義,這個序列決定了氨基酸序列 。在自然界中,這條氨基酸鏈會自發(fā)地折疊成一個通常非常精美的特定蛋白質(zhì)結(jié)構(gòu)。所以,過程就是從遺傳序列到蛋白質(zhì)結(jié)構(gòu)。
蛋白質(zhì)結(jié)構(gòu),也就是它的三維結(jié)構(gòu)之所以非常重要,是因為它在很大程度上決定了蛋白質(zhì)的功能,即它在生物體內(nèi)扮演的角色。當然,結(jié)構(gòu)并非功能的全部,但它確實是決定蛋白質(zhì)在自然界中實際作用的關(guān)鍵因素。因此,蛋白質(zhì)折疊問題歸根結(jié)底就是:我們能否僅根據(jù)一維的氨基酸序列,直接預測出蛋白質(zhì)的三維結(jié)構(gòu)?我們能否通過計算,從這個序列出發(fā),預測出那個極其復雜的三維結(jié)構(gòu)呢?
那么,為什么這個問題如此困難呢?著名蛋白質(zhì)研究員 Leventhal 在 1960 年代提出了一個猜想,后來被稱為 Leventhal 悖論。他計算出,一個普通蛋白質(zhì)可能形成的形狀數(shù)量大約是天文數(shù)字般的 10 的 300 次方。然而,在自然界和生物體內(nèi),蛋白質(zhì)卻能在短短幾毫秒內(nèi)自發(fā)地完成折疊。這就是悖論所在:既然存在如此多的可能性,自然界是如何做到快速折疊的呢?或者說,物理定律是如何實現(xiàn)這一過程的?這個悖論也給了我們希望:既然物理過程能解決這個問題 (并且在體內(nèi)每秒發(fā)生數(shù)十億次) ,那么通過計算也一定能在合理的時間內(nèi)找到解決方案,這個問題在計算上應該是可行的。
此外,吸引我投身這個問題的另一個原因是,有一個名為 CASP的競賽,科學家們通過艱苦的工作,使用電子顯微鏡等尖端且昂貴的設備來解析蛋白質(zhì)結(jié)構(gòu)。他們會將那些剛剛解析出來、尚未公開發(fā)表的結(jié)構(gòu)提供給 CASP 作為競賽題目。這樣一來,競賽組織者掌握著實際的基準真相,而來參賽的數(shù)百支計算團隊則利用各自的計算方法嘗試預測這些未知結(jié)構(gòu) 。等到夏末,組織者公布真實的結(jié)構(gòu),大家就可以將預測結(jié)果與真實結(jié)構(gòu)進行比較,評估預測的誤差。
于是,我們在 2016 年啟動了 Alpha Fold 項目,實際上差不多就在我們從韓國首爾的 AlphaGo 人機大戰(zhàn)回來后的第二天。我們當時覺得,技術(shù)已經(jīng)足夠成熟,是時候?qū)⑵鋺糜谟螒蝾I(lǐng)域之外,去解決那些真正有意義的重大難題了。我們稱這類問題為“根節(jié)點問題”,因為一旦解決,它們就能開辟出全新的研究分支和發(fā)現(xiàn)途徑,后續(xù)的大量工作都可以在此基礎(chǔ)上展開。蛋白質(zhì)折疊正是這類問題的典型代表。我們在 2018 年首次帶著 Alpha Fold 1 參加了 CASP 競賽。
我們從 2016 年開始這項工作。幾年后,Alpha Fold 1 準備就緒,我們用它參加了 CASP 13 競賽。你可以從圖表中看到,在此之前的十年間,在最難預測的蛋白質(zhì)類別中,獲勝團隊的最高得分一直徘徊不前。這個分數(shù)可以大致理解為一個準確度百分比,衡量預測出的氨基酸有多少比例位于真實結(jié)構(gòu)的正確位置上。如圖所示,過去十年進展甚微,分數(shù)一直卡在 60 分左右的水平。而實驗科學家們告訴我們,預測精度需要達到 90 分這個門檻——也就是達到原子級精度——計算方法才真正具有與實驗方法相媲美的實用價值,實驗科學家們才能真正依賴這些計算預測,而不必總是進行那些費時費力的實驗工作來解析結(jié)構(gòu)。
生物學家們普遍認為,一個博士生需要花費整個博士生涯,也就是四到五年的時間,才能解析出僅僅一個蛋白質(zhì)的結(jié)構(gòu)。科學界已知的蛋白質(zhì)有 2 億種,而人類蛋白質(zhì)組中就有 2 萬種。我們憑借 Alpha Fold 1 贏得了蛋白質(zhì)結(jié)構(gòu)預測競賽,并且比次優(yōu)系統(tǒng)好了將近 50%。Alpha Fold 1 首次將 機器學習 技術(shù)作為系統(tǒng)的核心組件引入。但這還不足以達到 原子級精度。我們必須從頭開始,利用已有的經(jīng)驗教訓,為 Alpha Fold 2 重新設計架構(gòu),并運用從 Alpha Fold 1 中學到的一切,最終才達到了這種原子級精度。這使得競賽組織者在 2020 年底宣布,蛋白質(zhì)折疊問題已被解決。
Alpha Fold 不僅極其精確,而且速度極快——它能在幾秒鐘內(nèi)完成一個普通蛋白質(zhì)的折疊。我們很快意識到,實際上可以預測所有已知的 2 億種蛋白質(zhì)的結(jié)構(gòu)。在隨后大約一年的時間里,我們利用 Google Cloud 上的大量計算資源完成了所有蛋白質(zhì)的結(jié)構(gòu)預測,然后通過我們歐洲生物信息學研究所的同事們,將這些數(shù)據(jù)在一個數(shù)據(jù)庫中免費公開發(fā)布,為全球任何人提供了免費、無限制的訪問權(quán)限。
實驗方法確定一個蛋白質(zhì)結(jié)構(gòu)就需要四五年時間,預測這 2 億個蛋白質(zhì)結(jié)構(gòu),相當于在一年內(nèi)完成了實驗方法下需要十億年博士研究才能完成的工作量??茖W研究能被加速到何種程度,可見一斑。這也開辟了全新的探索領(lǐng)域。許多蛋白質(zhì)結(jié)構(gòu),特別是那些研究較少的生物體 (比如某些特定類型的植物),雖然對科學和農(nóng)業(yè)研究極為重要,但其結(jié)構(gòu)卻鮮有被解析和公開?,F(xiàn)在,這些結(jié)構(gòu)數(shù)據(jù)都唾手可得了。此外,有了這 2 億個結(jié)構(gòu)數(shù)據(jù),我們可以在宏觀層面分析跨物種的結(jié)構(gòu)模式,甚至是 元結(jié)構(gòu),探尋進化過程中的共性。這確實為 結(jié)構(gòu)生物學 開辟了引人入勝的新研究方向,目前正有待探索。
我們從一開始就將安全問題置于優(yōu)先地位,并嚴肅對待作為 AI 前沿開拓者的責任。在這個項目上,我們咨詢了超過 30 位 生物安全 和 生物倫理學專家,確保向世界公開成果所帶來的益處遠超任何潛在風險。全球幾乎每個國家都有研究人員在使用 Alpha Fold,總數(shù)已超過 200 萬。這項工作已被引用超過 3 萬次,已成為生物學研究的標準工具之一。在座的許多博士生們,希望你們也在使用并受益于它。如今,Alpha Fold 的應用幾乎遍及生物學和醫(yī)學研究的各個領(lǐng)域。
在過去幾年里,我們持續(xù)開發(fā),取得更多進展并改進系統(tǒng)。今年早些時候,我們發(fā)布了供學術(shù)界使用的 Alpha Fold 3。我們將 Alpha Fold 3 的能力擴展到處理相互作用。Alpha Fold 2 主要提供蛋白質(zhì)的靜態(tài)結(jié)構(gòu)快照,但生物學本質(zhì)上是一個動態(tài)過程。因此,理解不同生物分子元件之間如何相互作用至關(guān)重要。這包括蛋白質(zhì)與其他蛋白質(zhì)的相互作用,也包括蛋白質(zhì)與生命必需的其他分子 (如 DNA 和 RNA) 以及 配體 的相互作用。配體是 小分子,比如藥物化合物。了解蛋白質(zhì)與這些化合物的結(jié)合方式非常重要。
此外,我們還開發(fā)了 Alpha Proteo,它致力于解決蛋白質(zhì)設計的逆向問題,并同樣基于 Alpha Fold 的技術(shù)。也就是說,如果想設計一種自然界中可能不存在的新型蛋白質(zhì),賦予其特定任務或功能,就需要確定能夠形成這種特定結(jié)構(gòu)的氨基酸序列和基因序列。這便是嘗試設計出能夠執(zhí)行新穎功能的新結(jié)構(gòu),在設計藥物、抗生素 和 抗體 等方面具有極高的應用價值。
無論是早期在游戲領(lǐng)域取得的成就,還是后來在科學研究工作,其核心都在于解決棘手的搜索問題。面對極其復雜的問題和海量的可能解決方案必須找到最優(yōu)解。這在巨大的組合搜索空間中,單靠暴力破解是無法實現(xiàn)的。因此,必須訓練一個神經(jīng)網(wǎng)絡模型。該模型能學習問題的拓撲結(jié)構(gòu),從而有效地引導搜索過程,以找到預定目標的最佳解決方案。
這是一種極其通用的方法。以 Go 為例,我們利用系統(tǒng)尋找最佳落子點。若將棋盤節(jié)點想象成化學化合物,那么就是在化學空間中尋找最佳分子。找到最佳分子,便是藥物設計的開端——找到能特異性與目標靶點結(jié)合、而不影響其他分子的化合物,從而減少副作用和毒性。當前我們用于設計這些分子的技術(shù),與此前的原理一脈相承,標志著我們向藥物發(fā)現(xiàn)領(lǐng)域邁出了新的一步。
我們相信,生物學正進入一個可稱之為數(shù)字生物學的新時代。生物學在其最根本層面上是一個信息處理系統(tǒng),在不斷抵抗周圍環(huán)境的熵增,這或許是生命的本質(zhì)。它是一個極其復雜且具有涌現(xiàn)性的信息處理系統(tǒng)。AI 正是應對這種復雜性的理想工具。正如數(shù)學是描述物理學和物理現(xiàn)象的完美語言,AI 有潛力成為描述生物學的完美語言。AI尤其擅長處理像生物學這樣的動態(tài)系統(tǒng)中復雜、涌現(xiàn)的行為和相互作用。
Alpha Fold 正是這一理念的力證。希望十年后回望,它不僅是一個孤立的突破,而是真正開啟了數(shù)字生物學的黃金新紀元。
AI 的應用遠不止生物學,它可以廣泛用于科學、數(shù)學、醫(yī)學等領(lǐng)域。我們已取得一系列突破,涵蓋健康 (通過視網(wǎng)膜掃描識別眼疾)、新材料發(fā)現(xiàn)、助力等離子體約束和聚變反應堆、研發(fā)更快算法 (如 AI 發(fā)現(xiàn)更快的矩陣乘法算法)、天氣預測,甚至在 量子計算機 及其 糾錯 方面提供幫助。AI 的應用潛力幾乎覆蓋所有領(lǐng)域。因此,我們鼓勵大學加強多學科交叉合作,將 AI 應用于特定專業(yè)領(lǐng)域的關(guān)鍵問題上。相信未來 5 到 10 年,通過這種方式可以取得諸多進展。
最后,談談更宏觀的視角:通往AGI的路徑以及相關(guān)進展。我們在對世界進行一般性理解的各個方面都取得了很大進展,有時稱之為世界模型。去年底發(fā)布的 VO2 視頻模型就是一例。VO2 是目前最先進的視頻生成技術(shù),能僅憑文本描述或單張靜態(tài)圖像生成視頻。
其中一些視頻效果驚人。例如那個切番茄的視頻,堪稱視頻模型的圖靈測試。通常模型會出錯,比如番茄復原、切到手指或刀移位。但 VO2 能較好地處理,說明系統(tǒng)為了生成逼真效果,必須深刻理解現(xiàn)實世界的物理規(guī)律。再比如藍莓掉入水中的氣泡效果,僅根據(jù)文本生成,卻準確模擬了物理現(xiàn)象。還有卡通人物的運動、蜜蜂的飛行等,都展示了模型對物理和動態(tài)的理解。五年前,如果有人告訴我無需專門編程、僅靠學習就能實現(xiàn)這種效果,我會覺得難以置信。然而,這些 學習系統(tǒng) 竟能通過觀看海量 YouTube 視頻學習到現(xiàn)實世界的物理規(guī)律。這展現(xiàn)了學習系統(tǒng)驚人的能力。
我們已經(jīng)在這方面取得了進展,并且通過 Genie 2 項目更進了一步。這讓我得以再次運用我在游戲領(lǐng)域的經(jīng)驗。Genie 2 將相關(guān)的視覺輸出或理解模型提升到了新的水平。現(xiàn)在,用戶僅憑一條文本指令,就能生成一個完整的游戲。例如,我們曾輸入指令:“生成一個可玩世界,玩家扮演一個身處未來城市的機器人”。系統(tǒng)隨之生成了相應的游戲畫面,玩家可以用 QWE 鍵和箭頭鍵控制機器人。目前,這個生成世界的連貫性只能維持幾秒鐘,但我們正在努力延長這個時間,目標是讓游戲世界的連貫性可以持續(xù)數(shù)分鐘。這樣一來,用戶就能真正體驗到我所說的世界模型——一種對真實世界及其互動規(guī)律、物理法則的深刻理解。
我們一直非常專注于 AI 技術(shù)的安全問題。早在 2010 年,當 AI 領(lǐng)域還鮮有人問津時,我們就已經(jīng)開始為這項技術(shù)未來可能取得的成功進行規(guī)劃和準備。我們當初設想這會是一個長達二十年的使命,令人欣慰的是,十五年過去,我們基本仍行走在預定的軌道上。我們當時就意識到,如果真要構(gòu)建這類具有變革力量的系統(tǒng)和技術(shù),就必須承擔起重大的責任,確保它們以安全、負責任的方式部署。為此,我們開發(fā)了名為 Synth ID 的技術(shù)系統(tǒng)。該系統(tǒng)利用 AI 技術(shù),具體是一個對抗性 AI 系統(tǒng),對圖像的像素、文本或音頻進行微調(diào),嵌入人眼或人耳無法察覺的無形水印。但專門的檢測系統(tǒng)能夠識別出這些經(jīng)過處理的內(nèi)容是合成生成的圖像,無論其形式是音頻、圖像還是視頻。隨著此類技術(shù)日益普及,能夠輕松區(qū)分合成內(nèi)容和真實內(nèi)容的能力,其重要性將愈發(fā)凸顯。
AI 展現(xiàn)出巨大的潛力,有望幫助我們應對從氣候變化到公共健康等最嚴峻的全球性挑戰(zhàn)。但顯而易見,這項技術(shù)將深刻影響社會中的每一個人。因此,至關(guān)重要的一點是,相關(guān)決策不能僅由技術(shù)專家掌握,而需要社會各界的廣泛利益相關(guān)者參與深入的溝通和互動。令人欣喜的是,過去幾年 AI 的主流化帶來了積極的現(xiàn)象,許多國家的政府及社會各界都開始高度關(guān)注 AI。國際峰會的召開也極具意義,例如,英國幾年前在Bletchley Park主辦的首屆峰會,匯集了各國政府首腦、學術(shù)界和公民社會代表,共同探討如何為 AI 技術(shù)發(fā)展設立恰當?shù)摹白o欄”,確保我們既能擁抱機遇,又能有效減輕潛在風險。鑒于 AI 技術(shù)正以指數(shù)級的速度發(fā)展和改進,這種跨界對話與合作只會變得越來越重要。
對于如何推進 AI 發(fā)展,我的看法不同于硅谷盛行的“快速行動,打破常規(guī)”的信條。雖然這種模式催生了許多創(chuàng)新和我們?nèi)粘J褂玫募夹g(shù),但我認為它并不適用于 AI 這樣具有深遠變革力量的技術(shù)。恰恰相反,我們應該采用科學方法,以謙遜和尊重的態(tài)度對待它——這是這項技術(shù)應得的審慎。我們必須承認,關(guān)于 AI 的未來發(fā)展,仍有許多未知數(shù),它畢竟是一項非常新的技術(shù)。我相信,只要以極其審慎的態(tài)度和富有遠見的規(guī)劃來推進,就能夠充分發(fā)掘 AI 的益處,并將其潛在的負面影響降至最低。然而,這一切的前提是,我們必須從現(xiàn)在就開始相關(guān)的研究和深入討論。
我們目前正在構(gòu)建自己的大型多模態(tài)模型系列,稱為 Gemini。其目標是整合此前各種模型的精華與優(yōu)勢,構(gòu)建成一個統(tǒng)一強大的系統(tǒng)。最新發(fā)布的 Gemini 2.0 版本,在眾多領(lǐng)先的基準測試中均達到了當前最佳水平。我們正利用 Gemini 推動下一代助手的發(fā)展,我對這個方向充滿期待,并稱之為通用助手,內(nèi)部項目代號為 Project Astra。設想一下,你可以將這樣的助手安裝在手機、智能眼鏡或其他設備上,它就像一個能伴隨你進入現(xiàn)實世界的個人助手,幫助你豐富日常生活體驗,或提升工作效率。
AI 發(fā)展的下一步是將 AlphaGo 所展現(xiàn)的那類基于智能體的模型(它們能在游戲等有限領(lǐng)域內(nèi)高效搜索并找到優(yōu)良解決方案)與 Gemini 這類更通用的模型相結(jié)合。
我們期望將這類搜索與規(guī)劃系統(tǒng),構(gòu)建于(如 Gemini 所具備的)能夠理解現(xiàn)實世界運作方式的世界模型基礎(chǔ)之上,從而使其能夠在現(xiàn)實世界中進行規(guī)劃并達成目標。
這對于機器人技術(shù)的實現(xiàn)和應用至關(guān)重要。
我相信在未來兩到三年內(nèi),機器人技術(shù)將迎來飛躍性的進展,成為一個極其重要的領(lǐng)域。
最后,我想就這一切進展的深層意義提出一個推測,特別是回溯到 Alan Turing 為奠定計算機科學基礎(chǔ)所做的奠基性工作。從某種意義上說,我視自己為圖靈理念的傳承者和實踐者,致力于探索圖靈機和經(jīng)典計算的思想邊界究竟在哪里。我常常思考 P=MP 問題——這或許是受到了曾在此地聆聽的某場講座的啟發(fā)。作為計算機科學領(lǐng)域的著名難題,它探討的是:對于經(jīng)典計算系統(tǒng)而言,哪些類型的問題是容易解決的?
目前,量子計算領(lǐng)域的研究如火如荼,無論是在劍橋還是在 Google,都有許多杰出的工作正在進行。人們普遍認為,許多復雜問題,包括模擬眾多真實世界的系統(tǒng),都需要依賴量子計算才能解決。
然而,我的猜想是:經(jīng)典的圖靈機,即我們構(gòu)建AI系統(tǒng)所依賴的經(jīng)典計算機,其能力可能遠超我們過去的認知。以 AlphaFold 和蛋白質(zhì)折疊為例:蛋白質(zhì)本質(zhì)上是量子系統(tǒng),在原子尺度上運作。理論上似乎需要進行量子模擬才能精確解析其三維結(jié)構(gòu)。但我們卻成功地利用神經(jīng)網(wǎng)絡近似地解決了這個問題。
這啟發(fā)了我一個想法,任何在自然界中能夠生成或被發(fā)現(xiàn)的、具有真實物理結(jié)構(gòu)的模式,或許都能被像AlphaFold這樣的經(jīng)典學習算法高效地發(fā)現(xiàn)和建模。如果這個猜想最終被證實,它將對量子力學乃至基礎(chǔ)物理學產(chǎn)生極其深遠的影響。這也是我個人及眾多同事熱切希望探索的方向——借助這些日益強大的經(jīng)典 AI 系統(tǒng),我們或許能更深入地揭示現(xiàn)實世界的真正本質(zhì)。
這讓我回想起多年前我投身人工智能領(lǐng)域的初衷。我始終相信,以這種方式構(gòu)建的通用人工智能,能夠成為理解我們周圍宇宙以及我們在其中位置的終極通用工具。
觀眾1提問:在神經(jīng)科學領(lǐng)域,您是否遇到過您認為值得解決并且至今仍值得解決,以助于我們更好地理解生物智能和人工智能 的根節(jié)點問題?
確實有很多這樣的問題。我的博士研究課題就是記憶和想象力,也就是關(guān)于未來思考和規(guī)劃。我當時非常想弄清楚大腦是如何完成這些功能的。研究發(fā)現(xiàn)海馬體同時參與了這兩個過程,所以我們或許可以利用我們的一些算法來模擬它。因此,我認為這里面有很多關(guān)鍵點。當然,還有很多宏大的問題,比如創(chuàng)造力、夢境、意識等等。我認為,構(gòu)建AI,然后將其與人類心智進行比較,是我們在這些“根節(jié)點問題”上取得進展的最佳途徑之一。例如,意識的本質(zhì)是什么?大腦基質(zhì)的物理實現(xiàn)與在硅基上通過算法模擬它相比,是否存在某些特殊之處。
觀眾2提問:第一,DeepMind 是在深度學習革命之前成立的,如果深度學習沒有像后來那樣發(fā)展起來,當時的心態(tài)如何?又打算如何繼續(xù)前進?第二,鑒于您在處理極具挑戰(zhàn)性的高維問題方面經(jīng)驗豐富,且梯度下降及其變體只能達到局部最優(yōu)解,是否曾對這些系統(tǒng)竟然能起作用感到驚訝?另外,是否認為自然界在很大程度上是次優(yōu)的,因此有可能構(gòu)建一個更優(yōu)化的“自然”?
第一個問題很棒。將公司命名為 DeepMind,部分原因就是“Deep”指代深度學習。當時,深度學習的早期形式已開始普及,例如 Jeffrey Hinton 在幾年前發(fā)明的玻爾茲曼機和分層神經(jīng)網(wǎng)絡等技術(shù)。對于當時在學術(shù)界接觸它的人而言,這似乎是個極具前景的方向。我們押注的另一項技術(shù)是強化學習以及兩者的結(jié)合。強化學習對于解決 AlphaGo 這樣的問題至關(guān)重要。你需要深度學習來對環(huán)境和世界進行建模,然后需要強化學習來制定計劃、找到解決方案并在世界中采取行動。
強化學習現(xiàn)在再度流行,它對于解決 AlphaGo 這類問題也至關(guān)重要。這需要兩部分配合:深度學習用于對環(huán)境和世界建模,強化學習則用來制定計劃、尋找解決方案并在環(huán)境中行動。
我們當時之所以在它剛起步時就押注于此,主要基于兩點:首先,我們認識到經(jīng)典方法,即專家系統(tǒng),無法規(guī)模化。這也是我在求學和研究期間的體會之一——當時存在推崇專家系統(tǒng)的不同‘陣營’或‘學派’。從學習中不僅能了解該做什么,也能了解不該做什么,以及某些方法為何行不通。我當時思考過這些經(jīng)典方法,感覺它們永遠無法擴展到我想用人工智能解決的那類問題的規(guī)模。
相比之下,學習系統(tǒng)似乎擁有無限的潛力,盡管在初期讓它們?nèi)〉萌魏物@著進展要困難得多,主要因為它們的規(guī)模還不夠大。我們在 2010 年創(chuàng)立 DeepMind 的另一個原因是,我們看到計算范式在硬件層面正在發(fā)生轉(zhuǎn)變,GPU 等技術(shù)開始興起——GPU 最初也是為游戲發(fā)明的,結(jié)果發(fā)現(xiàn)智能、游戲和計算機圖形學,本質(zhì)上都是矩陣乘法。所有這些不同的影響因素匯集到了一起。
同時,在那之前的十年里,對神經(jīng)科學和 fMRI 技術(shù)的理解也取得了長足的進步。因此,我感覺 2010 年是將所有這些要素整合在一起的絕佳時機。我們當時下注,并非確信會成功,而是相當確信其他方法行不通。基本上,所謂的 AI 寒冬就是因為人們試圖強行推廣那些專家系統(tǒng)而導致的。
關(guān)于第二個問題,我想說的是,首先,這些系統(tǒng)最終能夠收斂,確實令人驚訝,我們起初并不確定。在最初的幾年里毫無進展。如果你還記得 Pong 這款早期電腦游戲,一種非常簡單的模擬網(wǎng)球游戲,我們甚至無法讓 AI 得到一分。所以我們當時就在想:我們是不是太超前了,早了 10 年或 20 年?就像 Babbage 和他的差分機一樣,想法很了不起,理論也行得通,但他最終還是早了 50 年甚至 100 年。我總是說,你希望自己領(lǐng)先時代五年,而不是五十年。否則,你會經(jīng)歷很多痛苦,就像 Babbage 那樣。我們當時確實擔心這一點,但后來算法確實收斂了,這給了我們信心去攻克更難的問題。至于問題中關(guān)于自然界的部分,我的看法是,它們并非次優(yōu),實際上可能已經(jīng)相當優(yōu)化。因為它們經(jīng)歷了漫長的進化過程——不僅僅是生物學意義上的生命進化,還包括地質(zhì)和物理層面上的演變。例如小行星和各種物理現(xiàn)象相互作用,它們能存續(xù)至今,是因為在漫長時間里保持了穩(wěn)定。如果一個系統(tǒng)能長期穩(wěn)定,其內(nèi)部很可能就蘊含著值得學習的結(jié)構(gòu)。這是我的推測。
觀眾3提問:您對構(gòu)建高帶寬腦機接口及可植入式記憶與推理模塊有何看法?這樣可以進一步增強人類自主進行探索發(fā)現(xiàn)的能力,而不僅僅是與云端的 AI 進行對話。
是的,我對此領(lǐng)域很感興趣并持續(xù)關(guān)注,也曾協(xié)助構(gòu)建腦電圖帽等設備。當然,目前的問題在于這些設備的分辨率,即從大腦讀取信號的精度,并且理想情況下我們希望它能同時具備讀寫功能。但我對 Neurolink 這類項目,即植入大腦的芯片,非常著迷。顯然,目前這些技術(shù)主要是為了幫助例如退伍軍人等群體恢復身體功能。我認為這方面將會有驚人的進展,比如讓脊柱受傷的人能夠重新行走等等。我相信醫(yī)學領(lǐng)域?qū)⑷〉靡恍┝钊瞬毮康膶嵸|(zhì)性進展。在此之外,如果將來這類技術(shù)變得常規(guī)化,手術(shù)足夠安全,并且有可靠的操作方法,那么我可以想象,這或許是人類跟上技術(shù)發(fā)展步伐的一種途徑。從某種意義上說,這與我們今天身邊無處不在的技術(shù)并無本質(zhì)不同。我們每個人幾乎全天候帶著手機,還有電腦等設備。我們幾乎已經(jīng)與技術(shù)處于一種共生狀態(tài)。當然,將設備植入體內(nèi)會是更進一步,但我不太確定。這兩種狀態(tài)——技術(shù)植入體內(nèi)與隨身攜帶技術(shù),其間的區(qū)別究竟在哪,是否存在明確的界限。
觀眾4提問:您提到 Genie 2 模型目前能維持幾秒鐘的連貫性,并希望最終達到分鐘級別。但我們玩的游戲,需要近乎無限的連貫性。那么,您認為這類模型未來將如何整合到實際工作流程中?或者更具體地說,您如何看待 AI、您的模型以及您當前的研究在未來幾十年內(nèi)融入游戲開發(fā)?
是的,我認為 AI 將從多個方面融入游戲領(lǐng)域。
首先是作為工具,用于構(gòu)建游戲所需資產(chǎn),如 3D 模型、動畫等。我認為這些在未來幾年內(nèi)就會出現(xiàn)。其次,AI 可用于游戲平衡性的調(diào)整。想象一下,你設計了一款游戲,AI 可在一夜間模擬百萬次游戲過程,第二天設計師就能收到報告,指出不平衡之處,比如某個單位能力過強等等。
再次,是 Bug 測試,特別是對于開放世界游戲。我以前制作過模擬游戲和開放世界游戲,它們的 Bug 測試極其困難,因為其特點是玩家行為高度自由,游戲需隨之響應。那么如何測試一千萬玩家在游戲中走出各自獨特的路徑呢?實際上,讓 AI 玩家在發(fā)布前進行大量測試,有助于發(fā)現(xiàn)并解決許多 Bug。
還有一點,我認為非常令人興奮,那就是更逼真的 AI 角色,它們能夠推動故事情節(jié)發(fā)展。我們曾夢想擁有這樣的大型多人在線世界:其中的 AI 角色具備智能,能根據(jù)玩家行為更新自身信念和故事線,從而讓世界感覺更加生動、真實。我認為我們正處在能夠構(gòu)建這類游戲的關(guān)口。
最后,關(guān)于我們正在構(gòu)建的世界模型,它更多關(guān)乎通用人工智能。它代表了理解世界的能力——你的模型是否理解世界?如果模型能在一定時間內(nèi)生成這個世界,顯然它必須在某種程度上理解其底層的物理規(guī)律。這更多是為了實現(xiàn)通用智能。至于像全息甲板那樣只需想象就能呈現(xiàn)一切的技術(shù),或許擁有 AGI 后可以實現(xiàn),但目前看還需要一段時間。
關(guān)于本期演講
訪談發(fā)布時間:2025年3月25日
原文地址:https://youtu.be/hHooQmmzG4k?si=6sgxV9hUiqvv5ETo
訪談人物:DeepMind 的聯(lián)合創(chuàng)始人兼CEO Demis Hassabis
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828

未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
截止到2月28日 ”未來知識庫”精選的100部前沿科技趨勢報告
熱門跟貼