作為 Google DeepMind 的聯合創(chuàng)始人兼 CEO,以及因在蛋白質結構預測領域的貢獻而獲得諾貝爾獎的科學家,德米斯·哈薩比斯(Demis Hassabis)毫無疑問是當今人工智能領域最具影響力的人之一。近期,通過一系列播客訪談及在英國劍橋大學的公開講座,哈薩比斯闡述了他對 AI 發(fā)展的看法、DeepMind 的研究路徑,以及 AI 在未來,尤其是在科學研究和現實世界應用中的潛力。
“AI 將影響整個世界,每個行業(yè),每個國家。在我看來,它將是有史以來最具變革性的技術,”哈薩比斯在與 LinkedIn 聯合創(chuàng)始人 Reid Hoffman 主持的 Possible 播客節(jié)目中開宗明義地指出。他將 AI 的潛在影響力比作“電力或火”,并強調全球參與其設計的重要性,認為這不應僅僅局限于硅谷的“百平方英里加州地塊”。他認為,吸納來自不同地域、不同學科(如哲學、社會科學、經濟學)乃至更廣泛社會群體的觀點,“不僅僅是科技公司和科學家”,共同決定 AI 的構建方式和應用方向,至關重要。
這份思考,源于一段始于棋盤而非機房的獨特旅程。


棋盤上的頓悟:“思考‘思考’本身”
哈薩比斯的早年生活幾乎被國際象棋占據。自四歲學棋起,他便展現出驚人天賦,曾擔任英國青少年隊隊長,一度立志成為國際象棋特級大師,甚至世界冠軍?!澳菐缀跏俏艺麄€童年。”他回憶道,“所有課余時間,我都在世界各地參加比賽,與成年棋手對弈?!?/p>
然而,大約 11 歲時,一次深刻的自我反思改變了他的人生軌跡?!埃ㄏ缕澹┱娴氖且粋€人應該傾注一生的事業(yè)嗎?這是對我才智的最佳運用嗎?”這種內省恰逢他在英國國家隊訓練營中接觸到早期象棋計算機。本意是提升棋藝,哈薩比斯卻被一個更根本的問題所吸引:一個“沒有生命的塑料塊”如何能下得如此出色?
“我更著迷的是,有人編寫程序讓它做到了這一點……我非常想理解其中的原理,并最終嘗試編寫自己的象棋程序?!边@標志著他轉向了元認知(metacognition)——如 Hoffman 所說的,“思考‘思考’本身”。他的焦點從精通游戲轉向了理解智能過程的本質,以及如何利用計算來加速這一過程。
盡管如此,早期 AI 的局限性也讓他感到些許“失望”。他提到了著名的“深藍”(Deep Blue)對戰(zhàn)卡斯帕羅夫(Garry Kasparov)的比賽。當時已在劍橋大學學習神經科學的哈薩比斯表示,自己“對卡斯帕羅夫的大腦印象更深……而非那臺機器”。作為“專家系統(tǒng)”(expert system)方法的巔峰之作,“深藍”依賴于人類程序員精心編寫的啟發(fā)式規(guī)則(heuristics)和強大的蠻力搜索(brute force search)。它能達到世界頂尖的象棋水平,但除此之外,若不重新編程,連井字棋(tic-tac-toe)都不會下。
‘深藍’看起來……并不智能,“哈薩比斯表示,它缺少的是學習新事物的能力……而且它不像人腦那樣具有通用性。我認為這些(學習能力和通用性)才是智能的標志……是我們破解 AI 難題所必需的?!?/strong>
這些認識為 2010 年 DeepMind 的創(chuàng)立奠定了基礎。在專家系統(tǒng)仍占主導、AI 研究某種程度上處于“寒冬”之時,哈薩比斯和他的同事們做出了一個逆向押注:專注于學習系統(tǒng)。公司名稱中的“Deep”部分,正是指向了“深度學習”(deep learning)這種受大腦結構啟發(fā)的層級化神經網絡技術。
更關鍵的是,DeepMind 將深度學習與強化學習(RL, Reinforcement Learning)相結合,后者同樣源于對動物行為和神經科學的研究。強化學習的核心是通過試錯來學習,在環(huán)境中采取行動,根據結果獲得獎勵或懲罰,最終目標是最大化累積獎勵。“這基本上是人腦工作的兩大核心組成部分?!惫_比斯解釋說,“大腦是一個神經網絡,一個模式匹配和結構發(fā)現系統(tǒng)。但它同時也有強化學習機制……(大腦中的)多巴胺系統(tǒng)就實現了這一點?!?/p>
這種生物學上的合理性,在 AI 研究的寒冬時期給予了他們極大的信心?!爱斈闵硖幧衬阈枰魏嗡椿蜃C據來指引方向……而當時的 AI 正處于這種困境,因為之前的嘗試(專家系統(tǒng))多次失敗,基本走到了天花板?!盌eepMind 開創(chuàng)性地將這兩種方法融合為“深度強化學習”(deep reinforcement learning),創(chuàng)造出能夠從零開始學習復雜任務的智能體(agent)。

AlphaGo、“上帝之手”與創(chuàng)造力的本質
游戲成為了檢驗和完善這些理念的完美“坩堝”。它們提供了可控的環(huán)境、明確的目標(獲勝、最大化得分)、可量化的進展(Elo 等級分),以及與人類頂尖專家進行校準的機會。而終極挑戰(zhàn),便是古老的圍棋。
圍棋的復雜度遠超象棋——哈薩比斯指出,其可能的狀態(tài)數估計高達 10 的 170 次方,“比宇宙中的原子還多”。蠻力計算毫無可能。此外,圍棋高度依賴直覺;頂尖棋手常常難以清晰描述其落子背后的邏輯,只是說感覺“對”。這種基于模式識別和美感的特性,讓傳統(tǒng)專家系統(tǒng)束手無策。
DeepMind 的 AlphaGo 采用了不同的策略。它通過觀察數百萬局人類棋譜進行學習,隨后又與自身進行了數百萬局的對弈。它發(fā)展出了自己對“好”的模式、棋形和致勝局面的理解。2016 年,AlphaGo 在首爾與世界冠軍李世石進行了一場載入史冊的人機大戰(zhàn)。決定性的時刻出現在第二局:第 37 手。
“那是一步真正充滿創(chuàng)造力的棋?!惫_比斯回憶道。圍棋已有數千年歷史,其策略已被深入探索。然而,第 37 手前所未見,甚至最初被頂尖解說認為是失誤。“他們以為操作員 Aja 點錯了鼠標……因為那一步太不可思議了。”哈薩比斯說。但在一百多手之后,這步棋被證明是制勝的關鍵。

第 37 手(常被稱為“神之一手”)完美詮釋了哈薩比斯所定義的第二層次創(chuàng)造力:外推(extrapolation)。“你從已知信息出發(fā)進行推演,得出一個前所未見的新策略,就像第 37 手。這本身就非常有價值?!?/strong>這與第一層次的內插(interpolation,例如從數百萬張貓的圖片中生成一張平均的貓臉)以及尚難企及的第三層次——發(fā)明(invention)或“跳出框架思考”(out-of-the-box thinking)——形成對比。AI 能否發(fā)明圍棋本身?或者基于 1900 年代的信息推導出廣義相對論?“顯然,今天的答案是否定的,”哈薩比斯坦誠,“仍然缺少一些東西……但我認為它(真正的創(chuàng)造力)終將到來?!?/p> DeepMind 隨后通過 AlphaStar 繼續(xù)拓展邊界,挑戰(zhàn)了復雜的即時戰(zhàn)略(RTS, Real-Time Strategy)電子游戲《星際爭霸 II》(StarCraft II)。與圍棋不同,《星際爭霸》包含不完美信息(玩家無法看到全部地圖)、實時決策和資源管理等要素。為了攻克這一難關,DeepMind 設計了一個“智能體聯盟”(league of agents),讓不同的 AI 策略在內部聯賽中相互競爭。獲勝的策略得以進化,并產生新的變種,形成一種類似演化的動態(tài)過程,最終培養(yǎng)出能夠擊敗頂尖職業(yè)玩家的智能體。這成功解決了部分信息環(huán)境下的決策問題,向模擬真實世界挑戰(zhàn)邁進了一大步。 哈薩比斯將這種利用游戲的方式與“游戲的人”(Homo Ludens)概念聯系起來,認為玩耍是人類經驗的基礎,它不僅孕育創(chuàng)造力,也提供了一個安全的“練習場”,讓人們可以在壓力下模擬和訓練關鍵決策能力。因此,游戲不僅是基準測試,更是開發(fā)通用 AI 能力的理想訓練場。 從像素到蛋白質:AlphaFold 與“數字生物學”的黎明 在證明了學習系統(tǒng)在復雜游戲領域的強大能力后,哈薩比斯和 DeepMind 轉向了他們的終極目標:利用 AI 加速科學發(fā)現?!拔耶吷铝τ?AI 工作的全部意義,就是用它來加速科學發(fā)現?!彼麖娬{。他將目光投向了他所謂的“根節(jié)點問題”(root node problems)——那些一旦解決,就能解鎖整個全新知識分支的基礎性科學難題。 蛋白質折疊問題(protein folding problem)正是他任務清單中的重中之重。蛋白質是生命的基石,其復雜的三維結構決定了其功能。理解這些結構對于揭示疾病機理和設計藥物至關重要。然而,僅根據蛋白質的氨基酸線性序列預測其三維形狀,是一個困擾了科學家 50 年的巨大挑戰(zhàn)(因可能構象數量龐大,也被稱為“Levinthal 悖論”)。 運用在游戲 AI 中磨練出的技術,DeepMind 開發(fā)了 AlphaFold。2020 年,它在國際蛋白質結構預測關鍵評估競賽(CASP,Critical Assessment of protein Structure Prediction)中展現出驚人的準確性,被廣泛認為有效解決了該問題。隨后,DeepMind 使用 AlphaFold 預測了幾乎所有已知蛋白質(超過 2 億種)的結構,并將這個龐大的數據庫免費開放給全球科學界。 其影響是革命性的。“這就像在一年內完成了十億年的博士研究時間,”哈薩比斯在劍橋講座中提到?!叭蛴袃砂偃f研究人員正在使用它……已被引用超過三萬次,并已成為生物學研究的標準工具?!边@項成就為哈薩比斯和 DeepMind 的同事 John Jumper 贏得了 2024 年諾貝爾化學獎。 AlphaFold 不僅是一項生物學突破,更預示著哈薩比斯所稱的“數字生物學”(digital biology)新紀元的到來?!澳壳伴_發(fā)一種新藥平均需要 10 年時間……耗資數十億美元,”他說,“我們?yōu)槭裁床荒芾眠@些(AI)技術,將這個時間從數年縮短到數月?甚至,未來某一天,縮短到數周?就像我們將蛋白質結構發(fā)現的時間從過去的數年縮短到了分鐘乃至秒級一樣?!八J為,AI 有潛力成為描述生物學的“完美語言”。 邁向現實世界:多模態(tài)、機器人與通用智能助理 隨著 AlphaFold 的成功,DeepMind 的研究重心愈發(fā)轉向現實世界的應用。哈薩比斯強調了多模態(tài)的重要性,即讓 AI 能夠像人類一樣,同時處理和理解多種類型的信息輸入,如文本、圖像、音頻和視頻。 “我們生活在一個多模態(tài)的世界,”他解釋道,“如果我們希望 AI 系統(tǒng)成為出色的工具或助手,它們最終需要理解我們所處的空間和時間世界,而不僅僅是語言或抽象思維世界?!?/p> 這直接關系到機器人技術的未來。過去,人們普遍認為機器人需要通過物理互動(即所謂的“具身智能”,embodied intelligence)才能真正理解物理世界。然而,哈薩比斯指出,DeepMind 最新的視頻模型(如 Veo 2)僅通過觀看海量YouTube視頻,似乎就能掌握相當程度的物理常識,這讓他也感到震驚。這表明,強大的多模態(tài)基礎模型經過微調后,可能無需大量額外的機器人數據就能應用于機器人控制,這或許會大大加速機器人技術的發(fā)展。 DeepMind 正在推進一個名為“Project Astra”的研究原型,旨在打造“通用智能助理”(universal assistant)?!八梢栽谀愕氖謾C或其他設備上運行,也許是眼鏡。它能伴隨你在現實世界中活動,幫助你處理日常生活中的事務?!惫_比斯描述道。例如在烹飪時提供實時指導,或識別周圍環(huán)境中的物體。這種助理的核心是能夠理解 3D 世界并進行規(guī)劃的多模態(tài)模型,如 DeepMind 的 Gemini 系列。 同時,AI 也在改變軟件開發(fā)本身。哈薩比斯認為最近爆火的“vibe coding”代表了編程的未來,開發(fā)者主要通過自然語言與 AI 協作編程,將低層實現細節(jié)交給 AI 處理。這將極大地降低編程門檻,賦能設計師、藝術家等創(chuàng)意人士將想法變?yōu)楝F實,并使專業(yè)程序員的效率提升“10 倍”,實現人機協同創(chuàng)作的新模式。 此外,未來 10 到 15 年,哈薩比斯最希望看到的是 AI 在醫(yī)學領域帶來突破性進展,實現“數字速度的科學”(science at digital speed),大幅加速新藥研發(fā),甚至“真正有機會解決所有疾病”。 他甚至提出了一個猜想:基于經典計算(圖靈機)的 AI 系統(tǒng),其潛力可能遠超我們目前的認知,或許有一天能夠幫助人類探索量子力學乃至宇宙的基本規(guī)律。“我一直認為,以這種方式構建的通用人工智能,可能成為理解我們周圍宇宙以及我們在其中位置的終極通用工具?!?/strong>哈薩比斯說道。 參考資料: 1.https://www.possible.fm/podcasts/demis/ 2.https://www.cst.cam.ac.uk/nobel-laureate-and-cambridge-university-alumnus-sir-demis-hassabis-heralds-new-era-ai-drug-discovery 運營/排版:何晨龍
熱門跟貼