從天空到海洋,從生命科學(xué)到化學(xué)、物理學(xué),AI是否能成為推動(dòng)科技創(chuàng)新的核心動(dòng)力?
生成式AI的崛起以人們想不到的形態(tài)出現(xiàn),一如理科生的考卷由文科生批改。
席卷生活的方方面面之后,AI又以迅雷不及掩耳之勢,叩擊科學(xué)殿堂的大門。
一個(gè)時(shí)代、一個(gè)領(lǐng)域只有一個(gè)發(fā)展的“主范式”,與范式吻合才能踩在歷史發(fā)展進(jìn)步的一邊,但范式本身有慣性,所以每一代新的范式轉(zhuǎn)換都需要付出努力和代價(jià)。
AI4S就是范式轉(zhuǎn)換的重要表征,它不以人的主觀意志為轉(zhuǎn)移,也不能人為的對抗范式轉(zhuǎn)換。但是,它也不會(huì)自然降臨,每個(gè)范式轉(zhuǎn)換期都要付出巨大的勞動(dòng)甚至代價(jià),而只有經(jīng)歷這個(gè)過山車式的過程并始終不被甩出第一梯隊(duì),才能最終駕馭范式轉(zhuǎn)換帶來的紅利,能駕馭范式轉(zhuǎn)換的才能笑到最后。
關(guān)于AI4S最前沿的理論、實(shí)踐和爭論,都在這篇文章里。
——導(dǎo)語
01
故宮里的計(jì)算機(jī)——計(jì)算科學(xué)研究的歷史敘事與現(xiàn)實(shí)突破
人類歷史上得到普遍認(rèn)可的較早期的機(jī)械式計(jì)算機(jī)之一,是1642年法國哲學(xué)家兼數(shù)學(xué)家布累斯·帕斯卡發(fā)明的加法器(Pascaline)。
帕斯卡發(fā)明它的目的,是為幫助父親減少稅務(wù)計(jì)算上的勞作;而此后,二進(jìn)制和微積分的發(fā)明者萊布尼茨在加法器的基礎(chǔ)上,發(fā)明了人類第一臺可進(jìn)行四則運(yùn)算的機(jī)械計(jì)算機(jī)。
帕斯卡自己親手制作了50臺加法器,而后,人們又生產(chǎn)了許多復(fù)制品。據(jù)說,在中國的故宮博物院,也保存著兩臺銅制的復(fù)制品,是當(dāng)年外國人送給慈禧太后的禮品,但“老佛爺”哪里懂得它的奧妙,只把它當(dāng)成了西方的洋玩具,藏在深宮里面。
此后的幾個(gè)世紀(jì)里,機(jī)械式計(jì)算機(jī)、機(jī)電式計(jì)算機(jī)和現(xiàn)代意義上的電子計(jì)算機(jī)相繼出現(xiàn),但某種程度上,它們都有一個(gè)共同的前提——目的就是發(fā)明一個(gè)“代替人做數(shù)學(xué)計(jì)算”的機(jī)器。
某種意義上,人類在現(xiàn)代科學(xué)技術(shù)上真正的進(jìn)步,是從上世紀(jì)50年代開始的。因?yàn)橛辛舜笮碗娮佑?jì)算機(jī),并且基于機(jī)器計(jì)算的原理發(fā)展出來了許許多多的算法,我們才可以普遍的實(shí)現(xiàn)了從基本原理出發(fā)來解決實(shí)際問題。
基本原理雖然此前就存在,但就效率而言,用它解決實(shí)際問題是非常困難、幾乎做不到的。
例如,我們經(jīng)常聽說天才科學(xué)家破解密碼的故事,但這幾乎是不可復(fù)制的;而現(xiàn)在的黑客,哪怕數(shù)學(xué)知識粗淺,只要下載一個(gè)工具,在破解密碼的速度上就可以超過許多百年前的天才。
之所以能如此,這是因?yàn)槌绦蚶镆呀?jīng)內(nèi)置了一代又一代的計(jì)算機(jī)科學(xué)家開發(fā)和改善過的算法,而這些算法又基本有一個(gè)共同的出發(fā)點(diǎn):可以用多項(xiàng)式來逼近一般的函數(shù),從本質(zhì)上來說,這是牛頓、萊布尼茨的時(shí)代就發(fā)明出來的,但只有依賴現(xiàn)代計(jì)算機(jī),才能使之真正的被應(yīng)用于現(xiàn)實(shí)。
最早的計(jì)算機(jī)出現(xiàn)是為了把數(shù)學(xué)家從繁冗、人力所不能及的數(shù)學(xué)計(jì)算中解脫出來,但在摩爾定律加持之下,人類計(jì)算能力得以快速增加,這是它被用于科研進(jìn)而邁進(jìn)公眾生活的一個(gè)前提。
其中一個(gè)重要的里程碑,是“四色問題”的解決。
它提出于1852年,是英國制圖師弗朗西斯·古特里的一個(gè)假說。他指出,無論地圖上有多少個(gè)國家,只需要四種顏色就可以對地圖進(jìn)行著色,并且相鄰的國家顏色不會(huì)相同。
這個(gè)假說難以證明,主要是因?yàn)樯婕褒嫶蟮挠?jì)算量。因此,足足過了120多年,到了1976年才由美國的兩位數(shù)學(xué)家用計(jì)算機(jī)證明了這個(gè)假說,這背后是1200多個(gè)機(jī)器小時(shí)中進(jìn)行的100億次判斷所支撐的。

如果說圖靈時(shí)代的炸彈機(jī)、巨人機(jī)只是輔助數(shù)學(xué)家運(yùn)算一些步驟。那么,四色問題的解決則是在人類設(shè)定程序(算法)后,完全由計(jì)算機(jī)完成的證明。歷史在這里前進(jìn)了一大步——計(jì)算機(jī)正式走到了解決科學(xué)問題的舞臺上, 計(jì)算數(shù)學(xué)、計(jì)算力學(xué)、計(jì)算化學(xué)、計(jì)算生物學(xué)等交替出現(xiàn)。
比四色問題的解決更具有標(biāo)志性意義的,是現(xiàn)代計(jì)算機(jī)科學(xué)的最前沿——人工智能技術(shù)與科學(xué)的結(jié)合,而其代表事件則是2024年諾貝爾化學(xué)獎(jiǎng)的頒發(fā)。
這次由三人分享的化學(xué)獎(jiǎng)中,來自谷歌的英國科學(xué)家哈薩比斯和江珀的工作十分醒目,他們開發(fā)了一種名為AlphaFold2的人工智能模型,這種模型解決了一個(gè)已有50年歷史的難題,能夠預(yù)測大約兩億種已知蛋白質(zhì)的復(fù)雜結(jié)構(gòu),并且已被全球200多萬人使用。
我們可以借助對這個(gè)迷人案例的解析,來看看AI特別是深度學(xué)習(xí)是如何幫助人類解決頂級科學(xué)難題。
蛋白質(zhì)結(jié)構(gòu)是指蛋白質(zhì)分子的空間結(jié)構(gòu)。作為和我們息息相關(guān)的一類重要的生物大分子,了解清楚它的結(jié)構(gòu),對生命科學(xué)研究至關(guān)重要。
通過分析蛋白質(zhì)的結(jié)構(gòu),人們可以確認(rèn)它們的生理功能,這樣在遺傳學(xué)的實(shí)踐上就有很大的現(xiàn)實(shí)意義;同時(shí),它還可以為人們設(shè)計(jì)新的蛋白質(zhì)或改造已有蛋白質(zhì)提供可靠的依據(jù),而這就是當(dāng)今世界上基于精準(zhǔn)蛋白質(zhì)靶點(diǎn)的“救命神藥”的發(fā)明速度越來越快的背后推動(dòng)力。
但是這其中涉及到海量的計(jì)算,因?yàn)榈鞍踪|(zhì)結(jié)構(gòu)非常復(fù)雜。
解決蛋白質(zhì)結(jié)構(gòu)預(yù)測問題一直是結(jié)構(gòu)生物學(xué)的圣杯。在深度學(xué)習(xí)介入之前,人類依賴電子顯微鏡對蛋白質(zhì)進(jìn)行實(shí)際觀測,已經(jīng)做了大量艱苦的工作,并據(jù)此產(chǎn)生了蛋白質(zhì)數(shù)據(jù)庫(PDB)。
簡單來說,蛋白質(zhì)預(yù)測有兩條路徑——打個(gè)比方,TBM方法就是用采集到的指紋和已有的指紋庫相對比,一旦比中,就可以高度確信,但短板是數(shù)據(jù)庫中必須已經(jīng)有可靠的指紋;而FM方法則類似于在白紙上憑借想象力畫畫,其本質(zhì)是非常復(fù)雜的函數(shù)運(yùn)算。
人類從1994年起就設(shè)立了蛋白質(zhì)預(yù)測的獎(jiǎng)項(xiàng),但其中FM方向一直得分很低,大多數(shù)只有20到40分。
但AlphaFold的出現(xiàn)改變了這一切,其中的Fold指的就是“折疊”——2018年,AlphaFold采用深度學(xué)習(xí)基礎(chǔ)上的FM預(yù)測策略,通過三個(gè)系統(tǒng)支撐(建模、預(yù)測、優(yōu)化),出道就拿下當(dāng)年蛋白質(zhì)預(yù)測大獎(jiǎng);2020改進(jìn)后的模型AlphaFold2在第14屆CASP競賽上進(jìn)一步大殺四方,在給定預(yù)測蛋白質(zhì)中GDT平均得分92.4,遠(yuǎn)超所有競爭對手。
至此,深度學(xué)習(xí)支撐下的蛋白質(zhì)預(yù)測取得歷史性進(jìn)展,也開始消融TFM和FM之間的間隔,人類對于蛋白質(zhì)結(jié)構(gòu)預(yù)測乃至設(shè)計(jì)的能力得到極大增強(qiáng)。
可以說,哈薩比斯等學(xué)者的成就,和當(dāng)年四色問題的證明可以相提并論,同樣是計(jì)算服務(wù)于科研的里程碑事件。人們由此認(rèn)為,AI在未來科學(xué)研究中成為中堅(jiān)力量的可能性大幅度提升,一個(gè)新的時(shí)代即將開啟。
02
AI4S的中國故事開寫
在今天,用AI服務(wù)于科研被稱為“科學(xué)智能”,但人們往往使用一個(gè)更通俗的簡稱:AI4S(AI for Science的縮寫),值得自豪的是,這個(gè)名稱是兩位中國科學(xué)家提出的。
今天,在中國開展AI4S的研究,具有許多有利的條件。在筆者看來,有三個(gè)條件比較重要:
1.國家重視和中國科學(xué)家的AI4S意識早已覺醒;
2.中國的算力,特別是AI算力的基礎(chǔ)設(shè)施非常發(fā)達(dá),在全球數(shù)一數(shù)二;
3.AI4S的實(shí)踐日益展開,已經(jīng)在許多領(lǐng)域得到實(shí)證,理論基礎(chǔ)也正在探索和夯實(shí);
關(guān)于第一點(diǎn),中國科學(xué)院的湯超院士是這樣描述的:“好幾年前,鄂維南(北京大數(shù)據(jù)研究院院長、中國科學(xué)院院士)找到我,商量是否可能在北大設(shè)立一個(gè)交叉學(xué)科的項(xiàng)目,用來探索機(jī)器學(xué)習(xí)在不同的科學(xué)和工程領(lǐng)域的應(yīng)用。我們給它取了一個(gè)名字,叫AI for Science。我們兩個(gè)當(dāng)時(shí)都很為這個(gè)名字得意。現(xiàn)在來看,應(yīng)該是很多人都想到了這個(gè)名字,AI for Science也成為了一個(gè)趨勢”。
而這件事更大的背景是,國家自然科學(xué)基金委在2020年底設(shè)立了交叉科學(xué)部,來統(tǒng)籌基金委在交叉科學(xué)領(lǐng)域的整體資助工作,其中任務(wù)之一就是探索建立交叉科學(xué)研究范式,而交叉科學(xué)部成立以來的第一個(gè)重大研究計(jì)劃就是在AI for Science方向的。
所以嚴(yán)格來講,AI4S的概念是中國科學(xué)家提出的,而這個(gè)方向得到了國家的大力支持。某種程度上,這也說明中國科學(xué)家的思路越來越具有超前性,對國際頂級前沿技術(shù)的感知和參與,已經(jīng)在完成一個(gè)“從跟隨到開創(chuàng)”的新階段。
第二點(diǎn),中國有世界上最好的智能算力基礎(chǔ)設(shè)施之一。
從整體規(guī)模上來說,截至2023年底,我國提供算力服務(wù)的在用機(jī)架數(shù)達(dá)到810萬標(biāo)準(zhǔn)機(jī)架,各類算力提供主體超5000家,算力總規(guī)模位居全球第二,成為AI4S的基礎(chǔ)條件之一。
但是,僅僅看算力的總規(guī)模是不夠的,還要看算力平臺的對AI的親和度。
以華為云為例,就以系統(tǒng)性創(chuàng)新,重新定義了云基礎(chǔ)設(shè)施??梢詽M足隨著計(jì)算場景的多元化以及智能算力需求飛速增長而不斷產(chǎn)生的新需求。
最傳統(tǒng)的云計(jì)算中心,是以CPU為中心的主從架構(gòu),但這很難滿足以GPU為核心的智算需求。
同時(shí),科學(xué)家們發(fā)現(xiàn),在某種程度上,用通用算力(CPU、GPU)來滿足特定場景的需求,存在成本高、能耗高的問題。因此專用集成電路的概念開始盛行,針對不同的AI計(jì)算場景,又發(fā)展出了NPU(神經(jīng)網(wǎng)絡(luò)處理器)、TPU(針對專門為加速深層神經(jīng)網(wǎng)絡(luò)運(yùn)算能力的芯片)、DPU(深度學(xué)習(xí)處理器)等等。
但是,不同架構(gòu)和方向的處理器如何整合和調(diào)度又成了大問題,這就像好一輛車卻裝上了好幾個(gè)發(fā)動(dòng)機(jī),沒有協(xié)調(diào)好是開不走的。
各種基于不同需求、不同技術(shù)棧而研發(fā)的芯片如果不能協(xié)同,反而成為一盤散沙。在這個(gè)背景下,華為云研發(fā)了CloudMatrix架構(gòu),就像讓一只雄獅帶領(lǐng)著一群羚羊去戰(zhàn)斗,這種架構(gòu)實(shí)現(xiàn)了“一切可池化”,讓CPU、NPU、GPU、高速內(nèi)存等多樣資源統(tǒng)一抽象,被放進(jìn)一個(gè)資源池里?;诰畹恼{(diào)動(dòng),相比傳統(tǒng)單體算力,這種緊耦合矩陣算力規(guī)模提升了一個(gè)數(shù)量級以上。
此外,“一切皆對等”指通過超高帶寬的Scale Up網(wǎng)絡(luò),打破單體算力性能和集群線性度瓶頸,以盤古大模型訓(xùn)練為例,效率可提升68%;“一切可組合”則指通過瑤光智慧云腦提供NPU、GPU、CPU、內(nèi)存等資源按需組合,通過匹配最優(yōu)算力組合,實(shí)現(xiàn)百億到萬億級模型訓(xùn)練所需的資源。
另外,基于自主創(chuàng)新的AI底層硬件,華為云昇騰AI云服務(wù)整合了大規(guī)模算力集群、計(jì)算引擎CANN、AI 開發(fā)框架MindSpore、ModelArts AI 開發(fā)生產(chǎn)線和ModelArts Studio大模型即服務(wù)平臺,為大模型的訓(xùn)練,推理,AI 應(yīng)用的開發(fā)、運(yùn)行提供穩(wěn)定可靠的全棧算力保障。
舉一個(gè)很容易理解的例子,以一個(gè)常見的萬卡大集群為例,由于涉及到數(shù)十萬計(jì)的處理器、內(nèi)存、存儲陣列、跨網(wǎng)絡(luò)的高度并行和滿負(fù)荷運(yùn)轉(zhuǎn),經(jīng)常會(huì)出現(xiàn)因?yàn)椴糠钟布p壞和軟件故障導(dǎo)致的訓(xùn)練中斷。
一位AI專家告訴我,早期的大模型訓(xùn)練經(jīng)常運(yùn)行幾分鐘、十幾分鐘就會(huì)中斷,而即使經(jīng)過多次迭代,平均可持續(xù)水平也不超過3天。
但針對萬億模型訓(xùn)練這個(gè)典型場景,昇騰AI云服務(wù)已經(jīng)可實(shí)現(xiàn)40天無中斷,是業(yè)界標(biāo)準(zhǔn)的十幾倍乃至幾十倍。
由此可以說,目前我們已經(jīng)擁有世界級的高AI親和度的智算基礎(chǔ)設(shè)施,這是實(shí)現(xiàn)AI4S的重要前提之一。

因此,第三點(diǎn)也呼之欲出。
如鄂維南院士就指出,科學(xué)研究總體上可分成基于數(shù)據(jù)驅(qū)動(dòng)的開普勒范式和基于原理驅(qū)動(dòng)的牛頓范式,這兩種范式在現(xiàn)代遇到了各自的挑戰(zhàn),但這一挑戰(zhàn)又有一個(gè)共同的解決方向——“缺乏有效手段解決高維數(shù)學(xué)問題,是阻礙科學(xué)研究與技術(shù)發(fā)展取得進(jìn)一步突破的主因之一。而深度學(xué)習(xí),或者說人工智能,可以幫助解決這個(gè)問題“。
各個(gè)學(xué)科都有一些基本規(guī)律,其特點(diǎn)是都以微分方程呈現(xiàn),而且都是非常困難的微分方程。
而AI大模型在這方面優(yōu)勢明顯。
鄂維南指出,傳統(tǒng)的計(jì)算機(jī)算法基于用多項(xiàng)式逼近一般的函數(shù),但在目前的科研領(lǐng)域遇到的問題是,依賴的變量太多了。隨著變量個(gè)數(shù)(也就是維數(shù))的增加,計(jì)算的復(fù)雜度呈指數(shù)級增加,這就是維數(shù)災(zāi)難,而多項(xiàng)式方法對此是無效的。
反之,AI對于多維問題反而是好手,以大模型“最拿手”的人臉識別為例,“每個(gè)像素都是1個(gè)自由度,這里一共有32x32=1024個(gè)維度;此外,顏色空間有三維,所以再乘以3,每一個(gè)圖像都可以看成是3072維空間的一個(gè)點(diǎn),所以Cifar10的分類問題可以看成是尋找一個(gè)3072維空間上的函數(shù)。這樣的高維函數(shù)以前我們是根本沒辦法處理的”。
但這對深度學(xué)習(xí)大模型來說,恰是強(qiáng)項(xiàng)。
由此可見,從科學(xué)研究的角度來說,深度學(xué)習(xí)可以帶來新的計(jì)算方法、新的科學(xué)模型和新的實(shí)驗(yàn)方法,這似乎已經(jīng)是不爭的事實(shí)。
但在實(shí)踐中呢?
03
在實(shí)踐中成長
在主流科學(xué)界認(rèn)知到位和軟硬件支撐條件均已十分完備的情況下,中國的AI4S擁有了一個(gè)非常良好的開局。
讓國人驕傲的C919大飛機(jī)現(xiàn)在已經(jīng)在國航、東航和南航的航線上發(fā)揮作用,正在研發(fā)的C929和C939更是國人心心念念的“國之重器”。
也正是因?yàn)榇耍袊逃蔑w機(jī)公司聯(lián)合華為發(fā)布的業(yè)界首個(gè)工業(yè)級流體仿真大模型“東方御風(fēng)”,就更加受到關(guān)注。
很多網(wǎng)民津津樂道的是,為什么中國最近飛行器的研發(fā)周期屢屢打破此前的世界紀(jì)錄?
很多人都知道,中國的風(fēng)洞技術(shù)全球領(lǐng)先,這是近年來中國飛行器研究屢屢取得突破的重要原因。
此話不假。但是,這其中也有AI技術(shù)的功勞。AI4S的方式,在一定程度上顛覆了飛行器的研發(fā)周期率。
人們很少知道的是,一個(gè)超級風(fēng)洞不僅造價(jià)高昂,而且使用成本極高。其驅(qū)動(dòng)功率動(dòng)則超過1萬兆瓦。
更重要的是,高級別風(fēng)洞的穩(wěn)定輸出時(shí)間極短,100毫秒往往已經(jīng)是極限。
所以,在絕大多數(shù)真實(shí)研究中,吹風(fēng)洞只能解決一部分問題,而持續(xù)的優(yōu)化和模擬運(yùn)行,則要依靠計(jì)算機(jī)模擬,這就是我們前面談到的計(jì)算科技的一個(gè)重要分支——計(jì)算流體力學(xué)(CFD)。
用計(jì)算機(jī)仿真模擬來解決流體力學(xué)問題,從上世紀(jì)50年代就開始發(fā)展,隨著計(jì)算機(jī)算力的增長和軟件的升級,其能力已經(jīng)十分成熟。
甚至,有人一度鼓吹——數(shù)字風(fēng)洞可以取代傳統(tǒng)風(fēng)洞。
但魔鬼在細(xì)節(jié)里——一位航空專家告訴我——由于在計(jì)算時(shí)所提供的計(jì)算模型,并不能包含所有實(shí)際流動(dòng)的細(xì)節(jié),所以數(shù)值模擬結(jié)果可以預(yù)測實(shí)驗(yàn)器件的氣動(dòng)性能變化規(guī)律,但是不能反映實(shí)際的各種流動(dòng)細(xì)節(jié),因此真實(shí)風(fēng)洞試驗(yàn)仍不可或缺。
而之所以不足以反映各種細(xì)節(jié),有軟件設(shè)計(jì)、數(shù)值設(shè)置的問題,但還有一個(gè)更重要的問題,就在于我們前面提到的高維問題——因?yàn)閷?shí)際變量細(xì)節(jié)太多,導(dǎo)致計(jì)算維度太高,傳統(tǒng)仿真計(jì)算效果不夠好。
例如,在設(shè)計(jì)飛機(jī)翼型時(shí),當(dāng)攻角發(fā)生變化時(shí),流場會(huì)發(fā)生劇烈的變化,甚至出現(xiàn)激波現(xiàn)象。而激波前后的流場變化劇烈、復(fù)雜,導(dǎo)致無論是傳統(tǒng)的CFD,還是一些傳統(tǒng)的AI算法都會(huì)預(yù)測困難。
而“東方御風(fēng)”的強(qiáng)悍就在于,使用用更新后的AI模型替換傳統(tǒng)Navier-Stokes方程求解,提升了典型場景的仿真效率,而且通過將流動(dòng)劇烈變化區(qū)域的特征劃分為更多、更精細(xì)的維度來進(jìn)行精細(xì)捕捉,從而實(shí)現(xiàn)了前所未有的整體AI流體仿真的預(yù)測精度提升。
由于華為云底座提供了前所未有的并行AI算力,加之模型的優(yōu)化,得以在降低仿真時(shí)間同時(shí)又沉淀出了新的模型和工具。其不但局部改變了CFD的發(fā)展范式,也會(huì)很容易被華為云作為一種流體力學(xué)方面的解決方案利器,復(fù)用于高鐵、汽車等研發(fā)場景中。
這是一次標(biāo)準(zhǔn)的AI4S工程,而它的成績赫然是——降低仿真時(shí)間1000倍。
另一個(gè)高度值得關(guān)注的是在氣象預(yù)報(bào)領(lǐng)域,目前,該領(lǐng)域已經(jīng)成為國際AI巨頭展示AI4S能力的競技場。
天氣預(yù)報(bào)是一個(gè)非常適合AI4S來“炫技”的領(lǐng)域。一方面,各國都會(huì)有過去數(shù)十年甚至更長時(shí)間的天氣氣象數(shù)據(jù),是天然的優(yōu)質(zhì)訓(xùn)練數(shù)據(jù)集;另一方面,數(shù)值預(yù)報(bào)已經(jīng)把基于計(jì)算的預(yù)報(bào)在數(shù)學(xué)上發(fā)展到了一個(gè)相當(dāng)高的水平,給AI用來改進(jìn)或突破確定了較好的“靶點(diǎn)”。
先是國際頂級學(xué)術(shù)期刊《自然》(Nature)雜志在正刊發(fā)表了華為云盤古大模型研發(fā)團(tuán)隊(duì)的研究成果——《三維神經(jīng)網(wǎng)絡(luò)用于精準(zhǔn)中期全球天氣預(yù)報(bào)》,這是近年來中國科技公司首篇作為唯一署名單位發(fā)表的《自然》正刊論文,它們的成果的英文名稱是Pango-Weather,也就是盤古氣象大模型。
《自然》審稿人對該成果給予高度評價(jià):“華為云盤古氣象大模型讓人們重新審視氣象預(yù)報(bào)模型的未來,模型的開放將推動(dòng)該領(lǐng)域的發(fā)展?!?/p>
或許是華為云的大模型引發(fā)的連帶效應(yīng),谷歌和旗下的DeepMind連發(fā)三個(gè)天氣類模型NeuralGCM、GraphCast和Cencast,反映了這一領(lǐng)域的激烈競爭。
而華為云盤古氣象大模型主要的看點(diǎn),則不但是史上首個(gè)精度超過傳統(tǒng)數(shù)值預(yù)報(bào)方法的AI模型,而且速度相比傳統(tǒng)預(yù)報(bào)提速10000倍以上。
從技術(shù)上說,盤古氣象大模型的核心是提出了3D Earth-Specific Transformer模塊,其主要思想是使用一個(gè)視覺transformer的3D變種來處理復(fù)雜的不均勻的氣象要素。
這讓人不由想到此前鄂維南院士的話:高維計(jì)算是傳統(tǒng)計(jì)算的難點(diǎn),但對于基于多模態(tài)的大模型來說,只要把用于圖像或人臉識別的模型進(jìn)行改進(jìn),就可以很好的解決這個(gè)問題,這也是大模型的先進(jìn)之處。
同時(shí),由于氣象要素?cái)?shù)據(jù)對應(yīng)的經(jīng)緯度網(wǎng)格是不均勻的,而不同的要素在不同緯度、高度的分布也是不均勻的。盤古天氣大模型對這些不均勻性的建模,提升了預(yù)測精度,也有利于學(xué)習(xí)氣象數(shù)據(jù)背后潛藏著的復(fù)雜物理規(guī)律。
而無論是盤古-天氣大模型還是與之類似和競爭的多個(gè)大模型,共同點(diǎn)都是利用深度學(xué)習(xí)方法,在大規(guī)模的歷史天氣數(shù)據(jù)上進(jìn)行訓(xùn)練,并使用改良的模型模塊,從而在效率、效益和成本上,都具有顯著的優(yōu)勢。
很簡單的一個(gè)對比是,雖然訓(xùn)練需要的數(shù)據(jù)很大、過程也不短,但生成的模型只需要很少的算力、時(shí)間和能耗就能完成,這里的“很少”是對比傳統(tǒng)方式,其則至少需要在超級計(jì)算機(jī)集群上運(yùn)行很長時(shí)間。
其實(shí),數(shù)值天氣預(yù)報(bào)的“嫡系”升級版并不是氣象大模型,而是一種被稱為集合天氣預(yù)報(bào)的方法,它的代表機(jī)構(gòu)——?dú)W洲中期天氣預(yù)報(bào)中心(ECMWF)雄心勃勃的宣稱,2023年完全轉(zhuǎn)變?yōu)?00個(gè)成員的集合預(yù)報(bào)系統(tǒng)。
而氣象大模型相當(dāng)于半路上殺出的程咬金,是典型的跨越式技術(shù)對漸進(jìn)式技術(shù)突發(fā)的“降維打擊”。
可以想見,未來5-10年,兩種不同的模式將激烈沖突或融合發(fā)展,而這一幕也會(huì)在多個(gè)科技領(lǐng)域上演。
04
第五范式的前奏
由于前文已經(jīng)充分的描繪了AI4S的美好前景和積極實(shí)踐,那我們在這里就總結(jié)一些未來的機(jī)遇與挑戰(zhàn)。
首先,目前產(chǎn)生的一些AI4S的成果,用湯超院士的話說就是“大多是1到100,或者1到1000的成果,而較少是從0到1的”。
這句話深刻的揭示了AI4S的現(xiàn)狀。如果說的尖銳一點(diǎn),就是這些問題的解決剛好進(jìn)入了大模型的舒適區(qū),比如把一個(gè)視覺模型改造成力學(xué)模型,而且所解決問題的癥結(jié)也比較顯性。
當(dāng)然,進(jìn)步就是進(jìn)步,就像華為云的成就登上《自然》雜志一樣,讓中國的AI4S得到世界級的認(rèn)可,甚至激發(fā)了科技巨頭的跟進(jìn),這都是值得嘉賞的。
但我們并不應(yīng)該滿足,如哈薩比斯就提出——AGI(通用人工智能) 的一個(gè)重要測試標(biāo)準(zhǔn),將是其是否能夠自主生成像廣義相對論那樣的全新假設(shè)和理論。
如果說“圖靈測試”基本已經(jīng)在這一輪生成式大模型浪潮中得到驗(yàn)證。那“哈薩比斯假說”,就應(yīng)該是我們的AI產(chǎn)業(yè),特別是華為這樣的AI領(lǐng)軍企業(yè)的長期目標(biāo)。
其次,AI科學(xué)家應(yīng)該加速發(fā)展為AI+科學(xué)家。
我們一般稱研究AI發(fā)展的高層次科研人才為AI科學(xué)家,但推動(dòng)AI發(fā)展的,不應(yīng)該只有AI科學(xué)家。
2023 年,《自然》雜志(Nature)進(jìn)行了一項(xiàng)針對 1600 名科學(xué)家的調(diào)查研究,以了解科研工作者對生成式AI的使用狀況和想法。
結(jié)果顯示,有一半的參與者本身就是研究 AI 領(lǐng)域的研究者。而如果排除這部分人群,在非 AI 領(lǐng)域的研究者中,也有超過一半的人會(huì)在科研工作中使用 AI。
但不要高興太早,這些科學(xué)家使用AI的三個(gè)主要場景是——輔助非英語母語的作者撰寫論文(包括編輯和翻譯)、用 AI 編寫代碼、用 AI 提煉論文內(nèi)容以節(jié)省閱讀時(shí)間。
除了用AI編寫代碼有一定的科技屬性以外,另外兩項(xiàng)都是文字性的工作,這也和目前的大模型主要是大語言模型的現(xiàn)狀相匹配,但也從一定程度上反映了目前AI距離科研的核心場景還較遠(yuǎn)。
如果你希望AI解決核心的科研問題,首先得有熟悉這方面研究的科學(xué)家來描述需求、尋找靶點(diǎn),而AI科學(xué)家則配合其完成工作——不得不說,這很會(huì)很難。
我不由想起我對楊振寧先生的一次采訪,楊先生告訴我,上世紀(jì)50年代的時(shí)候,IBM發(fā)明了大型計(jì)算機(jī),因此聯(lián)系了一些他這樣的高級科學(xué)家來研究使用計(jì)算機(jī)是否對科研工作有幫助。
“我確實(shí)感到計(jì)算機(jī)有很強(qiáng)的計(jì)算能力,可以幫我解決一些科研上的問題。但當(dāng)時(shí)的計(jì)算機(jī)使用非常困難,你得自己編寫程序并輸入,我很快學(xué)會(huì)了,因?yàn)樗举|(zhì)上是數(shù)學(xué)。我甚至研究出了一種編程的方法,如果發(fā)展下去可能是未來的Fortune語言”,他回憶說:“但太耗時(shí)了,所以我試了一段時(shí)間就放棄了。”
這段話至今讀來仍然令人警醒——當(dāng)一種先進(jìn)的科研工具的使用門檻,高到令當(dāng)時(shí)的頂級科學(xué)家都有使用后就想放棄的念頭時(shí),它一定是很難推廣的。
事實(shí)上,正是一代代編程語言的進(jìn)化,從用代碼到可視化,從半自動(dòng)到自動(dòng)化,再到今天的可由AI自動(dòng)生成,計(jì)算機(jī)的科研價(jià)值和社會(huì)價(jià)值的釋放才能充分、徹底。
華為云對此已經(jīng)有深刻的認(rèn)知,例如他們已經(jīng)廣泛的和科學(xué)界合作。如在藥物研發(fā)方面,與華中科技大學(xué)、西交大一附院的教授通過華為云輔助制藥平臺發(fā)現(xiàn)新靶點(diǎn)活性物質(zhì);又如北京大學(xué)高毅勤教授基于華為云,研發(fā)的蛋白質(zhì)結(jié)構(gòu)預(yù)測功能,支持孤兒序列預(yù)測,功能上已經(jīng)超出AlphaFold2……此外,在氣象、農(nóng)業(yè)、海洋科學(xué)方面都有不錯(cuò)的嘗試。
我為這些做法點(diǎn)贊,但我更激賞的做法,是華為云已經(jīng)把平臺服務(wù)覆蓋到了10+AI4S領(lǐng)域(包括生物醫(yī)藥、計(jì)算化學(xué)、地球科學(xué)、電磁學(xué)、流體仿真、量子力學(xué)等)和80+模型,這才是真正的為科學(xué)家賦能的“大道”。
點(diǎn)對點(diǎn)、人對人形態(tài)的AI賦能,一定沒有1對多、工具性和生態(tài)型的賦能更有效率,我相信華為云會(huì)在這個(gè)方向上不斷拉低AI4S的使能方式,讓經(jīng)過工程化和產(chǎn)品化,支持開箱即用和二次開發(fā)的更多的AI4S工具和套件,去提升敏捷創(chuàng)新的效率,提高用戶科學(xué)計(jì)算AI的開發(fā)效率。
最后,范式轉(zhuǎn)換期一定有更多的困難和挑戰(zhàn)。
科學(xué)哲學(xué)家托馬斯·庫恩的《科學(xué)革命的結(jié)構(gòu)》是無數(shù)科創(chuàng)領(lǐng)域大佬的案頭書,他也被廣泛認(rèn)為是20世紀(jì)最重要的科學(xué)哲學(xué)家。
庫恩的核心理論就是“范式說”,這是一種對時(shí)代進(jìn)步的全新概念,簡單說,庫恩認(rèn)為一個(gè)時(shí)代、一個(gè)領(lǐng)域只有一個(gè)發(fā)展的“主范式”,與范式吻合才能踩在歷史發(fā)展進(jìn)步的一邊,但范式本身有慣性,所以每一代新的范式轉(zhuǎn)換都需要付出努力和代價(jià)。
AI4S就是范式轉(zhuǎn)換的重要表征,它不以人的主觀意志為轉(zhuǎn)移,也不能人為的對抗范式轉(zhuǎn)換。但是,它也不會(huì)自然降臨,每個(gè)范式轉(zhuǎn)換期都要付出巨大的勞動(dòng)甚至代價(jià),而只有經(jīng)歷這個(gè)過山車式的過程并始終不被甩出第一梯隊(duì),才能最終駕馭范式轉(zhuǎn)換帶來的紅利,能駕馭范式轉(zhuǎn)換的才能笑到最后。
熱門跟貼