青藏高原,是世界屋脊、亞洲水塔,是地球第三極,同時(shí)也是未來(lái)全球氣候變化影響中不確定性最大的地區(qū)之一。

過(guò)去五十年,青藏高原氣候變暖幅度是同期全球平均值的2倍,這不僅改變了冰川等固態(tài)水與湖泊、河流等液態(tài)水的庫(kù)存比例,還因區(qū)域大氣環(huán)流的變化重塑了青藏高原水體的空間分布格局。

這種現(xiàn)象被稱(chēng)為“亞洲水塔失衡”。

這一變化會(huì)加劇水資源供給、能源供需以及糧食生產(chǎn)之間的不確定性。這三者之間相互依存、相互影響的關(guān)系被稱(chēng)為“水-能-糧耦合”。

有一群來(lái)自中國(guó)科學(xué)院的科學(xué)家,試圖用AI更準(zhǔn)確地判斷氣候變化,以及對(duì)水能源和糧食之間的耦合關(guān)系,90后夏萃慧就是其中之一。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

從英語(yǔ)專(zhuān)業(yè)到自然地理學(xué)博士

她用“AI打敗AI”

夏萃慧是中國(guó)科學(xué)院青藏高原研究所的一名助理研究員。本科學(xué)的是英語(yǔ),碩士讀了同聲傳譯,最后機(jī)緣巧合成了一名自然地理學(xué)博士,一頭扎進(jìn)了對(duì)亞洲水塔的研究。

過(guò)去50年在青藏高原氣候變暖幅度高于全球平均值2倍,對(duì)地球最明顯的影響之一,是導(dǎo)致青藏高原的水體發(fā)生了顯著變化。

簡(jiǎn)單來(lái)說(shuō),水存在的形態(tài)可能是冰川,可能是降水,也可能是湖泊,這些形態(tài)按一定的比例存在。不過(guò)因?yàn)椤皝喼匏Ш狻?,?dǎo)致這個(gè)比例發(fā)生了變化,同時(shí)這些水在不同區(qū)域分布也變了。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

“比如原來(lái)我們可能覺(jué)得北邊的水少,南邊相對(duì)水會(huì)多,現(xiàn)在這個(gè)趨勢(shì)也在逆轉(zhuǎn)?!毕妮突壅f(shuō)。

氣候變化臨界點(diǎn),即突破某一自然閾值會(huì)引發(fā)一系列連鎖反應(yīng),導(dǎo)致地球系統(tǒng)和社會(huì)經(jīng)濟(jì)狀態(tài)發(fā)生快速且不可逆的變化。

青藏高原的生態(tài)重要性毋庸置疑,水資源的改變,影響的不只是喝水用水的問(wèn)題,也改變了包括水力發(fā)電在內(nèi)的能源生產(chǎn)和能源調(diào)度,同時(shí)對(duì)糧食生產(chǎn)造成了各種不確定性。

去年,夏萃慧所在的中國(guó)科學(xué)院青藏高原研究所,聯(lián)合阿里云研發(fā)了首個(gè)專(zhuān)注于氣候變化適應(yīng)領(lǐng)域水-能-糧多模態(tài)推理大模型——洛書(shū)。

夏萃慧說(shuō),開(kāi)發(fā)洛書(shū)大模型的目的,是希望能更準(zhǔn)確地判斷氣候變化對(duì)水,尤其是對(duì)水電站的來(lái)水的影響,以便于更好地適應(yīng)氣候變化。

洛書(shū)模型集成訓(xùn)練并整合了科研人員自主研發(fā)的可解釋AI驅(qū)動(dòng)水能耦合模型“思源”(Hydro Trace),通義千問(wèn)最新推理模型Qwen-QwQ-32B和通義千問(wèn)多模態(tài)大模型Qwen2.5-VL。

 青年科學(xué)家AI整活,青藏高原和太陽(yáng)耀斑都沒(méi)放過(guò)
打開(kāi)網(wǎng)易新聞 查看更多視頻
青年科學(xué)家AI整活,青藏高原和太陽(yáng)耀斑都沒(méi)放過(guò)

圖示-洛書(shū)時(shí)空注意力可視

科學(xué)模型每天產(chǎn)生出海量數(shù)據(jù),比如在季風(fēng)期是什么樣的影響,非季風(fēng)期有什么樣的影響。但具體到每一個(gè)水電站,需要科學(xué)家人工去一一分析,這個(gè)成本非常高。

“如果把時(shí)間花在這個(gè)事情上,就沒(méi)有時(shí)間干別的,也沒(méi)有現(xiàn)成的任何軟件能夠幫我來(lái)分擔(dān)這個(gè)事情。”夏萃慧說(shuō)。

她想到的一個(gè)辦法:用“AI打敗AI”。

只要把科學(xué)模型的數(shù)據(jù)交給通義千問(wèn)推理模型,做簡(jiǎn)單的微調(diào)后,推理模型就能根據(jù)數(shù)據(jù)結(jié)構(gòu)和微調(diào)邏輯,還原推理的過(guò)程。

“你能看到它思考的每一步,這點(diǎn)在現(xiàn)實(shí)生產(chǎn)中應(yīng)用中非常關(guān)鍵。”夏萃慧說(shuō),因?yàn)榭蒲泄ぷ餍枰暾逆準(zhǔn)剿伎寄芰?,而不是給我一個(gè)黑箱模型,我就聽(tīng)你的。

洛書(shū)大模型不僅能描繪水文過(guò)程時(shí)空變化,對(duì)關(guān)鍵來(lái)水點(diǎn)徑流進(jìn)行時(shí)空溯源和量化歸因,還能基于溯源歸因數(shù)據(jù)開(kāi)展大模型推理,動(dòng)態(tài)支持跨越多個(gè)時(shí)空尺度的水-能-糧系統(tǒng)聯(lián)動(dòng)分析,為產(chǎn)業(yè)用戶提供個(gè)性化的氣候適應(yīng)策略沙盤(pán)推演生成與驗(yàn)證服務(wù)。

它的核心創(chuàng)新在于時(shí)空特征注意力算法。融合該算法的思源模型在青藏高原復(fù)雜水文環(huán)境下的多點(diǎn)模擬準(zhǔn)確率高達(dá)98%(國(guó)際領(lǐng)先水平),較傳統(tǒng)方法提升近20%。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

大模型能預(yù)測(cè)太陽(yáng)耀斑嗎?

00后天文學(xué)家:準(zhǔn)確率95%

耀斑,太陽(yáng)最劇烈的活動(dòng)現(xiàn)象之一,每隔11年就會(huì)有大爆發(fā)。一次典型的X級(jí)耀斑,能在幾十分鐘時(shí)間里釋放出相當(dāng)于100億顆氫彈同時(shí)爆炸所釋放的能量。

為了破解耀斑爆發(fā)之謎,過(guò)去很多科學(xué)家從耀斑演化的物理過(guò)程進(jìn)行研究,希望透過(guò)物理機(jī)理尋找爆發(fā)先兆。近年來(lái),學(xué)者們從數(shù)據(jù)驅(qū)動(dòng)角度出發(fā),用統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)開(kāi)展研究。然而,隨著觀測(cè)數(shù)據(jù)的不斷積累和數(shù)據(jù)特征維度的不斷增加,模型擬合與模式發(fā)現(xiàn)對(duì)算法規(guī)模的要求越來(lái)越高,研究人員亟須對(duì)海量多模態(tài)數(shù)據(jù)進(jìn)行有效處理以探索太陽(yáng)耀斑之謎。

大模型能預(yù)測(cè)太陽(yáng)耀斑嗎?

中國(guó)科學(xué)院國(guó)家天文臺(tái)的科研人員,正在探索用AI技術(shù)向太陽(yáng)這顆火熱的恒星尋求更多科學(xué)要義。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

位于北京的懷柔觀測(cè)基地,擁有目前世界上持續(xù)時(shí)間最久的太陽(yáng)矢量磁場(chǎng)觀測(cè)資料,每一幅太陽(yáng)觀測(cè)圖像都可以轉(zhuǎn)化為“一段語(yǔ)言描述”,而大語(yǔ)言模型在預(yù)測(cè)“下一段語(yǔ)言文字”方面具有良好的準(zhǔn)確率,科學(xué)家們要做的是引導(dǎo)大模型對(duì)觀測(cè)數(shù)據(jù)進(jìn)行準(zhǔn)確地描述、分析,進(jìn)而實(shí)現(xiàn)模式、趨勢(shì)的發(fā)現(xiàn)和預(yù)測(cè)。

金烏大模型應(yīng)運(yùn)而生。在Qwen2系列模型的基礎(chǔ)上,國(guó)家天文臺(tái)科研團(tuán)隊(duì)通過(guò)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),訓(xùn)練模型“能夠理解、回答太陽(yáng)物理問(wèn)題”和“能夠認(rèn)識(shí)、分析太陽(yáng)圖像”等基本能力。大模型用于分析、預(yù)測(cè)太陽(yáng)耀斑,在X級(jí)耀斑的預(yù)測(cè)上,達(dá)到了95%的準(zhǔn)確率和100%的真實(shí)陽(yáng)性率。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

圖示-“金烏”模型網(wǎng)絡(luò)結(jié)構(gòu)圖

在中國(guó)科學(xué)院國(guó)家天文臺(tái)位于河北的觀測(cè)臺(tái)——興隆觀測(cè)站,隨著“星語(yǔ)3.0”接入觀測(cè)站望遠(yuǎn)鏡陣列,天文科學(xué)家們已經(jīng)開(kāi)啟了智能觀測(cè)。

00后李瑀旸是金烏·太陽(yáng)大模型的核心技術(shù)人員,同時(shí)作為國(guó)家天文臺(tái)人工智能組成員,李瑀旸也是天文大模型“星語(yǔ)”的主要負(fù)責(zé)人之一。

李瑀旸大學(xué)本科學(xué)的是應(yīng)用物理學(xué),并開(kāi)始接觸天文以及核物理,現(xiàn)在主讀的專(zhuān)業(yè)應(yīng)該是天體物理學(xué)。李瑀旸所在的星語(yǔ)團(tuán)隊(duì),主要由一群碩博生組成,平均年齡在22歲到28歲之間。

“星語(yǔ)3.0”是基于阿里云通義千問(wèn)開(kāi)源模型打造的天文學(xué)大模型,去年,成功接入國(guó)家天文臺(tái)興隆觀測(cè)站望遠(yuǎn)鏡陣列—Mini“司天”。目前星語(yǔ)的底座模型已從Qwen2.0升級(jí)至QwQ-32B。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

對(duì)于星語(yǔ)模型,李瑀旸更愿意定義其為天文科學(xué)家們的助手,而不是大模型。

比如星語(yǔ)巨身智能望遠(yuǎn)鏡,是一個(gè)為節(jié)省觀測(cè)值班人員以及為多望遠(yuǎn)鏡聯(lián)動(dòng)打下基礎(chǔ)的一個(gè)系統(tǒng)。

天文望遠(yuǎn)鏡是人類(lèi)探索宇宙的“照相機(jī)”。相比單體望遠(yuǎn)鏡,大型望遠(yuǎn)鏡陣列能更有效地整合高性能望遠(yuǎn)鏡資源,成本更低,觀測(cè)效率更高。

以往天文觀測(cè)主要依賴(lài)觀測(cè)助手和科研人員的配合??蒲腥藛T往往需要根據(jù)觀測(cè)所在地氣象情況修改觀測(cè)計(jì)劃,在觀測(cè)室等待數(shù)據(jù)返回并實(shí)時(shí)分析數(shù)據(jù),再根據(jù)結(jié)果修改觀測(cè)計(jì)劃。重要觀測(cè)目標(biāo)的每個(gè)環(huán)節(jié)都需要人工參與,效率低且難以同時(shí)控制多個(gè)望遠(yuǎn)鏡。

“預(yù)計(jì)能夠節(jié)省研究人員90%左右的觀測(cè)時(shí)間?!?/strong>李瑀旸說(shuō),以往觀測(cè)值班人員需要全程待在值班室,處理一系列的預(yù)處理、觀測(cè)等工作。但現(xiàn)在只要跟星語(yǔ)說(shuō):開(kāi)始觀測(cè)。星語(yǔ)會(huì)根據(jù)前面接收到的智能工作流,自動(dòng)制訂當(dāng)天觀測(cè)計(jì)劃,并在規(guī)定時(shí)間開(kāi)啟當(dāng)天的望遠(yuǎn)鏡觀測(cè),并且自動(dòng)進(jìn)行數(shù)據(jù)處理,全程不需要人工干預(yù)。

打開(kāi)網(wǎng)易新聞 查看精彩圖片

正在上天、入地和下海的AI

凝望海拔4500米的青藏高原冰川,AI大模型正在深入理解“亞洲水塔失衡”對(duì)能源糧食生產(chǎn)的影響;距離地球38萬(wàn)公里的月球表面,大模型正在智能分析判斷月球撞擊坑的形態(tài)、大小、年代;在興隆觀測(cè)站,“會(huì)思考”的天文望遠(yuǎn)鏡陣列已開(kāi)啟自主觀測(cè)新時(shí)代……

“‘賦能’這個(gè)詞低估了人工智能對(duì)科學(xué)的顛覆,對(duì)科學(xué)來(lái)說(shuō),人工智能不是一次工具的革命,而是一次科學(xué)革命的工具。”

最近,由世界互聯(lián)網(wǎng)大會(huì)人工智能專(zhuān)業(yè)委員會(huì)主辦的“人工智能賦能科學(xué)研究研討會(huì)”上,專(zhuān)委會(huì)首席主任委員、中國(guó)工程院院士、之江實(shí)驗(yàn)室主任王堅(jiān)說(shuō)。

王堅(jiān)舉了一個(gè)例子:大概在1948年,一個(gè)地球科學(xué)家寫(xiě)了一句話,當(dāng)時(shí)還沒(méi)有衛(wèi)星,沒(méi)有人知道從外太空看地球是什么樣子。他說(shuō)如果有人從外太空拍一張照片,我們對(duì)這個(gè)世界的觀念會(huì)有一次翻天覆地的變化。

30年以后,人類(lèi)才第一次從外太空拍到了地球的照片。一張是阿波羅18號(hào),另一張是阿波羅17號(hào)。

“原本是去探索月球,無(wú)意間拍到了一顆藍(lán)色星球,那就是地球。我們從來(lái)不知道地球是藍(lán)色的,這個(gè)全新的認(rèn)識(shí)推動(dòng)了一個(gè)學(xué)科的產(chǎn)生,就是地球系統(tǒng)科學(xué)的誕生?!?/p>

王堅(jiān)說(shuō),今天看到的所有宇宙照片,都不是拍照就能留下來(lái)的,而是后來(lái)通過(guò)計(jì)算看到。

最近,中國(guó)科學(xué)院多個(gè)研究所已接入阿里千問(wèn)QwQ-32B,在能源管理、天文觀測(cè)、深空探測(cè)等領(lǐng)域取得系列突破,推出多款基于通義千問(wèn)的人工智能大模型,將前沿科技與實(shí)際問(wèn)題深度融合,開(kāi)啟了“AI for Science”的征程。

除了中國(guó)科學(xué)院青藏高原研究所聯(lián)合阿里云發(fā)布多模態(tài)大模型“洛書(shū)”、國(guó)家天文臺(tái)發(fā)布的天文大模型“星語(yǔ)”和太陽(yáng)物理大模型“金烏”,面對(duì)南海珊瑚礁退化這一全球性挑戰(zhàn),南海海洋研究所研發(fā)的“瑤華”大模型,通過(guò)分析10萬(wàn)張水下影像,實(shí)現(xiàn)珊瑚種類(lèi)識(shí)別準(zhǔn)確率88%,效率較人工提升數(shù)十倍。

文 | 沈積慧