青藏高原,是世界屋脊、亞洲水塔,是地球第三極,同時也是未來全球氣候變化影響中不確定性最大的地區(qū)之一。

過去五十年,青藏高原氣候變暖幅度是同期全球平均值的2倍,這不僅改變了冰川等固態(tài)水與湖泊、河流等液態(tài)水的庫存比例,還因區(qū)域大氣環(huán)流的變化重塑了青藏高原水體的空間分布格局。

這種現象被稱為“亞洲水塔失衡”。

這一變化會加劇水資源供給、能源供需以及糧食生產之間的不確定性。這三者之間相互依存、相互影響的關系被稱為“水-能-糧耦合”。

有一群來自中國科學院的科學家,試圖用AI更準確地判斷氣候變化,以及對水能源和糧食之間的耦合關系,90后夏萃慧就是其中之一。

打開網易新聞 查看精彩圖片

從英語專業(yè)到自然地理學博士

她用“AI打敗AI”

夏萃慧是中國科學院青藏高原研究所的一名助理研究員。本科學的是英語,碩士讀了同聲傳譯,最后機緣巧合成了一名自然地理學博士,一頭扎進了對亞洲水塔的研究。

過去50年在青藏高原氣候變暖幅度高于全球平均值2倍,對地球最明顯的影響之一,是導致青藏高原的水體發(fā)生了顯著變化。

簡單來說,水存在的形態(tài)可能是冰川,可能是降水,也可能是湖泊,這些形態(tài)按一定的比例存在。不過因為“亞洲水塔失衡”,導致這個比例發(fā)生了變化,同時這些水在不同區(qū)域分布也變了。

打開網易新聞 查看精彩圖片

“比如原來我們可能覺得北邊的水少,南邊相對水會多,現在這個趨勢也在逆轉?!毕妮突壅f。

氣候變化臨界點,即突破某一自然閾值會引發(fā)一系列連鎖反應,導致地球系統(tǒng)和社會經濟狀態(tài)發(fā)生快速且不可逆的變化。

青藏高原的生態(tài)重要性毋庸置疑,水資源的改變,影響的不只是喝水用水的問題,也改變了包括水力發(fā)電在內的能源生產和能源調度,同時對糧食生產造成了各種不確定性。

去年,夏萃慧所在的中國科學院青藏高原研究所,聯合阿里云研發(fā)了首個專注于氣候變化適應領域水-能-糧多模態(tài)推理大模型——洛書。

夏萃慧說,開發(fā)洛書大模型的目的,是希望能更準確地判斷氣候變化對水,尤其是對水電站的來水的影響,以便于更好地適應氣候變化。

洛書模型集成訓練并整合了科研人員自主研發(fā)的可解釋AI驅動水能耦合模型“思源”(Hydro Trace),通義千問最新推理模型Qwen-QwQ-32B和通義千問多模態(tài)大模型Qwen2.5-VL。

 青年科學家AI整活,青藏高原和太陽耀斑都沒放過
打開網易新聞 查看更多視頻
青年科學家AI整活,青藏高原和太陽耀斑都沒放過

圖示-洛書時空注意力可視

科學模型每天產生出海量數據,比如在季風期是什么樣的影響,非季風期有什么樣的影響。但具體到每一個水電站,需要科學家人工去一一分析,這個成本非常高。

“如果把時間花在這個事情上,就沒有時間干別的,也沒有現成的任何軟件能夠幫我來分擔這個事情?!毕妮突壅f。

她想到的一個辦法:用“AI打敗AI”。

只要把科學模型的數據交給通義千問推理模型,做簡單的微調后,推理模型就能根據數據結構和微調邏輯,還原推理的過程。

“你能看到它思考的每一步,這點在現實生產中應用中非常關鍵。”夏萃慧說,因為科研工作需要完整的鏈式思考能力,而不是給我一個黑箱模型,我就聽你的。

洛書大模型不僅能描繪水文過程時空變化,對關鍵來水點徑流進行時空溯源和量化歸因,還能基于溯源歸因數據開展大模型推理,動態(tài)支持跨越多個時空尺度的水-能-糧系統(tǒng)聯動分析,為產業(yè)用戶提供個性化的氣候適應策略沙盤推演生成與驗證服務。

它的核心創(chuàng)新在于時空特征注意力算法。融合該算法的思源模型在青藏高原復雜水文環(huán)境下的多點模擬準確率高達98%(國際領先水平),較傳統(tǒng)方法提升近20%。

打開網易新聞 查看精彩圖片

大模型能預測太陽耀斑嗎?

00后天文學家:準確率95%

耀斑,太陽最劇烈的活動現象之一,每隔11年就會有大爆發(fā)。一次典型的X級耀斑,能在幾十分鐘時間里釋放出相當于100億顆氫彈同時爆炸所釋放的能量。

為了破解耀斑爆發(fā)之謎,過去很多科學家從耀斑演化的物理過程進行研究,希望透過物理機理尋找爆發(fā)先兆。近年來,學者們從數據驅動角度出發(fā),用統(tǒng)計方法、機器學習、深度學習等技術開展研究。然而,隨著觀測數據的不斷積累和數據特征維度的不斷增加,模型擬合與模式發(fā)現對算法規(guī)模的要求越來越高,研究人員亟須對海量多模態(tài)數據進行有效處理以探索太陽耀斑之謎。

大模型能預測太陽耀斑嗎?

中國科學院國家天文臺的科研人員,正在探索用AI技術向太陽這顆火熱的恒星尋求更多科學要義。

打開網易新聞 查看精彩圖片

位于北京的懷柔觀測基地,擁有目前世界上持續(xù)時間最久的太陽矢量磁場觀測資料,每一幅太陽觀測圖像都可以轉化為“一段語言描述”,而大語言模型在預測“下一段語言文字”方面具有良好的準確率,科學家們要做的是引導大模型對觀測數據進行準確地描述、分析,進而實現模式、趨勢的發(fā)現和預測。

金烏大模型應運而生。在Qwen2系列模型的基礎上,國家天文臺科研團隊通過監(jiān)督學習、強化學習,訓練模型“能夠理解、回答太陽物理問題”和“能夠認識、分析太陽圖像”等基本能力。大模型用于分析、預測太陽耀斑,在X級耀斑的預測上,達到了95%的準確率和100%的真實陽性率。

打開網易新聞 查看精彩圖片

圖示-“金烏”模型網絡結構圖

在中國科學院國家天文臺位于河北的觀測臺——興隆觀測站,隨著“星語3.0”接入觀測站望遠鏡陣列,天文科學家們已經開啟了智能觀測。

00后李瑀旸是金烏·太陽大模型的核心技術人員,同時作為國家天文臺人工智能組成員,李瑀旸也是天文大模型“星語”的主要負責人之一。

李瑀旸大學本科學的是應用物理學,并開始接觸天文以及核物理,現在主讀的專業(yè)應該是天體物理學。李瑀旸所在的星語團隊,主要由一群碩博生組成,平均年齡在22歲到28歲之間。

“星語3.0”是基于阿里云通義千問開源模型打造的天文學大模型,去年,成功接入國家天文臺興隆觀測站望遠鏡陣列—Mini“司天”。目前星語的底座模型已從Qwen2.0升級至QwQ-32B。

打開網易新聞 查看精彩圖片

對于星語模型,李瑀旸更愿意定義其為天文科學家們的助手,而不是大模型。

比如星語巨身智能望遠鏡,是一個為節(jié)省觀測值班人員以及為多望遠鏡聯動打下基礎的一個系統(tǒng)。

天文望遠鏡是人類探索宇宙的“照相機”。相比單體望遠鏡,大型望遠鏡陣列能更有效地整合高性能望遠鏡資源,成本更低,觀測效率更高。

以往天文觀測主要依賴觀測助手和科研人員的配合。科研人員往往需要根據觀測所在地氣象情況修改觀測計劃,在觀測室等待數據返回并實時分析數據,再根據結果修改觀測計劃。重要觀測目標的每個環(huán)節(jié)都需要人工參與,效率低且難以同時控制多個望遠鏡。

“預計能夠節(jié)省研究人員90%左右的觀測時間。”李瑀旸說,以往觀測值班人員需要全程待在值班室,處理一系列的預處理、觀測等工作。但現在只要跟星語說:開始觀測。星語會根據前面接收到的智能工作流,自動制訂當天觀測計劃,并在規(guī)定時間開啟當天的望遠鏡觀測,并且自動進行數據處理,全程不需要人工干預。

打開網易新聞 查看精彩圖片

正在上天、入地和下海的AI

凝望海拔4500米的青藏高原冰川,AI大模型正在深入理解“亞洲水塔失衡”對能源糧食生產的影響;距離地球38萬公里的月球表面,大模型正在智能分析判斷月球撞擊坑的形態(tài)、大小、年代;在興隆觀測站,“會思考”的天文望遠鏡陣列已開啟自主觀測新時代……

“‘賦能’這個詞低估了人工智能對科學的顛覆,對科學來說,人工智能不是一次工具的革命,而是一次科學革命的工具?!?/strong>

最近,由世界互聯網大會人工智能專業(yè)委員會主辦的“人工智能賦能科學研究研討會”上,專委會首席主任委員、中國工程院院士、之江實驗室主任王堅說。

王堅舉了一個例子:大概在1948年,一個地球科學家寫了一句話,當時還沒有衛(wèi)星,沒有人知道從外太空看地球是什么樣子。他說如果有人從外太空拍一張照片,我們對這個世界的觀念會有一次翻天覆地的變化。

30年以后,人類才第一次從外太空拍到了地球的照片。一張是阿波羅18號,另一張是阿波羅17號。

“原本是去探索月球,無意間拍到了一顆藍色星球,那就是地球。我們從來不知道地球是藍色的,這個全新的認識推動了一個學科的產生,就是地球系統(tǒng)科學的誕生。”

王堅說,今天看到的所有宇宙照片,都不是拍照就能留下來的,而是后來通過計算看到。

最近,中國科學院多個研究所已接入阿里千問QwQ-32B,在能源管理、天文觀測、深空探測等領域取得系列突破,推出多款基于通義千問的人工智能大模型,將前沿科技與實際問題深度融合,開啟了“AI for Science”的征程

除了中國科學院青藏高原研究所聯合阿里云發(fā)布多模態(tài)大模型“洛書”、國家天文臺發(fā)布的天文大模型“星語”和太陽物理大模型“金烏”,面對南海珊瑚礁退化這一全球性挑戰(zhàn),南海海洋研究所研發(fā)的“瑤華”大模型,通過分析10萬張水下影像,實現珊瑚種類識別準確率88%,效率較人工提升數十倍。

文 | 沈積慧