[討論] neuralGCM 基於神經網路的通用循環模型

作者: aabaabaabaab (simon0823)   2024-01-04 20:52:58
本篇論文一樣由google的研究發表,包含以下幾點特點
1.
相較於graphcast直接對數據擬合,此模型同時採用物理核心與神經網路,預測過程受
ODE等物理條件限制,並採用類似數值模式的時間積分型式。
https://imgur.com/fiau2Af.jpg
https://imgur.com/Jw0qWRE.jpg
2.
模型輸入包含外力(地形、時間、經緯度、太陽輻射、海冰密集度、海表溫度、隨機噪
聲及ERA5,由於使用sigma座標,採用神經網路濾除重力波。
https://imgur.com/pjie69J.jpg
3.
訓練預報時長由6小時延長到3-5天,並用於氣候預報,對於長期預報特徵的模糊性有
較好的改善(大氣河流)
https://imgur.com/dcZI2FC.jpg
https://imgur.com/cj1zfFF.jpg
4.誤差表現
https://imgur.com/8jwfzNF.jpg
總結:
NeuralGCM最大的不同是以動力框架提供的物理關系為核心,進而從源頭上解決了AI模
型的最大問題:物理一致性。
可以像數值模式一樣根據空間分辨率設置相應的時間積分步長。即使是神經網絡部分
,也可以說擬合的是物理過程而不是統計關係。
保證輸出的大氣環流具備物理可解釋性,與觀測到的天氣、氣候現象始終保持一致。
在物理方程的約束下,僅用3~5天預報時間的數據即可訓練出在幾十年模擬上保持穩定
的模型。
由於其監督學習的本質沒有改變,其中仍然存在一些問題:
仍然以ERA5為基準訓練模型。類似數值模式的動力框架置入NeuralGCM後,要超越數值
模式的預報,某種程度上其成功的核心仍然是替代參數化方案的神經網絡部分。同時
,ERA5也依賴數值模式,則NeuralGCM的學習目標其實限於ERA5對觀測的同化。換句話
說,NeuralGCM的本質仍然是利用神經網絡擬合觀測,且上限仍受同化效果的約束。
仍存在大量“魔法數字”的設置。如不同變量損失的平衡,參數化方案輸出的放縮,
不同損失項的權重等。這些參數的影響很難評估。當然,對於次網格尺度過程而言,
這些經驗性超參數即使在數值模式中也不可避免。
進一步,我們可以從不同角度理解NeuralGCM的設計:
從AI角度,NeuralGCM將代表物理過程的基本方程組嵌入神經網絡,訓練出受物理約束
的AI預報模型。
從數值模式角度,則是用神經網絡代替數值模式中的參數化方案。
甚至,我們可以將NeuralGCM中的神經網絡視作“訂正模型”,只是將訂正直接嵌入
數值模式的時間積分過程中,針對每一步的結果訂正,而不是訂正最終的輸出。
參考資料:
https://blog.csdn.net/qq_33431368/article/details/135143616
https://arxiv.org/abs/2311.07222
https://imgur.com/0BNN9nU.jpg

Links booklink

Contact Us: admin [ a t ] ucptt.com