氣象大模型支撐流域暴雨預報實踐探索
Exploring the application of large-scale meteorological models in basin-scale extreme rainfall forecasting趙銅鐵鋼,李強
(中山大學水利部粵港澳大灣區水安全保障重點實驗室,510275,廣州)
摘要:隨著人工智能技術發展,大模型被開發并應用于業務氣象預報。聚焦海河“23·7”流域性特大暴雨洪水,采用氣象大模型開展暴雨過程回顧性預報實驗,對比歐洲中期天氣預報中心業務氣象預報產品HRES,檢驗氣象大模型降水預報對于洪水災害防御的推廣應用價值。研究結果表明:相比傳統數值氣象預報,GraphCast、FuXi和AIFS三個氣象大模型對暴雨過程、落區形態、中心位置和發生時間的預報更準確。對于逐6h降水量,大模型在不同預見期下均呈現相當的預報精度。對于累積降水量,GraphCast、AIFS和HRES預報降水強度、暴雨過程和落區范圍接近實況,當起報時間提前到1d前,研究區平均累積降水量為124.6mm,預報累積降水量分別為132.7mm、115.5mm和140.0mm。對于最大降水量,GraphCast、FuXi和AIFS降水強度誤差較HRES更大,時間和位置誤差更小。實況最大累積降水量為484.8mm,當起報時間提前到1d前,GraphCast、FuXi、AIFS和HRES的預報值分別為329.7mm、190.1mm、251.2mm和415.3mm。整體上,氣象大模型能夠為洪水災害防御提供有效的降水預報信息,服務于水旱災害防御業務工作。
關鍵詞:氣象大模型;極端降水;降水預報;洪水災害防御;人工智能
作者簡介:趙銅鐵鋼,教授,主要從事水文預報研究相關工作。
通信作者:李強,博士,主要從事水文預報研究相關工作。E-mail:liqiang65@mail2.sysu.edu.cn基金項目:國家自然科學基金資助項目(52379033);水利部粵港澳大灣區水安全保障重點實驗室開放研究基金項目(WSGBA-KJ202308)。
受季風氣候、地形等因素影響,暴雨所導致的洪澇災害每年對我國經濟社會發展造成一定影響。例如,2021年河南鄭州“7·20”特大暴雨,暴雨強度大、時間集中,觀測雨量突破內陸地區小時降雨量歷史極值,導致嚴重城市內澇和超警洪水;2022年珠江“22·6”特大洪水,暴雨強度大、范圍廣、歷時長,引發7次編號洪水,其中北江第2號洪水為超100年一遇特大洪水;2023年海河“23·7”流域性特大暴雨洪水,降水強度大、時空集中,單站累積降水量超過1000mm,洪水量級大、漲勢猛、演進快,為海河流域60年來最大場次洪水。
隨著人工智能技術發展,大模型被開發并應用于業務氣象預報。相比傳統數值天氣預報模型,氣象大模型在有效預見期、計算速度和運行成本等方面具有明顯優勢。例如,谷歌DeepMind開發的GraphCast,采用圖神經網絡編碼器-解碼器架構,構建從經緯度網格到多網格特征的映射,將大模型預報時效提升到10d;復旦大學等開發的伏羲(FuXi),采用U-Transformer架構,使用級聯模型和多步損失函數減少時間累積誤差,將預報時效提升到15d;歐洲中期天氣預報中心(ECMWF)開發的AIFS,集成Transformer和圖神經網絡編碼器-解碼器,預報時效達15d,已用于業務氣象預報。
聚焦海河“23·7”流域性特大暴雨洪水,本文針對氣象大模型GraphCast、FuXi和AIFS進行適用性評估,并與ECMWF高分辨率氣象預報產品(HRES)進行對比。面向洪水災害防御,從逐6h降水量、累積降水量和最大降水量3個方面評估氣象大模型極端暴雨預報精度。首先,針對逐6h降水量,使用受試者工作特征(ROC)曲線評估不同預見期和降水強度下的預報精度;其次,針對過程累積降水量評估暴雨落區、過程和強度的預報效果;最后,針對最大6h降水量和最大累積降水量評估暴雨極值位置、強度及發生時間的預報誤差。
氣象大模型運行環境
GraphCast、FuXi和AIFS這三種代表性氣象大模型均由ECMWF第5代大氣再分析數據集(ERA5)訓練而成。它們的業務版本均進行了微調,支持HRES的初始場數據作為輸入。采用自回歸方法以前兩個時間步的氣象變量作為輸入,生成下一個時間步的預報數據,時間分辨率為6h,水平分辨率為0.25°×0.25°。大模型架構和參數等基本信息如下表所示。
氣象大模型基本信息
面向業務氣象預報,本文采用HRES的初始場數據作為驅動,搭建業務化運行環境。硬件、軟件和輸入數據等環境配置如下表所示。值得指出的是,氣象大模型訓練所用的ERA5數據并未用作驅動,原因在于其滯后5d發布,不能滿足業務預報時效性需求。HRES水平分辨率為0.1°×0.1°,時間分辨率最高1h,預見期最長15d,在世界標準時間每日0時、6時、12時和18時生成。ECMWF動態公開最近3d重采樣至0.25°×0.25°的HRES初始場數據和預報數據,其中初始場數據為基于衛星和氣象站等觀測生成的同化數據,用于驅動ECMWF綜合預報系統生成HRES預報數據。整體上,HRES既是國際氣象業務預報的基準性數據,也是我國天氣預報業務的重要支撐數據。研究表明,HRES對河南鄭州“7·20”特大暴雨和海河“23·7”流域性特大暴雨洪水的預報性能優于其他全球數值天氣預報產品。
氣象大模型運行環境配置
氣象大模型分為實時預報和回顧預報兩種運行狀態。實時預報通過ECMWF數據接口下載HRES初始場數據,經預處理驅動大模型生成預報。回顧預報通過ECMWF檔案檢索系統(MARS)下載HRES存檔的初始場數據,經過預處理驅動氣象大模型生成歷史回報。首次運行氣象大模型時,加載權重數據、創建計算圖等過程相對耗時,業務化運行后無需重復加載。經測試,GraphCast首次運行生成10d預報需要約150s,FuXi需要約90s,AIFS需要約70s;業務化運行時,GraphCast、FuXi和AIFS生成10d預報所需時間分別為70s、80s和60s左右。
暴雨預報實驗設計
1.研究區域與數據
海河流域總面積32萬km2,西、北和西南三面環山,山區與平原之間過渡帶短促。受半濕潤半干旱溫帶季風氣候影響,海河流域降水時空分布不均,7月下旬到8月上旬極易出現短歷時強降水。“23·7”流域性特大暴雨洪水中,海河流域累積降水總量達494億m3,永定河等8條河流發生有實測記錄以來最大洪水,造成京津冀超過500萬人受災,直接經濟損失超過1600億元。根據暴雨落區范圍,將35°N113°E—41°N117°E作為回顧性預報實驗的研究區域。
以多源加權集合降水(MSWEP)數據作為實況降水數據,該數據集成衛星遙感、大氣再分析及雨量站等多源降水資料,提供1979年至今全球0.1°×0.1°逐3h降水數據,是目前國際公認的高精度降水數據產品之一。相較于其他全球降水數據產品,MSWEP在表征地表“真實”降水方面表現更為出色,在對地觀測、氣候系統演化分析以及暴雨洪水預報等領域得到了廣泛應用。本文選取最新MSWEPV2.8版本數據,時間分辨率重采樣至6h,通過雙線性插值重采樣至0.25°×0.25°。此外,通過MARS下載重采樣至0.25°×0.25°分辨率的HRES數據,預見期為0~240h逐6h,以HRES初始場數據驅動氣象大模型,并將氣象大模型預報數據與HRES預報數據進行對比。
2.預報精度評
采用ROC曲線評估氣象大模型暴雨預報精度,利用ROC技能分數(ROCSS)衡量暴雨預報命中和誤報之間的整體判別能力。計算過程見式(1)~式(5):
式中,AUC表示ROC曲線下的面積,計算公式為:
式中,分別代表真陽性率和假陽性率,計算公式為:
式中,代表網格數量,個;為設定的降水量閾值,mm;fnon分別表示網格n的預報降水量和觀測降水量,mm;代表指示函數,計算公式為:
通過計算所有可能取值下的,繪制ROC曲線并計算ROCSS,從而綜合考慮研究區所有網格不同量級降水信息。ROCSS取值范圍為-1~1,數值越高代表預報精度越高。
歷史暴雨回顧性預報
1.逐6h降水預報精度
針對海河“23·7”流域性特大暴雨洪水逐6h降水量,各模型預報精度如下圖所示。預見期為6h時,GraphCast、FuXi、AIFS和HRES的ROCSS中位數分別為0.58、0.47、0.62和0.20。隨著預見期從6h增大到240h,各模型的ROCSS變化范圍增大,預報精度呈現下降趨勢。當預見期低于4d時,GraphCast和AIFS的ROCSS基本大于0;當預見期超過4d時,預報精度明顯下降,ROCSS出現較多負值。當降水量較大時,各模型的降水預報精度下降,表現為熱力圖中ROCSS值較低條帶與強降水在時間上耦合。相比HRES和FuXi,GraphCast和AIFS在預報較小降水時表現更好。FuXi在5~6d預見期精度變化明顯,熱力圖呈現清晰水平分界,對應其預見期5d前后子模型不同的級聯架構。對HRES,世界標準時間6時和18時起報的預見期為1~96h,因此ROCSS在預見期超過4d時為空值。
不同預見期下逐6h降水量預報檢驗
根據國家標準《降水量等級》(GB/T 28592—2012)對12h和24h降水等級進行劃分,將6h降水量劃分為中雨[2.5mm,7.5mm)、大雨[7.5mm,15.0mm)和暴雨[15.0mm,+∞),預報精度如下圖所示。整體上,預報精度與預見期呈負相關關系;相比中雨和暴雨,各模型對大雨的預報精度更高。以大雨預報為例,隨著預見期從1d增加到3d,GraphCast的ROCSS中位數從0.78下降到0.77(減少1.3%),FuXi從0.85下降到0.80(減少5.9%),AIFS從0.79下降到0.70(減少11.4%),HRES從0.63下降到0.53(減少15.9%)。隨著降水量從大雨增加到暴雨,各模型預報精度表現出下降趨勢,3d預見期的結果顯示,GraphCast的ROCSS中位數從0.77下降到0.28(減少64%),FuXi從0.80下降到0.01(減少99%),AIFS從0.70下降到0.21(減少70%),HRES從0.53下降到0.29(減少45%)。
不同降水強度和預見期下逐6h降水量預報檢驗
2.累積降水預報精度
各模型對于累積降水量的預報精度如下圖所示。總體上,GraphCast、FuXi、AIFS和HRES預報降水落區大致符合實況,對累積降水量有預報提示。其中,HRES預報累積降水量相對更好,但高估了300mm以上降水的落區范圍,低估了降水強度。相比之下,GraphCast、FuXi和AIFS的降水落區更平滑,低估了降水中心區域的累積降水量,對300mm以上降水的強度和落區范圍預報均偏小,FuXi的低估程度相對更大。隨著起報時間從世界標準時間7月28日0時(暴雨前1d)提前到7月26日0時(暴雨前3d),GraphCast、FuXi、AIFS和HRES預報300mm以上降水強度和落區面積減少,HRES預報強降水中心較實況偏西南,GraphCast和AIFS大致預報出強降水中心位置。
各模型2023-07-29T00:00Z—2023-08-01T00:00Z累積降水量
各模型區域平均累積降水量預報精度評估結果如下圖所示。整體上,GraphCast、AIFS和HRES預報降水量和降水過程更接近實況。MSWEP累積降水量為124.6mm,當起報時間提前到1d前,GraphCast、FuXi、AIFS和HRES的預報累積降水量分別為132.7mm、83.2mm、115.5mm和140.0mm,ROCSS分別為0.79、0.57、0.65和0.73;當起報時間提前到3d前,GraphCast、AIFS和HRES的預報累積降水量更接近基準值,分別為126.9mm、121.8mm和121.0mm,ROCSS分別為0.71、0.71和0.34,GraphCast和AIFS的預報降水時間序列比HRES更接近實況降水序列。GraphCast、AIFS和HRES預報累積降水量的互補累積分布函數曲線更接近MSWEP降水量的分布曲線,預報精度更高。
不同起報時間下累積降水量預報檢驗
3.最大降水預報精度
對于區域平均最大6h降水量,各模型預報結果如下圖所示。總體上,GraphCast、FuXi、AIFS和HRES均在一定程度上預報出最大6h降水的強度、位置和落區形態,對強降水過程預報有業務參考價值。相比實況降水落區,HRES落區過于離散化,40mm以上核心落區更分散,降水極值和落區范圍偏小;氣象大模型核心降水落區形態和位置更接近實況,但邊界過于平滑且低估了降水極值,顯示出AI模型固有過平滑問題。隨著起報時間從世界標準時間7月29日0時(最大6h降水前1d)提前到7月27日0時(最大6h降水前3d),各模型預報降水落區形態和位置與實況的偏差變大,低估極值更明顯。
區域平均最大6h降水量(2023-07-30T00:00Z—2023-07-30T06:00Z)
針對網格最大6h降水量和最大累積降水量,各模型預報發生位置、降水強度和時間誤差如下圖所示。整體上,HRES對降水強度的預報誤差較GraphCast、FuXi和AIFS更小,但在發生時間上不如氣象大模型準確。實況最大6h降水量和最大累積降水量分別為127.9mm和484.8mm,當起報時間提前到1d前,HRES更準確,預報值分別為117.8mm和415.3mm,GraphCast分別為84.8mm和329.7mm,FuXi分別為42.2mm和190.1mm,AIFS分別為61.9mm和251.2mm,而氣象大模型對最大累積降水量發生位置的預報更準確;當起報時間提前至3d前,HRES對最大降水強度的預報更準確,氣象大模型預報發生時間更準確,HRES、GraphCast、FuXi和AIFS預報最大6h降水發生時間的誤差分別為24h、0h、6h和-12h。
網格最大6h降水量和最大累積降水量預報檢驗
結語
聚焦海河“23·7”流域性特大暴雨洪水,本文采用氣象大模型開展暴雨過程回顧性預報實驗,對比ECMWF業務氣象預報精度,檢驗氣象大模型降水預報對于洪水災害防御的推廣應用價值。結果表明,一臺48G顯存的小型工作站即可支撐氣象大模型運行,在2min內生成10d全球氣象預報,能滿足實時業務預報要求。相比傳統數值天氣預報,氣象大模型對暴雨過程、落區形態、中心位置和發生時間的預報更準確,能夠為洪水災害防御提供具有業務參考價值的降水預報信息。三種大模型中,GraphCast預報累積降水量和最大降水量性能更好,更適用于本次極端暴雨事件的預報。
面向業務預報,氣象大模型還存在過平滑、分辨率低和可解釋性差的局限性。大模型的訓練數據ERA5在我國區域存在偏差,其降水數據尤為明顯;同時極端降水事件訓練樣本較少,限制了大模型預報暴雨強度的能力。此外,基于圖神經網絡的GraphCast和AIFS對極端暴雨強度的低估更小,可能比U-Transformer更適合預報極值。當前大模型大多采用6h和0.25°×0.25°的分辨率,過低的時空分辨率可能導致低估局部突發極端暴雨事件的強度。“黑箱”的大模型難以提供預報結果的解釋依據,會降低可信度。此外,未來還有待基于氣象站觀測數據對氣象大模型的極端暴雨預報性能作進一步評估,并與多種業務預報產品進行對比。
Abstract: With the advancement of artificial intelligence technology, large-scale models have been developed and applied in operational meteorological forecasting. Focusing on the “23·7” extreme rainfall and flood event in the Haihe River basin, retrospective forecasting experiments are conducted using large-scale meteorological models. The precipitation forecasts are compared with the High-Resolution Forecast (HRES) from the European Centre for Medium-Range Weather Forecasts (ECMWF) to evaluate the applicability of large-scale meteorological models in flood disaster prevention. The results indicate that, compared to traditional numerical weather prediction, the three large-scale meteorological models—GraphCast, FuXi, and AIFS—provide more accurate forecasts regarding the rainfall process, spatial distribution, central location, and timing. For 6-hourly precipitation, these models demonstrate comparable forecast accuracy across different lead times. Regarding accumulated precipitation, GraphCast, AIFS, and HRES produce forecasts of precipitation intensity, rainfall process, and affected areas that closely match observations. When the forecast initialization time is set 1 day in advance, the average accumulated precipitation in the study area was 124.6 mm, with forecasted values of 132.7 mm, 115.5 mm, and 140.0 mm, respectively. For maximum precipitation, GraphCast, FuXi, and AIFS exhibite larger errors in precipitation intensity compared to HRES but have smaller errors in timing and location. The observed maximum accumulated precipitation was 484.8 mm, while the forecasts from GraphCast, FuXi, AIFS, and HRES are 329.7 mm, 190.1 mm, 251.2 mm, and 415.3 mm, respectively, when the initialization time is set 1 day in advance. Overall, large-scale meteorological models can provide effective precipitation forecasts for flood disaster prevention operations.
Keywords: large-scale meteorological model; extreme precipitation; precipitation forecasting; flood disaster prevention; artificial intelligence
本文引用格式:
趙銅鐵鋼,李強.氣象大模型支撐流域暴雨預報實踐探索[J].中國水利,2025(9):34-41.責編李博遠
校對呂彩霞
審核王慧
監制軒瑋
聲明:本文系轉載自互聯網,請讀者僅作參考,并自行核實相關內容。若對該稿件內容有任何疑問或質疑,請立即與鐵甲網聯系,本網將迅速給您回應并做處理,再次感謝您的閱讀與關注。
不想錯過新鮮資訊?
微信"掃一掃"