大模型能不能預測惡劣天氣?

作者 | 發布日期 2024 年 02 月 17 日 8:20 | 分類 AI 人工智慧 , 環境科學 , 自然科學 line share follow us in feedly line share
大模型能不能預測惡劣天氣?


目前有不少的大語言模型已經擁有了高準確度的天氣預測能力,相較於傳統的天氣預測技術,這些被稱為大型 AI 氣象預測模型(Large AI Weather forecast Model,LWMs)在極端天氣預測方面有著更好的效果。

盤古氣象(Pangu-Weather)

盤古氣象(Pangu-Weather),是一款由華為推出的天氣預測系統,它利用深度學習技術來提高天氣預報的準確性。

盤古氣象提高預測準確性有兩個關鍵策略,包括一個定制的3D地球特定變換器(3DEST)架構,它可以將高度資訊格式化為立方體資料;此外研究團隊還設計了一個應用分層時間聚合演算法來減輕累積預報誤差。研究顯示,盤古氣象在短到中等範圍的預報(即從一小時到一週的預報時間範圍)顯示出巨大優勢。而且該系統還支援極端天氣預報和多種集合預報。

在極端氣象事件預報方面,盤古氣象展現出顯著的優勢。在測試2018的88個命名熱帶氣旋的追蹤上,其3天和5天的平均直接位置誤差均低於ECMWF-HRES,分別為120.29公里和195.65公里,優於後者的162.28公里和272.10公里。

不過盤古氣象仍存在一些限制與改進空間。由於其訓練數據是基於ERA5再分析數據,因此會存在較大偏差,尤其是在強度預測方面。其次,盤古氣象訓練過程中需要大量運算資源,訓練以及定期維護的成本極高。而且盤古氣象在未見過的數據或不同氣候條件下的泛化能力尚需驗證。

GraphCast

GraphCast 是由Google DeepMind開發的一個基於圖神經網路天氣預測模型,它能夠處理複雜的空間依賴關係,並在全球範圍內提供準確的天氣預報。

GraphCast利用GNNs在處理複雜空間依賴關係的優勢,以提升天氣預報的準確性。在預測過程中,GraphCast會西安進行資料預處理,將氣象資料轉換為圖篇結構,每個節點代表地理位置,並以邊來表示空間關係;之後,GraphCast將為圖中的每個節點提取特徵,如溫度、濕度、風速等;然後利用圖神經網路建模,透過聚合鄰居節點的資訊來更新每個節點的內容,學習複雜的空間依賴關係;接著進行時間序列預測,預測未來一段時間內各個節點的氣象資料變數;最後,對預測結果進行處理和評估,提高預報的可讀性和準確性。

GraphCast 同樣有問題。 GraphCast的表現很大程度上依賴高品質和全面的氣象數據,而數據的缺失或不準確性可能會影響模型的預測結果。此外,儘管GraphCast能夠處理複雜的空間依賴關係,但在即時更新和快速反應天氣變化方面可能仍存在挑戰。

(Source:pixabay

風烏(Fengwu)

風烏是全球的中程天氣預報系統,由上海人工智慧實驗室聯合中國科學技術大學、上海交通大學、南京資訊工程大學、中國科學院大氣物理研究所及上海中心氣象台發布。它採用了多模態和多任務學習的深度學習架構,包括模型特定的編碼器-解碼器和跨模態融合Transformer。這些組件在不確定性損失的監督下學習,以地區自適應的方式平衡不同預測器的最佳化。風烏還引入了重播緩衝區機制,透過儲存先前最佳化迭代的預測結果並用做當前模型的輸入,提高了長時預測效能。

風烏最大的特點,就是利用多模態和多任務學習能力來預測天氣,可以將全球氣象有效預報提高到10.75天。它在ERA5再分析資料上進行了等同39年時間的訓練,能夠準確模擬大氣動力學,並預測37個垂直層次的未來陸地和大氣狀態。

效能評估顯示,風烏在大多數預測目標上的表現優於GraphCast,例如將10天領先全球z500預測的均方根誤差(RMSE)從733降低到651 m²/s²。它在NVIDIA Tesla A100硬體上的推理成本僅為600毫秒,與GraphCast相比,在訓練和推理方面的計算成本更低。

和其他同類模型一樣,風烏也面臨著數據和成本的挑戰,而且隨著氣候模式的變化,風烏需要定期更新以保持準確性,這需要持續的資源投入和專業知識。

ClimateNet

ClimateNet是一個利用卷積神經網路從衛星影像中辨識氣候特徵的模型,旨在解決天氣和氣候科學領域中辨識、偵測和定位極端天氣事件的挑戰。ClimateNet透過ClimateContours工具進行資料集創建,讓專家標註氣候事件,並基於LabelMe進行了最佳化。其研究團隊進行了多次標註活動,產生了數百個專家標註的氣候資料快照,形成了ClimateNet資料集,並進行了嚴格的品質控制。

ClimateNet使用DeepLabv3+架構訓練深度學習模型,實現了氣候資料的像素級分割。該模型在兩個不同的氣候模型場景下進行了訓練和測試,並展示了優於基於啟發式演算法的模型的性能。此外,ClimateNet的應用案例顯示如何利用其分割結果進行條件降水分析,有助於理解氣候變遷對極端天氣事件的影響。

儘管ClimateNet取得了顯著進展,但因為訓練資料有限,且需要持續的更新和維護,ClimateNet目前仍處於研究階段,並沒有被正式投入使用。

(Source:pixabay

伏羲(FuXi)

伏羲是一款基於機器學習的天氣預報系統,能夠提供15天的全球天氣預報,具有6小時的時間解析度和0.25°的空間解析度。該系統基於歐洲中期天氣預報中心(ECMWF)的ERA5再分析資料集開發,並透過等同39年時間的資料訓練而成。

伏羲採用了一種新穎的級聯機器學習模型架構,由三個預先訓練的伏羲模型組成,分別針對0-5天、5-10天和10-15天的預報時間窗口進行最佳化。這些模型透過級聯方式產生完整的15天預報。伏羲在15天預報的表現與ECMWF集合平均相當,顯著減少了累積誤差,提高了長期預報的準確度。為了處理天氣預報的不確定性,伏羲也提供了一個有50成員的集合預報。

伏羲目前最大的問題是其預報時間在9天後便會出現性能下降的情況,而且伏羲的預測玩去哪依賴於ECMWF的ERA5再分析數據集,法完全獨立於傳統的數值天氣預報模型,這讓它目前還難以投入實際應用之中。

除了這些較成熟的大型AI 氣象預測模型之外,還有不少模型正在訓練中,以減少極端天氣可能帶來的影響。當然,由於成本、維護、精確度等問題,現在的天氣預測模型還難以做到全面準確,但相信隨著技術的發展,將來會有越來越多的AI模型被投入使用。

(本文由 品玩 授權轉載;首圖來源:pixabay

延伸閱讀: