Google 發表深度神經網路天氣模型 MetNet,幾秒鐘就能預測整個美國的降雨量

作者 | 發布日期 2020 年 04 月 03 日 12:00 | 分類 AI 人工智慧 , Google , 環境科學 Telegram share ! follow us in feedly


準確預測未來幾分鐘到幾週的天氣是一項基本的科學挑戰,它可以對社會的許多方面產生廣泛影響。

很多氣象機構目前採用的預報是基於大氣的物理模型。儘管在過去幾十年有很大的改進,但這些模型本身受到計算要求的限制,並且,它們對物理定律的近似值非常敏感。

另一種能夠克服這些限制的天氣預報方法是使用深度神經網路(DNNs)。DNNs 在強大的專用硬體(如GPU 和 TPU)上使用平行計算,發現數據中的模式,並學習從輸入到所需輸出的複雜轉換。

近日,在先前對降雨量預報的研究基礎上,Google 提出了 MetNet,這是一種用於降雨預報的神經天氣模型。這種 DNN 能夠在未來 8 小時內以 1km 的解析度預報降雨量,時間間隔為 2 分鐘。MetNet 的預測時間比 NOAA 目前使用的最先進的基於物理的模型提前了 7~8 小時。它可以在幾秒鐘內對整個美國的降雨量進行預測,而 NOAA 需要花費一小時。

網路輸入來自雷達站和衛星網路,無需人工標註。模型輸出是一個概率分布,Google 用它來推斷每個地理區域的降雨率和相關的不確定性。下面這張圖提供了該網路對美國大陸的預測範例。

▲ MetNet 模型預測結果與 NOAA 多雷達 / 多感測器系統(MRMS)測量的地面真實值相互比較。MetNet 模型(上圖)顯示了從 2 分鐘到 480 分鐘前預測的每小時 1 毫米降雨的概率,而 MRMS 數據(下圖)顯示了在同一時間段內接收到至少每小時 1 毫米降雨的區域。(Source:Google AI Blog,下同)

MetNet 不依賴於大氣動力學領域的物理定律,它是透過反向傳播學習,直接從觀測數據中預測天氣。該網路使用由多雷達 / 多感測器系統(MRMS)組成的地面雷達站,以及衛星系統(提供大氣中雲層由頂而下的視圖),測量得出的降雨量估計值。這兩個數據源均覆蓋美國大陸,並提供可由網路有效處理的圖像類輸入。

該模型每 64km×64km 執行一次,覆蓋整個美國,其解析度為 1km。然而,與這些輸出區域相比,輸入數據的實際物理覆蓋範圍要大得多,因為它必須考慮到在進行預測的時間段內,雲和降雨場的可能運動。

例如,假設雲以每小時 60km 的速度移動,為了可靠預測,捕捉到 8 小時前的大氣時間動態,模型需要 60×8=480km 的全方位空間背景。因此,要達到這個程度,需要 1,024km×1,024km 區域中的資訊來對中心 64km×64km 修補程式加以預測。

▲ 包含衛星和雷達圖像(1,024×1,024 平方公里)的輸入修補程式和輸出預測雷達圖像(64×64 平方公里)。

由於以全解析度處理 1,024km×1,024km 的區域需要大量記憶體,因此研究人員使用空間下採樣器,透過減少輸入面片的空間維度來減少記憶體消耗。同時,在輸入中查找並保留相關的天氣模式。然後沿降採樣輸入數據的時間維度應用時間編碼器,對 90 分鐘輸入數據的 7 個快照編碼,編碼片段長度為 15 分鐘。時間編碼器採用摺積 LSTM 實現,該摺積 LSTM 特別適合於圖像序列。

然後,時間編碼器的輸出被傳遞到空間聚集器,空間聚集器使用軸向自關注,有效地捕獲數據中的長距離空間依賴性,並基於輸入目標時間使用可變數量的上下文,預測 64km×64km 的輸出。

這種結構的輸出是一個離散的概率分布,估計美國大陸每平方公里的給定降雨率的概率。

▲ 神經氣象模型 MetNet 的結構。

結果

研究人員根據一個降雨率預測基準對 MetNet 進行評估,並比較結果與兩個基線:NOAA 高解析度快速刷新 HRRR 系統,這是目前在美國運行的物理天氣預測模型;一個估計降雨場運動(即光流)的基線模型,它是一種在預測時間少於 2 小時的時候,表現也很好的方法。

Google 的神經天氣模型的一個顯著優點是,它是為密集平行計算而優化的,並且非常適合在專用硬體(如 TPU)上運行。無論是針對紐約市這樣的特定地點還是針對整個美國,預測可以在幾秒鐘內並行進行。而像 HRRR 這樣的物理模型在超級電腦上的執行時間約為一小時。

在下面的圖表中,研究人員量化了 MetNet、HRRR 和光流基線模型之間的性能差異。這裡展示了這 3 個模型所取得的性能,在降雨率閾值為 1.0mm/h(相當於小雨)時使用 F1 分數進行評估。MetNet 神經天氣模型能夠在 8 小時內超過 NOAA-HRRR 系統,並且始終優於基於流量的模型。

▲ 1.0 mm/h 降雨率(越高越好)下的 F1 得分評估性能。神經天氣模型(MetNet)比目前在美國運行的基於物理的模型(HRRR)的時間尺度要提前 8 小時。

由於大氣的隨機性,未來天氣狀況的不確定性隨著預測時間的延長而增加。

MetNet 是一個概率模型,隨著預測時間的延長,預測的不確定性在可視化中表現為預測的日益平滑。相反,HRRR 並不直接進行概率預測,而是會對未來的降雨情況進行單一的預測。下圖比較 MetNet 模型和 HRRR 模型的輸出。

▲ 從 NOAA MRMS 系統獲得的 MetNet(上)和 HRRR(下)到地面真值(中)的輸出之間的比較。雖然 HRRR 模型預測的結構似乎更接近於基本事實,但預測的結構可能嚴重錯誤。

與 MetNet 模型相比,HRRR 物理模型的預測更清晰、更結構化。但其結構,特別是預測結構的準確時間和位置的精準度較低。這是由於初始情況和模型參數的不確定性造成的。

▲ HRRR(左)從許多可能的結果中預測單個潛在的未來結果(紅色),而 MetNet(右)透過分配未來結果的概率直接解釋不確定性。

▲ 研究人員比較了 HRRR 和 MetNet 模型。

未來方向

Google 正在積極研究如何改進全球天氣預報模型,尤其是在氣候快速變化很大的地區的準確性。雖然上文展示了美國大陸目前的 MetNet 模型,但它可以擴展到任何有足夠雷達和光學衛星數據的地區。本文提出的工作是這個努力的一個小小的墊腳石,Google 希望透過今後與氣象界的合作,能夠帶來更大的改進。

(本文由 雷鋒網 授權轉載;首圖來源:pixabay

延伸閱讀: