Google 發表深度神經網路天氣模型 MetNet，幾秒鐘就能預測整個美國的降雨量

準確預測未來幾分鐘到幾週的天氣是一項基本的科學挑戰，它可以對社會的許多方面產生廣泛影響。

很多氣象機構目前採用的預報是基於大氣的物理模型。儘管在過去幾十年有很大的改進，但這些模型本身受到計算要求的限制，並且，它們對物理定律的近似值非常敏感。

另一種能夠克服這些限制的天氣預報方法是使用深度神經網路（DNNs）。DNNs 在強大的專用硬體（如GPU 和 TPU）上使用平行計算，發現數據中的模式，並學習從輸入到所需輸出的複雜轉換。

近日，在先前對降雨量預報的研究基礎上，Google 提出了 MetNet，這是一種用於降雨預報的神經天氣模型。這種 DNN 能夠在未來 8 小時內以 1km 的解析度預報降雨量，時間間隔為 2 分鐘。MetNet 的預測時間比 NOAA 目前使用的最先進的基於物理的模型提前了 7~8 小時。它可以在幾秒鐘內對整個美國的降雨量進行預測，而 NOAA 需要花費一小時。

網路輸入來自雷達站和衛星網路，無需人工標註。模型輸出是一個概率分布，Google 用它來推斷每個地理區域的降雨率和相關的不確定性。下面這張圖提供了該網路對美國大陸的預測範例。

▲ MetNet 模型預測結果與 NOAA 多雷達 / 多感測器系統（MRMS）測量的地面真實值相互比較。MetNet 模型（上圖）顯示了從 2 分鐘到 480 分鐘前預測的每小時 1 毫米降雨的概率，而 MRMS 數據（下圖）顯示了在同一時間段內接收到至少每小時 1 毫米降雨的區域。（Source：Google AI Blog，下同）

MetNet 不依賴於大氣動力學領域的物理定律，它是透過反向傳播學習，直接從觀測數據中預測天氣。該網路使用由多雷達 / 多感測器系統（MRMS）組成的地面雷達站，以及衛星系統（提供大氣中雲層由頂而下的視圖），測量得出的降雨量估計值。這兩個數據源均覆蓋美國大陸，並提供可由網路有效處理的圖像類輸入。

該模型每 64km×64km 執行一次，覆蓋整個美國，其解析度為 1km。然而，與這些輸出區域相比，輸入數據的實際物理覆蓋範圍要大得多，因為它必須考慮到在進行預測的時間段內，雲和降雨場的可能運動。

例如，假設雲以每小時 60km 的速度移動，為了可靠預測，捕捉到 8 小時前的大氣時間動態，模型需要 60×8=480km 的全方位空間背景。因此，要達到這個程度，需要 1,024km×1,024km 區域中的資訊來對中心 64km×64km 修補程式加以預測。

▲ 包含衛星和雷達圖像（1,024×1,024 平方公里）的輸入修補程式和輸出預測雷達圖像（64×64 平方公里）。

由於以全解析度處理 1,024km×1,024km 的區域需要大量記憶體，因此研究人員使用空間下採樣器，透過減少輸入面片的空間維度來減少記憶體消耗。同時，在輸入中查找並保留相關的天氣模式。然後沿降採樣輸入數據的時間維度應用時間編碼器，對 90 分鐘輸入數據的 7 個快照編碼，編碼片段長度為 15 分鐘。時間編碼器採用摺積 LSTM 實現，該摺積 LSTM 特別適合於圖像序列。

然後，時間編碼器的輸出被傳遞到空間聚集器，空間聚集器使用軸向自關注，有效地捕獲數據中的長距離空間依賴性，並基於輸入目標時間使用可變數量的上下文，預測 64km×64km 的輸出。

這種結構的輸出是一個離散的概率分布，估計美國大陸每平方公里的給定降雨率的概率。

▲ 神經氣象模型 MetNet 的結構。

結果

研究人員根據一個降雨率預測基準對 MetNet 進行評估，並比較結果與兩個基線：NOAA 高解析度快速刷新 HRRR 系統，這是目前在美國運行的物理天氣預測模型；一個估計降雨場運動（即光流）的基線模型，它是一種在預測時間少於 2 小時的時候，表現也很好的方法。

Google 的神經天氣模型的一個顯著優點是，它是為密集平行計算而優化的，並且非常適合在專用硬體（如 TPU）上運行。無論是針對紐約市這樣的特定地點還是針對整個美國，預測可以在幾秒鐘內並行進行。而像 HRRR 這樣的物理模型在超級電腦上的執行時間約為一小時。

在下面的圖表中，研究人員量化了 MetNet、HRRR 和光流基線模型之間的性能差異。這裡展示了這 3 個模型所取得的性能，在降雨率閾值為 1.0mm/h（相當於小雨）時使用 F1 分數進行評估。MetNet 神經天氣模型能夠在 8 小時內超過 NOAA-HRRR 系統，並且始終優於基於流量的模型。