進階 AI 解讀資訊,MUM 如何助 Google 搜尋提供 COVID-19 疫苗可靠資訊?

作者 | 發布日期 2021 年 06 月 30 日 18:20 | 分類 AI 人工智慧 , Google Telegram share ! follow us in feedly


用戶要從 Google 的服務獲得可靠的 COVID-19 疫苗資訊相當重要,然而指稱 COVID-19 以及相關疫苗的名稱相當繁雜。為此在 Google I/O 2021 開發者大會就已亮相的新工具 MUM(Multitask Unified Model),可在短短幾秒鐘內辨識超過 50 種語言、800 種以上用來稱呼疫苗的詞語,並已應用在 Google 搜尋服務中,幫助全球用戶即時獲得可靠資訊。

許多事物都有不同稱呼,比方說碳酸飲料又名汽水、美式足球又名橄欖球。這些名稱差異有的是語言功能使然,有的是在反映文化上的細微差異,也有單純因為地域不同,所以同樣的事物卻有不同的稱呼。

Google 搜尋研究員暨副總裁 Pandu Nayak 指出,COVID-19 即是非常具有代表性的例子,Google 搜尋服務必須學會辨識人們用來指稱新型冠狀病毒的每個詞組,以確保為來自世界各地的用戶即時呈現產生搜尋結果,並從世界衛生組織(WHO)、美國疾病控制與預防中心(CDC)等衛生機關獲得正確情報。

Google 分析如 AstraZeneca、CoronaVac、Moderna、Pfizer、Sputnik 等廣泛使用的疫苗於全球共有超過 800 種名稱。而用戶在 Google 搜尋疫苗資訊時,可能會用「Coronavaccin Pfizer」、「mRNA-1273」、「CoVaccine」等各式各樣的關鍵字。能夠正確識別所有的疫苗名稱,對用戶能否從 Google 獲得可靠的疫苗資訊相當重要。

Pandu Nayak 分享藉由 MUM,Google 可在短短幾秒鐘內辨識超過 50 種語言、800 種以上用來稱呼疫苗的詞語。在驗證 MUM 的搜尋結果後,已將這個模型應用在 Google 搜尋服務中,幫助全球用戶找到有關 COVID-19 疫苗的資訊。

MUM 具有知識轉移能力,可從本身接受訓練逾 75 種語言中學習並轉移知識。譬如閱讀一本書時,如果人們會讀多種語言,就可以在閱讀後用自己會的語言來分享書中觀點,MUM 對於不同語言知識的轉移即是類似這樣的概念。

也因上述能力,MUM 不需要從每一種新語言中學習新的能力或技能,這種跨語言遷移學習能力可以幫助 Google 快速改善系統,即使沒有太多訓練資料也是如此。以疫苗名稱來說,只需要一小部分官方疫苗名稱作為樣本,MUM 就能快速識別這是疫苗在不同語言間的名稱。

(首圖來源:Google Blog