Facebook 打造 SEER 程式,使用 10 億張 Instagram 公開照片訓練 AI

作者 | 發布日期 2021 年 03 月 08 日 15:10 | 分類 AI 人工智慧 , Facebook Telegram share ! follow us in feedly


以分享照片與影片為核心的社群平台 Instagram,已是過去 10 年來全球最大的影像資料庫之一,而母公司 Facebook 正在利用這個擁有超過 10 億張公開圖像的龐大資料庫,訓練 AI 人工智慧模型。Facebook 打造被簡稱為「SEER」(SElf-supERvised)的電腦視覺程式,在物件識別測試中的表現優於現有的 AI 模型。

許多 AI 模型是經過仔細標記的數據集進行訓練,但 Facebook 表示 SEER 透過隨機分析未標記、未分類的 Instagram 圖像,學習了解如何識別照片中的物件,這種 AI 技術被稱為自監督學習(Self-Supervised Learning,SSL)。

Facebook 認為,AI 未來在於建立可以直接從任何訊息中學習的系統,運用包括文字、圖片或者其他形式的數據,而無需依靠精心標記、分類的數據集來訓練如何識別物件。

SEER 的成果則展現,自監督學習可以勝任現實環境中的電腦視覺任務。Facebook 認為這是一項突破,成為更加靈活、準確且適應性強的電腦視覺模型。

儘管這只是一個研究項目,但 Facebook 發言人指出,其發展潛力相當廣泛,包括用於自動生成文字說明,來向視障者描述具體畫面,能對在 Facebook Marketplace 上銷售的商品進行自動分類,還能防止有害圖像在 Facebook 平台傳播。

不過,許多 Instagram 用戶可能感到驚訝,他們公開的照片與影片被用於訓練 Facebook 的 AI 系統。Facebook AI Research 的軟體工程師 Priya Goyal 指出,Instagram 有在資料政策中告知用戶,會使用所需的資訊來支持創新研究,包括像這樣圖像訓練 AI 的技術。

Priya Goyal 還表示,將開源該程式部分的程式碼與研究細節,以便其他研究人員也能採用、進行試驗,但不會共享圖像資訊或 SEER 模式。

(首圖來源:Facebook AI