影像分析新利器,Meta 新發表影像分割 AI 模型

作者 | 發布日期 2023 年 04 月 07 日 12:29 | 分類 AI 人工智慧 , Facebook line share follow us in feedly line share
影像分析新利器,Meta 新發表影像分割 AI 模型


微軟大力資助的 OpenAI 推出 ChatGPT 後造成轟動,掀起一波 AI 競賽,大型科技公司紛紛宣揚他們在 AI 技術的突破,其中 Meta 展示他們在影像分割和電腦視覺方面的最新進展。

Meta 宣布一種名為 Segment Anything Model(SAM)的 AI 模型,可以辨識圖像和影片中的單一物體,即便是過去 AI 訓練上沒有遇過的物體也能辨識出來。

根據 Meta 官方部落格文章指出,SAM 是一種影像分割模型,可以根據文字提示或使用者點擊進而圈出圖像中的特定物體。影像分割是電腦視覺(Computer Vision,CV)的一種過程,涉及將圖像區分成多個片段或區域,再對應特定的物體,這是為了讓圖像易於分析或處理。Meta 認為影像分割技術有助於理解網頁內容、開發 AR 應用、編輯圖像,也能將影片中的動物或物體自動定位、追蹤,以進行學術研究。

▲ SAM 能夠快速辨識圖像和影片中的單一物體。

通常建立準確的影像分割模型需要專家進行高度專業化的工作,現在透過 SAM,Meta 希望能減少影像分割對專業訓練和知識的要求,促成電腦視覺的進一步發展。

除了 SAM 以外,Meta 還建立一個名為 SA-1B(Segment Anything 1-Billion mask dataset)的訓練資料集,其中包括從一家大型照片公司獲得許可的 1,100 萬張圖像,以及利用影像分割模型產生的 11 億個分割遮罩。目前 SAM 的程式碼已在 GitHub 上,還有展示網站能夠免費體驗,Meta 將讓 SAM 和 SA-1B 能在 Apache 2.0 授權條款下用於研究。

《路透社》報導指出,Meta 執行長祖克柏(Mark Zuckerberg)強調今年將生成式 AI(Generative AI)納入公司旗下服務的重要性,儘管尚未發表使用生成式 AI 的商用產品,但 Meta 已在 Facebook 平台用上類似 SAM 的技術進行照片標記、內容審核,以及確認 Facebook 和 Instagram 上的推薦貼文。

雖然影像分割技術並不新奇,但 SAM 能夠辨識出不存在於訓練資料集內的物體,並對學術研究開放使用,成為這項技術最大亮點,SA-1B 的發布可望也能推動新一代電腦視覺應用。

(首圖來源:Meta AI 網站截圖)

延伸閱讀: