
微軟大力資助的 OpenAI 推出 ChatGPT 後造成轟動,掀起一波 AI 競賽,大型科技公司紛紛宣揚他們在 AI 技術的突破,其中 Meta 展示他們在影像分割和電腦視覺方面的最新進展。
Meta 宣布一種名為 Segment Anything Model(SAM)的 AI 模型,可以辨識圖像和影片中的單一物體,即便是過去 AI 訓練上沒有遇過的物體也能辨識出來。
根據 Meta 官方部落格文章指出,SAM 是一種影像分割模型,可以根據文字提示或使用者點擊進而圈出圖像中的特定物體。影像分割是電腦視覺(Computer Vision,CV)的一種過程,涉及將圖像區分成多個片段或區域,再對應特定的物體,這是為了讓圖像易於分析或處理。Meta 認為影像分割技術有助於理解網頁內容、開發 AR 應用、編輯圖像,也能將影片中的動物或物體自動定位、追蹤,以進行學術研究。
▲ SAM 能夠快速辨識圖像和影片中的單一物體。
通常建立準確的影像分割模型需要專家進行高度專業化的工作,現在透過 SAM,Meta 希望能減少影像分割對專業訓練和知識的要求,促成電腦視覺的進一步發展。
除了 SAM 以外,Meta 還建立一個名為 SA-1B(Segment Anything 1-Billion mask dataset)的訓練資料集,其中包括從一家大型照片公司獲得許可的 1,100 萬張圖像,以及利用影像分割模型產生的 11 億個分割遮罩。目前 SAM 的程式碼已在 GitHub 上,還有展示網站能夠免費體驗,Meta 將讓 SAM 和 SA-1B 能在 Apache 2.0 授權條款下用於研究。
《路透社》報導指出,Meta 執行長祖克柏(Mark Zuckerberg)強調今年將生成式 AI(Generative AI)納入公司旗下服務的重要性,儘管尚未發表使用生成式 AI 的商用產品,但 Meta 已在 Facebook 平台用上類似 SAM 的技術進行照片標記、內容審核,以及確認 Facebook 和 Instagram 上的推薦貼文。
雖然影像分割技術並不新奇,但 SAM 能夠辨識出不存在於訓練資料集內的物體,並對學術研究開放使用,成為這項技術最大亮點,SA-1B 的發布可望也能推動新一代電腦視覺應用。
- Meta releases AI model that can identify items within images
- Meta shares AI model that can detect objects it hasn’t seen before
- New AI model can “cut out” any object within an image—and Meta is sharing the code
(首圖來源:Meta AI 網站截圖)