搞定關鍵模型,台灣 NAS 廠商一年內將 AI 導入商用

作者 | 發布日期 2018 年 02 月 06 日 16:35 | 分類 AI 人工智慧 , 儲存設備 , 軟體、系統 follow us in feedly

深度學習技術的成熟,大幅提升影像與語音辨識的精準度,也再度掀起了市場對人工智慧技術的強烈關注。




全球瘋 AI,台廠也不例外

隨著 Amazon、Google、IBM 與 Microsoft 等國際大廠的加入,面對龐大的人工智慧市場商機,包括台灣等來自世界各地的企業,都想透過圖像辨識等人工智慧技術加值產品服務能量。不過,礙於人才(技能)不足、對深度學習模型掌握度不高、可用資料庫不齊全等挑戰,如何將技術真正落實在產品應用中,以充分滿足使用者需求,仍是許多對 AI 大餅躍躍欲試的廠商所須攻克之處。

全球市占第一的台灣網路儲存伺服器品牌群暉科技(Synology)日前推出搭載深度學習影像辨識的相片管理服務── Moments,僅運用四人團隊,在不到一年的時間之內就將深度學習技術應用於服務,其關鍵即在於運用自行建置的深度學習模型,以提升圖像辨識精準度。

優化圖像辨識精準度的兩大祕訣──自建與訓練深度學習模型

對期望提升人工智慧圖像辨識能力的企業來說,如何自建深度學習模型,以及如何訓練模型來優化圖像辨識精準度是最關鍵、也最具挑戰的工作。企業資料科學家得先依據目標建立適合的演算法,並建構一套可以自行分析數據資料、找出特徵值的深度學習模型,然後透過大量有標記(Label)的數據資料(又稱資料集)持續不斷的訓練、優化深度學習模型對圖像辨識的精準度。

現成模型通常都有原先設定的目標,如「物件偵測:偵測每張照片裡面的物件與位置」,但企業開發新應用時希望建立的演算法往往與現成模型原先目標不相同,導致同一張圖像套入模型或演算法出現不同的辨識結果,大幅影響將深度學習技術導入產品的可能性。以群暉科技為例,希望建立的演算法目標是「從一張照片中辨識出多個物件 / 場景」,但這與當前學界研究中盛行的「影像分類:一張圖片即一個主題」等演算法的目標不同。為了讓研發結果能與產品服務接軌、滿足使用者需求,群暉科技才決定自行開發模型。

然而,另一個困難點則在於訓練用資料集的可用性問題。深度學習模型能夠成功實現智慧辨識的關鍵,在於資料的訓練過程,而訓練用資料中已經存在的標記,將很大程度地決定最終訓練結果能否符合目標。群暉科技在取得訓練用數據資料時,便因為資料標記方式與訓練目標不一致,於是重新標記每一筆資料,並且另外準備了一份專門用來驗證辨識成果的驗證用資料集,才得以順利進入正式的模型訓練階段。

值得特別注意的是,為提升深度學習模型的圖像辨識精準度,研發團隊通常都將花費許多時間「調整模型參數、重新訓練模型與驗證模型精準度」,才能從中找出最佳參數,並導入於產品或應用服務中。

從跨界合作取代單打獨鬥  人工智慧就這麼做

深度學習模型的研發費時費工,群暉科技花了近一年的時間,透過產學合作的方式與台灣大學資工系教授徐宏民的研究團隊合作,加速整個產品開發;但是前瞻深度學習技術還是得面對群暉產品、客戶上的諸多要求,因此內部的人工智慧研發團隊得自行落實模型開發與建立。「很令人興奮的產學合作經驗,群暉在深度學習技術從無到有,甚至目前各項視覺辨識指標都達到世界級的水準。」徐宏民表示,在協助群暉科技研發團隊採用合適的視覺辨識技術之際,也發現了其他重要的研究議題,已帶回實驗室進行前瞻的研究工作。

群暉科技軟體開發部協理高士軒說:「在開發 Moments 的經驗中,我們發現想以人工智慧提升服務能量,除了要成立人工智慧研發團隊、還得清楚定義目標,並且持續不斷的予以優化。」高士軒亦認為,因應需求差異,每個產業所需要的深度學習模型都將有所不同,為加速人工智慧相關產品的開發腳步,建議除成立專門的研發團隊,還可進一步尋求外部技術支援;群暉科技便是在徐宏民教授的專業指導下,得以在短時間內成功推出搭載人工智慧技術的全新應用服務。

▲ 全新智慧照片管理套件 Moments 透過深度學習技術,主動辨識出人像、地點、主題等,分類照片不費吹灰之力。(Source:Synology)

對欲導入視覺辨識等人工智慧技術的企業,徐宏民提出三點建議,首先是相信台灣具有相關領域世界級的技術研究能量;其次是確保高階主管對深度學習等技術的認可並願意投資;最後是將深度學習等技術放到產品藍圖,而非只是單純做研究。

展望未來,隨著機器人、自動車、智慧工廠與智慧醫療等應用的崛起與普及,視覺辨識等人工智慧技術將被廣泛地應用在各個地方,不過,由於應用領域差異,所需的視覺辨識技術將有所不同,相關領域企業可透過產學合作等方式及早投入,提升對視覺辨識等人工智慧技術的掌握度,從而開創專屬藍海市場。

(首圖來源:Synology)