手機 App 成為盲人救星,深度學習技術能辨識物體講給他們聽

作者 | 發布日期 2016 年 04 月 17 日 12:00 | 分類 app , 尖端科技 , 手機 follow us in feedly

許多武俠小說、科幻或超級英雄故事中,眼睛瞎掉的角色,常常發展出超級聽覺,甚至能「聽聲辨物」,但這只是明眼人的想像,實際上根本不可能聽聲辨物,盲人最大的障礙之一,就是不知道身邊有什麼事物,得請明眼人告訴他們,不過,雖然不能聽聲辨物,但科技的進步讓盲人如今有機會能「手機辨物」,大大改善生活。



由 Google、美國航太總署(NASA)等機構與投資者於 2008 年資助成立的奇點大學(Singularity University),專注研究解決「人類面臨的重大挑戰」,他們關注的目標也放在改善盲人生活之上,奇點大學研究團隊訪問 88 名盲人,詢問他們生活中最大的不便是什麼,他們告訴研究團隊,最讓他們挫折的,是因為看不到周遭事物,得不斷拜託明眼人告訴他們身邊有什麼,在智慧型手機發明後,盲人有個替代方案,就是透過視訊傳遞畫面,然後由網路另一端的明眼人告訴他們看到什麼,但這種操作相當耗費時間,來回問答可能要花上兩分鐘,又非得要有網路連線不可,而且也一樣要拜託別人。

科技不應該只有用這麼笨拙的方式解決問題,研究團隊想到,若能用軟體即時辨識,那就省去了相當多麻煩,而在深度學習的技術發展下,要用軟體辨識物體已經並非難事,只要將大量圖片丟給深度學習軟體,告訴它裡頭是什麼,深度學習機制就會學習什麼樣的圖形是什麼物體,自動找出如何辨認它們的方式,就好比 AlphaGo 學習如何下圍棋一樣。根據這樣的技術,研究團隊打造出 Aipoly Vision 手機 App,測試版本可辨識出 1 千種不同顏色的物件,而 2016 年 3 月底釋出的更新,則可辨識 5 千種物件。

使用方式則相當簡單,只要對著所想要「看」的方向拍攝,手機就會自動說出所「看」的方向有什麼東西。當盲人試用 Aipoly Vision 時,有人喜極而泣,表示這簡單的功能卻對其生活有極大改善,並將之比擬為相當於是盲人的自動車科技。

 

日本人下載來學英語

Aipoly Vision 也將進一步發展文字辨識功能。目前盲人已經有由國家盲人協會(National Federation of the Blind,NFB)與發明家雷蒙‧庫茲威爾(Raymond Kurzweil)共同發展的文字辨識軟體 KNFB Reader,不過要價 99 美元,可幫助盲人閱讀無點字書籍、唸出餐廳菜單、說明指示等,Aipoly Vision 打算達到同樣功能,而且免費提供。

Aipoly Vision 還可辨識品牌的 logo,這點對盲人也很方便,因為盲人憑著觸覺可以知道這是一瓶飲料,但是卻不可能摸出是哪牌的什麼飲料,這時品牌辨識就能派上用場,只不過 Aipoly Vision 的品牌辨識功能尚待改進,因為若拿一瓶可口可樂給它辨識,它會認成酷爾斯啤酒,這點有點讓人擔心,可樂看成啤酒或許還無所謂,若是把不可飲用的液體當成飲料那就有誤飲的潛在風險。

Aipoly Vision 辨識的能力也還有所限制,譬如,若拿 Aipoly Vision 來看超人漫畫,它能認出那是超人,但是無法告訴盲人超人在做什麼動作。不過 Aipoly Vision 還會不斷繼續改善功能,並持續將所有的經費都投入技術研發,下一步還將包括納入臉部辨識功能,幫盲人認人。

目前 Aipoly Vision 在蘋果(Apple)App Store 上全球已經有 3.5 萬人下載,其中在日本有 8,000 人下載,有趣的是,日本下載的用戶中,有很多根本是明眼人,那下載來幹嘛呢?原來是 Aipoly Vision 說著一口字正腔圓的英國腔英語,結果日本人拿來學習英語,這是研究團隊始料未及的應用,不過也給了他們靈感,或許之後還可以往語言學習的方向發展,不只照顧盲人,也照顧明眼人。

(首圖來源:Aipoly Vision) 

關鍵字: , , ,

發表迴響