不必學亞馬遜 Alexa 那一套,杜奕瑾呼籲台灣別只做大老二

作者 | 發布日期 2018 年 07 月 12 日 8:15 | 分類 AI 人工智慧 , 網路 , 軟體、系統 follow us in feedly

PTT 之父杜奕瑾返台後,創立台灣人工智慧實驗室(AI Labs),開發的語意辨識引擎「雅婷一號」,他分享內部測試過辨識率準確度更勝科大訊飛,如今,「雅婷一號」也傳出將跟華碩合作。



杜奕瑾表示,「我們台灣的中文語音技術已經是世界水準,跟科大訊飛、Google 及百度一起測,我們台灣本地的中文辨識率是最準確的。」不過對於華碩合作案,他表示個別的合作不方便講。

開發「雅婷一號」,靠網路大數據訓練

▲ 杜奕瑾說,雅婷一號不斷在 YouTube 上看片學國語,現在國語、台語都能通。(Source:HowFun

他表示,現在 AI Labs 團隊做的語音辨識及語意理解,都是用本地的資料做訓練,不管是看 PTT 網站還是上 YouTube,「網路就是大數據」,杜奕瑾說,很多企業說沒有數據無法做機器訓練,現在雅婷一號台語也能通,連人臉辨識訓練也是用在地影片做訓練。

為何要開發雅婷一號?據了解,起源是有次數位政委唐鳳拜會杜奕瑾時,帶了一位每分鐘可以打 300 到 350 字的速錄師薛雅婷,做訪談逐字稿,結果唐鳳對杜奕瑾的語音 AI 辨識印象深刻,還打趣不要讓「雅婷」整天做會議紀錄太累,所以讓這個語音辨識系統取名雅婷一號。

「但語音介面要每天在身邊使用,其實還有很大的改善空間」,杜奕瑾說,至今身邊都沒有出現太多語音控制服務。但他仍對聲控發展樂觀以對,可是能否做到完全順暢,他認為不管是國際大廠還是台灣業者,都還在摸索。

人工智慧使用者介面,仍處摸索期

在杜奕瑾的觀念裡,數位社會發展有 3 個時間軸線發展,第一階段是 1995 年起的 10 年,是電腦時代,當時的使用介面是瀏覽器;而後進入 10 年智慧手機時代,使用介面就是 App;如今現在進入第 3 個人工智慧階段,但使用介面是什麼呢?杜奕瑾說,「大家都還在摸索」。

▲ 人稱 PTT 創世神的杜奕瑾在台專攻智慧醫療、智慧交通、語音辨識 3 大領域。(Source:AI Labs

AI Labs 開發了雅婷一號語音辨識引擎。杜奕瑾說,語意理解跟語音辨識技術其實在這幾年有很大的突破,但怎樣才是最佳用戶體驗,還有很多改善空間。

他建議大家發展 AI 的使用方式,應該是思考用科技去解決身邊的問題,這樣做出來的工具自然最好用,因為這是你最了解的地方。也因此,杜奕瑾回台後創立 AI Labs 投入智慧城市、智慧醫療、人機介面 3 領域發展,他說,「台灣一定要有自己的力量」。

台灣徒有框架,缺乏核心引擎

杜奕瑾觀察,台灣廠商大量做裝置端產品,或是服務框架出來後,卻缺乏核心引擎,現在人工智慧實驗室就是建立一個很紮實的、在台灣的引擎,不需要把資料送出國。

「你願意把資料送到中國嗎?」杜奕瑾問,個資傳送涉及隱私跟安全問題,「資料就是國安」,雅婷一號是唯一不需要將資料外送的引擎。

▲ 智慧音箱品牌大增,杜奕瑾問:你願意把自己資料送出國運算嗎?

現在的語音辨識引擎,例如 Alexa 主要功能就是購物跟聽音樂,但杜奕瑾認為,未來人機介面體驗其實還有很多發揮空間,若能做到天然的溝通技術,不會只能做這兩樣工作。

杜奕瑾說,現在大家就是看 Alexa 做得起來(購物跟聽音樂)就跟進做,但他呼籲,「我們不要做大老二」,不要只是看亞馬遜做了就想複製,又例如無人機運貨或無人商店,在他眼裡實用性都不夠強,他認為台灣廠商仍應回歸關注身邊的問題,以此為本去想解法。

台灣 AI 產業占據良好位置

杜奕瑾說,其實台灣在數位社會發展邁入人工智慧階段時,有非常好的位置,一方面跟美國廠商合作關係好,一方面有世界第一流的軟體人才,比方台大在 2016 年是亞洲 AI 大學排名第一,台灣團隊在國際比賽中也常拿到世界冠軍,在他眼中,台灣的基本教育水準已在,加上有開放的思想與言論及行動力,在未來時代中都是非常好的創新點,只是需要有人幫忙組織。

也因此,除了雅婷一號,醫療照顧上,人工智慧實驗室跟疾病管制局合作,透過 AI 線上判讀檢測,讓醫生不必白跑一趟,另外做心臟超音波也可以不需專業人員,能透過遠端即時執行,目前更計劃用演算法發現罕見疾病跟基因關係,期望利用基因編輯方式治療罕見疾病。

在智慧城市上,人工智慧實驗室也在做交通自動辨識監控系統,期望在兼顧隱私下,做急難救助及犯罪防治,但這需要搭配邊緣運算力。另外也利用人工智慧引擎,學習已逝導演齊柏林大量的影片中運鏡跟影像調整技巧,未來要用 AI 來拍《看見台灣》影片續集。

(本文由 數位時代 授權轉載;首圖來源:pixabay

延伸閱讀: