LINE 努力訓練 AI 聽說能力,要成為 LINE Bank 等服務重要的技術支架

作者 | 發布日期 2019 年 12 月 04 日 11:54 | 分類 AI 人工智慧 Telegram share ! follow us in feedly


語言助理是這年代熱門話題,但不是每家企業有工程團隊能寫程式串接 Chatbot,提供語音問答服務。因此提供工具協助一般企業建議 Chatbot 是 AI 應用普及的重要一步。台灣人常用的 LINE 通訊與網路入口服務布局未來,推出 Chatbot Builder Framework,能不用寫程式只要餵資料,就能建構 Chatbot,服務不同應用場景。

NAVER Clova 資料科學家李在元負責帶領 Chatbot Builder Framework,解釋他們推出 LINE Partners 計畫要積極招商,尋求不同領域的公司來合作,建構 Chatbot 生態。而台灣不少人很關心 Clova 的中文語音辨識的狀況,李在元指出他們拿韓語的訓練資料集 chitchat 來訓練,並且將 Chitchat 資料集翻譯成英文和台灣中文,訓練英文和台灣中文的問答。結果發現中文情境下,測試的次數越多,辨識的成功率下降。要能推出台灣人滿意而且辨識率達一定程度,還需要努力。

另外 Chitchat 資料集翻譯成英文、台灣中文,也會發生中文有的句型,並不會存在翻譯過來的 Chitchat 資料集當中,造成 Chitchat 訓練出來的中文語音辨識會缺句型,需要另外補上缺漏的句型資料來訓練。

▲ 李在元解釋中文辨識度的問題 ,希望能隨著時間能夠逐步改善。(Source:科技新報)

李在元指出,他們總共用 4 種模型訓練出適合的語音辨識模型,並且透過 AutoML 模型再選擇最適合、辨識度最高的模型,來服務使用者。

LINE 推 LINE Partners 語音服務計畫,至於 Chatbot Builder Framework 的收費模式,李在元指出要依案例來談,有很多種雙方都能獲益,資源交換的型式,客戶資料如金融業狀況,不能隨便上雲端,也能用 on-premise 的型式安裝在合作客戶的機器。

李在元指出,目前語音辨識模型在多語言混雜情境當中,因為模型針對單一語言訓練,隨著混雜的語言比重越高效果不好,像是 90% 英語搭配 10% 中文,相比 80% 英文搭配 20% 中文,後者辨識效果會比較差。不過搭配 superdomain 模型,判斷講者主要是講什麼語言,再搭配特定語言的模型,能達到比較好的語音辨識效果。

LINE 由於有即時通訊軟體的優勢,可以運用 LINE ID 提供的身份認證機制,對於語音辨識衍生的應用,來說,能夠方便的口語介面。像是 LINE 提出的 LINE Brain 與之後要上線的 LINE Bank,語音辨識與語音服務是他們各自業務重要的核心,LINE 與他們母集團 NAVER 必須要做出辨識正確率高的語音辨識程度,才能達成這兩項計畫給予技術支援,滿足使用者的期待。

(首圖來源:科技新報)