微軟研發人工智慧語音技術,只需少量訓練即可運作

作者 | 發布日期 2019 年 05 月 29 日 8:45 | 分類 AI 人工智慧 , Microsoft follow us in feedly


目前文字轉語音的技術已相當普及,由於應用範圍廣泛,不少科技公司努力開發新技術,帶來更自然流暢的效果。最近微軟就開發出只需少量訓練就可運作的人工智慧語音技術。

目前文字生成語音技術需要大量資料去訓練調整,才能達到自然效果,不過微軟最近開發的人工智慧技術,可用 200 個聲音標本,也就是約 20 分鐘錄音,自動生成擬真度高的語音,比傳統技術節省不少時間。此次採用深度神經網路技術,直接將輸入文字連接到聲音庫,生成語音更有效率,即使較複雜的文字也可快速生成。

據研究人員指,雖然現在技術生成的語音仍未臻完美,但可讀性已達 99.84%,意味大多數情況下,語音都可正確理解。新技術將讓文字生成語音的技術門檻大幅降低,就算是中小型公司,都可簡單製作自己的語音系統,無需投入大量資源。不過目前微軟仍然未推出使用這技術的相關產品,距離正式推出相信仍有一段時間。

(本文由 Unwire Pro 授權轉載;首圖來源:微軟

關鍵字: , ,