微軟研發人工智慧語音技術，只需少量訓練即可運作

目前文字轉語音的技術已相當普及，由於應用範圍廣泛，不少科技公司努力開發新技術，帶來更自然流暢的效果。最近微軟就開發出只需少量訓練就可運作的人工智慧語音技術。

目前文字生成語音技術需要大量資料去訓練調整，才能達到自然效果，不過微軟最近開發的人工智慧技術，可用 200 個聲音標本，也就是約 20 分鐘錄音，自動生成擬真度高的語音，比傳統技術節省不少時間。此次採用深度神經網路技術，直接將輸入文字連接到聲音庫，生成語音更有效率，即使較複雜的文字也可快速生成。

據研究人員指，雖然現在技術生成的語音仍未臻完美，但可讀性已達 99.84%，意味大多數情況下，語音都可正確理解。新技術將讓文字生成語音的技術門檻大幅降低，就算是中小型公司，都可簡單製作自己的語音系統，無需投入大量資源。不過目前微軟仍然未推出使用這技術的相關產品，距離正式推出相信仍有一段時間。

（本文由 Unwire Pro 授權轉載；首圖來源：微軟）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？