Google 新技術,機器語調超自然與人無異

作者 | 發布日期 2017 年 12 月 29 日 18:00 | 分類 AI 人工智慧 , Google , 機器人 follow us in feedly

Google 人工智慧(AI)技術再進化,該公司宣布能讓機器人說話語調不再生硬,聽來和人類難辨真假。



PhoneArena、Quartz、每日郵報報導,Google 部落格宣稱,開發出第二代文字轉語音系統「Tacotron 2」,能讓機器說話聲音沒有怪異、不自然之處,聽來幾乎和人類一模一樣。機器會依據語意學決定正確發音,文章略有拼寫錯誤也能順利讀出,而且就連繞口令都難不倒。

(Source:Google

Google 人員表示,外界認為 Tacotron 2 表現類似專業人員。民眾給 Tacotron 2 的平均意見分數(Mean Opinion Score)是 4.53 分,只略低於專業人員錄製聲音的 4.58 分。

Tacotron 2 包括兩個深度類神經網路,第一個網路會把文字轉成聲譜圖,用圖像表達音頻,接著把聲譜圖輸入 WaveNet 系統中,機器會照圖發出相應聲音(Tacotron 2 與人類聲音對照點此)。

不過 Google 表示,Tacotron 2 仍有許多地方需要改進,包括無法讀出部分難字,無法即時合成音頻;機器聲音沒有情緒,不能傳達快樂或悲傷的感覺。

儘管如此,此一技術仍大有可為,目前 Google 虛擬語音助理已用 WaveNet 技術發聲,若能進一步採用 Tacotron 2,可讓 Google 助理如虎添翼。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:shutterstock)

延伸閱讀: