谷歌AI擊敗棋王後再進化!會開口說話、語調超像真人

作者 | 發布日期 2016 年 09 月 10 日 17:17 | 分類 AI 人工智慧 line share follow us in feedly line share
谷歌AI擊敗棋王後再進化!會開口說話、語調超像真人


谷歌人工智慧(AI)系統「AlphaGo」,先前擊敗南韓圍棋棋王Lee Se-dol揚名國際。如今研發AlphaGo的團隊再下一城,宣稱能讓電腦說話的聲音更貼近人類,或許未來人們能和AI對話聊天。

CNBC、每日郵報、英國金融時報報導,谷歌母公司Alphabet旗下的DeepMind 8日宣布研發新技術,能讓電腦合成語音和人類聲音的差距減少一半。DeepMind表示,長久以來,人機互動的夢想就是讓人類能和機器對話。

當前的語音合成技術錄製人們實際說話的聲音,存放在資料庫,需要時把字句打散重組,合成為完整句子,此種方式生成的語音聽起來生硬不自然,也缺乏感情。

DeepMind的「WaveNet」技術,能分析原始聲波,使用類神經網路(Neural Network)加以修正。此種技術需要龐大的運算能力,每秒要1.6萬個範本才能轉成數據、合成為語音。DeepMind表示,WaveNet生成的中英文,聽起來比谷歌現行技術自然許多。

英文

中文

DeepMind說,Wavenet能模仿所有人的聲音,還能加入感情和語調,讓電腦生成語音聽來更豐富多變。不此如此,他們還用該技術製造出類似鋼琴的琴聲。不過內情人士指出,WaveNet需要極大的運算能力,可預見的未來或許還無法使用在真實世界,目前也未用於谷歌產品。

人工智慧(AI)再次締造里程碑,谷歌人工智慧系統「AlphaGo」,3月9日擊敗世界圍棋棋王Lee Se-dol,寫下歷史新頁。

英文、中文説話品質比較

                                  英文、中文説話品質比較

金融時報(FT)、衛報報導,電腦早已征服西洋棋,1997年IBM深藍(Deep Blue)打敗了西洋棋王Garry Kasparov。圍棋比西洋棋更複雜,有上兆種可能性,需要靠直覺推演情勢,即便超級電腦都不容易上手。研發AlphaGo的谷歌DeepMind執行總裁Demis Hassabis說,AlphaGo的勝利是歷史性時刻。韓國解說員認為,AlphaGo下法神祕莫測,致勝關鍵在於不會受到情緒干擾。AlphaGo就算犯錯,仍能保持冷靜,不影響後面棋局。相反的,Lee因為一開始的失誤,苦吞敗仗。

AlphaGo的勝利,可能意味人工智慧將更廣泛運用,人類工作岌岌可危。CNBC報導,人工智慧不斷進化,新創公司Thumbtack報告稱,當前所謂的「零工經濟」,將在20年消失。未來物流公司無需聘請人類駕駛,改用自駕車和無人機取代,叫車軟體優步(Uber)、零售巨擘亞馬遜(Amazon)都會加入此一潮流。另外,當前的高階工作者,如律師、會計等,工作也不再穩固,將成為新的零工經濟成員。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:Google)