為什麼語音助理都預設女聲?Google 產品經理說出真相

作者 | 發布日期 2019 年 09 月 23 日 16:14 | 分類 AI 人工智慧 , Google , 科技趣聞 follow us in feedly


稍早《衛報》曝光語音助理 Siri 的內部文件,顯示蘋果為了避免 Siri 回答問題時有性別偏見,為 Siri 制定了一系列道德規範。

很長一段時間,蘋果、Google 、微軟等科技公司的語音助理都預設女聲,聯合國報告指出是因為軟體設計由男性主導,加強性別偏見的傳播。

最近 Google 負責 TTS (Text-to-Speech,文本轉語音)的產品經理 Brant Ward 接受採訪時,卻有不一樣的答案。他表示,Google 第一次推出語音助理時,其實想用男聲,選擇女聲是無奈之舉。

Google 本來想推出同時支援男聲和女聲的語音助理,但傳統 TTS 系統卻很難做到,因為這套系統接受的訓練數據都是女性,女聲的效果也更好。

為什麼 Google 的 TTS 系統採用的訓練樣本女性多於男性,Brant Ward 表示,由於女聲音調更清楚,當時的系統更容易聽懂。

女聲更容易辨識,過去幾十年這觀念逐漸成了「文本轉語音」領域的共識,因此 Google 等公司一度放棄開發男聲語音助理,可能也是一種偏見。

車載語音系統 Cerence 的 TTS 開發總監 Johan Wouters 表示,沒有任何科學證據表明女聲讓機器更容易理解,男聲和女聲的開發沒有技術差異,開發的難度並不是語音助理多為女聲的主要原因。

(Source:Gigazine

Brant Ward 也回應 Johan Wouters 的質疑,表示他的分析只適用 Google 的系統。

此外,隨著 AI 技術出現,Google 已解決了這個問題。透過 Google 母公司 Alphabet 旗下的人工智慧公司 DeepMind 提供的新演算法 WaveNet,能用更少訓練樣本,生成更逼真的人聲。

得益於 WaveNet,Google Assistant 在 2017 年 10 月開始支援男聲,目前 Google 已在全球 7 個國家推出支援男聲的語音助理,甚至帶有當地口音,如有英國和美國南部口音。

但如果把語音助理預設為男聲,是否又是另一種性別偏見?Google 的解決方法是,男聲和女聲為隨機配給用戶,每種性別的聲音都有 50% 的使用機率。

不得不說,蘋果和 Google 這些科技巨頭為了避免「性別不平等」的指摘,真是如履薄冰了。不管怎麼說,科技產品對不同性別和文化的包容,意味著用戶有更多選擇,終究不是壞事。

(本文由 愛范兒 授權轉載;首圖來源:Unsplash

延伸閱讀: