Alexa 很懂你?除了人工智慧還是有真人在監聽

作者 | 發布日期 2019 年 04 月 11 日 17:41 | 分類 AI 人工智慧 , Amazon , 資訊安全 follow us in feedly

亞馬遜(Amazon)人工智慧助理 Alexa 應用大量資料訓練,以提升語音辨識和應答的準確性,但亞馬遜從未透露提升 Alexa 準確性的細節,據 Bloomberg 報導亞馬遜在訓練 Alexa 時,有大量員工辨識分析數百萬條語音,由於人類加入,語音助理提供服務的過程,就會面臨如何保護用戶隱私的問題,至今亞馬遜沒有給更好的解釋。



語音助理訓練會使用大量資料,亞馬遜宣布時,往往會介紹大量機器學習技術的應用如何提升語音助理的性能,但提升辨識準確率最高效的辦法就是讓人來聽。這一點在亞馬遜 Alexa 冗長的用戶服務協議中列明,但很少會有用戶注意到這些內容。隨著語音助理在日常生活的應用越來越普遍,用戶也開始關注語音助理如何工作,但各大公司對語音助理的服務和技術細節往往避而不談,特別是有員工參與語音辨識這些細節從未公開討論。

機器學習技術應用時,人類參與資料的分析通常解釋為資料註釋,這是自然語言辨識、翻譯、圖像辨識等技術應用的基礎工作之一,比如 Alexa 無法準確辨識用戶的口音,不同地區重複的地名或其他難以辨識的資訊,技術研發時並沒有考慮到這些因素,應用就需要人類介入修正。

在全球有成千上萬亞馬遜公司、供應商和合作方員工參與 Alexa 語音助理的工作,從技術層面來看,半監督學習的模式是提升機器學習技術效率的主要方式,但問題在於大多數用戶並不知道自己的語音可能被另一個人聽到,同時語音可能包括用戶的隱私資料,且這些資料可能被人為濫用,整個過程都得不到有效監管。

據 Bloomberg 報告顯示,當員工從 Alexa 語音助理聽到一些負面內容,一旦涉及執法機構調查,亞馬遜有可能提出這些語音資料,之前有案例 Alexa 語音當成庭審證據,更糟糕的是 Alaxa 部分員工會與其他同事分享、討論聽到語音的有趣或尷尬的內容,此舉涉嫌侵犯用戶隱私。

亞馬遜聲明,人為介入只為幫助一小部分 Alexa 語音,以便改善用戶體驗,這有助於提升語音辨識的準確率和升級自然語音理解系統,Alexa 才能為用戶服務,但執行過程有嚴格的技術和操控限制,對任何濫用 Alexa 資料的行為都是零容忍,員工無法獲得語音發出者的用戶資料,任何涉及個人隱私的資料都是保密的。

如果是如 Amazon 在 2018 超級盃的廣告影片般,以這些真人收聽回覆,我想很多會很願意試一下吧。

(首圖來源:亞馬遜

關鍵字: , , ,