Google reCAPTCHA 系統被破解，機器語音驗證準確率高達 85%

1 月 2 日的消息，美國馬里蘭大學的 4 位研究員開源了一個名為 UnCaptcha 的工具，能夠破解 Google 的驗證碼系統 reCAPTCHA，其進行語音驗證的準確率高達85%。

與眾多驗證機制一樣，早期的 reCAPTCHA 系統透過數位驗證碼進行辨識，以此確保操作方是人類而非機器人。但是，2012 年一個 Google 研究團隊幾乎百分之百破解了其文本驗證碼系統。於是 Google 在這之後的升級版中，加入了語音和圖像驗證的方式。

如今，上述驗證方式再次遭遇巨大挑戰。「Google 的 reCAPTCHA 系統使用了一些高級的分析工具來判斷一個用戶到底是人還是機器人。他們使用了多種元素，包括 cookie、解題的速度、滑鼠的移動以及解題的成功率。」

▲ UnCaptcha 工具測試介面。

據該項目負責人稱：「reCAPTCHA 系統的語音辨識體制由一長串數字讀音組成，每個字的語速、音調都不相同，甚至還會改變口音。為了解析這些數字，首先需要從網頁上將音頻文件下載下來，再導入到線上的語音辨識工具中（比如 IBM、Google Drive、Google 語音辨識、Sphinx、Wit-AI、微軟 Bing 語音辨識）進行辨識，再將解析後的結果嵌入驗證框即可通過驗證。」

目前，UnCaptcha 工具已經在著名的 Reddit 網站進行實驗。據悉，實驗者在進行用戶註冊那一步的時候終止了實驗，這也是為了不給該網站增添不必要的營運風險。

「實驗結果非常明顯，UnCaptcha 在辨識數字方面的準確率高達 92%，整體語音辨識準確率達到了 85%。」雷鋒網獲悉，該工具的發明者在一份聲明中稱：「這種工具能夠破解最新版的 reCAPTCHA，但這僅限於在自己網站上使用且僅用於教育目的。」

得到破解技術後，該負責人第一時間通知了 Google，並督促對現有驗證方式進行升級。目前，UnCaptcha 工具已經開源，並被託管在 GitHub 上提供了安裝使用範例。

在 GitHub 上，群眾們也針對此事展開討論。有網友稱：「此項目中的核心破解技巧使用到各家的語音辨識技術，這其中也包括 Google，這讓人看起來多少有點『搬石頭砸自己腳』的意味。」

（本文由雷鋒網授權轉載；首圖來源：pixabay）