驗證碼擋不住,美企開發 AI 演算模型成功突破 CAPTCHA 驗證

作者 | 發布日期 2017 年 10 月 31 日 2:00 | 分類 AI 人工智慧 , 尖端科技 , 資訊安全 follow us in feedly

當人們在網站註冊或購物時,經常會出現圖像驗證碼的輸入要求,為了區分「真人」,圖片會出現線條及扭曲分隔開的文字,讓電腦難以辨識,但這種方式最近被一款人工智慧(AI)破解了。



NPR 報導,新創公司 Vicarious 表示,他們已運用 AI 開發出一種演算法模型,可以通過「全自動區分電腦與人腦的公開圖靈測試」,也就是現在十分常見,稱為 CAPTCHA 的驗證機制。

CAPTCHA 主要是在圖上顯示一組驗證碼,由混亂的字母、波紋線和一些背景雜訊組合而成,類似測試過去電腦判讀起來十分困難,也因此 CAPTCHA 能力被一些 AI 研究人員當作測試的關鍵基準。

這並非第一次有人成功破解 CAPTCHA 驗證,大約在 10 年前,一家科技公司就曾被販售票券的 Ticketmaster 控訴,原因是繞過 CAPTCHA 系統大量購買演唱會門票。

但過去這例子中,主要是利用 CAPTCHA 特定的弱點,防止程序出現細微的變化借以繞過系統,但 Vicarious 聯合創始人 Dileep George 指出,這項新的研究卻是「從根本上」打倒了 CAPTCHA。

過去多是採用深度學習(Deep learning)來訓練 AI 反應特定事物,透過這樣的訓練,AI 能逐漸學會辨識圖中不同字母,但一旦字母互相重疊,AI 便會難以辨識。

George 解釋,深度學習只是複製人腦工作方式的一部分,就像人們也從經驗中學習一樣。但人類小孩並不需要看過大量、不同形式的字母才能區別,即使出現的字母比較大又是斜體,小孩依然能輕鬆辨識出來。

George 表示,他們發現大腦在接受視覺時,會自然出現一些假設,但過去使用的深度學習並沒有相同情況。為了讓 AI 也有這種特性,Vicarious 團隊改採用遞歸皮質網路(RCN)技術,讓 AI 即使較少培訓,也能推理出看到的內容。

在訓練階段,AI 看到字母後便會建構出它所認知的字母模型概念,理解並猜測字母的輪廓、內部、背景等,之後新的圖片出現時,AI 便會試著運用過去建立的理解解釋這張圖片。當字母部分重疊,它便能理解缺失是因為字母部分隱藏在另一個字母後面。

Vicarious 團隊提到,CAPTCHA 有非常多種類型,但無論哪種只要被演算法達到 1% 以上準確度,就能視為破解。而這款 AI 演算法模型在 reCAPTCHAs 的測試中,準確率達 66.6%,BotDetect 達到 64.4%,Yahoo 和 PayPal 則都達 57% 左右。

雖然 Vicarious 的演算模型確實在通過 CAPTCHA 驗證機制達到不錯的成效,但這項研究的主要目標其實是要讓機器人視覺上能像人類一樣理性思考,和破解 CAPTCHA 並沒有太大關係。

George 表示,團隊的長遠目標是建立像是人腦一樣的 AI,CAPTCHA 只是一個自然而然的測試,因為這正好能檢測系統是否能像人腦一樣工作。

George 強調,機器人需要認識周遭的世界,能理解並操作物體,在人們打算應用的領域,AI 必須要在較少培訓之下,運用快速推論、非常靈活的方式處理事情。

「這是技術的必然進步方向,人們必須接受這件事:電腦將像人腦一樣工作。」

目前尚不清楚這項研究對資訊安全會有多大影響,George 指出,Google 已開始從基於文字的 CAPTCHA 轉移到更進步的測試,隨著人工智慧越來越聰明,這些驗證機制也必須找出新方式,來確保用戶的人類身分。

(首圖來源:shutterstock)