科學家想用老鼠判別 Deepfake 製作的影片,但這事沒那麼容易

作者 | 發布日期 2019 年 08 月 15 日 8:30 | 分類 AI 人工智慧 , 生物科技 , 軟體、系統 follow us in feedly


自從 Deepfake 技術面世以來,就一直朝著不可控的方向發展。

從開始用在成人電影換成女明星的臉,到美國總統川普、Facebook CEO 祖克柏等公眾人物相繼成為 Deepfake 技術的受害者,再到「一鍵脫衣」的 App「DeepNude」,Deepfake 技術帶來的負面影響愈加明顯。

更令人擔心的是,Deepfake 技術還在進化。史丹佛等幾所學校發表研究,甚至能篡改影片語句,只要輸入任意文本,就能讓影片中的講者說出對應的話,比如將電視台主持人報導的「蘋果股價收盤於 191.45 美元」數字改為「182.25 美元」。

儘管這兩個詞的發音和口型完全不同,但幾乎看不出修改痕跡。研究者經過調查發現,59.6% 受試者認為修改過的影片是真的,這項技術成功騙過大部分人的眼睛及耳朵。

Deepfake 技術讓網路世界變得更真假難辨,與此同時不少科學家和機構也開始研發鑑定 Deepfake 的技術,開始一場貓捉老鼠的遊戲。

據《華爾街日報》報導,本週在拉斯維加斯舉辦的黑帽網路安全大會,俄勒岡大學研究人員提出,老鼠等小動物未來或有助於鑑定偽造的影片和音頻。

研究人員發現,老鼠在辨識自然語音元素方面很有天分,能聽出聲音中的不規則性,比如透過訓練能區分 P、B、T 等不同音素,以及不同母音發聲的區別,進而辨識複雜的聲音,並檢測音頻的真實性。

科學家以條件反射訓練小老鼠,讓老鼠在聽到真實和合成影片的時候分別跑向不同位置,如果辨識正確就給予獎勵,測試過程老鼠辨識假音頻的準確率達 75%。

雖然當研究人員添加新聲音和母音的等變量後,老鼠辨識準確率有下降,但又經過一段時間訓練後,還是能區分新的語音模式。

研究計畫成員之一、俄勒岡大學研究生 Jonathan Saunders 認為,還可以進一步優化,形成通用版本 Deepfake 檢測演算法,但這需要更深入了解大腦如何分析和處理聲音。

儘管老鼠在聽覺研究領域有很大潛力,但這也不意味社交平台和影像網站將來透過飼養大量老鼠就能鑑定 Deepfake 假影片。研究人員希望透過明白老鼠如何辨識假音頻,進而更容易訓練機器對抗 Deepfake 。

除了之外,很多研究團隊都採用生成式對抗網路(GAN)鑑定 Deepfake,以 AI 對抗 AI。

前不久,加州大學柏克萊分校和南加州大學研究團隊開發一套 AI 鑑別系統,先透過生成式對抗網絡,提取川普、希拉蕊和歐巴馬等人的臉部、頭部運動特徵,合成假影片。

隨後再用機器學習分析真假影片的差異,得到每個人的「軟性生物特徵」(soft biometric signature),辨識出細微的動作特徵,這種檢測工具辨識 Deepfake 影片的準確率達 95%,研究人員希望未來半年內提升至 99%。

去年美國國防部研究機構 DAPRA 也研發出專門打假 Deepfake 的 AI 工具,抓住 AI 生成人臉缺乏眨眼功能的缺陷,透過檢測眼睛狀態判斷影片的真假,準確率高達 99%。

▲ 原始影片(上圖)中,6 秒內檢測到眨眼動作。而 Deepfake 生成的假影片(下圖)沒有眨眼。 (Source:紐約州立大學奧爾巴尼分校

遺憾的是,這套工具無法大規模應用,研究人員試圖開發出可擴展的平台化工具,能鑑定網路大量影片。

不過這種利用 AI 對抗 AI 的鑑定方式也有問題,因為生成式對抗網路的原理就是讓兩套神經網路相互博弈中學習,隨著鑑定技術的提升,假影片的品質也會提高,兩者永遠不斷對抗,誰也無法徹底打敗誰。

同時比起 Deepfake 技術的研發,鑑定技術的科研力量顯得有點勢單力薄。據  DeepTrace 平台統計,2018年,全球涉及 GAN 生成圖像和影片的論文多達 902 篇,研究如何辨識合成圖像和影片的論文只有 25 篇。

加州大學柏克萊分校的電腦科學家 Hany Farid 也指出,目前研究合成影片和鑑定人數是 100:1,Farid 認為依靠技術現有的鑑定技術難以阻止 Deepfake 影片在社交平台傳播:

解決方法不能只靠技術,還需要媒體專業的報導,以及更好的數位公民、公司和政策。

(本文由 愛范兒 授權轉載;首圖來源:pixabay

延伸閱讀: