有圖不一定有真相!NVIDIA AI 現在能混合人臉特徵,創造出全新臉孔

作者 | 發布日期 2018 年 12 月 20 日 19:30 | 分類 AI 人工智慧 , 尖端科技 follow us in feedly


我們都知道類神經網路在圖像造假上有著相當好的表現,但究竟好到何種程度?如果你對不久前 Nvidia 的圖片填空技術還有印象,那麼不妨看看他們最新的成果。

近日公布的論文中,Nvidia 展示了如何參考實際影像憑空創造出一個看起來像是全新的人。在下面的圖片中,你可以看到如何將運用真實人物的原始圖片,將膚色、髮色、臉部特徵等特徵混合在一起,創造出一個看起來像是全新的人。

▲ 第 1 行為基準列,左邊第 1 排為目標參照列,2~4 行為基本風格複製(姿勢、頭髮、臉型),5~6 行為中等風格複製(臉部特徵、眼睛),第 7 行為細部風格複製(配色)。

隨著技術進步,近幾年生成性對抗網路(GANs)產生的圖像解析度和品質已經大有改善,然而因為人臉隨機特徵複雜,一些潛在屬性即使是人們也難以詳細描述,但在過去風格轉換(style transfer)論文的協助下,Nvidia 以某種方式重新設計生成器(generator)架構,使其將圖片視為一系列的「風格」,並在不需人類參與調整的情況下學習訓練,實現特定的風格混合操作。

下方的介紹影片中可以看到更多的詳細內容,其中甚至包含貓咪、車子和房間的混合,透過細微參數調整更可以組成更多全然不同的人臉形象。

AI 創造逼真臉孔的能力可能會引發不安。過去我們已經看到 deepfakes 用來創造非自願色情內容,或是藉由合成讓政治人物說出並未說出口的話,這些工具可能被用於宣傳錯誤資訊,削弱大眾對圖片證據的信任,這種趨勢也可能會損害司法系統和政治。

然而以目前來說,這些能力距離真實世界還有些距離,因為 AI 研究者特別關注產生臉孔的整體能力,人們不能以同樣的真實度來進行何種訓練,同時在專業知識和時間上也有著嚴重的限制,在這個例子中,Nvidia 的研究人員花了一週的時間在 8 個 Tesla GPUs 上訓練模型才創造出這些臉孔。

為了協助未來數位圖片驗證,一些專家已經在考慮全新的方法,像是讓相機應用程式用地理編碼來標記圖片好驗證拍攝時間和地點,但 Nvidia 的工作也顯示了 AI 在造假上的進展速度有多快,可以預見的是,未來幾十年 AI 造假和認證技術之間將會互相拉扯著發展到更好的境界。

(圖片來源:arXiv via  NVIDIA

延伸閱讀: