不想成為 AI 養分!藝術家打造「反向搜尋引擎」,挖掘資料庫裡是否有自己

作者 | 發布日期 2022 年 10 月 01 日 11:00 | 分類 AI 人工智慧 , Big Data , 資訊安全 line share follow us in feedly line share
不想成為 AI 養分!藝術家打造「反向搜尋引擎」,挖掘資料庫裡是否有自己


8 月美國科羅拉多州的藝術比賽,遊戲設計師 Jason Allen 作品〈Théâtre D′opéra Spatial〉(太空歌劇院)奪得首獎,並無藝術背景的他,得獎作品是這麼創作的:用 Midjourney 修正關鍵字,從人工智慧(AI)產生的上百張圖挑出滿意的,再用修圖軟體後製微調,最後印成畫布參賽。

AI作品贏過真人獲藝術大獎,許多人立刻出聲撻伐,反對AI進入藝術領域,但也有人樂見越來越成熟的AI技術,未來成為協助創作的幫手。

儘管藝術創作適不適合用AI,很難短期達成共識,但面對應用越來越廣泛,藝術公司Spawning AI推出網站「Have I Been Trained」,讓你至少知道自己的照片或作品,是否被當成AI訓練素材。

AI也有創造力?畫作超越真人作品得首獎

美國科羅拉多州8月舉辦年度藝術比賽,允許參賽者用科技工具協助創作的「數位藝術」評比項目,Allen以〈Théâtre D′opéra Spatial〉奪下首獎。此畫散發古典巴洛克風格,人物構圖與光影表現也相當引人入勝。

▲〈Théâtre D′opéra Spatial〉。(Source:維基百科

然而這幅精緻亮眼的作品,是由AI圖像產生工具Midjourney創作。Midjourney是AI圖像產生工具,只要輸入想要圖片的文字描述,就會產生畫作。

雖然Allen強調參賽時清楚註明創作工具,且他本人也花了大把時間修正關鍵字與精心後製圖片,才產生得獎畫作,但AI介入創作領域,甚至贏過真人,仍激起藝術圈強烈的正反議論。

支持派認為,AI就是數位協助工具,和普遍使用的Adobe Photoshop、Illustrator並無差異;另一派人士則擔憂,透過無感情數據演算創作,不符合藝術本質,且訓練AI的過程,還有盜用別人靈感或版權的疑慮。

你該知道是否變成訓練材料!藝術家夫婦成立「反查AI素材網站」

訓練AI需要大量藝術作品為學習素材,AI藝術家夫婦Mat Dryhurst和Holly Herndon透過Spawning AI公司推出「Have I Been Trained」網站,讓藝術家有權利表達:是否同意作品納入AI學習系統。

藝術家只要點入Have I Been Trained搜尋關鍵字,就會自動從AI訓練圖庫列出所有相關影像,如果你發現作品成為AI教材,可點選回報系統,表達是否願意將作品加入素材庫。

儘管這項搜尋網頁只能反查,短期無法即時將圖片剔除於資料庫之外,但Dryhurst與Herndon最終目標是希望建立藝術家的合作標準:如果你尊重其他藝術家,就不要使用別人不想提供的素材訓練AI創作。

▲ Have I Been Trained會根據關鍵字,從AI訓練素材庫搜尋相關圖像。此為輸入Holly Herndon的搜尋結果。

Have I Been Trained還在測試階段,以圖庫Laion-5b為主要搜尋範圍。此圖庫有高達58億張圖像,為大型AI工具Stable Diffusion與Midjourney的主要訓練數據來源。

雖然Have I Been Trained以保護藝術家為出發點,一般人如果想知道個人照是否也被當成AI培訓素材,也能查詢自己的資料,了解圖片有無盜用風險。

圖片隱私越來越受重視,波蘭新創瞬間找出四散網路的照片

除了有Have I Been Trained網站直接從AI素材庫下手,波蘭新創PimEyes著眼猖獗的網路盜圖現象,讓使用者快速找到哪些地方有用自己的照片。

PimEyes與大量資料庫合作,分析1.5億個網頁、高達9億張臉孔資料,打造相當精準的臉部搜尋系統,只要先上傳一張自己的照片,系統最快4秒內就找到四散網路的所有相似照片。如果搜尋後發現照片遭盜,還可透過PimEyes協助要求盜圖者下架。

▲ PimEyes以9億張面孔為基礎,精準搜尋相符人臉照。

儘管用途與立意不同,但Have I Been Trained和PimEyes都顯示,發達技術使圖像變為惡意用途的機率大增,用戶保護個資之餘,也越來越在意自身照片的重要性,避免自己的照片渾然不知下用於不明用途。

(本文由 創業小聚 授權轉載;首圖來源:Unsplash