別傻了,AIGC 殺不死藝術家

作者 | 發布日期 2022 年 11 月 25 日 8:00 | 分類 AI 人工智慧 , Big Data , 數位內容 line share follow us in feedly line share
別傻了,AIGC 殺不死藝術家


AIGC 產生內容能取代插畫師、畫家的工作嗎?或更瘋一點,AI 能量產藝術作品,乃至根本上顛覆藝術市場嗎?AIGC 爆紅已和科技界探討許多,今天目光轉向從業者:AI 能否取代藝術家的工作?

畫家回答:下筆之前我自己都不知道會發生什麼事,AI如何知道?又怎麼算到?

AI不能畫的東西

詢問能否辨認AI和人類作品時,某建築系大四生給了非常明快的答案。他正在申請英國倫敦皇家藝術學院研究所,申請作品之一即是AI輔助創作的互動式網站,訪客可在圖片互動頁面探索他設計的故事,網站所有圖片都由Disco diffusion和MidJourney兩個今年爆紅的AIGC人工智慧工具產生。

▲ 基於AIGC模型生成再微調。(Source:吳佳佑,下同)

「AI生成圖像整體光影、結構及色彩表現在我看來無可挑剔,但很多細節經不起近看」,對有繪畫底子又常使用AI工具的建築系大四生來說(網站花了四個月搭建,用AI產生了數千張圖),目前AI產圖迥異人類顯而易見,「細節經常出現色塊堆積、太不自然和線條粗細變化不均等問題」。

對美術門外漢來說,細節(需放大觀察的程度)可能並不重要,但對專業者來說差別很明顯。「我點出關鍵後,不管有沒有美術底子大概都能看出來。AI產圖看不出繪畫順序,因沒有人類繪畫的邏輯。」建築系大四生說。

問題可能來自演算法。主流AIGC工具採用Diffusion Model擴散模型,訓練基於有文字描述的圖片數據,反覆降噪圖片,AI學習如何產生符合文字描述的圖片。由於文字描述往往是整張圖的內容,AI深度學習結果對圖片整體結構和光影了解良好,細節就會失準,因細節沒有文字描述卻複雜多變。

這可能是日本ACG最近熱炒的AI三大畫圖難題:目前AI模型不能畫的三個主題為賽菲羅斯游泳、樋口円香吃拉麵和哭泣美少女吃蛋糕。AI模型輸入文字後往往會產生讓人啼笑皆非的圖。

▲ Neil Shen用MidJourney畫的賽菲羅斯游泳。

其實AI畫不出來的圖遠不只三種,如叫AI畫游泳的鮭魚,大概會出現鮭魚生魚片而不是活魚。

▲ Neil Shen用MidJourney畫的游泳鮭魚。

人類看來非常匪夷所思的AICG錯誤同樣要歸咎演算法,一旦指令範圍太窄,如日漫較少出現的游泳動作,或畫面內容有較複雜多變的物理互動邏輯如「吃拉麵」,要同時處理人物、手指、麵條和筷子這幾種對AI都屬線條的內容時,很高機率會翻車,因訓練演算法的資料庫這類內容不多,故擴散模型對複雜細節線條變化的理解還相當初級。

但細節卻是決定畫家藝術風格和程度的決定性因素。某插畫師說明科班美術生結構、線條色彩和細節如何訓練,都因循和AI完全不同的邏輯。「如以操場為主題畫十幅畫,你會想畫出每條跑道線且照透視、光影結構完整畫出來,但畫到某程度,就會想抽象點處理,有些留白,有些加重,有些乾脆去掉。很多時候畫家只畫主觀感受到的東西,作品生動不表示和真實世界一模一樣。」

繪畫不僅考驗畫家技巧(這部分AI沒有問題),畫家身為人,感受、心情至成長歷程、教育背景等有影響,資料之龐大AI無法計算,真正創作過程在打破某些規則和邏輯。「我下筆前都不知道之後會發生什麼事,AI又怎麼知道,怎麼算出來?」插畫師說。

擺脫「低效率工作」代表什麼?

AI能模仿的東西

就像人工智慧倫理討論,科技界討論AIGC衝擊藝術的程度也經常模棱兩可。技術至上主義者(矽谷大部分人)幾乎迴避藝術性,持續鑽研深度學習才是重要的事。而資料庫和演算法最佳化後,藝術性似乎就能用0或1表達。

▲ Google論文顯示AIGC能製作梵谷風格圖。

某種意義算成功,甚至連Google最新基於擴散演算法的Imagen Video模型產生影片都能模仿某藝術家風格。使用AI輔助創作對許多遊戲美術師都是慣例,有大廠遊戲製作經驗的某美術設計談到AIGC時頻繁提到「餵圖」一詞,意思是遊戲人物形象設計最初尤其一閃而過的NPC,他們會給AIGC工具很多參考圖,快速產生符合要求的人物。

「雖然還要再調整,但AI確實已取代人力承擔部分工作」,他目前用較多的是側重二次元風格的novel AI,基於最紅的Stable Diffusion模型,資料庫由500多萬張有文本標註的圖片組成。

然「餵圖」訓練的AIGC模型充滿爭議。10月7日網友🧛‍♂️𝟝𝖄𝖔𝖚基於剛過世的南韓名畫家金政基作品,用Stable Diffusion訓練一個金政基風格模型,引來網友惡評;10月底工程師Ogbogu Kalu將迪士尼簽約畫師Hollie Mengert作品未經同意就拿來訓練產生Mengert畫風的模型,又衝上趨勢。

如果說前者網友一面倒批評是因尊重死者,後者就是AIGC快速發展衝擊插畫市場的縮影。Hollie Mengert是迪士尼簽約畫家,她本人都不能隨意使用自己作品,從畢業到現在畫風形成至少花了十多年,而Ogbogu Kalu訓練新模型只要幾小時,成本幾乎為零。

▲ 左為Hollie Mengert作品,右為Ogbogu Kalu模型作品。(Source:Waxy

如果風格模仿這麼容易,那畫家十幾年訓練還有什麼意義,商業價值又該如何衡量?這些疑問充斥許多畫家腦海。雖然機器學習不能100%模仿所有風格,但AIGC已厲害到對許多領域產生衝擊。前述美術設計就直言,既然AIGC能介入遊戲原畫和人物設計(甚至很多AI圖比一般畫師品質好),網路流行的美術外包很多基礎工作很快就會被AI取代。

畫家不是沒有警覺,很多人開始聲明自己的作品「禁止用於AI模型學習」,還有些人乾脆刪掉全部網路作品。二次元繪畫發展最成熟的日本,「AI學習禁止」也變成流行語。

但對矽谷AI產圖爭議並不是考慮重點,因技術中立、更潮的詞叫「AI民主化」(democratization of AI),這是信仰,AIGC技術潛在的巨大商業前景才重要。彭博社報導,投資Stability AI的Lightspeed合夥人Gaurav Gupta直言不諱,AIGC技術根本性賦予人們更多權力,同時使「低效率」(inefficiency)作業剝離內容創作。

「只要AIGC產圖能滿足要求,我不介意使用」,美術設計說。

AI會取代誰?

Gaurav Gupta表態幾乎明示AIGC技術對繪畫市場的顛覆性衝擊,如果簡單分為商業繪畫和藝術繪畫兩部分,前者顯然影響更大。某遊戲工作室原畫師輕鬆說:「許多人說AI作品很冰冷,但我覺得滿美的,構圖顏色都很好。有深度的內容AI還做不到,但可讓設計師和美術師前期工作參考。」

儘管AIGC對遊戲策劃初階能輔佐表達想要的遊戲效果,但還不能介入原畫師更高階工作。「設計越到後期要求越精確細緻,AI只能在要求還模糊的時候一次性產生多種選擇,但方向明確後,AI就無法勝任規模化遊戲設計。」

前述美術設計看法卻不同:「AIGC高精圖不僅可用於前期策劃,遊戲人物設計和場景設計都有廣泛前景,但就是大量腰部以下插畫師會失業。目前還未大規模使用是因法律風險,而不是AI產圖品質。」

不只遊戲前期策劃,商業繪畫從影視美術、網站設計至圖書出版,AIGC技術描繪大場景、特定風格和精細度均有優勢,更不必說成本低、速度快,又不會被題材、風格或產量限制等。儘管還有「游泳鮭魚」這類問題,但商業繪畫過去完全靠人力的創意市場出現超強競爭者,首當其衝的就是精細度和創意要求不高的領域。

「只要AIGC產圖滿足要求,我不介意全面使用,因真的節省許多成本。」時尚雜誌執行主編被問及對AIGC的看法時說。時尚雜誌做大企劃時背景、燈光、場地成本皆要可觀開支,製作過程還受時間、空間及人為因素限制。AIGC技術根本上解決這些問題,還能拓展視覺語言豐富度──「要是AI夠強,我一個人就能做一本雜誌了對吧?」時尚雜誌主編說。其實今年美國版《柯夢波丹》就用MidJourney畫了封面

人類可以「興之所至」創作,但AI根本沒有「興」,又能「至」到哪裡?

AI有創造性嗎?

如果對商業繪畫領域AIGC的顛覆性沒有懷疑,那藝術繪畫領域爭議就更多。「如果功力夠好,就不會被取代」是許多人的論點。儘管AI模仿功力惟妙惟肖,但不理解圖背後的含義,換言之,AI不具創造力。

這不是說AIGC沒有任何創造力,DeepMind創辦人、人工智慧領軍人物Demis Hassabis接受Lex Fridman訪談時表示,AI的創造力可讓它看過數百萬張貓圖後「創造」普通的貓,但人類還不能把高層次抽象概念(如發明象棋規則而不是教AI下象棋)以演算法準確敘述給AI理解。

從這意義說,探討AIGC藝術性有點滑稽。問及AI的藝術性時,藝術留學機構負責人迅速否定,因公司每年都將大批學生送進全世界頂尖藝術學校賺錢,AIGC領域當然是關注焦點。「學生申請學校的作品不建議過度使用AIGC創作」,負責人說。他認為藝術品的價值是感染力,而這只能來自人,AI作品太冷靜匠氣,「我看得出AI圖細節很精緻,但靈魂不統一,不夠動人。」

藝術創作立意和技法都是服務人。「稍微成熟的藝術家,創作都算精緻」,對負責人來說,真正突破和創造性的偉大藝術作品,永遠不拘泥於窠臼,而沒有主觀意見,AI作品只流於外表精緻卻內在平庸。

寫專欄會大量使用AI圖當配圖的自由撰稿人精妙比喻:有類作品不用解釋,因本身夠好;另一類必須解釋,否則觀眾不知道在看什麼。最差的作品就是有沒有解釋都無所謂,因作品不好文字解釋也看不懂,AI作品正屬此類。

「AI靠演算法產生結果,但人類創造過程最革命性的嘗試磨練,打破又重塑規則被忽略,人會興之所至,但AI根本沒『興』,又能『至』到何處?」藝術留學機構負責人說。

總體來說,AIGC於藝術領域更像精準執行的工具,可產生精確結果,前提是人已有創意框架。如建築系大四生所說,很難想像沒有AIGC工具幫助,他的網站幾千張圖要去哪裡生出來。且許多資深AI愛好者都開始用AI拍電影,除了配音,從語言腳本、鏡頭畫面到音效都將是用AIGC完成。

AIGC的確降低創作門檻,沒有訓練過的人現在憑想像力就能變出作品,重塑人們對藝術的認知,革命性之大就像照相機之於油畫。中國央美藝術史博士認為這一樣有個漸進過程。「新工具出現都會讓人再思考藝術本質,歷史發生不只一次,因比起技術進步,理論總會稍微落後。」

話雖如此,博士並沒有試過AIGC工具,對網路充斥AIGC圖片,她以「不和諧」總結,並第一次使用MidJourney輸入Gothic letters(哥德風字母)和名字拼音縮寫為關鍵詞產生三組共12張圖後,覺得AI功力還不如她隨便從中世紀手抄本剪出字母方便好看。

隨著演算法發展,AIGC進化速度只會更快不會變慢,不僅對繪畫領域產生重大影響,互動設計、實驗藝術乃至元宇宙,AIGC都可能扮演重要角色。

建築系大四生剛和英國皇家藝術學院教授聊完作品,很可能錄取,而他的專業Information Experience Design方向之一就叫Moving Image Design動態圖像設計,聽起來就是專為AIGC準備的路。而這是AIGC或人的勝利?

(本文由 品玩 授權轉載;首圖來源:shutterstock)

延伸閱讀: