輸入文字就能畫出心中美景,NVIDIA 展示 GauGAN2 的 AI 繪畫能力

作者 | 發布日期 2021 年 11 月 25 日 17:15 | 分類 AI 人工智慧 , GPU , IC 設計 Telegram share ! follow us in feedly


GPU 大廠輝達 (NVIDIA) 今日宣布,藉著 NVIDIA Research 廣受歡迎的 AI 人工智慧繪畫展示的最新版 GauGAN2 協助,現在只需輸入三、四個字,一樣能透過強大算力,讓電腦畫出逼真畫面。

輝達指出,GauGAN 背後的深度學習模型讓大家將想像力化為逼真的作品,比過去更容易,只需輸入「sunset at a beach」等短句,人工智慧便會即時生成場景。再加入形容詞如「sunset at a rocky beach」,或將「sunset」換成「afternoon」、「rainy day」,以生成對抗網路為基礎的模型還可立即修改。

不僅如此,使用者只需按個按鈕,便能產生分割圖,在高層次輪廓圖顯示場景中物體位置。使用者可切換到繪圖畫面,用天空、樹木、岩石和河流等標籤,透過粗略草圖調整場景,用智慧筆刷將塗鴉融入影像。

輝達展示有趣畫面,使 GauGAN2 將分割映射 (segmentation mapping)、圖像修復及文字到影像生成等技術融合到一個模型,成為強大的工具,混合使用文字和繪畫創造極寫實的藝術作品。藉由結合文字、語義分割、草圖和風格樣式等多種模式──GAN 框架示範內容,藝術家更輕鬆將腦中想法變成高品質的 AI 人工智慧影像。

使用者無需畫出想像場景的每個元素,只需輸入短句,便能快速產生關鍵特徵和主題,像是白雪皚皚的山脈,接著可於起點草草幾筆,讓某座山更高;前景加入幾棵樹,或天空增加幾朵雲。不僅能創作十分寫實的影像,藝術家還能描繪出超凡脫俗的景色。

想像一下,若想重現《星際大戰》(Star Wars) 系列有兩個太陽的 Tatooine 星球,使用者只要輸入「desert hills sun」就能建立起點,接著快速畫出第二個太陽的草圖。使用者只要在文字方塊輸入更多字,就會在 AI 創造影像加入更多內容。

輝達強調,NVIDIA Selene 超級電腦已使用 1 千萬張高品質風景圖片訓練 GauGAN2 AI 模型。NVIDIA Selene 超級電腦採用 NVIDIA DGX SuperPOD 系統,是全球前十名超級電腦之一。研究人員使用神經網路學習單字及對應的視覺內容關係,如「winter」、「foggy」或「rainbow」。與專用於文字到影像,或分割圖到影像之應用程式最先進模型相比,GauGAN2 的神經網路產生種類更豐富、更高品質的影像。

GauGAN2 展示內容顯現藝術家日後使用強大影像生成工具創作的無限可能性。例子之一即基於 GauGAN 技術的 NVIDIA Canvas 應用程式,NVIDIA RTX GPU 用戶皆能下載。

(首圖來源:輝達)

關鍵字: , , ,