Google 文字轉圖像模型升級第二代,支援英文、中文等七種語言

作者 | 發布日期 2023 年 12 月 14 日 6:44 | 分類 AI 人工智慧 , Google , 雲端 line share follow us in feedly line share
Google 文字轉圖像模型升級第二代,支援英文、中文等七種語言


Google Cloud 打造第二代文字轉圖像 AI 工具 Imagen 2,其 AI 模型可以根據文字提示建立和編輯圖像。

Imagen 2 利用 Google DeepMind 技術開發而成,該模型在 5 月 Google I/O 2023 開發者大會悄悄推出預覽版,現在正式提供給列入許可名單的 Vertex AI 用戶使用,Vertex AI 是用於建構模型和 AI 應用程式的開發者工具。與第一代 Imagen 相比,Google Cloud 聲稱 Imagen 2 在圖像品質顯著提升,並能準確描繪出提示需求。

Imagen 2 與其他圖像生成模型如 OpenAI DALL·E 3Amazon Titan Image Generator 等大致相同,但有兩點差異在於,Imagen 2 不僅可以讀取英文提示,更直接支援中文、印地語、日語、韓語、葡萄牙語、西班牙語其他六種語言,明年也會支援更多語言,還能產生創意且逼真的標誌並覆蓋在現有圖像上。

「由於新穎訓練和建模技術,Imagen 2 可以理解更具描述性的長篇提示,並對有關圖像細節提供詳細答案」,Google Cloud 表示這些技術也強化 Imagen 2 多語言理解能力。

Imagen 2 利用 Google DeepMind 開發的 SynthID,將隱形浮水印加入模型產生的影像上,並能適應壓縮、色彩調整、套用濾鏡等圖像編輯。偵測隱形浮水印需要 Google 的工具,第三方無法使用該工具。

Google Cloud 未透露使用哪些資料訓練 Imagen 2 模型,這點不令人意外。像 Google 這種開發生成式 AI 的科技公司是否可以利用公開資料(甚至是受版權保護的資料)訓練模型、從事商業活動,目前仍是一個懸而未決的法律問題。Google 則為用戶提出賠償辦法,保護符合條件的 Vertex AI 用戶免受與 Google 使用訓練資料和 Imagen 2 輸出的版權索賠。

(首圖為 Imagen 2 生成範例,首圖來源:Google DeepMind

延伸閱讀: