文字轉圖像更細緻，Google Imagen 3 模型悄悄在美推出

外媒 VentureBeat 報導，Google 打造的第三代文字轉圖像工具 Imagen 3 悄悄向美國用戶推出，可在 Google 的 AI Test Kitchen 存取使用。

Imagen 3 將提供出色的圖像生成品質，且較上一代 Imagen 2 擁有更多強化功能，包括生成速度提升 40% 以上，更好的文字提示理解和指令遵循能力。Imagen 3 也包括多語言、多種畫面比例的支援，內建安全功能（例如 Google DeepMind 的 SynthID 數位浮水印）。

Imagen 3 似乎保有一些保護措施，它無法生成受版權保護的角色圖像，拒絕產生泰勒絲（Taylor Swift）等公眾人物圖像，也無法生成有關武器的圖像，這與 xAI 新推出的 Grok-2 形成強烈對比，後者對於生成政治人物圖像沒有任何保護措施。

5 月份 Google I/O 2024 開發者大會宣布將升級更新成 Imagen 3，隨後預覽版本開放給申請早期實驗階段的 Vertex AI 客戶試用，Google 則在 8 月 13 日發表有關這項文字轉圖像工具的論文。

無論 Google 或 xAI 未來幾個月很重要，因為它們必須面對用戶意見回饋、潛在監管審查及影像生成技術帶來的廣泛影響。

（首圖來源：Google Cloud Blog）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？