
外媒 VentureBeat 報導,Google 打造的第三代文字轉圖像工具 Imagen 3 悄悄向美國用戶推出,可在 Google 的 AI Test Kitchen 存取使用。
Imagen 3 將提供出色的圖像生成品質,且較上一代 Imagen 2 擁有更多強化功能,包括生成速度提升 40% 以上,更好的文字提示理解和指令遵循能力。Imagen 3 也包括多語言、多種畫面比例的支援,內建安全功能(例如 Google DeepMind 的 SynthID 數位浮水印)。
Imagen 3 似乎保有一些保護措施,它無法生成受版權保護的角色圖像,拒絕產生泰勒絲(Taylor Swift)等公眾人物圖像,也無法生成有關武器的圖像,這與 xAI 新推出的 Grok-2 形成強烈對比,後者對於生成政治人物圖像沒有任何保護措施。
5 月份 Google I/O 2024 開發者大會宣布將升級更新成 Imagen 3,隨後預覽版本開放給申請早期實驗階段的 Vertex AI 客戶試用,Google 則在 8 月 13 日發表有關這項文字轉圖像工具的論文。
無論 Google 或 xAI 未來幾個月很重要,因為它們必須面對用戶意見回饋、潛在監管審查及影像生成技術帶來的廣泛影響。
(首圖來源:Google Cloud Blog)