對決 OpenAI Sora，Google 影像生成新模型 Veo 2 推出

影像生成模型 Veo 和圖像生成模型 Imagen 3 日前登上 Google 的 Vertex AI 平台，提供企業客戶加以運用。負責開發的 Google DeepMind 16 日進一步發表 Veo 2 新模型和最新版本的 Imagen 3。

Veo 2 & Imagen 3

Veo 2 對現實世界的物理原理以及人類動作和表情的細微差異有更深入的理解，有助於提高生成影像的整體細節和真實感。

Google DeepMind 指出，Veo 2 理解電影拍攝的獨特語言，用戶能夠指定風格類型、拍攝鏡頭、電影效果等。如果用戶需要一顆滑過場景中央的低角度鏡頭，或者一顆觀察科學家使用顯微鏡的臉部特寫鏡頭，Veo 2 皆能滿足特定需求；甚至在文字提示寫道「18mm 鏡頭」，Veo 2 知道如何模擬這顆廣角鏡頭來拍攝，或在文字提示加入淺景深，可聚焦在拍攝對象並模糊背景。不只如此，Veo 2 支援最高 4K 解析度，生成影像長度增長至數分鐘。

影像生成模型可能有「幻覺」，產生不需要的細節，比方說多餘手指或意外物體等，Google 則強調 Veo 2 發生這類細節的頻率更低，使輸出影像更真實。此外，Veo 2 的生成影片包含一個肉眼看不見的 SynthID 數位浮水印，幫助辨識影像是否為 AI 生成，減少傳播不實資訊等狀況。