Gemini 1.5 Pro 模型公開預覽,Imagen 2 文字轉圖像可生成 GIF 動圖

作者 | 發布日期 2024 年 04 月 11 日 15:51 | 分類 AI 人工智慧 , Google line share follow us in feedly line share
Gemini 1.5 Pro 模型公開預覽,Imagen 2 文字轉圖像可生成 GIF 動圖


一年一度 Cloud Next 2024 大會上,Google 公開 Gemini 及其他模型最新進展。

Gemini 1.5 Pro 模型提供 128K token、1000K token 兩種上下文長度,Google Cloud 客戶可用它處理大量資訊,包含 1 小時影片、11 小時音訊、超過 3 萬行程式碼,或者 70 萬個以上字詞。

Gemini 依照模型大小分 Ultra、Pro、Nano 三種,Gemini 1.5 Pro 在 Gemini 屬於中量級,但在性能測試上已經超越規模最大、性能最強的 Gemini Ultra 1.0。現在 Gemini 1.5 Pro 進入公開預覽版階段,透過 Vertex AI、AI Studio 平台提供大眾使用。

此外,Gemini Code Assist 是 Google 專為企業客戶打造的 AI 程式碼編寫輔助功能,測試下發現完成一般開發工作所需時間加快 40%。隨著 Gemini Code Assist 導入 Gemini 1.5 Pro,運用最高 1000K token 上下文長度處理大量資料,以提供更準確的程式碼建議。

(Source:Google Blog

Imagen 2 模型具備多種圖像生成功能,可協助企業客戶產出符合品牌需求的 AI 圖像,加上 SynthID 數位浮水印,也能幫助強化受爭議停用的 Gemini 圖像生成功能。

現在 Imagen 2 進一步提供文字轉即時圖像(text-to-live images)功能,幫助行銷和創意人員輕鬆產生如 GIF 的 4 秒動畫,同時配備安全篩選和數位浮水印。這類似於 Runway、Pika 等 AI 生成剪輯工具,但目前 Imagen 2 生成的解析度僅 360×640,Google 承諾未來改善這一點。此外,Google 也為 Imagen 2 推出進階圖像編輯功能,包含圖像修復、圖像擴展。

▲ Imagen 2 加入可產生 GIF 動圖的文字轉即時圖像功能。

(首圖來源:Google Blog