Gemini 示範影片造假?Google DeepMind 澄清:影片都是真的

作者 | 發布日期 2023 年 12 月 08 日 15:26 | 分類 AI 人工智慧 , Google line share follow us in feedly line share
Gemini 示範影片造假?Google DeepMind 澄清:影片都是真的


Google 釋出一段「Hands-on with Gemini」影片,測試讓多模態的 Gemini 看一系列影像,推理出所看到的內容,同時與測試人員互動。但這段與 Gemini 流暢互動的影片引起部分人士質疑真實性,對此 Google DeepMind 出面說明。

Gemini 原生設計成多模態模型,第一版 Gemini 1.0 所受的訓練能夠同時辨識和理解文字、圖像、音訊等不同資訊,並回答涉及複雜主題的問題。為讓大眾了解 Gemini 強大之處,Google 釋出影片測試讓 Gemini 看一系列影像,不僅推理出看到的內容,同時也與測試人員緊密互動。這段令人驚嘆的影片已超過 150 萬觀看次數,帶出人們能與應用 Gemini 的服務產生接近真人般互動,也凸顯多模態模型如何靈活適應各種資訊輸入、即時產生回饋。

儘管 Google 在影片資訊欄說明「為使示範影片簡潔,延遲部分已減少,Gemini 輸出也已縮短」,但 Gemini 回答之快,幾乎沒有猶豫,也沒有冗長答案,行雲流水般的影像不免懷疑是否經過 Google 精心安排才呈現出理想成果,誇大了 Gemini 性能,人們是否被 Gemini 互動速度、準確性所誤導。

▲ 引起討論的「Hands-on with Gemini」影片

對此,Google DeepMind 研究和深度學習負責人 Oriol Vinyals 表示,示範影片為 Gemini 提供一連串不同模態如圖像、文字等資訊,讓它透過預測接下來可能發生的情況來回應。在打造應用程式時,可對 Gemini 下提示指令,讓用戶行為與模型相配置,就能獲得類似結果。

Oriol Vinyals 發文強調,所有 Gemini 提示和輸出都是真的,為影片簡潔起見而縮短長度,開發者部落格也有專文說明這段影片如何透過多模態提示與 Gemini 互動。未來 Gemini Pro 開放使用時,開發者可以嘗試類似操作,也希望藉此影片激勵開發者創造更多可能性。

▲ Google DeepMind 副總出面澄清示範影片造假疑慮。

(首圖來源:影片截圖)

延伸閱讀: