Google I/O 2025：聚焦 AI 卻未提及幻覺問題

在 2025 年 Google I/O 大會上，人工智慧成為了唯一的焦點，Google 的高層們花了近兩個小時的時間深入探討這一主題。

在大會上，Google推出了多項新技術，包括名為Flow的AI影像生成工具、250美元的AI Ultra訂閱計劃、Gemini的多項新功能以及虛擬購物試穿功能。最引人注目的是，AI模式的搜尋工具已向美國所有用戶開放。

然而，在這場幾乎兩小時的演講中，與AI相關的一個重要問題卻未被提及，那就是「幻覺」。幻覺是指大型語言模型在回答問題時所產生的虛構事實和不準確性。根據各大AI品牌的數據，這一問題似乎愈發嚴重，某些模型的幻覺率甚至超過40%。在Google I/O上，觀眾幾乎無法察覺到這一問題的存在，似乎Gemini等模型從未出現過幻覺。

在演講中，Google對幻覺問題的最接近的提及是在介紹AI模式和Gemini的深度搜索能力時。Google表示，該模型會在給出答案之前檢查自己的工作，但缺乏具體的細節，這聽起來更像是盲人領盲，而非真正的事實檢查。

對於AI的懷疑者來說，矽谷對這些工具的信心似乎與實際結果脫節。用戶們注意到，AI工具在簡單任務上經常失敗，例如計數、拼寫檢查等。

Google強調其最新的AI模型Gemini 2.5 Pro在多個AI排行榜上名列前茅，但在真實性和回答簡單問題的能力上，AI聊天機器人的表現卻不盡如人意。根據SimpleQA基準測試（評估語言模型回答簡短事實性問題的能力），Gemini 2.5 Pro的得分僅為52.9%

然而，Google拒絕討論SimpleQA基準或幻覺問題，但指向了Google對AI模式和AI概述的官方解釋，指出AI模式可能在某些情況下自信地提供不準確的資訊。為了提高準確性，他們與Google DeepMind研究團隊合作，使用代理強化學習來獎勵模型生成更有可能準確的陳述。

（首圖來源：shutterstock）