
在 2025 年 Google I/O 大會上,人工智慧成為了唯一的焦點,Google 的高層們花了近兩個小時的時間深入探討這一主題。
在大會上,Google推出了多項新技術,包括名為Flow的AI影像生成工具、250美元的AI Ultra訂閱計劃、Gemini的多項新功能以及虛擬購物試穿功能。最引人注目的是,AI模式的搜尋工具已向美國所有用戶開放。
然而,在這場幾乎兩小時的演講中,與AI相關的一個重要問題卻未被提及,那就是「幻覺」。幻覺是指大型語言模型在回答問題時所產生的虛構事實和不準確性。根據各大AI品牌的數據,這一問題似乎愈發嚴重,某些模型的幻覺率甚至超過40%。在Google I/O上,觀眾幾乎無法察覺到這一問題的存在,似乎Gemini等模型從未出現過幻覺。
在演講中,Google對幻覺問題的最接近的提及是在介紹AI模式和Gemini的深度搜索能力時。Google表示,該模型會在給出答案之前檢查自己的工作,但缺乏具體的細節,這聽起來更像是盲人領盲,而非真正的事實檢查。
對於AI的懷疑者來說,矽谷對這些工具的信心似乎與實際結果脫節。用戶們注意到,AI工具在簡單任務上經常失敗,例如計數、拼寫檢查等。
Google強調其最新的AI模型Gemini 2.5 Pro在多個AI排行榜上名列前茅,但在真實性和回答簡單問題的能力上,AI聊天機器人的表現卻不盡如人意。根據SimpleQA基準測試(評估語言模型回答簡短事實性問題的能力),Gemini 2.5 Pro的得分僅為52.9%
然而,Google拒絕討論SimpleQA基準或幻覺問題,但指向了Google對AI模式和AI概述的官方解釋,指出AI模式可能在某些情況下自信地提供不準確的資訊。為了提高準確性,他們與Google DeepMind研究團隊合作,使用代理強化學習來獎勵模型生成更有可能準確的陳述。
- Google talked AI for 2 hours. It didnt mention hallucinations.
- The 13 biggest announcements from Google I/O 2025
(首圖來源:shutterstock)