
Google 升級了 Gemini 2.5 Pro 預覽版本,讓開發者搶先體驗正式釋出前的最新功能。
升級後的 Gemini 2.5 Pro 預覽版本是建立在上個月 Google I/O 2025 開發者大會所展示的基礎上,採納開發者的意見回饋,並改進其風格和結構,能夠更具創意、更好的回應。數週過後將會釋出 Gemini 2.5 Pro 正式版,為企業級應用做好準備。
最新版 Gemini 2.5 Pro 在基準測試 LMArena 取得 1,470 分占據領先地位,也在有關 AI 編碼的 WebDev Arena 取得 1,443 分。它在編碼方面持續表現出色,在 Aider Polyglot 等困難的基準測試處於領先地位。它還在 GPQA 和 HLE(Humanity’s Last Exam)等高度挑戰的基準測試展現頂級性能,這些基準測試是評估模型的數學、科學、知識及推理能力。
The latest version of 2.5 Pro reflects an 24-point Elo score jump, maintaining its lead on @lmarena_ai at 1470, while continuing to excel at other key benchmarks including:
🟦AIDER Polyglot (coding)
🟦HLE (reasoning and knowledge)
🟦and GPQA (science and math).— Google DeepMind (@GoogleDeepMind) June 5, 2025
▲ 最新版 Gemini 2.5 Pro 的基準測試。
開發者現在可以透過 Google AI Studio 和 Vertex AI 中的 Gemini API 開始使用 Gemini 2.5 Pro 預覽版本,Google 也在其中增加思考預算,讓開發者更精確控制成本和延遲。不只如此,Google 也在 Gemini 應用程式導入預覽版本。
(首圖來源:Google Blog)