Google 開啟 Gemini 3 時代，模型回應減少奉承、提升編碼和搜尋功能

第一代 Gemini 模型能夠看、能夠聽、能夠理解大量資訊，並且跨模態自然生成。第二代 Gemini 模型具備進階的推理能力，使 AI 代理能夠思考、採取行動。現在 Google 將模型提升至新的層次，正式發表「Gemini 3」模型，宣稱是世界上最強大的多模態與推理模型。

Google 首次讓所有使用者從推出第一天就能在 Gemini 應用程式取得新模型 Gemini 3 Pro 預覽版，同時也將 Gemini 3 Pro 導入搜尋服務。

Gemini 3 Pro 是原生多模態模型，意味著它能同時處理文字、圖片、影片、音訊及程式碼，不必分開處理。Google 舉例，Gemini 3 Pro 可以解讀並翻譯不同語言的手寫食譜，然後把它編成一本食譜書，或是根據一系列的學術論文、講座影片，製作互動式學習卡。

Gemini 3 是 Google 最強大的 Vibe Coding 和代理編碼模型，使用者也會在 Google 旗下產品看到導入 Gemini 3 的改進。在 Google 搜尋的 AI 模式（AI Mode）功能中，Gemini 3 Pro 幫助呈現視覺化內容，例如圖片、表格，甚至根據使用者的查詢顯示模擬結果，可以使用升級版 Google「查詢擴展技術」進行更多搜尋，不僅能將問題拆解成便於搜尋的部分，還能理解使用者意圖，協助找到先前可能錯過的搜尋結果。

Google DeepMind 產品管理資深總監多希（Tulsee Doshi）表示，新模型使 Google 更接近「讓資訊普及且有用」的目標，尤其幫助搜尋引擎持續進步。「我認為朝此方向邁出最大的一步，跳脫僅限文字回應的框架，並且讓你能夠看到更豐富、更完整的內容」，她說。

隨著 Gemini 3 推出，這讓 Google 有機會在 GPT-5 問世經歷波折後加速超越 OpenAI。Google 官方部落格文章稱 Gemini 3 Pro 的回應「聰明、精簡、直接，以真實深刻的見解取代陳腔濫調和奉承。告訴你需要知道的，而不是你想聽到的。」Google 毫不掩飾地針對 OpenAI，形容 Gemini 3 Pro 不會像 ChatGPT 背後支援的模型那樣空泛又愛奉承。

除上述改進外，Gemini 3 Pro 具備更好的推理能力和代理能力，能夠完成更複雜的任務，並且可以在更長的時間範圍內提前規劃。這款模型正在推動一項實驗性的 Gemini Agent 功能，在 Gemini 應用程式替使用者執行任務，例如瀏覽和整理電子郵件、研究並預訂旅遊行程。

實際上，Gemini 3 Pro 突破 1,501 Elo 分數，榮登 LMArena 排行榜榜首。此外，Gemini 3 Deep Think 模式進一步提升模型的推理能力，但目前僅提供安全測試人員使用。

▲ Gemini 3 Pro 在多項關鍵 AI 基準測試表現領先。（Source：Google Blog）

▲ Gemini 3 Pro 展現更好的長期規劃能力，與競爭對手相比產生更高的回報。（Source：Google Blog）

Gemini 3 Pro 從即日起在 Gemini 應用程式向所有人提供，而美國的 Google AI Pro 與 Google AI Ultra 訂閱用戶可以在 AI 模式從模型下拉選單選擇「Thinking」來試用 Gemini 3 Pro，Gemini Agent 則優先向 Google AI Ultra 訂閱用戶提供。

Google 近年來推動 Gemini 以及相關應用取得成果，AI 摘要（AI Overviews）現在每月活躍使用者達到 20 億，Gemini 應用程式每月活躍使用者超過 6.5 億，超過 70% 的雲端客戶正在使用 Google 的 AI，更有 1,300 萬名開發者利用 Google 的生成式 AI 模型進行開發。

（首圖來源：Google）