第一代 Gemini 模型能夠看、能夠聽、能夠理解大量資訊,並且跨模態自然生成。第二代 Gemini 模型具備進階的推理能力,使 AI 代理能夠思考、採取行動。現在 Google 將模型提升至新的層次,正式發表「Gemini 3」模型,宣稱是世界上最強大的多模態與推理模型。
Google 首次讓所有使用者從推出第一天就能在 Gemini 應用程式取得新模型 Gemini 3 Pro 預覽版,同時也將 Gemini 3 Pro 導入搜尋服務。
Gemini 3 Pro 是原生多模態模型,意味著它能同時處理文字、圖片、影片、音訊及程式碼,不必分開處理。Google 舉例,Gemini 3 Pro 可以解讀並翻譯不同語言的手寫食譜,然後把它編成一本食譜書,或是根據一系列的學術論文、講座影片,製作互動式學習卡。
Gemini 3 是 Google 最強大的 Vibe Coding 和代理編碼模型,使用者也會在 Google 旗下產品看到導入 Gemini 3 的改進。在 Google 搜尋的 AI 模式(AI Mode)功能中,Gemini 3 Pro 幫助呈現視覺化內容,例如圖片、表格,甚至根據使用者的查詢顯示模擬結果,可以使用升級版 Google「查詢擴展技術」進行更多搜尋,不僅能將問題拆解成便於搜尋的部分,還能理解使用者意圖,協助找到先前可能錯過的搜尋結果。
Google DeepMind 產品管理資深總監多希(Tulsee Doshi)表示,新模型使 Google 更接近「讓資訊普及且有用」的目標,尤其幫助搜尋引擎持續進步。「我認為朝此方向邁出最大的一步,跳脫僅限文字回應的框架,並且讓你能夠看到更豐富、更完整的內容」,她說。
隨著 Gemini 3 推出,這讓 Google 有機會在 GPT-5 問世經歷波折後加速超越 OpenAI。Google 官方部落格文章稱 Gemini 3 Pro 的回應「聰明、精簡、直接,以真實深刻的見解取代陳腔濫調和奉承。告訴你需要知道的,而不是你想聽到的。」Google 毫不掩飾地針對 OpenAI,形容 Gemini 3 Pro 不會像 ChatGPT 背後支援的模型那樣空泛又愛奉承。
除上述改進外,Gemini 3 Pro 具備更好的推理能力和代理能力,能夠完成更複雜的任務,並且可以在更長的時間範圍內提前規劃。這款模型正在推動一項實驗性的 Gemini Agent 功能,在 Gemini 應用程式替使用者執行任務,例如瀏覽和整理電子郵件、研究並預訂旅遊行程。
實際上,Gemini 3 Pro 突破 1,501 Elo 分數,榮登 LMArena 排行榜榜首。此外,Gemini 3 Deep Think 模式進一步提升模型的推理能力,但目前僅提供安全測試人員使用。

▲ Gemini 3 Pro 在多項關鍵 AI 基準測試表現領先。(Source:Google Blog)
▲ Gemini 3 Pro 展現更好的長期規劃能力,與競爭對手相比產生更高的回報。(Source:Google Blog)
Gemini 3 Pro 從即日起在 Gemini 應用程式向所有人提供,而美國的 Google AI Pro 與 Google AI Ultra 訂閱用戶可以在 AI 模式從模型下拉選單選擇「Thinking」來試用 Gemini 3 Pro,Gemini Agent 則優先向 Google AI Ultra 訂閱用戶提供。
Google 近年來推動 Gemini 以及相關應用取得成果,AI 總覽(AI Overviews)現在每月活躍使用者達到 20 億,Gemini 應用程式每月活躍使用者超過 6.5 億,超過 70% 的雲端客戶正在使用 Google 的 AI,更有 1,300 萬名開發者利用 Google 的生成式 AI 模型進行開發。
- Google Unveils Gemini 3, With Improved Coding and Search Abilities
- Google Seeks to Shake Up Chatbot Race With New Gemini Version
- Google is launching Gemini 3, its ‘most intelligent’ AI model yet
(首圖來源:Google)






