
Google DeepMind 新開發的 AI 新系統「AlphaEvolve」,是一套使用大型語言模型自主發現並系統性地改善演算法的 AI 代理,使它更符合實際需求。
AlphaEvolve 的運作方式結合 2 種 Gemini 模型,其中 Gemini Flash 負責生成多樣化的程式方案,而 Gemini Pro 則對這些方案深入分析。AlphaEvolve 根據準確性、運算效率等客觀指標對各種方案進行評估,選出表現最好的變體,並在循環過程不斷進化。
Google DeepMind 將 AlphaEvolve 描述成測試時運算代理(test-time compute agent),是一種在運行時主動探索和評估新方案的 AI 系統。AlphaEvolve 使用測試時運算主動解決問題以改善結果,與目前的推理模型做法一致,然而 AlphaEvolve 是透過循環過程多次生成、測試及改善整個演算法,整個過程更有效率,過去需要數週進行改善,現在只需幾天的時間就能完成。
AlphaEvolve 已在 Google 多個基礎設施環節加以運用,例如為 Google 的「Borg」管理系統開發出一種新的資源分配方式,平均釋放 Google 全球 0.7% 運算資源。
AlphaEvolve 也幫助優化 Gemini 模型本身,透過改進矩陣乘法的分解方式,使模型訓練時間縮短 1%。在另一案例中,AlphaEvolve 改善 FlashAttention 核心,這是運行大型語言模型的關鍵 GPU 元件,達到最高 32.5% 的性能提升。
AlphaEvolve 成功提高 Google 在資料中心、晶片設計及 AI 訓練流程的效率,甚至包括訓練 AlphaEvolve 自身所採用的大型語言模型。它有助於設計更快的矩陣乘法演算法,為尚未解決的數學問題找出解決方法,凸顯應用在不同領域的可能性。
- Google DeepMind’s AI Agent Dreams Up Algorithms Beyond Human Expertise
- DeepMind claims its newest AI tool is a whiz at math and science problems
- AlphaEvolve is Google DeepMind’s new AI system that autonomously creates better algorithms
(圖片來源:Google DeepMind)