Anthropic 剛發表 Opus 4.7 模型威力強大,Claude Code 聲勢更力壓 Codex 與 Gemini,逼得 Google DeepMind 再度成立「突擊隊」救急,就連 Google 創辦人布林都親自下場督軍。曾於 AlphaFold、Gemini 等專案大放異彩,只在關鍵時刻組成的突擊隊究竟是什麼?
Google DeepMind最近又組成新「突擊隊」(strike team)。
《The Information》報導,突擊隊集中火力,希望增加AI模型的程式碼撰寫,並聚焦長時間開發,如撰寫新軟體、閱讀多個檔案、理解使用者意圖,接著完成程式。
2022年底OpenAI開放大眾使用ChatGPT、掀起新一波AI浪潮後,隔年便回歸辦公室的Google共同創辦人布林(Sergey Brin),也參與這支突擊隊。Google DeepMind技術長暨首席AI架構師武庫格魯(Koray Kavukcuoglu)也在名單內,帶隊者則是先前負責模型預訓練的研究工程師博吉奧(Sebastian Borgeaud)。
布林備忘錄寫道:「若想在最後衝刺時勝出,當務之急是跨越自主執行能力的鴻溝,並使模型蛻變為程式碼開發的核心戰力。」不過具體講,Google DeepMind的突擊隊如何運作?
平時發散研究,關鍵時刻換檔
即將出版的《無限機器》,作者馬拉比(Sebastian Mallaby)仔細梳理哈薩比斯(Demis Hassabis)的成長故事,以及他如何一手組建DeepMind,又如何努力帶領團隊與OpenAI、Anthropic等對手競爭。
書中鉅細靡遺描述DeepMind開發不同專案曾遇上的瓶頸,以及最後如何克服挑戰、完成任務的歷程。突擊隊便是DeepMind先前面臨重要時刻時,特別組成的任務編組。
接受《遠見》專訪時,馬拉比解釋,DeepMind長期有兩種運作邏輯。一種是由下而上的「藍天科學」(blue sky science),研究員可自由探索、發表論文,沿著不同方向嘗試。另一種則是由上而下集中的「專案突擊隊」模式。當哈薩比斯判斷某項技術成熟,只要投入更多資源就有機會打出決定性成果時,組織就會從前者切換到後者。
馬拉比指出,這其實就是哈薩比斯一路以來的「探索與開發」(exploration and exploitation),平時保留自由探索的空間,關鍵時刻再集中資源衝刺突破。利用AI成功預測蛋白質結構、並且讓哈薩比斯得到諾貝爾獎的AlphaFold,可說是突擊隊的絕佳成功案例。
2018年,目標預測蛋白質結構的AlphaFold專案,團隊努力下已能準確預測蛋白質結構60%主要原子位置,若以預測蛋白質結構的重要國際評比「CASP競賽」衡量DeepMind的研發成果,已是領先群雄。但哈薩比斯不滿意,他希望準確度能提升到有如X光晶體學那樣精準。
▲ 紀錄片〈The Thinking Game〉詳細描述DeepMind如何打造出AlphaFold,破解生物學領域重要的蛋白質結構預測難題。
2018年夏天,哈薩比斯無預警走進蛋白質團隊辦公室,聽取進度報告之後發出質疑。後來和哈薩比斯共享諾貝爾獎桂冠的瓊珀(John Jumper)回憶,當時AlphaFold團隊的計畫,大略只是延續原本做法,結果哈薩比斯質問:「我們到底要不要解決這個問題?」
團隊負責人席尼爾(Andrew Senior)反駁,他認為哈薩比斯設定的目標太難達成,且AlphaFold的既有表現,已有望能在CASP競賽奪冠,恰好替專案完美收尾。哈薩比斯卻不接受這個答案,因為他的野心不在登上競賽榜首,他渴望完全解決蛋白質結構預測挑戰。
後來,直接摺疊等新方向逐漸浮現成果,再加上CASP告捷,哈薩比斯決定將蛋白質團隊人數翻倍,並轉成突擊隊模式,由瓊珀取代席尼爾,負責帶領團隊。擴編後團隊展開一場長達數月的黑客松,研究員圍在白板前推敲想法、快速測試各種演算法,再從眾多方向收斂出最佳方案。瓊珀負責逐一檢視實驗結果,推動有潛力的方向繼續前進,若沒有成果也會及早收手。
這種先廣泛探索、接著集中開發最佳方案的方法,讓AlphaFold最終達成目標,這便是突擊隊模式火力全開的威力。
不論職位高低,只看能否改善結果
Google與其他企業開始大語言模型戰爭後,也不只一次組建突擊隊。
2023年夏天,Google DeepMind投入Gemini 1.5的預訓練與進階版本開發時,以及OpenAI在2024年9月預告將推出o1,推理模型搶先一步後,Google DeepMind都曾啟動突擊隊。
雖然突擊隊會召集不同部門、不同職位的成員,但運作邏輯相當明確。所有人都必須精力集中給同個模型或同項任務,不能參與其他專案;任何人都能提出改善方案並測試,但最後採用與否,只看是否真的提升模型表現。
考量到算力珍貴,突擊隊也要求先小規模測試改善方案,再用統一標準評估結果,確認確實有效後,才會正式納入模型開發流程。與OpenAI競爭推理模型表現時,突擊隊由沙澤爾(Noam Shazeer)與雷伊(Jack Rei)帶隊,原本只希望招募40名志願研究員,最後吸引150人報名。不過DeepMind和Google Brain合併,雙方工作習慣不同,突擊隊由上而下的大規模協作,開始時並不順利,直到以模型表現為導向的制度開始發揮作用,團隊才逐漸站穩腳步。

▲ 馬拉比《無限機器》詳細描繪哈薩比斯如何帶領DeepMind的歷程。(Source:天下文化)
馬拉比解釋,山景城Google Brain不太有由上而下的管理體制,非常熟悉由下而上的模式。相較之下,DeepMind保有由上而下指揮突擊隊的元素。所幸,團隊合併日長,雙方文化差異逐漸縮小,這套做法也成功融入向哈薩比斯匯報的Google團隊。
細究突擊隊的運作模式,不是單純徵調菁英、集體加班,有明確的運作流程,以及高度一致的目標,還有只問結果不問提出想法者出身的判斷標準。這也是突擊隊能在壓力升高、日程緊迫時發揮作用的原因。
如今,Google為了推高程式碼產生模型,再度組建突擊隊,競爭壓力明顯。
若不論對外銷售只看員工使用,Anthropic已把Claude Code整合至工程師日常流程,甚至宣稱公司幾乎100%程式碼都是AI寫的。Google財務長2月才表示,Google約50%程式碼由coding代理產出,兩者仍有不小差距。
接下來就看Google能否再次複製成功經驗,以突擊隊力挽狂瀾。
(本文由 遠見雜誌 授權轉載;首圖來源:shutterstock)






