在一項引人注目的實驗中,程式設計新創公司 Cursor 利用 OpenAI 的 GPT-5.2,部署了數百個自主 AI 代理,成功從零開始建造並運行了一個完整的網頁瀏覽器,且在整整一週內無需人類干預。這個成就產生了約 300 萬行代碼,並在開發者中引發討論,展示了長期運行代理的先進能力。
這款瀏覽器擁有自己的瀏覽器引擎,能渲染網頁、處理Flexbox布局、顯示圖像和執行腳本,儘管存在一些可見的故障,證明它並非基於現有的引擎。Cursor的自定義協調層管理著數百個代理,透過結構化角色防止混亂:規劃者負責創建任務,工作者執行任務,而評審代理則驗證任務的完成。最初的平面層級結構失敗,因為代理變得風險厭惡並出現瓶頸,這突顯了提示設計的重要性超過基礎設施。
We built a browser with GPT-5.2 in Cursor. It ran uninterrupted for one week.
It’s 3M+ lines of code across thousands of files. The rendering engine is from-scratch in Rust with HTML parsing, CSS cascade, layout, text shaping, paint, and a custom JS VM.
It *kind of* works! It… https://t.co/pHL5CgZCfK pic.twitter.com/jA6wDdwRif
— Michael Truell (@mntruell) January 14, 2026
這項實驗的成本約為8萬美元的AI代幣,並持續運行了數天到數週。Cursor是一個針對AI開發優化的Visual Studio Code分支,支援GPT、Claude、Gemini和Grok等模型,具備多文件編輯、終端命令和「指針」系統等功能,以高效處理上下文而不會使代理記憶過載。
這項成就引發開發者熱議,獨立研究員西門·威利森(Simon Willison)曾預測到2029年將會有人使用AI建造完整的網頁瀏覽器,而Cursor的進展將這個時間表提前,讓專家們感到驚訝。OpenAI工程師Bill Chen強調,這個項目使用的GPT-5.2模型顯示了在長期任務中更高的連貫性和智慧,這標誌著一種「能力過剩」的現象,即最先進的AI模型能夠做的事情,遠超過目前的公開部署。
Cursor工程師Jonas Nelle指出,隨著 AI 模型持續進步,工程師和研究人員需要每隔幾個月重新審視他們對 AI 模型能力的假設。雖然他坦言「今天不會下載它來取代 Chrome」,但這個瀏覽器專案「肯定比以往任何模型所能做到的都要好」。
儘管這些工具仍然是研究原型,尚未公開,但Cursor的實驗顯示了AI在複雜、持續的軟件工程中的潛力。
- Cursor used a swarm of AI agents powered by OpenAI to build and run a web browser for a week—with no human help. Here’s why developers are buzzing
- Cursor’s agent swarm tackles one of software’s hardest problems and delivers a working browser
- What the Team Behind Cursor Knows About the Future of Code
(首圖來源:Michael Truell)






