2029 年的預言提前實現！Cursor用 GPT‑5.2 自主建瀏覽器，一週零人工介入

在一項引人注目的實驗中，程式設計新創公司 Cursor 利用 OpenAI 的 GPT-5.2，部署了數百個自主 AI 代理，成功從零開始建造並運行了一個完整的網頁瀏覽器，且在整整一週內無需人類干預。這個成就產生了約 300 萬行代碼，並在開發者中引發討論，展示了長期運行代理的先進能力。

這款瀏覽器擁有自己的瀏覽器引擎，能渲染網頁、處理Flexbox布局、顯示圖像和執行腳本，儘管存在一些可見的故障，證明它並非基於現有的引擎。Cursor的自定義協調層管理著數百個代理，透過結構化角色防止混亂：規劃者負責創建任務，工作者執行任務，而評審代理則驗證任務的完成。最初的平面層級結構失敗，因為代理變得風險厭惡並出現瓶頸，這突顯了提示設計的重要性超過基礎設施。

We built a browser with GPT-5.2 in Cursor. It ran uninterrupted for one week.

It’s 3M+ lines of code across thousands of files. The rendering engine is from-scratch in Rust with HTML parsing, CSS cascade, layout, text shaping, paint, and a custom JS VM.

It *kind of* works! It… https://t.co/pHL5CgZCfK pic.twitter.com/jA6wDdwRif

— Michael Truell (@mntruell) January 14, 2026

這項實驗的成本約為8萬美元的AI代幣，並持續運行了數天到數週。Cursor是一個針對AI開發優化的Visual Studio Code分支，支援GPT、Claude、Gemini和Grok等模型，具備多文件編輯、終端命令和「指針」系統等功能，以高效處理上下文而不會使代理記憶過載。

這項成就引發開發者熱議，獨立研究員西門·威利森（Simon Willison）曾預測到2029年將會有人使用AI建造完整的網頁瀏覽器，而Cursor的進展將這個時間表提前，讓專家們感到驚訝。OpenAI工程師Bill Chen強調，這個項目使用的GPT-5.2模型顯示了在長期任務中更高的連貫性和智慧，這標誌著一種「能力過剩」的現象，即最先進的AI模型能夠做的事情，遠超過目前的公開部署。

Cursor工程師Jonas Nelle指出，隨著 AI 模型持續進步，工程師和研究人員需要每隔幾個月重新審視他們對 AI 模型能力的假設。雖然他坦言「今天不會下載它來取代 Chrome」，但這個瀏覽器專案「肯定比以往任何模型所能做到的都要好」。

儘管這些工具仍然是研究原型，尚未公開，但Cursor的實驗顯示了AI在複雜、持續的軟件工程中的潛力。

（首圖來源：Michael Truell）