Agent 這個詞,AI 行業喊了至少兩年。2024 年起,每一場發表會都在談 Agent,投資機構認為它是下一個兆元市場,新創公司一夕之間改了 slogan。但打開產品一看,還是一個對話框等你打字:你給指令,它給回答;你不提問,它就停在那。概念跑得很快,產品形態沒跟上。直到 OpenClaw 出來,這種錯位才突然變得可見──不是因為它發明了什麼新技術,而是它把那層一直缺少的互動前端拼對了。
OpenClaw這個小龍蝦的火熱沒有曇花一現,從一個週末項目起步,短時間衝到十萬級GitHub stars,單週兩百萬訪問。但更能說明問題的是它迅速從極客玩具升級為Agent雛形:用戶群從開發者擴散到各行各業,營運、創業者、普通人,討論焦點也從技術實現轉向日常使用。2月15日,Sam Altman宣布OpenClaw創辦人Peter Steinberger加入OpenAI,也為這輪「個人Agent形態」做了背書。而在各個科技社群、社群媒體、各個線下聚會上,人們還在蜂擁而至為自己部署著各種「龍蝦」。
這股龍蝦熱逐漸演變出了一種行業共識:如果把AI當作一整個獨立的「產品」,那麼ChatGPT們之前其實只是在構建「後端」,這一次它才真正有了「前端」。
對話框其實困住了所有人
ChatGPT問世三年多,定義了一個近乎統一的互動模式:一個輸入框,你打字,它回覆。三年裡,絕大多數AI產品都在複製這個模式。豆包、Kimi、Perplexity、Claude,換名字換皮膚換模型,底下還是同一套回合制界面。
對話框看起來很自然,但它把AI鎖在了被動位置:你不打開它,它就不存在;你不提問,它就不行動。AI的全部價值,仰賴用戶主動發動、主動拆解、主動盯人過程、主動驗收。對重度使用者來說這只是習慣,但對多數一般人而言,「想到要用AI」本身就是門檻。
還有一層更隱密的問題:對話方塊把能力限制在「答案」了。你問一個問題,它給一段文字;你讓它寫程式碼,它給一段程式碼。互動結束,系統即停。它沒辦法替你跑一個持續性任務,沒辦法在你不在的時候盯住什麼,沒辦法在發現異常後主動來找你。
對話框是回合制遊戲,但真正的助手應該是線上即時的。
Peter Steinberger在Lex Fridman的訪談中把這點說得更狠:我們現在給Agent的界面,本質上是在「複製Google」──一個prompt、一個聊天框,就像電視剛出現時人們把廣播節目原封不動搬到螢幕上播。

(Source:Unsplash)
換句話說,GenAI的後端能力已經到了2026年的水準,前端界面還停在2010年。Agent的推理與規劃能力在變強,UI層基本上沒變,反而拖住了體驗。許多任務明明需要表單、預覽、控制、逐步回饋,但產品仍在用「聊天」硬扛。
當界面沒進化,模型再強,使用者體感也只是「聰明了一點」。這也是為什麼業界會同時出現兩種情緒:一邊是能力暴漲,一邊是「怎麼還是用不起來」。
OpenClaw做對了什麼
OpenClaw接入了聊天軟體,就這麼簡單。
它跑在飛書(Lark)、iMessage、Telegram裡,能在本地運行、替用戶執行動作。訊息會彈出來找你,不用切換上下文。對話框是你得專門去開啟的東西,聊天軟體是你已經待著的地方。跟AI說句話,跟回覆一條微信一樣隨意。
分發上的差距更大。ChatGPT要註冊、打開;飛書和Telegram早就裝在手機上了。OpenClaw接取這些平台,用戶取得AI的門檻降到接近零。使用者只有一直在用,才會真正體會到價值。
但入口只是一半。OpenClaw真正的突破是主動性。
Peter在訪談中提到,他為Agent加了定期觸發機制,最初的提示詞很粗暴:每隔一段時間surprise me。你睡它在跑,開會它也在跑。一個等你來用,一個替你去做。喊了兩年Agent,直到OpenClaw,大多數人才第一次摸到Agent該有的手感。
Claude Code再強,使用者心智被「編程工具」鎖死了:打開終端、輸入指令、盯輸出。OpenClaw更像一個長期在線的代理人,存在方式本身就不一樣。
而Agent產品面向使用者可能本來就該是黑盒。你說「幫我盯著這幾個帳號」,它去盯著,中間用了什麼模型、燒了多少token,不關用戶的事。OpenClaw的token消耗比傳統對話式AI高一個數量級,但用戶不在乎──他們看不到過程,只看到結果。
Cowork本來最有機會站在OpenClaw今天的位置,發布時甚至引發了一波軟體股恐慌。但它差了兩步:沒進聊天軟體,界面上顯示了太多配置項。Cowork開啟是資料夾選擇、權限設定、任務進度面板;OpenClaw開啟是一個聊天視窗。一個像在操作軟體,一個像在跟人說話。

(Source:影片截圖)
很有代表點的是,很多人用OpenClaw到現在,就沒拿它像AI IDE那樣寫程式過。這款原本跑在終端機裡的技術產品,用戶拿來管理郵件、盯熱點、整理資訊、安排行程、一句話開發。技術棧是程式設計師的,使用場景完全不是。
ChatGPT們只是後端,OpenClaw們定義了前端
過去幾年,從GPT-3到GPT-5,從Claude到Gemini,整個產業做的事情其實都是同一件:堆後端。更大的模型、更長的上下文、更好的推理——這些都是基礎設施,是水力發電煤。
ChatGPT們這些GenAI產品和模型,就是後端,負責產生文字、產生程式碼、呼叫工具、理解意圖。
但後端再強,沒有前端也觸及不了普通人。網路的後端是TCP/IP,真正改變世界的是瀏覽器;行動網路的後端是3G/4G,真正改變世界的是App Store。後端決定能力上限,前端決定誰能用這些能力。
OpenClaw所呈現出來的Agent就是這一輪AI的前端。它接收意圖,在真實環境裡做決策、調工具,把結果交付給你。GenAI的能力,不管是生成程式碼還是邏輯推理,都在後面撐著這個代理。
這也就是為什麼GPT-5發布時行業反應相對平淡:模型確實更強了,但體驗在對話框裡沒有質的變化,用戶覺得「好像聰明了一點」,然後繼續用原來的方式。後端在進步,前端沒變,使用者感受到的提升就很有限。
反過來,OpenClaw用的模型並不比別人強──它接的是Claude、GPT、DeepSeek,跟所有人調用的API一樣。但它換了前端,體驗像是跳了一代。
Peter在Lex的訪談裡用一句話把這個未來推到了極端:every app is just a very slow API now。X平台(前稱Twitter)對存取設限,並沒有真正讓Agent「不可能」讀取內容──Agent只需要打開瀏覽器去讀,只是成本更高、速度更慢。

(Source:影片截圖)
也意味著,當Agent能替你跨越一堆界面完成工作,App這層「為人類設計的UI」就會逐漸退化為「為Agent提供的資料與動作界面」。使用者不再「使用」你的產品,使用者的Agent替他們「呼叫」你的產品。
越標準化的工具──App、郵件、日曆、任務管理、文件儲存──越可能先被改寫。越複雜、越強權限的系統會更慢,但也更依賴「前端入口+權限+工作流程編排」這個組合。
GenAI和Agent不是兩個時代,是同一個系統的兩層。ChatGPT的對話方塊定義了GenAI的互動模式,OpenClaw的聊天軟體定義了Agent的互動模式。前者最後會隱藏,變成後端。OpenClaw這樣的Agent成為一切的前端。
難得的自下而上的「革命」
這股熱潮沒有褪去的背後,另一個讓人有些意外的地方是,OpenAI「收編」OpenClaw後,人們的熱情並沒有減弱。
但也因為OpenAI挖走了OpenClaw的創辦人,到現在也沒推出類似的產品型態。
這可能因為ChatGPT的對話框心智太強,三年多累積的使用者習慣反而成了負擔。而OpenAI的商業模式建立在訂閱和API呼叫上,讓Agent跑在第三方聊天軟體裡,等於把使用者入口拱手讓人。
Anthropic的處境同樣特殊。Claude Code成長很快,但「程式設計工具」標籤一旦貼上就撕不掉。Cowork是對的棋子,1月發布即引發一波軟體股恐慌,但它生在桌面端、不在聊天軟體裡,起步慢了半拍。
同一時期,Perplexity推出了名為Computer的Super Agent,走雲端路線但定位類似──這說明「主動式Agent嵌入日常工具」已成行業共識,區別只在誰先拿到用戶。
這些巨頭面對的其實是同一個困境:現有產品太成功了,反而堵住了解決真正的需求的路。ChatGPT的對話框、Claude Code的終端、Office的生產力套件、微信的社交生態──每一個都是護城河,但也是圍牆。OpenClaw沒有這個包袱。巨頭們被自己的成功困在原地,不是看不見新模式,而是動不了。
看起來,人們對OpenClaw和收了它的OpenAI的認知依然是分開的,OpenClaw代表的新的互動模式,沒有對「自有入口」的執念反而把使用者體驗做好了,而一個好的「前端」從來都是自下而上建設起來的。
這也讓OpenClaw成了這一輪越來越像是巨頭之間的資源遊戲的AI演進中,一次難得的自下而上的破局。它給了大批開發者和創業者一些新的信心:創新還可以發生,即使是從一個小團隊、一個週末專案、一個「surprise me」的粗暴提示詞開始,遊戲還遠遠沒有結束。






