整合 Operator、深入研究雙優勢,代理新工具 ChatGPT agent 登場

作者 | 發布日期 2025 年 07 月 18 日 11:44 | 分類 AI 人工智慧 , ChatGPT , OpenAI line share Linkedin share follow us in feedly line share
Loading...
整合 Operator、深入研究雙優勢,代理新工具 ChatGPT agent 登場

OpenAI 將自主代理能力直接整合到 ChatGPT,結合 Operator、Deep Research(深入研究)2 款代理工具的優勢,打造最新 ChatGPT agent(ChatGPT 智慧體),可看出 OpenAI 正全力投入現今最熱門的代理式 AI 領域。

ChatGPT agent 結合 OpenAI 自家 Operator 操作網站的能力、Deep Research 整合網路資訊的能力,以及 ChatGPT 的對話技能,打造出一套自主代理系統,於是 ChatGPT 會依照指示為你完成工作、加速產出過程。這代表你能將構想和問題延伸到具體行動,像是深入研究財務資料、填寫線上表單,或是製作精美簡報。

OpenAI 舉例對 ChatGPT 提出「看一下我的行事曆,並根據最近的新聞,簡單歸納接下來與客戶開會的重點」,或是「分析 3 家競爭對手並製作成簡報」等要求,ChatGPT agent 將會瀏覽網站內容、選擇日期、篩選結果、提醒你安全登入、執行程式碼,甚至產出簡報和試算表等可以編輯的輸出內容,完成整個研究結果。

ChatGPT agent 在執行重要操作前會徵詢你的許可,並在需要時向你徵詢額外資訊,你可以隨時能夠中斷作業、接管瀏覽器,或者直接停止任務。值得一提的是,ChatGPT agent 內建一項「監視模式」保護措施,比方說進行金融交易時,系統會要求用戶不得離開畫面去做其他事,否則 ChatGPT agent 將會暫停運作。

事實上,ChatGPT agent 是今年兩項重要突破技術自然演進的成果:Operator 這款代理工具透過遠端瀏覽器直接操作網站,結合多步驟網路推理工具 Deep Research,前者可在網站上捲動、點選及輸入內容,而後者擅長分析和歸納資訊要點。OpenAI 發現,用戶嘗試向 Operator 提出的查詢,其實更適合交由 Deep Research 處理,於是結合兩者優點。

ChatGPT agent 背後的模型透過強化學習進行訓練,可完成需要多種工具的複雜任務;這次就用到透過圖形使用者介面操作網站的視覺瀏覽器、用來處理簡單推理型網路查詢的文字瀏覽器,以及直接存取 API 的機制。

Operator 更對外媒表示,ChatGPT agent 能夠存取「整台電腦」,並非只有瀏覽器,大大增強它能使用的工具集,未來的應用範圍可望更廣。

ChatGPT agent 即日起逐步向 ChatGPT Pro / Plus / Team 訂閱用戶開放,本月也將開放 ChatGPT Enterprise 企業版 / Edu 教育版用戶使用。其中,ChatGPT Pro 方案用戶每月任務數幾乎無上限,而其他訂閱用戶每月可執行 50 項任務,可彈性加購使用額度。

OpenAI 指出這次發表只是將自主代理能力直接整合到 ChatGPT 的開端,團隊計劃持續新增項目以及改進,讓 ChatGPT agent 與時俱進。

▲ 執行長 Sam Altman 帶領團隊成員發表 ChatGPT agent。

(首圖來源:影片截圖)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》