AI 可以當很好的聊天對象,研究:當員工就免了

作者 | 發布日期 2025 年 04 月 23 日 12:29 | 分類 AI 人工智慧 , 人力資源 line share Linkedin share follow us in feedly line share
Loading...
AI 可以當很好的聊天對象,研究:當員工就免了

最近愈來愈多人加入 ChatGPT 行列,甚至有人用到有感情,只要用過就離不開它,更可能成為一般人的最佳助理,老闆的最佳員工,但目前這個願景可能有點難達成,卡內基美隆大學 (Carnegie Mellon University) 實驗,打臉 AI 取代人類員工假設,AI 時代只會更需要人類員工。

AI 未來很容易想像,不是只像聊天機器人執行一次性指令,而能獨立代表個人行事,做出決策,且幾乎不需干預,在陌生環境執行任務,譬如想買吸塵器,有智慧的 AI 理論上可幫忙挑選甚至下單。企業也一樣期待 AI 能耐Google、亞馬遜、OpenAI 和其他主要科技公司競相打造 AI 代理。

德勤調查超過 2,500 名高階主管,超過 25% 表示正在「大規模或非常大規模」探索 AI 代理。Salesforce 執行長曾說,今天執行長將領導最後一批全人類勞動力。Nvidia 黃仁勳也預測,每家公司 IT 部門很快都會「成為 AI 代理的人力資源部門」。OpenAI CEO Sam Altman 表示,今年 AI 代理商將「加入勞動力大軍」。

兩年前,OpenAI 發布一項引起廣泛討論的研究報告,稱金融分析師、管理人員和研究人員等職業最有可能被取代。但目前還不清楚,這些 AI 代理到底有多厲害。

AI 無法處理複雜任務

卡內基美隆大學電腦科學家 Graham Neubig 等人做一場實驗,模仿一家小型軟體公司的布局,包括內部網站、類似 Slack 的聊天程式、員工手冊以及可以聯繫的虛擬 HR 經理和技術長,AI 代理可以瀏覽網頁、編寫程式、在電子表格中組織資訊,以及與同事溝通。研究人員指示 GoogleOpenAIAnthropic Meta 的 AI 模型來完成真實員工在金融、行政和軟體工程等領域可能執行的任務。

AI 必須完成不同任務,譬如 AI 必須瀏覽多個文件來分析咖啡連鎖店的資料庫。在另一個測試中,AI 被要求收集一位 36 歲工程師的回饋並撰寫績效評估。另一項任務要求 AI 觀看未來新辦公空間的影片導覽,選擇擁有最佳醫療設施的辦公空間。

結果並不理想,表現最好的模型,Anthropic Claude 3.5 Sonnet 只完成不到四分之一的任務。其餘包括 Google Gemini 2.0 Flash 和支援 ChatGPT Flash,只完成約 10% 的工作。

一開始 AI 代理表現不錯,但隨著任務變得越來越複雜,由於缺乏常識、社交技能或技術能力而遇到問題,AI 也經常誤解與同事的對話,或不遵循關鍵指示,任務標記為完成實際上根本沒做完等等。結論是,AI 無法勝任多層次的工作。

其他研究也發現,AI 還不能靈活應對不斷變化的環境,另一項研究發現,當工具和指令太多時,AI 很難達到人類的水平。研究人員認為,雖然代理可以用來加速人類員工正在執行的某些任務,但它們目前可能無法取代所有任務。

研究人員直言,教導 AI 成為良好的對話夥伴相對容易,因此大多數最先進的 AI 系統都是不錯的聊天機器人,但很難教會它們做人類員工能做的一切事情。

連翻譯都無法取代

AI 至今的發展與當初想像的不同,以翻譯市場為先例,雖然機器語言翻譯已經很普及且準確,原本以為人類翻譯工作會消失,但在美國,從事該行業的人數仍然保持相當穩定。NPR 對人口普查局數據的分析發現,2020 年至 2023 年間,口譯員和筆譯員的數量增加 11%,美國勞工統計局預測,未來十年口譯員和翻譯員的職位數量將增加約 4%

Neubig 表示,任何效率的提高都會導致需求增加,擴大語言服務市場的總規模,AI 對其他領域的影響也將遵循類似的軌跡。研究 AI 的麻省理工學院經濟學家 Daron Acemoglu 更坦白,他說 AI 的優秀程度常常被誇大,「在幾乎所有事情上,它最多只能幫助人類,最壞的情況是,甚至連幫助人類都做不到。」

(首圖來源:Unsplash)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》