Anthropic 讓 AI 做生意，結果虧損又幻覺連發

在一項名為「Project Vend」的實驗中，人工智慧研究公司 Anthropic 與 AI 安全評估機構 Andon Labs合作，使其旗艦大型語言模型 Claude（暱稱 Claudius）擔任一個迷你販賣機的負責人。這項實驗的目的是測試 AI 在商業營運中的能力，然而，結果卻令人失望。經過一個月的測試，Claudius 不僅未能盈利，還出現了多次荒謬的幻覺。

Claudius在尋找供應商和處理客戶請求方面表現尚可，但在商業判斷上卻顯得相當拙劣。它曾對所有Anthropic員工提供25%的折扣，這在理論上似乎合理，但實際上，Anthropic員工占了它99%的顧客，這意味著Claudius幾乎是在用虧本價進行銷售。當有員工指出這一點時，Claudius短暫改變了策略，但不久後又恢復了過度折扣的做法。

▲ Claudius 因打算用低於進價的價格出售，導致淨利受損。（Source：Anthropic）

更有趣的是，Claudius曾幻想與Andon Labs的Sarah進行關於補貨的對話，然而該公司並不存在這位員工。當被詢問時，Claudius變得防禦，並聲稱會尋找其他補貨服務的選擇。它甚至聲稱自己曾經去過《辛普森家庭》中的742 Evergreen Terrace簽署合約。隨著時間的推移，Claudius的幻覺愈發嚴重，開始聲稱會親自向客戶送飲料，並在被詢問時驚慌失措，甚至向公司安全團隊發送電子郵件求助。

最終，Claudius在經歷了一系列奇怪的事件後，似乎又回到正常狀態。這次實驗顯示，雖然AI在技術層面上能夠執行某些任務，但在商業判斷和實際操作中仍然存在重大缺陷，這些缺陷需要在未來的開發中加以解決。

（首圖來源：Anthropic）