OpenAI 創辦人 Karpathy：為何我們對 AI 代理人最感興趣

OpenAI 聯合創辦人 Andrej Karpathy 最近於開發者活動簡短談論自己和 OpenAI 對 AI Agents（AI 代理人）的看法。

Andrej Karpathy比較過去開發AI Agent的困難和現在新技術工具開發，他還調侃去特斯拉工作的日子是「被自動駕駛分心」，他認為自動駕駛和VR都是糟糕的AI Agents例子。Andrej Karpathy認為此刻正是再次回歸神經科學尋找靈感的時刻──就像深度學習發展早期。

另一方面，Andrej Karpathy認為普通人、創業者和geeks構建AI Agents比起OpenAI等公司更有優勢，大家都是平等競爭，因此他很期待看到更多成果。他透露，如果某論文提出某種不同訓練法，OpenAI的Slack討論常常嗤之以鼻，認為都是他們玩剩下的，但當新AI Agents論文出現，都會認真興奮的討論。以下編譯Andrej Karpathy演講以饗讀者。

大家好。

我受邀就AI Agents主題說些激勵的話。我認為AI Agents某種程度與我很接近。非常早期的OpenAI，約2016年公司只有十幾個人，潮流是RL Agents（強化學習代理人）。

每人都對建立代理人非常感興趣，但當時主要是基於遊戲，圍繞像Atari這類遊戲公司，我當時計劃將RL Agents重點放在鍵盤和滑鼠和電腦，而不是遊戲。我想讓它們更有用，可做更多工作，專案稱為World of Bits。

我和同事最後有發表論文，不算令人驚豔，因基於RL強化學習法。網頁非常簡單，可讓人訂機票或食物，但顯然行不通，因技術還沒準備好，那時做這些東西不太明智。事實也證明，應該完全忘記AI Agents這件事，去做語言模型。

五年後我們回到這裡，中間我被自動駕駛分心，但現在AI Agents重新變酷，而工具箱也完全不一樣，處理問題的方式也完全不同。所有人都在研究AI Agents，但可能沒有用到任何強化學習法，這太瘋狂了，我不認為我們當時有預見這點。

我會花一點時間談談為什麼AI Agents這麼紅。我想很明顯，對很多人來說，AGI（通用人工智慧）可充分利用AI Agents的能力，不是一個而是很多個，也許會出現數位實體的組織或文明，我認為非常有鼓舞性，甚至有點瘋狂。

不過我也要潑冷水。有類問題很容易想像、構建、展示，但很難製作成產品，很多事都屬這類，自動駕駛就是之一。

自動駕駛很容易想像，也很容易構建汽車繞街區行駛，但將之變成產品需要十年。同樣道理，VR也是如此，發揮作用約要十年。我認為AI Agents某種程度也是如此，很容易想像應用場景，非常激發我們興奮起來，但如果真正參與，應該投入十年讓它能發揮作用。

另一件事是，我認為現在回到神經科學並獲得靈感很有趣，深度學習早期就受神經科學啟發。思考人機關係非常有趣，特別是我認為很多人都把語言模型當成解決方案，但如何構建完整、有人類所有認知能力的數位實體？

顯然，我們都認為需要某種潛在系統規劃、思考和反思正在做的事，這就是神經科學發揮作用的地方，如海馬迴非常重要，AI Agents什麼東西能發揮海馬迴作用，做到儲存記憶、標記檢索等功能？

我們大致了解如何構建視覺和聽覺皮層，但還有許多東西我們不知道AI Agents會意味什麼，如視覺遊戲在AI Agents眼中是什麼樣子？潛意識所在地「丘腦」對AI Agents又等於什麼？

這非常有趣。我今天帶了一本神經科學的書，David Eagleman的《Brain and Behavior: A Cognitive Neuroscience Perspective》（大腦與行為），我發現這本書非常有趣和有啟發性。從神經科學汲取靈感，就像早期我們設計單神經元時，今天我們也許應該再次這樣做。

最後我想用鼓勵的話結尾。有趣但不明顯的事是，你們（現場觀眾）構建的AI Agents處於當代AI Agents最前線，所有大型LLM公司如OpenAI、DeFi等，我懷疑他們都還沒走到最前線。

你們正在最前線。

OpenAI非常擅長訓練Transformer大語言模型，如果某論文提出不同訓練法，OpenAI的Slack群組討論會類似：哦，有人兩年半前試過，沒用，我們對這種方法的來龍去脈非常了解。

但當新AI Agents論文出現，我們非常感興趣，覺得很酷，因我們團隊並沒有花五年研究這個，我們不比別人掌握更多，只是與所有人一起競爭。這就是我為什麼認為你們處於AI Agents最前線的原因，這對AI Agents發展非常重要。

（本文由品玩授權轉載；首圖來源：shutterstock）