OpenAI 聯合創辦人 Andrej Karpathy 最近於開發者活動簡短談論自己和 OpenAI 對 AI Agents(AI 代理人)的看法。
Andrej Karpathy比較過去開發AI Agent的困難和現在新技術工具開發,他還調侃去特斯拉工作的日子是「被自動駕駛分心」,他認為自動駕駛和VR都是糟糕的AI Agents例子。Andrej Karpathy認為此刻正是再次回歸神經科學尋找靈感的時刻──就像深度學習發展早期。
另一方面,Andrej Karpathy認為普通人、創業者和geeks構建AI Agents比起OpenAI等公司更有優勢,大家都是平等競爭,因此他很期待看到更多成果。他透露,如果某論文提出某種不同訓練法,OpenAI的Slack討論常常嗤之以鼻,認為都是他們玩剩下的,但當新AI Agents論文出現,都會認真興奮的討論。以下編譯Andrej Karpathy演講以饗讀者。

大家好。
我受邀就AI Agents主題說些激勵的話。我認為AI Agents某種程度與我很接近。非常早期的OpenAI,約2016年公司只有十幾個人,潮流是RL Agents(強化學習代理人)。
每人都對建立代理人非常感興趣,但當時主要是基於遊戲,圍繞像Atari這類遊戲公司,我當時計劃將RL Agents重點放在鍵盤和滑鼠和電腦,而不是遊戲。我想讓它們更有用,可做更多工作,專案稱為World of Bits。
我和同事最後有發表論文,不算令人驚豔,因基於RL強化學習法。網頁非常簡單,可讓人訂機票或食物,但顯然行不通,因技術還沒準備好,那時做這些東西不太明智。事實也證明,應該完全忘記AI Agents這件事,去做語言模型。
五年後我們回到這裡,中間我被自動駕駛分心,但現在AI Agents重新變酷,而工具箱也完全不一樣,處理問題的方式也完全不同。所有人都在研究AI Agents,但可能沒有用到任何強化學習法,這太瘋狂了,我不認為我們當時有預見這點。
我會花一點時間談談為什麼AI Agents這麼紅。我想很明顯,對很多人來說,AGI(通用人工智慧)可充分利用AI Agents的能力,不是一個而是很多個,也許會出現數位實體的組織或文明,我認為非常有鼓舞性,甚至有點瘋狂。
不過我也要潑冷水。有類問題很容易想像、構建、展示,但很難製作成產品,很多事都屬這類,自動駕駛就是之一。
自動駕駛很容易想像,也很容易構建汽車繞街區行駛,但將之變成產品需要十年。同樣道理,VR也是如此,發揮作用約要十年。我認為AI Agents某種程度也是如此,很容易想像應用場景,非常激發我們興奮起來,但如果真正參與,應該投入十年讓它能發揮作用。
另一件事是,我認為現在回到神經科學並獲得靈感很有趣,深度學習早期就受神經科學啟發。思考人機關係非常有趣,特別是我認為很多人都把語言模型當成解決方案,但如何構建完整、有人類所有認知能力的數位實體?
顯然,我們都認為需要某種潛在系統規劃、思考和反思正在做的事,這就是神經科學發揮作用的地方,如海馬迴非常重要,AI Agents什麼東西能發揮海馬迴作用,做到儲存記憶、標記檢索等功能?
我們大致了解如何構建視覺和聽覺皮層,但還有許多東西我們不知道AI Agents會意味什麼,如視覺遊戲在AI Agents眼中是什麼樣子?潛意識所在地「丘腦」對AI Agents又等於什麼?
這非常有趣。我今天帶了一本神經科學的書,David Eagleman的《Brain and Behavior: A Cognitive Neuroscience Perspective》(大腦與行為),我發現這本書非常有趣和有啟發性。從神經科學汲取靈感,就像早期我們設計單神經元時,今天我們也許應該再次這樣做。
最後我想用鼓勵的話結尾。有趣但不明顯的事是,你們(現場觀眾)構建的AI Agents處於當代AI Agents最前線,所有大型LLM公司如OpenAI、DeFi等,我懷疑他們都還沒走到最前線。
你們正在最前線。
OpenAI非常擅長訓練Transformer大語言模型,如果某論文提出不同訓練法,OpenAI的Slack群組討論會類似:哦,有人兩年半前試過,沒用,我們對這種方法的來龍去脈非常了解。
但當新AI Agents論文出現,我們非常感興趣,覺得很酷,因我們團隊並沒有花五年研究這個,我們不比別人掌握更多,只是與所有人一起競爭。這就是我為什麼認為你們處於AI Agents最前線的原因,這對AI Agents發展非常重要。
(本文由 品玩 授權轉載;首圖來源:shutterstock)






