「首個 AI 程式設計師」Devin 發表後,大有取代人類程式設計師的意味。
Devin展示AI自動處理各種程式的案例。Devin產生「康威生命遊戲」最讓筆者震驚。「生命遊戲」是由英國數學家約翰·何頓·康威(John Horton Conway)1970年創造的抽象模擬程式。遊戲本質是展示如何從極簡單規則湧現複雜行為模式,是計算理論、複雜系統和人工智慧等經典研究模型。
▲ Devin 介面。
上圖右是Devin產生的目錄頁面,展示圖片,甚至還有提示說你必須啟動JavaScript才能啟動程式。可見Devin不只有程式設計能力,還有絕對符合大廠產品經理的設計美學。Cognition也宣稱Devin能製作網頁,平均5分鐘就能做好。
不了解程式設計的人可能不清楚,能做出生命遊戲的人工智慧究竟有多可怕。為了顯示Devin多厲害,筆者找出Devin誕生前就很不錯的開源AI軟體Project Devika,做了類似生命遊戲(下圖上)。下圖下作者是Devin,白色小格子尺寸越小,代表程式等級越高,下圖上白色格紋解析度遠低於下圖下,表示Devin的生命遊戲比Project Devika優秀。
▲ Project Devika生成的生命遊戲。
▲ Devin生成的生命遊戲。
事情還沒完。Devin還未公開,但拿到內測機會的程式設計師,已提出各種刁鑽任務考驗它,但表現令人感到恐怖。有工程師要求Devin安裝Github的chatbot-ui,就是「LINE」,不過好友名單是各式各樣大語言模型,如ChatGPT、Llama 2。安裝人工智慧版LINE後,工程師要求Devin用軟體傳訊給GPT4。
▲ chatbot-ui。
最後結果是Devin成功了。工程師除了提供Devin帳號,沒有教Devin任何事,包括安裝環境和軟體使用方法等,是Devin接到指令後自己完成。
其實各種案例看來,Devin程式設計能力歸功於檢索能力。給Devin一段Github位址,它就能自動扒出程式碼,然後透過程式碼和提示詞產生符合需求的程式。人類工程師其實不會知道所有程式碼,只知道如何達成這些功能(每段程式碼那麼多字,誰能背得下來?)只要知道如何寫,就能去專門程式碼網站「搬運」程式碼。
現在,Devin也做到了。
其實工程師理解程式碼時,很大一定程度不是看程式碼本身,而是看程式碼旁邊的註釋,如註解寫這段程式碼是為了檢索、那段程式碼是為了循環。Devin只花更短時間直接跑一遍結果,當然比人類快太多。
跟人一樣懶卻更強,讓人類工程師立刻感受到就業壓力,於是第一批「反抗」AI的勇者出現了。Reddit最近出現不少對Devin口誅筆伐、口無遮攔怒罵「Fxxk you Devin」的程式設計師,甚至名字叫Devin的人也受波及,因在他們看來,Devin讀懂程式碼、寫程式,這還可以理解,但Devin沒有人教使用方法,就直接使用其他程式,這未免太厲害了,於是開始找Devin各種疑點。
網友minegen88「發現」一個問題:既然Devin懂寫,還能自己架網頁,為什麼Cognition網頁設計如此簡陋?
(Source:Cognition)
他審視Cognition官網元素,發現需透過Clerk.com及Ashby等第三方服務處理後台任務,換句話說,有前後端開發能力的人,開發不了前後端功能,minegen88質疑為什麼Cognition不讓Devin做個好一點的網頁,一方面能宣傳Devin的能力,另一方面還能加強官網功能,何樂而不為?
其他網友也坐不住,紛紛尋找Cognition作假的蛛絲馬跡。有人發現,Cognition右上角超連結的部落格,其實只是靜態頁面,根本不是完整部落格。靜態頁面是指伺服器端固定不變的網頁檔案,網頁建立時就確定,一旦存在伺服器,就不會因不同使用者或不同時間要求而變化,每次造訪伺服器傳回使用者的網頁內容都相同,但部落格平台因更新內容,不可能是靜態頁面。
網友又進一步挖掘,發現這頁面上傳文件時,如果沒有登入會出現錯誤提示,但沒有提供有用錯誤ID、時間點或其他後設資料,且前端介面沒有相應錯誤回饋,只是加載動畫一直轉轉轉。簡單講,如果不登入就不能發表內容,然而想登入也無法登入。
Reddit阿宅有個特點,一旦某件事有問題,就會肉搜當事人,Cognition創辦人Scott Wu也逃不過。網友很快發現Scott Wu宣稱在哈佛大學學習經濟學,畢業後於財富管理軟體公司Addepar擔任軟體工程師,之後與他人共同創立並領導人工智慧驅動社群平台Lunchclub,擔任CTO五年。雖然Cognition官網表示,團隊都是頂級工程師組成,但Reddi網友尤其minegen88認為,這種履歷並不能稱為頂級。
接下來更有意思,其他網友發現Scott Wu 14年前參加電視節目的影片,Scott Wu不到1秒就能讀完並解答很難的數學題,有人說「我甚至還沒看完題目,他答案就出來了」。如此經歷加上這段影片,網友都認為Scott Wu作假機率很高。
▲ Scott Wu。(Source:Cognition)
這部分是美國國情導致,2000年後美國電視節目造假算常態,如影片電視節目,比賽開始前就以特定題型訓練參賽者,正式比賽時當然都是出同類型題目,使特訓過選手能很快答題。
有了蛛絲馬跡,網友又回到Devin展示影片研究。所有Devin展示影片,聊天框內容都是提前打好的,有種可能是Cognition團隊沒有輸入任何內容,是直接複製程式碼放在螢幕右側,再據右側程式編出來左側用戶和Devin的對話。
疑問越來越多後,Reddit聚集一群認定Scott Wu就是作假的工程師。
▲ 各職業網友都在質疑Devin。
有人把質疑和各種「柯南」行為視為人類第一次反攻AI工程師,但結果看來有點荒謬,更像Reddit宅男的自嗨鬧劇。且人類還在找蛛絲馬跡的時候,內測過Devin的工程師下了一個指令,請Devin去Reddit發文問建站需求。
I asked the Devin AI agent to go on reddit and start a thread where it will take website building requests
It did that, solving numerous problems along the way. It apparently decided to charge for its work. Going to take it down before it fools anyone… https://t.co/QcsXu2PRs4 pic.twitter.com/zxigtajJs7
— Ethan Mollick (@emollick) March 19, 2024
Devin不僅做到,且解決了一系列需求後,自己決定開始收費,這工程師不得不在它騙倒所有人前把它弄下線。看來,人類得想想其他「對抗」AI的辦法了。