「AI 程式設計師」Devin 大殺四方後,人類程式設計師開始反擊

作者 | 發布日期 2024 年 03 月 29 日 8:10 | 分類 AI 人工智慧 , 科技趣聞 , 軟體、系統 line share follow us in feedly line share
「AI 程式設計師」Devin 大殺四方後,人類程式設計師開始反擊


「首個 AI 程式設計師」Devin 發表後,大有取代人類程式設計師的意味。

Devin展示AI自動處理各種程式的案例。Devin產生「康威生命遊戲」最讓筆者震驚。「生命遊戲」是由英國數學家約翰·何頓·康威(John Horton Conway)1970年創造的抽象模擬程式。遊戲本質是展示如何從極簡單規則湧現複雜行為模式,是計算理論、複雜系統和人工智慧等經典研究模型。

▲ Devin 介面。

上圖右是Devin產生的目錄頁面,展示圖片,甚至還有提示說你必須啟動JavaScript才能啟動程式。可見Devin不只有程式設計能力,還有絕對符合大廠產品經理的設計美學。Cognition也宣稱Devin能製作網頁,平均5分鐘就能做好。

不了解程式設計的人可能不清楚,能做出生命遊戲的人工智慧究竟有多可怕。為了顯示Devin多厲害,筆者找出Devin誕生前就很不錯的開源AI軟體Project Devika,做了類似生命遊戲(下圖上)。下圖下作者是Devin,白色小格子尺寸越小,代表程式等級越高,下圖上白色格紋解析度遠低於下圖下,表示Devin的生命遊戲比Project Devika優秀。

▲ Project Devika生成的生命遊戲。

▲ Devin生成的生命遊戲。

事情還沒完。Devin還未公開,但拿到內測機會的程式設計師,已提出各種刁鑽任務考驗它,但表現令人感到恐怖。有工程師要求Devin安裝Github的chatbot-ui,就是「LINE」,不過好友名單是各式各樣大語言模型,如ChatGPT、Llama 2。安裝人工智慧版LINE後,工程師要求Devin用軟體傳訊給GPT4。

▲ chatbot-ui。

最後結果是Devin成功了。工程師除了提供Devin帳號,沒有教Devin任何事,包括安裝環境和軟體使用方法等,是Devin接到指令後自己完成。

其實各種案例看來,Devin程式設計能力歸功於檢索能力。給Devin一段Github位址,它就能自動扒出程式碼,然後透過程式碼和提示詞產生符合需求的程式。人類工程師其實不會知道所有程式碼,只知道如何達成這些功能(每段程式碼那麼多字,誰能背得下來?)只要知道如何寫,就能去專門程式碼網站「搬運」程式碼。

現在,Devin也做到了。

其實工程師理解程式碼時,很大一定程度不是看程式碼本身,而是看程式碼旁邊的註釋,如註解寫這段程式碼是為了檢索、那段程式碼是為了循環。Devin只花更短時間直接跑一遍結果,當然比人類快太多。

跟人一樣懶卻更強,讓人類工程師立刻感受到就業壓力,於是第一批「反抗」AI的勇者出現了。Reddit最近出現不少對Devin口誅筆伐、口無遮攔怒罵「Fxxk you Devin」的程式設計師,甚至名字叫Devin的人也受波及,因在他們看來,Devin讀懂程式碼、寫程式,這還可以理解,但Devin沒有人教使用方法,就直接使用其他程式,這未免太厲害了,於是開始找Devin各種疑點。

網友minegen88「發現」一個問題:既然Devin懂寫,還能自己架網頁,為什麼Cognition網頁設計如此簡陋?

(Source:Cognition

他審視Cognition官網元素,發現需透過Clerk.com及Ashby等第三方服務處理後台任務,換句話說,有前後端開發能力的人,開發不了前後端功能,minegen88質疑為什麼Cognition不讓Devin做個好一點的網頁,一方面能宣傳Devin的能力,另一方面還能加強官網功能,何樂而不為?

其他網友也坐不住,紛紛尋找Cognition作假的蛛絲馬跡。有人發現,Cognition右上角超連結的部落格,其實只是靜態頁面,根本不是完整部落格。靜態頁面是指伺服器端固定不變的網頁檔案,網頁建立時就確定,一旦存在伺服器,就不會因不同使用者或不同時間要求而變化,每次造訪伺服器傳回使用者的網頁內容都相同,但部落格平台因更新內容,不可能是靜態頁面。

網友又進一步挖掘,發現這頁面上傳文件時,如果沒有登入會出現錯誤提示,但沒有提供有用錯誤ID、時間點或其他後設資料,且前端介面沒有相應錯誤回饋,只是加載動畫一直轉轉轉。簡單講,如果不登入就不能發表內容,然而想登入也無法登入。

Reddit阿宅有個特點,一旦某件事有問題,就會肉搜當事人,Cognition創辦人Scott Wu也逃不過。網友很快發現Scott Wu宣稱在哈佛大學學習經濟學,畢業後於財富管理軟體公司Addepar擔任軟體工程師,之後與他人共同創立並領導人工智慧驅動社群平台Lunchclub,擔任CTO五年。雖然Cognition官網表示,團隊都是頂級工程師組成,但Reddi網友尤其minegen88認為,這種履歷並不能稱為頂級。

接下來更有意思,其他網友發現Scott Wu 14年前參加電視節目的影片,Scott Wu不到1秒就能讀完並解答很難的數學題,有人說「我甚至還沒看完題目,他答案就出來了」。如此經歷加上這段影片,網友都認為Scott Wu作假機率很高。

▲ Scott Wu。(Source:Cognition

這部分是美國國情導致,2000年後美國電視節目造假算常態,如影片電視節目,比賽開始前就以特定題型訓練參賽者,正式比賽時當然都是出同類型題目,使特訓過選手能很快答題。

有了蛛絲馬跡,網友又回到Devin展示影片研究。所有Devin展示影片,聊天框內容都是提前打好的,有種可能是Cognition團隊沒有輸入任何內容,是直接複製程式碼放在螢幕右側,再據右側程式編出來左側用戶和Devin的對話。

疑問越來越多後,Reddit聚集一群認定Scott Wu就是作假的工程師。

▲ 各職業網友都在質疑Devin。

有人把質疑和各種「柯南」行為視為人類第一次反攻AI工程師,但結果看來有點荒謬,更像Reddit宅男的自嗨鬧劇。且人類還在找蛛絲馬跡的時候,內測過Devin的工程師下了一個指令,請Devin去Reddit發文問建站需求。

Devin不僅做到,且解決了一系列需求後,自己決定開始收費,這工程師不得不在它騙倒所有人前把它弄下線。看來,人類得想想其他「對抗」AI的辦法了。

(本文由 品玩 授權轉載;首圖來源:Pixabay

延伸閱讀: