機器人自學完成以單手解魔術方塊,這里程碑的意義是什麼?

作者 | 發布日期 2019 年 10 月 17 日 8:30 | 分類 AI 人工智慧 , 機器人 follow us in feedly


機器人能做的事越來越多,摘水果、組裝家具、捏壽司……但現在的人工智慧還離不開人工干預。

不過最近伊隆‧馬斯克創辦的人工智慧公司 OpenAI 展示了具里程碑意義的成果,去年首次發表的機械手 Dactyl,已學會單手解魔術方塊,還是 Dactyl 自學的。

影片可看到,Dactyl 解魔方的手法還稍顯笨拙,要花 4 分鐘左右才能完成,比起熟練的高手還是有很大差距。但解魔方的手速並不是 Dactyl 新能力的重點,而是這意味著我們距離理想中的 AI 機器人更近一步:

那是一種可透過學習執行各種工作的機器人,且無需經過長達數月到數年的訓練,甚至無需專門設計程式。

實際上,機器人解魔方並不是什麼新鮮事。2016 年半導體製造商英飛凌製造的機器人,能在不到 1 秒內復原一個魔方,遠超過人類的最快紀錄。兩年後麻省理工學院開發的機器人將時間縮短到 0.4 秒。

但這些機器人手大都和人手很不一樣,這樣的設計也注定無法完成更多工作。Dactyl 採用的是模仿人手的 24 關節機械手,研究人員希望 Dactyl 能學習如何像人類控制這些關節。

OpenAI 機器人技術主管 Peter Welinder 表示,其實很多機器人都能輕易解魔方,但 Dactyl 與這些機器人最大的不同在於,那些機器人是製造出來專門解魔方,但 Dactyl 卻能完成更多工作。

我們正在嘗試製造通用機器人,能像人手完成多種作業,而不局限於某樣特定工作。

因此,Dactyl 真正了不起的地方不在於單手解魔方,而是如何學習這項技能的過程。因為研究人員並沒有專門為機械手設計程式,一切都要靠 Dactyl 自己領悟。

要讓機器人「自學成才」就離不開人工智慧。Dactyl 採用在虛擬環境的深度學習模型,這模型有個好處,就是不會耗費現實世界的時間,此外還不用擔心機器人訓練時摔壞或傷害到人。

Dactyl 在虛擬世界積累數萬年的訓練經驗,但在現實只過了幾個月,頗有點「山中一日,世上千年」的感覺。這訓練方式大大縮短了 AI 的學習時間,背後則需要數千個超高效能的 CPU 和 GPU 同時執行。

通過訓練的 Dactyl 還能自行應付各種突發狀況,比如解魔方時研究人員不斷用東西戳它,還用紙屑和泡沫干擾,但 Dactyl 依舊能完成工作,且訓練時沒有模擬過這種情形。

Peter Welinder 指出,現在機器人之所以無法像人類掌握多項技能,是因為機器人要完成一項簡單的工作,也需要大量訓練,完成新工作則要從頭訓練,即便是波士頓動力的網紅機器狗也無法自主作業,如果沒有專門程式設計和人工干預,連基本動作都難以完成。

但如果機器人的 AI 演算法可像人類一樣建模,就能快速掌握多項技能。正如 OpenAI 所說,Dactyl 是邁向未來機器人的一小步,卻至關重要,能讓人工智慧不再依賴人類,代替人類完成更多複雜的體力勞動。

(本文由 愛范兒 授權轉載;首圖來源:OpenAI