機器人自學完成以單手解魔術方塊，這里程碑的意義是什麼？

機器人能做的事越來越多，摘水果、組裝家具、捏壽司……但現在的人工智慧還離不開人工干預。

不過最近伊隆‧馬斯克創辦的人工智慧公司 OpenAI 展示了具里程碑意義的成果，去年首次發表的機械手 Dactyl，已學會單手解魔術方塊，還是 Dactyl 自學的。

從影片可看到，Dactyl 解魔方的手法還稍顯笨拙，要花 4 分鐘左右才能完成，比起熟練的高手還是有很大差距。但解魔方的手速並不是 Dactyl 新能力的重點，而是這意味著我們距離理想中的 AI 機器人更近一步：

那是一種可透過學習執行各種工作的機器人，且無需經過長達數月到數年的訓練，甚至無需專門設計程式。

實際上，機器人解魔方並不是什麼新鮮事。2016 年半導體製造商英飛凌製造的機器人，能在不到 1 秒內復原一個魔方，遠超過人類的最快紀錄。兩年後麻省理工學院開發的機器人將時間縮短到 0.4 秒。

但這些機器人手大都和人手很不一樣，這樣的設計也注定無法完成更多工作。Dactyl 採用的是模仿人手的 24 關節機械手，研究人員希望 Dactyl 能學習如何像人類控制這些關節。

OpenAI 機器人技術主管 Peter Welinder 表示，其實很多機器人都能輕易解魔方，但 Dactyl 與這些機器人最大的不同在於，那些機器人是製造出來專門解魔方，但 Dactyl 卻能完成更多工作。

我們正在嘗試製造通用機器人，能像人手完成多種作業，而不局限於某樣特定工作。

因此，Dactyl 真正了不起的地方不在於單手解魔方，而是如何學習這項技能的過程。因為研究人員並沒有專門為機械手設計程式，一切都要靠 Dactyl 自己領悟。

要讓機器人「自學成才」就離不開人工智慧。Dactyl 採用在虛擬環境的深度學習模型，這模型有個好處，就是不會耗費現實世界的時間，此外還不用擔心機器人訓練時摔壞或傷害到人。

Dactyl 在虛擬世界積累數萬年的訓練經驗，但在現實只過了幾個月，頗有點「山中一日，世上千年」的感覺。這訓練方式大大縮短了 AI 的學習時間，背後則需要數千個超高效能的 CPU 和 GPU 同時執行。

通過訓練的 Dactyl 還能自行應付各種突發狀況，比如解魔方時研究人員不斷用東西戳它，還用紙屑和泡沫干擾，但 Dactyl 依舊能完成工作，且訓練時沒有模擬過這種情形。

Peter Welinder 指出，現在機器人之所以無法像人類掌握多項技能，是因為機器人要完成一項簡單的工作，也需要大量訓練，完成新工作則要從頭訓練，即便是波士頓動力的網紅機器狗也無法自主作業，如果沒有專門程式設計和人工干預，連基本動作都難以完成。

但如果機器人的 AI 演算法可像人類一樣建模，就能快速掌握多項技能。正如 OpenAI 所說，Dactyl 是邁向未來機器人的一小步，卻至關重要，能讓人工智慧不再依賴人類，代替人類完成更多複雜的體力勞動。

（本文由愛范兒授權轉載；首圖來源：OpenAI）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？