教一次就會!Open AI 新演算法讓機器人學會「模仿」

作者 | 發布日期 2017 年 05 月 18 日 22:37 | 分類 AI 人工智慧 , VR/AR , 尖端科技 follow us in feedly

馬斯克(Elon Musk)創立的人工智慧公司 Open AI 最近有了新的突破,透過新型演算法「一次性模仿學習」(one-shot imitation learning),Open AI 讓機器人只需要看一次示範動作,就能成功複製人類的行為。



Open AI 表示,透過一次性模仿學習,研究人員只需要在虛擬實境(VR)中示範一次動作,機器人就能透過相同的動作做出同樣的結果。以這次的實驗為例,在看過示範後,機器人就成功地將桌上分散的木塊堆疊成相同形狀。

Open AI 的機器人外觀和普通機器手臂無異,搭載視訊鏡頭、手臂及夾爪三大部分,系統則由兩大神經網路組成:視覺網路(Vision network)與模仿網路(Imitation network)。

Open AI 不採用真實影像,而是將數十萬張具有不同紋理、光影的虛擬影像,透過鏡頭輸入視覺網路來進行訓練,模仿網路則透過觀察示範內容,來推測出行為的目標,並進而實現出任務的意圖。

但模仿網路究竟是如何學會推測的?Open AI 表示,他們先是用 10 幾項不同的任務對模仿網路進行訓練,每個任務都進行了數千次的虛擬示範,讓模仿網路觀察並學習推測,並逐漸學會在第一次示範動作時,就能有效理解任務的意圖。

透過這兩大神經網路系統,即使在啟動參數不同的情況下,機器人也能夠達成目標。

(Source:OpenAI

以這次的示範來說,木塊可以任意擺放在桌上的任何位置,如果示範的結果是藍色木塊於白色木塊上方,機器人會找到在不同位置的藍白木塊,並確實地照順序堆疊完成任務。

研究人員以嬰兒為例,當看到成人在面前吐舌時,嬰兒也會試著模仿吐舌,人類的模仿本能讓學習事物能夠非常快速,「我們也希望讓機器人具備同種學習功能。」

(首圖來源:Flickr/Heisenberg Media CC BY 2.0)