DeepMind 打造全新學習模式「SAC-X」,鼓勵機器人自我摸索完成任務

作者 | 發布日期 2018 年 03 月 05 日 16:00 | 分類 AI 人工智慧 , 尖端科技 , 機器人 follow us in feedly

人工智慧AI)能做非常多的事,圖像辨識、語音辨識、雲端運算……在機器學習深度學習技術的協助下,AI 解析數據的能力並不會有人懷疑,但它們並不善於自行探索。




圍棋界打遍天下無敵手 AlphoGo 的創造者、Google 旗下知名 AI 研究機構 DeepMind 打算改變這一切,教會機器如何自己搞懂事情。

為了解決這個問題,DeepMind 為 AI 機器人建立了一個全新的學習模式「預定輔助控制」(Scheduled Auxiliary Control,SAC-X),為機器人提供一個簡單的目標,並在完成時提供獎勵。

DeepMind 解釋,SAC-X 定義的輔助任務總是遵循一個大原則,那便是「鼓勵機器人探索感測器空間」,研究團隊並不會告訴機器人如何完成任務,他們只會開啟機器配置的感測器,剩餘的便留給機器去摸索,一直到它把事情正確完成。

如果你看過機械手臂在工廠協助生產的場景,下面的影片或許不會太令你印象深刻,但必須一提的是,這台機器手臂並沒有特定的程序或設計在引導,它只是在自行摸索如何達成人類的要求,並獲得相應的獎勵。

一旦 DeepMind 或其他 AI 公司教會機器人做這些事,這將很大程度的改變世界。

以目前的研究應用來看,沒有一個機器人可以走進一間陌生的房間,並且將它整理乾淨,就連其中包含的單項任務──整理床舖、清空垃圾或放一杯咖啡,對機器人來說都非常複雜。

當機器人能學會自我摸索,每種任務的執行方式都將會是無限,雖然目前距離電影裡能打點一切的 AI 機器人還有很長一段路要走,但 DeepMind 確實已踏出了第一步。

(首圖來源:Deepmind