Tag Archives: 強化學習

結合深度學習與強化學習,Google 訓練機器手臂的長期推理能力

作者 |發布日期 2018 年 08 月 02 日 8:30 |
分類 AI 人工智慧 , Google , 機器人

機器人如何學到在多樣且複雜的真實世界物體和環境中廣泛使用的技能?如果機器人設計用來在可控環境執行重複工作,那麼這工作相對來說應更簡單,如設計在管線組裝產品的機器人。但要是想設計成會觀察周圍環境,根據環境決定最佳行動,同時還能回應不可預知環境的機器人,那難度就等比級數的增長。 繼續閱讀..

DeepMind:人腦前額皮質藏了一個強化學習系統

作者 |發布日期 2018 年 05 月 17 日 11:13 |
分類 AI 人工智慧 , Google , 生物科技

最近,AI 系統已學會一系列遊戲玩法,如雅達利經典遊戲《Breakout》和《乓》(Pong)。儘管令人印象深刻,但其實人工智慧需要數千小時的遊戲時間才能達到並超越人類玩家。相比之下,我們可在幾分鐘內掌握以前從未玩過的遊戲基礎操作。DeepMind 研究了這個問題,論文《Prefrontal cortex as a meta-reinforcement learning system》發表在《自然》神經科學子刊。隨著論文發表,DeepMind 也寫了一篇解讀文章,介紹論文主要內容,以下編譯供讀者參考。 繼續閱讀..

DeepMind 論文揭示最強 AlphaGo Zero,不靠人類知識進化成長

作者 |發布日期 2017 年 10 月 19 日 11:08 |
分類 AI 人工智慧 , Google

AlphaGo「退役」了,但 DeepMind 探索圍棋並沒有停止。今年 5 月烏鎮大會的「人機對弈」,中國棋手、世界冠軍柯潔九段以 0 比 3 不敵 AlphaGo。隨後 DeepMind 創始人 Hassabis 宣布,AlphaGo 將永久結束競技舞台,不再比賽。同時 Hassbis 表示:「我們計劃在今年稍晚發表最後一篇論文,詳細介紹我們在演算法效率取得的進展,以及應用在其他更領域的可能性。就像第一篇 AlphaGo 論文,我們希望更多開發者接過棒子,利用這些全新的進展開發屬於自己的強大圍棋程式。」

繼續閱讀..