Tag Archives: QT-Opt

結合深度學習與強化學習,Google 訓練機器手臂的長期推理能力

作者 |發布日期 2018 年 08 月 02 日 8:30 | 分類 AI 人工智慧 , Google , 機器人

機器人如何學到在多樣且複雜的真實世界物體和環境中廣泛使用的技能?如果機器人設計用來在可控環境執行重複工作,那麼這工作相對來說應更簡單,如設計在管線組裝產品的機器人。但要是想設計成會觀察周圍環境,根據環境決定最佳行動,同時還能回應不可預知環境的機器人,那難度就等比級數的增長。 繼續閱讀..