DeepMind：強化學習能達到通用人工智慧水準

比起限定功能的人工智慧系統，「通用人工智慧」是不少研究的目標，這樣的系統可以更有彈性自動對應不同的應用範疇，就如真人。DeepMind 最近宣稱，就算只是用強化學習方式訓練，也可以達此水準。

DeepMind 最近於《Artificial Intelligence》期刊發表的論文表示，人工智慧系統的能力並不是透過制定和解決複雜問題而產生，而是透過「獎勵最大化」的單一原則可達成。他們認為，獎勵最大化和試行錯誤的經驗，可培養出智力相關能力，其中一個實際應用的方式就是強化學習，他們相信最終可達通用人工智慧水準。

（Source：VentureBeat）

他們提出，利用這原則可更有效建立 AI 系統，他們假設「最大化獎勵的一般目標足以驅動表現出自然和人工智慧研究的大部分（如果不是全部）能力的行為」，模仿大自然智慧進化的適者生存機制，迫使系統在單一目標下發展出不同的相關能力。不過這套理論仍有需解決的地方，例如對學習代理的樣本效率應該如何判斷，始終強化學習需要大量數據訓練，而現有數據下可能要幾個世紀的訓練時間才能發展出通用人工智慧。