阅读背景:

深度增强学习David Silver(四)——Model-Free Prediction

来源:互联网 

本节课主要介绍:

  • Monte-Carlo Learning
  • Temporal-Difference LearningT



你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: