阅读背景:

强化学习之Q-learning

来源:互联网 

三要素:状态(state),动作(action),奖赏(reward)。更具具体情况自行进行给定。 三要素:状态(state),动作(action),奖赏(reward)。更具具体情况自




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: