阅读背景:

深度强化学习:入门(Deep Reinforcement Learning: Scratching the surface)

来源:互联网 

RL的方案

两个主要对象:Agent和Environment

Agent观察Environment,做出Action,这个Action会对Environment造成一定影响和改变,继而Agent会从新的环境中获得Reward。循环上述步骤。Agent观察Enviro




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: