阅读背景:

强化学习 Model-Based 和 Model-Free_布谷AI的专栏

来源:互联网 

Model指的是针对环境的建模,即输入Action,环境的响应:Reward和State。




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: