阅读背景:

强化学习(十九) AlphaGo Zero强化学习原理

来源:互联网 

    在强化学习(十八) 基于模拟的搜索与蒙特卡罗树搜索(MCTS)中,我们讨论了MCTS的原理和在棋类中的基本应用。这里我们在前一节MCTS的基础上,讨论下DeepMind的AlphaGo Zero强化学习原理。中,我们讨论了MCTS的




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: