文章目录 前言 什么是强化学习? 强化学习基本元素 强化学习的分类: 场景应用分类 经典强化学习算法 Q learning (说到不一定做到 Off policy) Sarsa 算法(说到做到型--On policy) DQN Policy Gradients Actor Critic AC 流程 DQN DDPG A3C 文章目录 前言 什么是强化学习? 强化学习基本元素 强化学习的分类: 场景应用分类 经典强化学习算 你的当前访问异常,请进行认证后继续阅读剩余内容。 提交