1. 甚么是强化学习
其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的进程中学习到在特定的情境下选择哪类行为可以得到最大的回报。在很多场景中,当前的行为不但会影响当前的rewards,还会影响以后的状况和一系列的rewards。RL最主要的3个特定在于:其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcem
其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的进程中学习到在特定的情境下选择哪类行为可以得到最大的回报。在很多场景中,当前的行为不但会影响当前的rewards,还会影响以后的状况和一系列的rewards。RL最主要的3个特定在于:其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcem