RL的方案
两个主要对象:Agent和Environment
Agent观察Environment,做出Action,这个Action会对Environment造成一定影响和改变,继而Agent会从新的环境中获得Reward。循环上述步骤。Agent观察Enviro
两个主要对象:Agent和Environment
Agent观察Environment,做出Action,这个Action会对Environment造成一定影响和改变,继而Agent会从新的环境中获得Reward。循环上述步骤。Agent观察Enviro