阅读背景:

2019/5/14 基于无模型的强化学习方法

来源:互联网 

(一)无模型的强化学习方法解决哪类问题

模型状态转化概率矩阵P始终是未知                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                模型状态转化概率矩阵P始终是未知              




你的当前访问异常,请进行认证后继续阅读剩余内容。

分享到: